夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

ApdativeNN:建模類人自適應(yīng)感知機(jī)制,突破機(jī)器視覺不可能三角

0
分享至



視覺是人類理解復(fù)雜物理世界的重要方式。讓計(jì)算機(jī)具備視覺感知與認(rèn)知的能力,是人工智能的主要研究問題之一,對(duì)多模態(tài)基礎(chǔ)模型、具身智能、醫(yī)療 AI 等重要領(lǐng)域具有關(guān)鍵支撐作用。過去幾十年間,計(jì)算機(jī)視覺取得了顯著突破,已在圖像識(shí)別、目標(biāo)檢測、多模態(tài)理解等多個(gè)任務(wù)上接近甚至超越人類專家水平。然而,當(dāng)前的高精度模型在實(shí)際落地中常面臨較大挑戰(zhàn):它們的推理過程往往需要激活上億參數(shù)來處理高分辨率圖像或視頻、以解決復(fù)雜和挑戰(zhàn)性的視覺問題,導(dǎo)致功耗、存儲(chǔ)需求和響應(yīng)時(shí)延急劇上升。這一瓶頸使得它們難以部署在算力、能耗、存儲(chǔ)等資源高度受限的實(shí)際系統(tǒng)中(如機(jī)器人、自動(dòng)駕駛、移動(dòng)設(shè)備或邊緣終端等),甚至在醫(yī)療、交通等場景下由于延遲決策危害生命安全。另一方面,大型模型龐大的推理能耗在也帶來了大規(guī)模部署的環(huán)境可持續(xù)性問題。

上述挑戰(zhàn)的一個(gè)重要原因在于現(xiàn)有視覺模型普遍采用了全局表征學(xué)習(xí)范式:一次性并行處理整幅圖像或視頻的所有像素、提取全部對(duì)應(yīng)特征,再應(yīng)用于具體任務(wù)。這種 “全局并行計(jì)算” 范式使得模型計(jì)算復(fù)雜度隨輸入尺寸呈至少平方或立方增長,逐漸形成了一個(gè)日益嚴(yán)峻的能效瓶頸:信息豐富的高分辨率時(shí)空輸入、性能領(lǐng)先的大型模型、高效快速推理,三者難以同時(shí)滿足。這一挑戰(zhàn)正在成為制約視覺智能走向大規(guī)模、可部署落地、低碳環(huán)保的公認(rèn)難題。



圖1 當(dāng)前計(jì)算機(jī)視覺范式所面臨的能效瓶頸

人類視覺系統(tǒng)為突破上述瓶頸提供了重要啟示:在觀察復(fù)雜環(huán)境時(shí),人眼不會(huì)一次性處理全部視覺信息,而是通過一系列 “注視” 動(dòng)作主動(dòng)、選擇性地采樣關(guān)鍵區(qū)域,以小范圍高分辨率的感知逐步拼接出對(duì)物理世界中有用信息的認(rèn)知。這種先進(jìn)的機(jī)制能在龐雜的信息流中快速篩取要點(diǎn),大幅降低計(jì)算開銷,使得人類高度復(fù)雜的視覺系統(tǒng)即便在資源受限的前提下依然能夠高效、快速運(yùn)行。無論外界場景多么復(fù)雜,人類視覺的能耗主要取決于注視帶寬與注視次數(shù),而非全局像素量。早在 2015 年,LeCun, Bengio, Hinton 便在《Nature》綜述論文 “Deep Learning” 中指出,未來的 AI 視覺系統(tǒng)應(yīng)具備類人的、任務(wù)驅(qū)動(dòng)的主動(dòng)觀察能力。然而近十年來,這一方向仍缺乏系統(tǒng)性研究。



圖2 人類視覺系統(tǒng)的主動(dòng)自適應(yīng)感知策略

2025 年 11 月,清華大學(xué)自動(dòng)化系宋士吉、黃高團(tuán)隊(duì)在《自然?機(jī)器智能》(Nature Machine Intelligence)上發(fā)表了論文《Emulating human-like adaptive vision for efficient and flexible machine visual perception》(模擬人類自適應(yīng)視覺,實(shí)現(xiàn)高效靈活的機(jī)器視覺感知)。該研究提出了AdaptiveNN 架構(gòu),通過借鑒人類 “主動(dòng)自適應(yīng)視覺” 的機(jī)制,將視覺感知建模為由粗到精的最優(yōu)序貫決策問題:逐步定位關(guān)鍵區(qū)域、累積多次注視信息,并在信息足夠完成任務(wù)時(shí)主動(dòng)終止觀察。在理論上,該研究通過結(jié)合表征學(xué)習(xí)與自獎(jiǎng)勵(lì)強(qiáng)化學(xué)習(xí),給出了 AdaptiveNN 所面臨的離散 - 連續(xù)混合優(yōu)化問題的無需額外監(jiān)督的端到端求解方法。在涵蓋 9 類任務(wù)的廣泛實(shí)驗(yàn)中,AdaptiveNN 在保持精度的同時(shí)實(shí)現(xiàn)了最高 28 倍的推理成本降低,可在線動(dòng)態(tài)調(diào)整其行為以適配不同任務(wù)需求與算力約束,同時(shí),其基于注視路徑的推理機(jī)制顯著提升了可解釋性。AdaptiveNN 展現(xiàn)出構(gòu)建高效、靈活且可解釋的計(jì)算機(jī)視覺新范式的潛力。另一方面,AdaptiveNN 的感知行為在多項(xiàng)測試中與人類接近,也為未來探索人類視覺認(rèn)知機(jī)制的關(guān)鍵問題提供了新的見解和研究工具。



  • 論文標(biāo)題:Emulating human-like adaptive vision for efficient and flexible machine visual perception
  • 論文鏈接:https://www.nature.com/articles/s42256-025-01130-7

AdaptiveNN:類人主動(dòng)感知架構(gòu)



借助這一機(jī)制,AdaptiveNN 能夠在保證高精度的同時(shí)顯著降低計(jì)算量,實(shí)現(xiàn)“看得清,也看得省”。它使神經(jīng)網(wǎng)絡(luò)具備了類人式的主動(dòng)感知,從而突破了傳統(tǒng)視覺模型在效率與效果之間的權(quán)衡瓶頸。

值得注意的是,AdaptiveNN 在設(shè)計(jì)上具有較強(qiáng)的兼容性和靈活性,適用于多種不同的深度神經(jīng)網(wǎng)絡(luò)基礎(chǔ)架構(gòu)(如卷積網(wǎng)絡(luò)、Transformer等)和多種類型的任務(wù)(如純視覺感知、視覺-語言多模態(tài)聯(lián)合建模等)。



圖3 AdaptiveNN的網(wǎng)絡(luò)架構(gòu)和推理過程

理論創(chuàng)新:自激勵(lì)強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的主動(dòng)感知行為學(xué)習(xí)

AdaptiveNN 的訓(xùn)練過程同時(shí)涉及連續(xù)變量(如從注視區(qū)域中提取特征)與離散變量(如決定下一次注視位置)的優(yōu)化,傳統(tǒng)反向傳播算法難以直接處理這一混合問題。為此,研究團(tuán)隊(duì)在理論上提出了面向離散 - 連續(xù)混合優(yōu)化問題的端到端求解方法,使 AdaptiveNN 能夠在統(tǒng)一框架下簡單易行地完成整體訓(xùn)練。具體而言,從期望優(yōu)化目標(biāo)出發(fā),對(duì)整體損失函數(shù) L(θ) 進(jìn)行分解,AdaptiveNN 的端到端優(yōu)化過程可自然地分解為兩部分



其中第一項(xiàng)為表征學(xué)習(xí)目標(biāo)(representation learning),對(duì)應(yīng)于從注視區(qū)域中提取任務(wù)相關(guān)的特征;第二項(xiàng)為自激勵(lì)強(qiáng)化學(xué)習(xí)目標(biāo)(self-rewarding reinforcement learning),對(duì)應(yīng)于優(yōu)化注視位置的分布,驅(qū)使模型的主動(dòng)注視行為實(shí)現(xiàn)最大化的任務(wù)收益。這一理論結(jié)果揭示了 AdaptiveNN 的內(nèi)在學(xué)習(xí)規(guī)律:主動(dòng)感知的優(yōu)化本質(zhì)上是表征學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的統(tǒng)一



圖4 強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的端到端主動(dòng)視覺的理論框架

實(shí)驗(yàn)驗(yàn)證:高效視覺感知,類人視覺行為

  • 性能提升顯著:在使用相同主干網(wǎng)絡(luò)(如 DeiT-S、ResNet-50)的情況下,AdaptiveNN-DeiT-S 和 AdaptiveNN-ResNet-50 分別以2.86 GFLOPs 與 3.37 GFLOPs的平均計(jì)算量,取得與傳統(tǒng)靜態(tài)模型相當(dāng)甚至更優(yōu)的準(zhǔn)確率(81.6% / 79.1%),實(shí)現(xiàn)了 5.4× 與 3.6× 的計(jì)算節(jié)省。
  • 可解釋性增強(qiáng):AdaptiveNN 的注視軌跡自動(dòng)聚焦于類別判別性區(qū)域,例如動(dòng)物的頭部、樂器的關(guān)鍵結(jié)構(gòu)、咖啡機(jī)的旋鈕與噴嘴等。當(dāng)目標(biāo)較小或遠(yuǎn)離攝像機(jī)時(shí),模型會(huì)自適應(yīng)地延長觀察序列,主動(dòng)調(diào)整注視步數(shù)以獲得更精確的判斷。這種 “由粗到細(xì)、按需注視” 的策略,與人類視覺的逐步注視過程高度一致。



圖5 ImageNet視覺感知實(shí)驗(yàn)結(jié)果

為了進(jìn)一步驗(yàn)證 AdaptiveNN 的泛化與精細(xì)感知能力,研究團(tuán)隊(duì)在六個(gè)細(xì)粒度視覺識(shí)別任務(wù)(CUB-200、NABirds、Oxford-IIIT Pet、Stanford Dogs、Stanford Cars、FGVC-Aircraft)上進(jìn)行了系統(tǒng)評(píng)估。

  • AdaptiveNN 在保持精度基本不變甚至略有提升的情況下,實(shí)現(xiàn)了5.8×–8.2× 的計(jì)算量節(jié)省,顯著超越傳統(tǒng)靜態(tài)視覺模型的性能–能效上限。
  • 通過可視化(Fig. A1b–A1e),可以看到模型自發(fā)聚焦于任務(wù)判別性區(qū)域 —— 如鳥類的喙部、犬類的面部、汽車的燈組與航空器的螺旋槳 —— 而無需任何顯式的定位監(jiān)督。



圖6 細(xì)粒度視覺識(shí)別任務(wù)實(shí)驗(yàn)結(jié)果

AdaptiveNN 在空間注視位置任務(wù)難度判斷兩個(gè)層面,都展現(xiàn)出與人類視覺高度一致的自適應(yīng)行為。定量結(jié)果表明,無論是 “看哪里”、還是 “覺得什么難”,模型的感知策略都與人類極為相似。在 “視覺圖靈測試” 中,人類受試者幾乎無法區(qū)分模型與真實(shí)人類的凝視軌跡。

更值得關(guān)注的是,這一成果對(duì)認(rèn)知科學(xué)的研究具有啟發(fā)意義。AdaptiveNN 的結(jié)果不僅為理解人類視覺行為的關(guān)鍵認(rèn)知科學(xué)問題(例如 “視覺能力的形成究竟源于先天機(jī)制還是后天學(xué)習(xí)”)提供了新的啟發(fā),也展示了其作為一種通用計(jì)算模型的潛力。未來,AdaptiveNN 有望用于模擬和檢驗(yàn)人類的注意分配、感知學(xué)習(xí)、以及復(fù)雜任務(wù)中的視覺決策機(jī)制,為將來認(rèn)知科學(xué)方面的研究提供了潛在的定量工具。



圖7 AdaptiveNN與人類視覺感知行為的一致性測試

從視覺感知到邁向高效具身推理

在實(shí)驗(yàn)驗(yàn)證中,研究團(tuán)隊(duì)進(jìn)一步將 AdaptiveNN 應(yīng)用于具身智能的基礎(chǔ)模型(視覺 - 語言 - 行為模型,VLA)上結(jié)果表明,該框架在復(fù)雜操作場景中顯著提升了具身基礎(chǔ)模型的推理與感知效率,在保持任務(wù)成功率的同時(shí)將計(jì)算開銷大幅降低 4.4-5.9 倍。這一成果為解決具身智能系統(tǒng)長期面臨的效率瓶頸提供了新的思路與技術(shù)路徑。



圖8 ApdativeNN應(yīng)用于VLA具身任務(wù)的實(shí)驗(yàn)結(jié)果

清華大學(xué)自動(dòng)化系博士生王語霖、樂洋、樂陽為論文共同第一作者,宋士吉教授與黃高副教授為共同通訊作者。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
離譜!一男子存500萬一年定期,利息151000。到期取錢,工作人員卻說,存單是假的!男子怒了直接告上法院!

離譜!一男子存500萬一年定期,利息151000。到期取錢,工作人員卻說,存單是假的!男子怒了直接告上法院!

上海約飯局
2025-12-02 18:47:01
張文宏直言:不管你信不信,老人過了80歲,基本都有如下7個(gè)現(xiàn)狀

張文宏直言:不管你信不信,老人過了80歲,基本都有如下7個(gè)現(xiàn)狀

黃河新流域
2025-09-28 13:34:43
北京已有近800萬人申領(lǐng)三代社保卡,擬增老年餐、校園卡等服務(wù)

北京已有近800萬人申領(lǐng)三代社???,擬增老年餐、校園卡等服務(wù)

新京報(bào)
2025-12-09 19:17:05
英超:布魯諾·費(fèi)爾南德斯打入“賽季最丑進(jìn)球”

英超:布魯諾·費(fèi)爾南德斯打入“賽季最丑進(jìn)球”

星耀國際足壇
2025-12-09 11:56:02
吳千語回應(yīng)銷售額破1.5億,抄襲風(fēng)波升級(jí),被扒源頭廠家才賣2毛錢

吳千語回應(yīng)銷售額破1.5億,抄襲風(fēng)波升級(jí),被扒源頭廠家才賣2毛錢

古希臘掌管月桂的神
2025-12-09 19:30:15
外交部對(duì)日本右翼勢力挑釁言行表態(tài)

外交部對(duì)日本右翼勢力挑釁言行表態(tài)

北青網(wǎng)-北京青年報(bào)
2025-12-10 03:20:18
尺度驚艷,這5部黃暴劇集,一口氣看完真是太過癮了

尺度驚艷,這5部黃暴劇集,一口氣看完真是太過癮了

小微看電影
2025-06-20 09:50:16
逃,逃,逃

逃,逃,逃

入木三分談
2025-12-08 18:27:46
中國加速替代禁令的后果開始出現(xiàn),日媒:我們的根被弄斷了

中國加速替代禁令的后果開始出現(xiàn),日媒:我們的根被弄斷了

往后相濡以沫
2025-12-08 20:31:55
茼蒿立大功!醫(yī)生調(diào)查發(fā)現(xiàn):茼蒿對(duì)這5種疾病有好處,建議常吃

茼蒿立大功!醫(yī)生調(diào)查發(fā)現(xiàn):茼蒿對(duì)這5種疾病有好處,建議常吃

阿纂看事
2025-10-13 15:36:03
69年,林彪想讓李作鵬當(dāng)總政治部主任,毛主席不同意:讓這個(gè)人當(dāng)

69年,林彪想讓李作鵬當(dāng)總政治部主任,毛主席不同意:讓這個(gè)人當(dāng)

明月清風(fēng)閣
2025-12-08 08:20:16
坐標(biāo)武漢:這輪甲流的威力越來越嚴(yán)重了!

坐標(biāo)武漢:這輪甲流的威力越來越嚴(yán)重了!

牛鍋巴小釩
2025-12-09 01:19:08
佳能中山退場!2.5N+1有人拿八九十萬!員工邊走邊哭!

佳能中山退場!2.5N+1有人拿八九十萬!員工邊走邊哭!

魔都囡
2025-12-09 03:20:45
“感謝”高市早苗,讓我們重溫了毛主席的話:你們是我們的先生

“感謝”高市早苗,讓我們重溫了毛主席的話:你們是我們的先生

扶蘇聊歷史
2025-12-05 12:10:28
博主曝光多地?zé)o人機(jī)“黑飛”至8000米高空,知名藝人斥責(zé)挑戰(zhàn)航空安全,警方已介入

博主曝光多地?zé)o人機(jī)“黑飛”至8000米高空,知名藝人斥責(zé)挑戰(zhàn)航空安全,警方已介入

極目新聞
2025-12-09 19:38:14
一百來萬撿漏法國古堡?中國明星富豪集體拋售酒莊,投資血本無歸

一百來萬撿漏法國古堡?中國明星富豪集體拋售酒莊,投資血本無歸

長星寄明月
2025-11-28 13:01:27
皇馬畸形的雙核模式或只能讓阿隆索敗走伯納烏

皇馬畸形的雙核模式或只能讓阿隆索敗走伯納烏

K唐伯虎
2025-12-09 07:08:46
147:5!中俄反對(duì)無效,聯(lián)大通過決議,日本要求中國“自廢武功”

147:5!中俄反對(duì)無效,聯(lián)大通過決議,日本要求中國“自廢武功”

混沌錄
2025-12-05 22:20:08
王勵(lì)勤終于做出行動(dòng)!國乒大改革斬?cái)囡埲ξ幕?,樊振東開心了

王勵(lì)勤終于做出行動(dòng)!國乒大改革斬?cái)囡埲ξ幕?,樊振東開心了

順靜自然
2025-12-09 09:06:59
張柏芝官方回應(yīng)庭審現(xiàn)場狀況:根本沒有失控大哭,只表達(dá)委屈無奈

張柏芝官方回應(yīng)庭審現(xiàn)場狀況:根本沒有失控大哭,只表達(dá)委屈無奈

深析古今
2025-12-09 09:34:31
2025-12-10 04:31:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11881文章數(shù) 142509關(guān)注度
往期回顧 全部

科技要聞

H200是不是要讓中國“上癮”?

頭條要聞

31歲中國女留學(xué)生讓26歲外籍男友檢測性病 遭殘忍殺害

頭條要聞

31歲中國女留學(xué)生讓26歲外籍男友檢測性病 遭殘忍殺害

體育要聞

“蘇炳添時(shí)代”正式畫上句號(hào)

娛樂要聞

尖叫之夜劉宇寧打包餅干被嘲寒酸?

財(cái)經(jīng)要聞

縣城經(jīng)濟(jì)神話,夢醒時(shí)分

汽車要聞

旗艦巨作 鴻蒙智行首款MPV智界V9信息披露

態(tài)度原創(chuàng)

游戲
家居
親子
教育
公開課

里昂還是來了!《生化危機(jī)9》新視覺圖泄露

家居要聞

現(xiàn)代手法 詮釋東方文化

親子要聞

拎上帽子就出發(fā)!

教育要聞

我的感覺是這樣,你看了視頻什么感覺

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 俺也去婷婷网| 亚洲 无码 制服 丝袜 自拍| 日韩精品无码去免费专区| 日韩中文字幕综合第二页| 黑人和亚洲女人精品| 国产免费拔擦拔擦8x高清在线人| 无码成人精品区一级毛片 | 天堂acv在线免费| 国产精品老熟女免费| 日本高清视频色欧WWW| 操操操操操操人妻| 精品视频国产香蕉尹人视频| 亚洲国产成人无码电影| 黑人巨大娇小6一12xxxx| 精品无码秘 人妻一区二区| 国产成人精品亚洲日本在线观看 | Av成人片乱码色午夜| 人妻丰满av无码中文字幕| 草草剧院在线| JAPANESE70MATURE老妇| 97国内精品久久久久不卡| 丁香婷婷六月天| 玩弄邻居少妇高潮大叫| 亚洲日韩欧洲无码AV夜夜摸| 久久综合av免费观看| 成人午夜激情在线观看| 奇米7777影视播放器| 日本α级视频| 六月婷亚洲男人的天堂| 亚洲精品成人久久久| 免费亚洲无码视频在线| 亚洲欧美日韩三区| 99jiujiure在线视频| 又大又长又黄AV| 国产日韩呻吟高潮99久久| 亚欧熟女乱色一二三区日韩| 亚洲欧美中文日韩在线v日本| 久热这里只有精品99在线观看| 熟女激情一区| 免费激情AV| 亚洲色大成网站www看下面|