夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

東京大學(xué)、牛津大學(xué)等聯(lián)合發(fā)布VLA萬(wàn)字綜述:機(jī)器人邁向通用智能的全棧指南

0
分享至

文章來(lái)源:我愛(ài)計(jì)算機(jī)視覺(jué)(ID:aicvml)

當(dāng)大語(yǔ)言模型(LLM)和視覺(jué)語(yǔ)言模型(VLM)的能力不斷溢出到機(jī)器人領(lǐng)域,一個(gè)激動(dòng)人心的新方向——視覺(jué)-語(yǔ)言-動(dòng)作(Vision-Language-Action, VLA)模型,正成為通往通用機(jī)器人之路的關(guān)鍵鑰匙。最近,來(lái)自東京大學(xué)、牛津大學(xué)和德克薩斯大學(xué)奧斯汀分校的研究者們聯(lián)手,在《IEEE Access》上發(fā)表了一篇極為全面的綜述,系統(tǒng)性地梳理了VLA模型的全貌。

這不僅僅是一篇簡(jiǎn)單的文獻(xiàn)回顧,更是一份面向真實(shí)世界應(yīng)用的“全棧式”指南,涵蓋了從軟件算法到硬件平臺(tái)、從數(shù)據(jù)收集到模型評(píng)估的方方面面。CV君覺(jué)得,對(duì)于任何想要了解或投身于具身智能領(lǐng)域的研究者和工程師來(lái)說(shuō),這篇論文都將是一份寶貴的參考資料。



  • 論文 : Vision-Language-Action Models for Robotics: A Review Towards Real-World Applications

  • 作者 : Kento Kawaharazuka, Jihoon Oh, Jun Yamada, Ingmar Posner, Yuke Zhu

  • 機(jī)構(gòu) : 東京大學(xué)、牛津大學(xué)、德克薩斯大學(xué)奧斯汀分校

  • 論文地址 : https://arxiv.org/abs/2510.07077

  • 項(xiàng)目主頁(yè) : https://vla-survey.github.io

VLA模型:機(jī)器人通往通用之路的基石

在過(guò)去,機(jī)器人系統(tǒng)通常將感知、語(yǔ)言理解和動(dòng)作執(zhí)行解耦處理,這限制了其在復(fù)雜、未知任務(wù)中的泛化能力。而VLA模型的出現(xiàn),旨在打破這些模態(tài)之間的壁壘。

簡(jiǎn)單來(lái)說(shuō),VLA模型是一個(gè)統(tǒng)一的端到端框架,它接收視覺(jué)觀察(看什么)和自然語(yǔ)言指令(做什么)作為輸入,并直接生成機(jī)器人的控制動(dòng)作(怎么做)。其核心目標(biāo)是學(xué)習(xí)一個(gè)能夠跨越不同任務(wù)、物體、機(jī)器人形態(tài)和環(huán)境的通用策略,從而讓機(jī)器人僅需少量甚至無(wú)需額外的任務(wù)數(shù)據(jù),就能靈活、可擴(kuò)展地部署于真實(shí)世界。

這篇綜述的結(jié)構(gòu)非常清晰,從VLA模型面臨的核心挑戰(zhàn)出發(fā),系統(tǒng)地回顧了其發(fā)展歷程、關(guān)鍵技術(shù)和未來(lái)方向。


VLA模型的演進(jìn)之路

VLA模型的發(fā)展并非一蹴而就,論文通過(guò)一張時(shí)間線圖清晰地展示了其技術(shù)演進(jìn)脈絡(luò)。



  • 早期CNN ?? ?? : 以CLIPort為代表,首次嘗試將預(yù)訓(xùn)練的VLM(如CLIP)用于提取視覺(jué)和語(yǔ)言特征,實(shí)現(xiàn)了端到端的物體操縱。但基于CNN的架構(gòu)在統(tǒng)一多模態(tài)信息和擴(kuò)展性方面存在瓶頸。

  • 基于Transformer和VLM的規(guī)模化策略 : 隨著Transformer架構(gòu)的興起,以谷歌的RT-1、RT-2為代表的模型,利用大規(guī)模真實(shí)世界數(shù)據(jù)進(jìn)行訓(xùn)練,并借助強(qiáng)大VLM(如PaLM-E)作為骨干網(wǎng)絡(luò),展現(xiàn)了出色的泛化能力。這一時(shí)期的代表作還有OpenVLA,它成為了一個(gè)主流的開(kāi)源VLA架構(gòu)。

  • 擴(kuò)散/流匹配技術(shù)的融合 : 為了生成更平滑、更連續(xù)的動(dòng)作,Octo、RDT-1B、π0等模型將擴(kuò)散模型(Diffusion Models)或流匹配(Flow Matching)技術(shù)集成到動(dòng)作解碼器中,顯著提升了機(jī)器人控制的實(shí)時(shí)性和穩(wěn)定性。

  • 近期趨勢(shì):潛在動(dòng)作與層級(jí)控制 : 最新的研究,如LAPA、π0.5、GR00T N1,則開(kāi)始關(guān)注從視頻中學(xué)習(xí)潛在動(dòng)作(Latent Action)以及構(gòu)建層級(jí)控制策略,旨在將高層的任務(wù)規(guī)劃與底層的電機(jī)執(zhí)行更優(yōu)雅地結(jié)合起來(lái)。

VLA核心架構(gòu):三大主流范式

論文將現(xiàn)有的VLA模型歸納為三大核心架構(gòu):傳感器-動(dòng)作模型、世界模型和可供性模型。


傳感器-動(dòng)作模型 (Sensorimotor Models)

這是最直接、最主流的VLA架構(gòu),它將視覺(jué)、語(yǔ)言等傳感器輸入直接映射到動(dòng)作輸出。論文進(jìn)一步細(xì)分了七種具體的實(shí)現(xiàn)方式,展示了該領(lǐng)域架構(gòu)設(shè)計(jì)的多樣性。


從最初的“Transformer + 離散動(dòng)作”到最新的“VLM + 擴(kuò)散Transformer”,我們可以看到一條清晰的技術(shù)路線:模型骨干從零開(kāi)始訓(xùn)練的Transformer演變?yōu)槔没ヂ?lián)網(wǎng)數(shù)據(jù)預(yù)訓(xùn)練的VLM,動(dòng)作表示也從離散的Token演變?yōu)橛蓴U(kuò)散或流匹配生成的連續(xù)控制信號(hào)。

世界模型 (World Models)

與直接輸出動(dòng)作不同,世界模型的核心思想是“預(yù)測(cè)未來(lái)”。它根據(jù)當(dāng)前的觀察和語(yǔ)言指令,預(yù)測(cè)未來(lái)世界的感官狀態(tài)(如未來(lái)的圖像序列)。然后,基于這些預(yù)測(cè)來(lái)規(guī)劃和生成動(dòng)作。這種方式使得機(jī)器人具備了更強(qiáng)的規(guī)劃和多模態(tài)推理能力。


可供性模型 (Affordance-based Models)

“可供性”(Affordance)是一個(gè)源于心理學(xué)的概念,指環(huán)境為行動(dòng)者提供的行動(dòng)可能性。在機(jī)器人領(lǐng)域,它表示物體或場(chǎng)景的可操作屬性??晒┬阅P褪紫然谡Z(yǔ)言指令預(yù)測(cè)出環(huán)境中的可供性(例如,一個(gè)杯子“可以被拿起”的區(qū)域),然后基于這些可供性來(lái)生成具體動(dòng)作。這種方式讓機(jī)器人的行為更具解釋性和魯棒性。


VLA模型的訓(xùn)練與實(shí)現(xiàn)

訓(xùn)練一個(gè)強(qiáng)大的VLA模型,離不開(kāi)有效的學(xué)習(xí)范式。論文總結(jié)了三種主流策略:

  • 監(jiān)督學(xué)習(xí) : 這是最主要的方式,通常以模仿學(xué)習(xí)(Imitation Learning)的形式,在“圖像-語(yǔ)言-動(dòng)作”配對(duì)的數(shù)據(jù)集上進(jìn)行訓(xùn)練。

  • 自監(jiān)督學(xué)習(xí) : 用于學(xué)習(xí)模態(tài)間的一致性(如語(yǔ)言指令與目標(biāo)圖像的對(duì)齊)或從無(wú)標(biāo)簽數(shù)據(jù)中學(xué)習(xí)有意義的表征(如從人類(lèi)視頻中學(xué)習(xí)潛在動(dòng)作)。

  • 強(qiáng)化學(xué)習(xí) (RL) : RL常用于微調(diào)通過(guò)模仿學(xué)習(xí)預(yù)訓(xùn)練好的VLA模型,以提升其在真實(shí)世界中的魯棒性和成功率,或用于訓(xùn)練底層控制器。

邁向真實(shí)世界:全棧視角

這篇綜述最具價(jià)值的部分之一,就是它提供了一個(gè)完整的“全?!币暯?,詳細(xì)討論了將VLA模型部署到真實(shí)世界所涉及的各個(gè)環(huán)節(jié)。



  • 機(jī)器人平臺(tái) : 涵蓋了機(jī)械臂、靈巧手、移動(dòng)機(jī)器人、四足機(jī)器人和人形機(jī)器人等VLA研究中常用的硬件。

  • 數(shù)據(jù)收集 : 介紹了遙操作、代理設(shè)備(Proxy Devices)和人類(lèi)數(shù)據(jù)收集等多種方法。

  • 公開(kāi)數(shù)據(jù)集 : 系統(tǒng)整理了近年來(lái)用于VLA研究的真實(shí)世界機(jī)器人數(shù)據(jù)集,這對(duì)研究者來(lái)說(shuō)是極為寶貴的資源。

  • 評(píng)估基準(zhǔn) : 同樣,論文也匯總了主流的VLA評(píng)估仿真環(huán)境及其關(guān)鍵特性,為模型的公平比較提供了依據(jù)。

總結(jié)

CV君認(rèn)為,這篇綜述通過(guò)對(duì)VLA模型進(jìn)行系統(tǒng)性的全棧式梳理,不僅清晰地描繪了該領(lǐng)域的技術(shù)圖景和發(fā)展脈絡(luò),還為研究者和工程師提供了極具價(jià)值的實(shí)踐指南。它就像一張?jiān)敿?xì)的地圖,指引著我們?nèi)绾卧赩LA這個(gè)充滿機(jī)遇與挑戰(zhàn)的新大陸上探索。

大家對(duì)VLA模型的未來(lái)怎么看?歡迎在評(píng)論區(qū)分享你的見(jiàn)解!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
鏡報(bào):曼聯(lián)高層與多名一線球員進(jìn)行了會(huì)談,討論俱樂(lè)部的現(xiàn)狀

鏡報(bào):曼聯(lián)高層與多名一線球員進(jìn)行了會(huì)談,討論俱樂(lè)部的現(xiàn)狀

懂球帝
2025-10-13 03:25:06
吳石就義,陳誠(chéng)自覺(jué)愧對(duì)故人,暗中幫助吳家,2000年后細(xì)節(jié)才披露

吳石就義,陳誠(chéng)自覺(jué)愧對(duì)故人,暗中幫助吳家,2000年后細(xì)節(jié)才披露

小港哎歷史
2025-10-13 08:40:03
建議中老年人:早餐少吃饅頭和稀飯,多吃這4樣,營(yíng)養(yǎng)又健康

建議中老年人:早餐少吃饅頭和稀飯,多吃這4樣,營(yíng)養(yǎng)又健康

小童歷史
2025-10-09 11:35:07
廣州的廖一帆爸爸火了,因?yàn)樗议_(kāi)了家委會(huì)的真相

廣州的廖一帆爸爸火了,因?yàn)樗议_(kāi)了家委會(huì)的真相

清暉有墨
2025-09-05 19:24:18
蒸螃蟹幾分鐘?冷水還是熱水?很多人都錯(cuò),難怪螃蟹散黃不鮮美

蒸螃蟹幾分鐘?冷水還是熱水?很多人都錯(cuò),難怪螃蟹散黃不鮮美

阿龍美食記
2025-10-03 20:19:02
力拓與必和必拓對(duì)人民幣結(jié)算的截然不同態(tài)度背后的股權(quán)戰(zhàn)爭(zhēng)分析。

力拓與必和必拓對(duì)人民幣結(jié)算的截然不同態(tài)度背后的股權(quán)戰(zhàn)爭(zhēng)分析。

丹徒生
2025-10-07 09:34:15
反擊美國(guó)“變臉” 普京即將公布神秘新武器是什么?

反擊美國(guó)“變臉” 普京即將公布神秘新武器是什么?

環(huán)球網(wǎng)資訊
2025-10-12 15:44:02
東莞市公安局黨委委員、副局長(zhǎng)肖漢華接受紀(jì)律審查和監(jiān)察調(diào)查

東莞市公安局黨委委員、副局長(zhǎng)肖漢華接受紀(jì)律審查和監(jiān)察調(diào)查

極目新聞
2025-10-13 09:19:04
江蘇這條高速將于年底開(kāi)工,計(jì)劃2027年建成,可為江宜高速分流!

江蘇這條高速將于年底開(kāi)工,計(jì)劃2027年建成,可為江宜高速分流!

白淺娛樂(lè)聊
2025-10-13 01:28:07
54歲突然發(fā)現(xiàn),許多中產(chǎn)家庭漸漸窮回去了,以下兩個(gè)征兆,要警惕

54歲突然發(fā)現(xiàn),許多中產(chǎn)家庭漸漸窮回去了,以下兩個(gè)征兆,要警惕

雪雪呀
2025-08-11 08:41:29
楊蘭蘭是誰(shuí)?10層迷霧揭開(kāi)后,她可能根本就不是人

楊蘭蘭是誰(shuí)?10層迷霧揭開(kāi)后,她可能根本就不是人

吃瓜盟主
2025-09-11 14:48:46
任家萱為友人慶生,抱著兒子腹部好凸似懷二胎,男友露面變好看了

任家萱為友人慶生,抱著兒子腹部好凸似懷二胎,男友露面變好看了

小咪侃娛圈
2025-10-13 09:17:57
45歲大姐在國(guó)外當(dāng)保姆15年,雇主臨別塞信封,她拆開(kāi)一看竟不是錢(qián)

45歲大姐在國(guó)外當(dāng)保姆15年,雇主臨別塞信封,她拆開(kāi)一看竟不是錢(qián)

蘭姐說(shuō)故事
2025-09-23 05:05:07
全球熱議!外媒回過(guò)神集體報(bào)道殲-16鎖定F-22A,基本都沒(méi)人相信?

全球熱議!外媒回過(guò)神集體報(bào)道殲-16鎖定F-22A,基本都沒(méi)人相信?

軍機(jī)Talk
2025-10-11 14:35:41
中美之間到底在爭(zhēng)奪什么?

中美之間到底在爭(zhēng)奪什么?

流蘇晚晴
2025-08-25 21:37:04
舉重世錦賽中國(guó)3金收官,女隊(duì)0金,朝鮮狂攬17金破10項(xiàng)世界紀(jì)錄

舉重世錦賽中國(guó)3金收官,女隊(duì)0金,朝鮮狂攬17金破10項(xiàng)世界紀(jì)錄

米修體育
2025-10-12 15:41:27
吹噓澤連斯基是英雄、最偉大的政治家,你們的良心不會(huì)痛嗎

吹噓澤連斯基是英雄、最偉大的政治家,你們的良心不會(huì)痛嗎

素衣讀史
2025-10-12 18:11:33
古人指出北平建都有巨大弊端,毛主席也猶豫,一高人幫他下定決心

古人指出北平建都有巨大弊端,毛主席也猶豫,一高人幫他下定決心

沈言論
2025-09-25 13:45:03
冰火兩重天!華為路測(cè)L3自動(dòng)駕駛,288萬(wàn)輛特斯拉FSD被美國(guó)大規(guī)模調(diào)查

冰火兩重天!華為路測(cè)L3自動(dòng)駕駛,288萬(wàn)輛特斯拉FSD被美國(guó)大規(guī)模調(diào)查

大白聊IT
2025-10-13 00:10:46
通脹之下你的錢(qián)正在 “蒸發(fā)”!這3種資產(chǎn)才是普通人最好的保護(hù)傘

通脹之下你的錢(qián)正在 “蒸發(fā)”!這3種資產(chǎn)才是普通人最好的保護(hù)傘

小白鴿財(cái)經(jīng)
2025-10-10 09:16:17
2025-10-13 09:56:49
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識(shí),交流思想
5157文章數(shù) 64593關(guān)注度
往期回顧 全部

科技要聞

海外子公司被荷蘭凍結(jié) 聞泰科技:堅(jiān)決反對(duì)

頭條要聞

美防長(zhǎng)稱(chēng)外國(guó)要在美國(guó)本土建軍事基地 惹怒特朗普擁躉

頭條要聞

美防長(zhǎng)稱(chēng)外國(guó)要在美國(guó)本土建軍事基地 惹怒特朗普擁躉

體育要聞

表兄弟決賽相遇,他們?cè)谏虾?chuàng)造黑馬奇跡

娛樂(lè)要聞

娜扎被搶休息室,網(wǎng)友扒出疑似林允

財(cái)經(jīng)要聞

三大指數(shù)均大幅低開(kāi) 創(chuàng)業(yè)板指跌4.44%

汽車(chē)要聞

1.5T動(dòng)力/尺寸越級(jí) 國(guó)民家轎第5代帝豪首秀亮相

態(tài)度原創(chuàng)

游戲
家居
時(shí)尚
房產(chǎn)
軍事航空

無(wú)人觸及 《33號(hào)遠(yuǎn)征隊(duì)》總監(jiān)稱(chēng)還有彩蛋沒(méi)人發(fā)現(xiàn)

家居要聞

空間藝術(shù) 星河宇宙之旅

60歲阿姨靠穿搭火了!“簡(jiǎn)約款”穿出高級(jí)感,自然老去也很美

房產(chǎn)要聞

大利好來(lái)了!海南安居房擬出新政!

軍事要聞

金正恩連續(xù)八次深夜閱兵 "大殺器"亮相

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 国产极品粉嫩尤物一区二区| 国产精品伦一区二区三区免费看| 婷婷久久一区| 大陆极品少妇内射aaaaa| 欧美成人免费全部观看| 国产精品私拍99pans大尺度| 亚洲免费高清专区一区二区| 国精产品52永久一区一区| 国产欧美日韩亚洲精品区| 亚洲丝袜AV| 久久夕老熟女一区二区三区| 亚洲av成人无码天堂| 色欲天天天综合网在线观看| 美女裸体十八禁免费网站| 欧美日本亚洲| 天天操夜夜夜骑操中合网| 国产精品私拍99pans大尺度| 性生生活大片又黄又| 精品人妻一区二区三区在线浪潮| 欧美交换配乱吟粗大25p| 俺也去开心五月深深爱| 岛国av无码中文久久精品成人| 日韩精品免费一线在线观看| 中文字幕一区二区三区乱码图片| 狠狠色噜噜狠狠狠狠777米奇| 亚洲一区二区蜜臀中出| 亚洲国产精品久久久久秋霞小| 67194成l人在线观看线路无码| 亚洲精品一区久久久久久| 中文字幕av一区二区三区人妻少妇| 9久久伊人精品综合| 男人的天堂亚洲区| 无码中文人妻在线三区| 伊人久久一区二区三区无码| 国产特黄A三级三级三级| 日本成人午夜在线观看| 亚洲中文字幕av每天更新| 真实乱偷全部视频| 亚洲精品成人影院| 国产精品视频分类| 国产在线第一区二区三区|