夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

豐田研究院發(fā)布機(jī)器人大行為模型研究,單一模型掌握數(shù)百項(xiàng)任務(wù)

0
分享至

豐田研究院(TRI,Toyota Research Institute)近日發(fā)布了一項(xiàng)關(guān)于大行為模型(LBMs,Large Behavior Models)研究成果,這項(xiàng)技術(shù)或有望給機(jī)器人的學(xué)習(xí)方式重大變革。研究顯示,通過預(yù)訓(xùn)練的 LBMs,機(jī)器人可以在學(xué)習(xí)新任務(wù)時(shí)減少高達(dá)80% 的數(shù)據(jù)需求,單一模型能夠掌握數(shù)百項(xiàng)不同的操作技能。相關(guān)論文以《大行為模型多任務(wù)靈巧操作的細(xì)致檢驗(yàn)》(A Careful Examination of Large Behavior Models for Multitask Dexterous Manipulation)發(fā)表在arXiv上。


圖丨相關(guān)論文(來(lái)源:arXiv)

研究的作者之一,豐田研究院副總裁、美國(guó)麻省理工學(xué)院教授 Russ Tedrake 在社交媒體上表示:“LBMs 確實(shí)有效!隨著預(yù)訓(xùn)練數(shù)據(jù)量的增加,我們看到了一致且具有統(tǒng)計(jì)學(xué)意義的改進(jìn)?!?/p>


圖丨相關(guān)推文(來(lái)源:X)

傳統(tǒng)的機(jī)器人訓(xùn)練方法存在諸多限制:每個(gè)任務(wù)都需要單獨(dú)編程,學(xué)習(xí)過程緩慢且不一致,往往局限于狹窄定義的任務(wù)和高度受限的環(huán)境。相比之下,LBMs 采用了類似于大語(yǔ)言模型(LLMs,Large Language Models)的架構(gòu)思路,但專門針對(duì)機(jī)器人的物理操作行為進(jìn)行優(yōu)化。

TRI 此次研究采用的 LBM 架構(gòu),是一種基于擴(kuò)散模型和 Transformer 的復(fù)雜神經(jīng)網(wǎng)絡(luò)。它能夠整合來(lái)自多路攝像頭(包括機(jī)器人手腕和場(chǎng)景攝像頭)的視覺信息、機(jī)器人自身的姿態(tài)和位置等本體感知數(shù)據(jù),以及人類通過自然語(yǔ)言下達(dá)的任務(wù)指令。這個(gè)多模態(tài)系統(tǒng)通過學(xué)習(xí),直接輸出機(jī)器人需要執(zhí)行的一系列連貫、精確的動(dòng)作指令。具體來(lái)說(shuō),這些模型能夠一次性預(yù)測(cè)未來(lái) 16 個(gè)時(shí)間步(約 1.6 秒)的動(dòng)作序列,從而實(shí)現(xiàn)平滑而具有預(yù)見性的操作。


(來(lái)源:arXiv)

為了驗(yàn)證 LBMs 的有效性,研究團(tuán)隊(duì)在近 1,700 小時(shí)的機(jī)器人演示數(shù)據(jù)上訓(xùn)練了多個(gè) LBMs,這些數(shù)據(jù)包括 468 小時(shí)的內(nèi)部收集雙臂機(jī)器人遙操作數(shù)據(jù)、45 小時(shí)的仿真收集遙操作數(shù)據(jù)、32 小時(shí)的通用操作接口(UMI,Universal Manipulation Interface)數(shù)據(jù),以及約 1,150 小時(shí)從 Open X-Embodiment 數(shù)據(jù)集中精選的互聯(lián)網(wǎng)數(shù)據(jù)。

在評(píng)估環(huán)節(jié),研究團(tuán)隊(duì)進(jìn)行了 1,800 次真實(shí)世界評(píng)估試驗(yàn)和超過 47,000 次仿真試驗(yàn),覆蓋 29個(gè)不同任務(wù)。為確保結(jié)果的可靠性,他們采用了盲測(cè) A/B 測(cè)試方法,并建立了新的統(tǒng)計(jì)評(píng)估框架來(lái)確??绮煌蝿?wù)和設(shè)置的結(jié)果置信度。


(來(lái)源:arXiv)

研究中使用的硬件平臺(tái)基于 Franka Panda FR3 機(jī)械臂的雙臂操作系統(tǒng),配備多達(dá)六個(gè)攝像頭——每個(gè)手腕最多兩個(gè),以及兩個(gè)靜態(tài)場(chǎng)景攝像頭。在感知層面,模型使用預(yù)訓(xùn)練的 CLIP 視覺變換器提取圖像特征,并通過 CLIP 文本編碼器處理任務(wù)描述的語(yǔ)言特征。這些視覺和語(yǔ)言特征與本體感受信息以及擴(kuò)散時(shí)間步編碼相結(jié)合,形成觀察特征。

在動(dòng)作生成方面,LBMs 采用去噪擴(kuò)散隱式模型(DDIM,Denoising Diffusion Implicit Models)來(lái)生成連續(xù)的機(jī)器人動(dòng)作。通過 K 步迭代去噪過程,從高斯噪聲樣本開始,逐步生成精確的動(dòng)作序列。

研究得出了三個(gè)關(guān)鍵發(fā)現(xiàn)。首先,微調(diào)后的 LBMs 在已見任務(wù)上的表現(xiàn)始終優(yōu)于單任務(wù)基線模型。在名義條件和分布偏移條件下,無(wú)論是在仿真還是真實(shí)世界環(huán)境中,微調(diào)的 LBM 都表現(xiàn)出統(tǒng)計(jì)學(xué)上的顯著優(yōu)勢(shì)。

其次,LBMs 展現(xiàn)出更強(qiáng)的魯棒性。當(dāng)引入分布偏移時(shí),雖然整體任務(wù)性能有所下降,但微調(diào)的 LBMs 比從零開始訓(xùn)練的策略表現(xiàn)出更強(qiáng)的適應(yīng)能力。在仿真環(huán)境中,LBMs 在分布偏移條件下統(tǒng)計(jì)上優(yōu)于單任務(wù)策略的比例從名義條件下的 3/16 提升到 10/16。

第三,也是最重要的發(fā)現(xiàn)是,LBMs 能夠顯著減少學(xué)習(xí)新任務(wù)所需的數(shù)據(jù)量。研究表明,要在仿真中達(dá)到相似的性能水平,需對(duì) LBM 進(jìn)行微調(diào)。所需的數(shù)據(jù)量不到從零開始訓(xùn)練所需數(shù)據(jù)的 30%。在真實(shí)世界任務(wù)中,這一優(yōu)勢(shì)更加明顯——LBM 僅用 15% 的數(shù)據(jù)就能超越使用全部數(shù)據(jù)訓(xùn)練的單任務(wù)基線模型。

研究還驗(yàn)證了 LBM 的 Scaling Law。通過使用不同比例的預(yù)訓(xùn)練數(shù)據(jù),研究人員發(fā)現(xiàn)隨著預(yù)訓(xùn)練數(shù)據(jù)量的增加,模型性能穩(wěn)步提升。即使在當(dāng)前的數(shù)據(jù)規(guī)模下,研究人員也沒有發(fā)現(xiàn)性能的不連續(xù)性或急劇拐點(diǎn),這表明人工智能擴(kuò)展在機(jī)器人學(xué)習(xí)領(lǐng)域同樣有效。


圖丨LBM 上的 Scaling Law(來(lái)源:arXiv)

為了測(cè)試 LBMs 的能力極限,研究團(tuán)隊(duì)還設(shè)計(jì)了多種復(fù)雜的長(zhǎng)期任務(wù)。例如,“切蘋果”任務(wù)要求機(jī)器人使用蘋果取芯器給蘋果去核,從器具架中取出刀具,拔出刀鞘將蘋果切成兩半,再將兩半切成片,最后用布擦拭刀具并重新裝鞘放回器具架。在這類復(fù)雜任務(wù)中,LBMs 同樣展現(xiàn)出了優(yōu)于傳統(tǒng)方法的性能。

這項(xiàng)研究的一個(gè)重要貢獻(xiàn)是強(qiáng)調(diào)了統(tǒng)計(jì)嚴(yán)格性在機(jī)器人學(xué)習(xí)評(píng)估中的重要性。研究團(tuán)隊(duì)指出,許多機(jī)器人學(xué)習(xí)論文可能由于統(tǒng)計(jì)功效不足而測(cè)量的是統(tǒng)計(jì)噪聲而非真實(shí)效果。他們展示了在不同試驗(yàn)次數(shù)和真實(shí)成功率下的置信區(qū)間寬度:以 50 次試驗(yàn)為例,得到的置信區(qū)間寬度通常為 20%-30% 的絕對(duì)成功率,這使得除了最大規(guī)模的效應(yīng)之外,其他效應(yīng)都無(wú)法可靠測(cè)量。

為了解決這一問題,研究團(tuán)隊(duì)采用了貝葉斯分析方法,使用均勻 Beta 先驗(yàn)計(jì)算成功率的后驗(yàn)分布,并通過緊湊字母顯示(CLD,Compact Letter Display)方法指示統(tǒng)計(jì)顯著性。這種方法為機(jī)器人學(xué)習(xí)領(lǐng)域設(shè)立了新的評(píng)估標(biāo)準(zhǔn)。

研究結(jié)果表明,即使在數(shù)據(jù)規(guī)模相對(duì)較小的情況下,預(yù)訓(xùn)練也能帶來(lái)一致的性能提升。這使得建立數(shù)據(jù)獲取和性能提升的良性循環(huán)得以可能。隨著更多任務(wù)被納入預(yù)訓(xùn)練混合數(shù)據(jù)中,LBM 的整體性能將持續(xù)平穩(wěn)改善。然而,研究也發(fā)現(xiàn)了一些局限性。非微調(diào)的預(yù)訓(xùn)練 LBMs 表現(xiàn)參差不齊,這部分歸因于模型語(yǔ)言引導(dǎo)能力的局限性。

研究團(tuán)隊(duì)表示,在內(nèi)部測(cè)試中,更大的視覺-語(yǔ)言行為原型在克服這一困難方面顯示出良好前景,但需要更多工作來(lái)嚴(yán)格驗(yàn)證這一效果。此外,數(shù)據(jù)標(biāo)準(zhǔn)化等看似次要的設(shè)計(jì)選擇對(duì)下游性能有重大影響,往往超過架構(gòu)或算法改進(jìn)的影響,提醒研究者在比較方法時(shí)需要仔細(xì)隔離這些設(shè)計(jì)選擇,避免混淆性能變化的來(lái)源。

參考資料:

1.https://arxiv.org/pdf/2507.05331

2.https://toyotaresearchinstitute.github.io/lbm1/

3.https://x.com/RussTedrake/status/1942931808422875640

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
人心不足蛇吞象!人民日?qǐng)?bào)點(diǎn)名,揭開全紅嬋真實(shí)處境,誤會(huì)太深

人心不足蛇吞象!人民日?qǐng)?bào)點(diǎn)名,揭開全紅嬋真實(shí)處境,誤會(huì)太深

張鴘喜歡軟軟糯糯
2025-08-07 05:58:03
最低調(diào)普京女婿被億萬(wàn)富豪當(dāng)街暴打:拒絕10億賠償,只提一個(gè)要求

最低調(diào)普京女婿被億萬(wàn)富豪當(dāng)街暴打:拒絕10億賠償,只提一個(gè)要求

刀刃故事
2024-11-11 10:40:21
大女兒結(jié)婚李連杰曬30萬(wàn)的陪嫁車引群嘲“還有臉曬”

大女兒結(jié)婚李連杰曬30萬(wàn)的陪嫁車引群嘲“還有臉曬”

娛樂小丸子
2025-08-08 21:03:46
警惕!這3家合資車退出中國(guó),超過60萬(wàn)車主正面臨無(wú)處修車的困境

警惕!這3家合資車退出中國(guó),超過60萬(wàn)車主正面臨無(wú)處修車的困境

行遠(yuǎn)走天下
2025-08-07 17:27:52
胖東來(lái)擬留20個(gè)崗位給有犯罪前科人員,當(dāng)?shù)厝松绮块T回應(yīng)

胖東來(lái)擬留20個(gè)崗位給有犯罪前科人員,當(dāng)?shù)厝松绮块T回應(yīng)

界面新聞
2025-08-08 16:05:38
重慶女孩考公差1分,調(diào)檔時(shí)領(lǐng)導(dǎo)瞥見材料備注,瞬間驚出冷汗

重慶女孩考公差1分,調(diào)檔時(shí)領(lǐng)導(dǎo)瞥見材料備注,瞬間驚出冷汗

今天說(shuō)故事
2025-08-02 17:58:12
全網(wǎng)通緝!理想車主天塌了

全網(wǎng)通緝!理想車主天塌了

李東陽(yáng)朋友圈
2025-08-08 14:37:01
女子洗頭被摸后續(xù):視頻曝光很炸裂,當(dāng)事員工崩潰,她被扒是慣犯

女子洗頭被摸后續(xù):視頻曝光很炸裂,當(dāng)事員工崩潰,她被扒是慣犯

興史興談
2025-08-09 07:31:37
廣東:兜里一分錢都沒有,男子去花了1074元,讓朋友救急買單不還

廣東:兜里一分錢都沒有,男子去花了1074元,讓朋友救急買單不還

大蘇專欄
2025-08-08 20:46:37
名嘴:除非湖人能得到字母或約基奇,否則詹姆斯可能是東契奇生涯最好隊(duì)友

名嘴:除非湖人能得到字母或約基奇,否則詹姆斯可能是東契奇生涯最好隊(duì)友

雷速體育
2025-08-09 11:54:52
越南真慌了,從10月15日起,對(duì)中國(guó)公民實(shí)施單方面免簽入境政策

越南真慌了,從10月15日起,對(duì)中國(guó)公民實(shí)施單方面免簽入境政策

荊楚寰宇文樞
2025-08-08 23:20:14
45歲大叔相親32歲女子,女方提出進(jìn)行試婚,當(dāng)晚他就冷汗直流

45歲大叔相親32歲女子,女方提出進(jìn)行試婚,當(dāng)晚他就冷汗直流

五元講堂
2025-04-28 11:30:57
震撼爆料!克萊申請(qǐng)買斷投奔火箭,底薪加盟只為與杜蘭特復(fù)仇奪冠

震撼爆料!克萊申請(qǐng)買斷投奔火箭,底薪加盟只為與杜蘭特復(fù)仇奪冠

縱人離
2025-08-09 13:37:09
全網(wǎng)勸離的“雞蛋”事件后續(xù):妻子哽咽發(fā)聲,踩中三大婚姻雷區(qū)

全網(wǎng)勸離的“雞蛋”事件后續(xù):妻子哽咽發(fā)聲,踩中三大婚姻雷區(qū)

千潯觀點(diǎn)
2025-08-09 04:02:47
男籃亞洲杯最尷尬一幕!2800000000比39:中國(guó)隊(duì)都救不了他們?

男籃亞洲杯最尷尬一幕!2800000000比39:中國(guó)隊(duì)都救不了他們?

籃球快餐車
2025-08-08 18:19:46
徐杰談解說(shuō)首秀:比打球還累 看比賽時(shí)會(huì)思考如果是自己會(huì)怎么做

徐杰談解說(shuō)首秀:比打球還累 看比賽時(shí)會(huì)思考如果是自己會(huì)怎么做

直播吧
2025-08-09 21:30:21
91年原39軍副軍長(zhǎng)訪問朝鮮,臨走時(shí)卻被金日成攔住:你還不能離開

91年原39軍副軍長(zhǎng)訪問朝鮮,臨走時(shí)卻被金日成攔?。耗氵€不能離開

說(shuō)一說(shuō)歷史
2025-08-09 12:06:21
趙薇大粉曝其離婚原因!被拖兩年沒利用價(jià)值才離婚,男方已組建家庭

趙薇大粉曝其離婚原因!被拖兩年沒利用價(jià)值才離婚,男方已組建家庭

八星人
2025-08-08 16:13:33
不斷挑戰(zhàn)底線,涼涼不可避免!香港一步步失去了內(nèi)地游客的市場(chǎng)!

不斷挑戰(zhàn)底線,涼涼不可避免!香港一步步失去了內(nèi)地游客的市場(chǎng)!

青眼財(cái)經(jīng)
2025-08-07 23:48:28
普京做出最大讓步,只要特朗普肯點(diǎn)頭,他就交出一半烏克蘭領(lǐng)土?

普京做出最大讓步,只要特朗普肯點(diǎn)頭,他就交出一半烏克蘭領(lǐng)土?

影孖看世界
2025-08-09 23:27:25
2025-08-10 01:16:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
15503文章數(shù) 513968關(guān)注度
往期回顧 全部

科技要聞

對(duì)話王興興:機(jī)器人給國(guó)家交稅不是夢(mèng)!

頭條要聞

媒體:特朗普欲促成"三邊峰會(huì)" 為此甚至獻(xiàn)祭半個(gè)印度

頭條要聞

媒體:特朗普欲促成"三邊峰會(huì)" 為此甚至獻(xiàn)祭半個(gè)印度

體育要聞

為打亞洲杯放棄NBA,他還要被韓國(guó)人罵

娛樂要聞

離婚3年 孫怡媽話揭露女兒離婚現(xiàn)實(shí)

財(cái)經(jīng)要聞

釋永信海外資本局:至少4600萬(wàn)流向澳洲

汽車要聞

百萬(wàn)級(jí)舒適感!東風(fēng)風(fēng)神L8真實(shí)力打臉楊子

態(tài)度原創(chuàng)

藝術(shù)
教育
家居
親子
公開課

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

哈爾濱省重點(diǎn)高中2025高考成績(jī)盤點(diǎn),誰(shuí)高分考生最多?占比最高?

家居要聞

通透流暢 時(shí)尚簡(jiǎn)約新居

親子要聞

女子3次產(chǎn)檢都是雙胞胎,生產(chǎn)時(shí)卻只有一個(gè),半夜喂奶卻感覺不對(duì)

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 四虎永久在线精品免费观看视频| www.毛片网站| 国产精品久久久久精品三级卜| 老牛AV无码一区二区三区| 亚洲人成网77777| 一本av高清一区二区三区| 午夜无码精品一区二区三区99午| 高潮呻吟久久AV无码| 精品国产av色一区二区深夜久久| A级毛片100部免费看| 精品国产亚洲第一区二区三区| 国日韩精品一区二区三区| 大屁股大乳丰满人妻| 欧美精品VlDEo| 男人的天堂无码av| 成人妇女免费播放久久久,| 国产91高跟视频| 河南老熟女高潮大叫| 2021亚洲va在线va天堂va国产| 黑人巨鞭大战欧美极品少妇| 无人去码一码二码三码区| 少妇饥渴放荡的高潮喷水| 青春草黄色网址| 欧美最猛性xxxxx黑人巨茎| 欧美另类色图小说| 国产精品主播一区二区三区| 末发育娇小性色xxxxx| 九九热视频免费在线播放| 丁香综合五月| 国产AV口爆吞精亚洲浪潮AV| 九九久久精品免费观看| 四川少妇搡BB| 国产精品秘入口18禁麻豆免会员| 欧洲无码八a片人妻少妇| 日韩欧美亚洲国产精品字幕久久久 | 按摩推油一区二区| 亚洲精品久久久久中文字幕m男| 香蕉久久夜色精品国产| 四虎影院海外永久| 亚洲av伦理一区二区| 77777奇米影视|