夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

LaDi-WM模型大幅提升機(jī)器人操作策略的成功率和跨場景泛化能力

0
分享至



在機(jī)器人操作任務(wù)中,預(yù)測性策略近年來在具身人工智能領(lǐng)域引起了廣泛關(guān)注,因?yàn)樗軌蚶妙A(yù)測狀態(tài)來提升機(jī)器人的操作性能。然而,讓世界模型預(yù)測機(jī)器人與物體交互的精確未來狀態(tài)仍然是一個(gè)公認(rèn)的挑戰(zhàn),尤其是生成高質(zhì)量的像素級(jí)表示。

為解決上述問題,國防科大、北京大學(xué)、深圳大學(xué)團(tuán)隊(duì)提出LaDi-WM(Latent Diffusion-based WorldModels),一種基于隱空間擴(kuò)散的世界模型,用于預(yù)測隱空間的未來狀態(tài)。

具體而言,LaDi-WM 利用預(yù)訓(xùn)練的視覺基礎(chǔ)模型 (Vision Fundation Models) 來構(gòu)建隱空間表示,該表示同時(shí)包含幾何特征(基于 DINOv2 構(gòu)造)和語義特征(基于 Siglip 構(gòu)造),并具有廣泛的通用性,有利于機(jī)器人操作的策略學(xué)習(xí)以及跨任務(wù)的泛化能力。

基于 LaDi-WM,團(tuán)隊(duì)設(shè)計(jì)了一種擴(kuò)散策略,該策略通過整合世界模型生成的預(yù)測狀態(tài)來迭代地優(yōu)化輸出動(dòng)作,從而生成更一致、更準(zhǔn)確的動(dòng)作結(jié)果。通過在虛擬和真實(shí)數(shù)據(jù)集上的大量實(shí)驗(yàn),LaDi-WM 能夠顯著提高機(jī)器人操作任務(wù)的成功率,尤其是在 LIBERO-LONG 數(shù)據(jù)集上提升27.9%,超過之前的所有方法。





  • 論文地址:https://arxiv.org/abs/2505.11528
  • 項(xiàng)目主頁:https://guhuangai.github.io/LaDiWM.github.io/

論文創(chuàng)新點(diǎn):

1.一種基于隱空間擴(kuò)散的世界模型:使用視覺基礎(chǔ)模型構(gòu)建隱空間的通用表示,并在隱空間學(xué)習(xí)可泛化的動(dòng)態(tài)建模能力。

2.一種基于世界模型預(yù)測迭代優(yōu)化的擴(kuò)散策略:利用世界模型生成未來預(yù)測的狀態(tài),將預(yù)測的狀態(tài)反饋給策略模型,迭代式地優(yōu)化策略輸出。



圖 1 :(左)通過任務(wù)無關(guān)的片段學(xué)習(xí)隱擴(kuò)散世界模型;(右)通過世界模型的未來狀態(tài)預(yù)測來優(yōu)化策略模型

技術(shù)路線

該團(tuán)隊(duì)提出一種利用世界模型優(yōu)化策略學(xué)習(xí)的框架,以學(xué)習(xí)機(jī)器人抓取操作相關(guān)的技能策略。該框架可分為兩大階段:世界模型學(xué)習(xí)和策略學(xué)習(xí)。

A. 世界模型學(xué)習(xí):

(a)隱空間表示:通過預(yù)訓(xùn)練的視覺基礎(chǔ)模型對觀測圖像提取幾何表征與語義表征,其中幾何表征利用 DINOv2 提取,而語義表征則使用 Siglip 提取。

(b)交互擴(kuò)散:同時(shí)對兩種隱空間表示實(shí)施擴(kuò)散過程,并在擴(kuò)散過程中讓二者充分交互,學(xué)習(xí)幾何與語義表征之間的依賴關(guān)系,從而促進(jìn)兩種表示的準(zhǔn)確動(dòng)態(tài)預(yù)測。



圖 2 : 基于交互擴(kuò)散的世界模型架構(gòu)

B. 策略模型訓(xùn)練與迭代優(yōu)化推理

(a)結(jié)合世界模型的未來預(yù)測引導(dǎo)策略學(xué)習(xí):將世界模型給出的未來預(yù)測作為額外的輸入,引導(dǎo)策略模型的準(zhǔn)確動(dòng)作預(yù)測;模型架構(gòu)基于擴(kuò)散策略模型,有利于學(xué)習(xí)多模態(tài)動(dòng)作分布。

(b)迭代優(yōu)化策略輸出:策略模型可以在一個(gè)時(shí)間步多次利用世界模型的未來預(yù)測作為引導(dǎo),從而不斷優(yōu)化自身的動(dòng)作輸出。實(shí)驗(yàn)顯示,該方案可以逐漸降低策略模型的輸出分布熵,達(dá)到更準(zhǔn)確的動(dòng)作預(yù)測。



圖 3 : 基于未來預(yù)測引導(dǎo)的策略模型架構(gòu)

實(shí)驗(yàn)結(jié)果

虛擬實(shí)驗(yàn):

在公開的虛擬數(shù)據(jù)集(LIBERO-LONG,CALVIN D-D)中,團(tuán)隊(duì)驗(yàn)證了所提出框架在機(jī)器人抓取相關(guān)的操作任務(wù)上的性能。在實(shí)驗(yàn)中,世界模型的訓(xùn)練數(shù)據(jù)會(huì)與策略模型的訓(xùn)練數(shù)據(jù)區(qū)分開,從而驗(yàn)證世界模型的泛化能力。對于 LIBERO-LONG,給定語言指令,多次執(zhí)行并統(tǒng)計(jì)機(jī)器人完成各項(xiàng)任務(wù)的成功率。對于 CALVIN D-D,連續(xù)給定五個(gè)語言指令,多次執(zhí)行并統(tǒng)計(jì)平均完成任務(wù)的數(shù)量。

在 LIBERO-LONG 數(shù)據(jù)集,為了驗(yàn)證世界模型對策略模型的引導(dǎo)作用,團(tuán)隊(duì)僅使用 10 條軌跡去訓(xùn)練各任務(wù),對比結(jié)果如表 1 所示。相比于其他方法,LaDi-WM 能夠提供精確的未來預(yù)測,并將預(yù)測反饋給策略模型,不斷優(yōu)化動(dòng)作輸出,僅需少量訓(xùn)練數(shù)據(jù)即可達(dá)到 68.7% 的成功率,顯著優(yōu)于其他方法。



表 1: LIBERO-LONG 性能對比

在 CALVIN D-D 數(shù)據(jù)集上,LaDi-WM 同樣展示了在長時(shí)任務(wù)中的強(qiáng)大性能(表 2)。



表 2: CALVIN D-D 性能對比

團(tuán)隊(duì)進(jìn)一步驗(yàn)證了所提出框架的可擴(kuò)展性,如圖 4 所示。

(a)逐漸增大世界模型的訓(xùn)練數(shù)據(jù),模型的預(yù)測誤差逐漸降低且策略性能逐漸提升;

(b)逐漸增大策略模型的訓(xùn)練數(shù)據(jù),抓取操作的成功率逐漸提升;

(c)逐漸增大策略模型的參數(shù)量,抓取操作的成功率逐漸提升。



圖 4 : 可擴(kuò)展性實(shí)驗(yàn)

為了驗(yàn)證 LaDi-WM 的跨場景泛化能力,團(tuán)隊(duì)在 LIBERO-LONG 上訓(xùn)練世界模型,并直接應(yīng)用于 CALVIN D-D 的策略學(xué)習(xí)中,實(shí)驗(yàn)結(jié)果如表 3 所示。若是使用在 LIBERO-LONG 訓(xùn)練的原始策略模型,直接應(yīng)用到 CALVIN D-D 是不工作的(表第一行);而使用在 LIBERO-LONG 訓(xùn)練的世界模型來引導(dǎo) CALVIN 環(huán)境下的策略學(xué)習(xí),則可以比在 CALVIN 環(huán)境訓(xùn)練的原始策略的性能高 0.61(表第三行)。這表明,世界模型的泛化能力要優(yōu)于策略模型的泛化能力。



表 3: 跨場景實(shí)驗(yàn)結(jié)果。L 代表 LIBERO-LONG,C 代表 CALVIN D-D

團(tuán)隊(duì)進(jìn)一步探索了利用世界模型迭代優(yōu)化的工作原理。團(tuán)隊(duì)收集不同迭代輪次下策略模型的輸出動(dòng)作并繪制其分布,如圖 5 所示。迭代優(yōu)化的過程中,輸出動(dòng)作分布的熵在逐漸降低,這表明策略模型每一步的輸出動(dòng)作更加穩(wěn)定,從而提升整體的抓取成功率。



圖 5 : 迭代優(yōu)化的動(dòng)作分布對比

真機(jī)實(shí)驗(yàn):

團(tuán)隊(duì)也在真實(shí)場景中驗(yàn)證了所提出框架的性能,具體操作任務(wù)包括「疊碗」、「開抽屜」、「關(guān)抽屜」以及「抓取物體放入籃子」等,如圖 6 所示。



圖 6 : (左)真實(shí)場景環(huán)境;(右)機(jī)器人實(shí)際操作樣例

在真實(shí)場景中,LaDi-WM 將原始模仿學(xué)習(xí)策略的成功率顯著提升 20%(表 4)。



表 4: 真實(shí)場景性能對比

圖 7 展示了最終所得策略模型在不同任務(wù)上的執(zhí)行軌跡,從圖中可以發(fā)現(xiàn),提出的策略能夠在不同光照條件以及不同初始位置的情況下有魯棒的泛化性。



圖 7 : 真實(shí)場景機(jī)器人執(zhí)行軌跡

總結(jié)

國防科大、北京大學(xué)、深圳大學(xué)團(tuán)隊(duì)提出了一種隱空間擴(kuò)散的世界模型 LaDi-WM(Latent Diffusion-based World Models),利用視覺基礎(chǔ)模型提取通用的隱空間表示,并在隱空間學(xué)習(xí)可泛化的動(dòng)態(tài)建模。同時(shí),團(tuán)隊(duì)提出基于世界模型的未來預(yù)測來引導(dǎo)策略學(xué)習(xí),在推理階段通過迭代式地優(yōu)化策略輸出,從而進(jìn)一步提高策略輸出動(dòng)作的準(zhǔn)確度。團(tuán)隊(duì)通過虛擬與真機(jī)上廣泛的實(shí)驗(yàn)證明了 LaDi-WM 的有效性,所提出的方法顯著提升了機(jī)器人抓取操作技能的性能。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一個(gè)精神分裂的程序員,用10年寫了一個(gè)拯救世界的操作系統(tǒng)

一個(gè)精神分裂的程序員,用10年寫了一個(gè)拯救世界的操作系統(tǒng)

碼農(nóng)翻身
2025-12-24 08:58:10
中東王子全身癱瘓赴華求醫(yī),中醫(yī)摸下手腕,1句話讓醫(yī)療團(tuán)隊(duì)傻眼

中東王子全身癱瘓赴華求醫(yī),中醫(yī)摸下手腕,1句話讓醫(yī)療團(tuán)隊(duì)傻眼

小哥很OK
2025-12-07 15:35:44
泰國軍隊(duì)攻入柬埔寨園區(qū)畫面疑曝光!電詐分子跪地,墻上中文扎眼

泰國軍隊(duì)攻入柬埔寨園區(qū)畫面疑曝光!電詐分子跪地,墻上中文扎眼

環(huán)球熱點(diǎn)快評
2025-12-23 16:48:49
央視曝光!同仁堂再度造假,3元成本翻20倍賣,家中有老人的速查

央視曝光!同仁堂再度造假,3元成本翻20倍賣,家中有老人的速查

近史博覽
2025-12-23 11:13:26
何穗曬2個(gè)月寶寶會(huì)抬頭,頭發(fā)稀耳朵大有福,對陳偉霆稱呼顯親昵

何穗曬2個(gè)月寶寶會(huì)抬頭,頭發(fā)稀耳朵大有福,對陳偉霆稱呼顯親昵

心靜物娛
2025-12-24 10:39:01
李湘前夫李厚霖被刑拘,被抓原因曝光,與秦海璐多個(gè)女星談過戀愛

李湘前夫李厚霖被刑拘,被抓原因曝光,與秦海璐多個(gè)女星談過戀愛

寒士之言本尊
2025-12-22 13:22:18
失業(yè)的人越來越多了

失業(yè)的人越來越多了

曹多魚的財(cái)經(jīng)世界
2025-12-24 14:56:20
昭通市人民政府發(fā)布最新人事任免通知!涉及6名干部

昭通市人民政府發(fā)布最新人事任免通知!涉及6名干部

微昭通
2025-12-24 16:14:29
對華反擊計(jì)劃已敲定!高市早苗興奮之際發(fā)現(xiàn):中國正狂拋美債

對華反擊計(jì)劃已敲定!高市早苗興奮之際發(fā)現(xiàn):中國正狂拋美債

小鬼頭體育
2025-12-24 15:39:37
快手變快播?深夜上萬直播間同時(shí)"搞黃色"裸聊,年度最大網(wǎng)絡(luò)事故

快手變快播?深夜上萬直播間同時(shí)"搞黃色"裸聊,年度最大網(wǎng)絡(luò)事故

派大星紀(jì)錄片
2025-12-23 16:49:00
81歲林豆豆現(xiàn)狀:已退休23年,獨(dú)居在北京老房子,用閱讀打發(fā)時(shí)間

81歲林豆豆現(xiàn)狀:已退休23年,獨(dú)居在北京老房子,用閱讀打發(fā)時(shí)間

攬星河的筆記
2025-11-12 12:36:17
你聽過最勁爆的瓜是啥?網(wǎng)友:被大八歲的補(bǔ)習(xí)班老師表白了

你聽過最勁爆的瓜是啥?網(wǎng)友:被大八歲的補(bǔ)習(xí)班老師表白了

帶你感受人間冷暖
2025-11-26 00:10:06
楊瀚森NBA生涯總得分來到38分,超越河村勇輝

楊瀚森NBA生涯總得分來到38分,超越河村勇輝

懂球帝
2025-12-24 14:35:06
美女白色露臍T恤配藍(lán)色瑜伽褲,性感值拉滿,簡直是行走的 荷爾蒙

美女白色露臍T恤配藍(lán)色瑜伽褲,性感值拉滿,簡直是行走的 荷爾蒙

小喬古裝漢服
2025-09-24 07:20:03
68歲相聲演員娶小30歲洋妻,生一屋混血兒移居國外,如今過得怎樣

68歲相聲演員娶小30歲洋妻,生一屋混血兒移居國外,如今過得怎樣

豐譚筆錄
2025-12-24 00:09:46
杜新枝婆媳悼念姚策被許敏投訴:錯(cuò)換人生里,母愛不該是博弈籌碼

杜新枝婆媳悼念姚策被許敏投訴:錯(cuò)換人生里,母愛不該是博弈籌碼

陌上桃花開的
2025-12-24 16:14:23
庫里:我對圣誕大戰(zhàn)沒什么特別回憶,因?yàn)槲覜]打出過好的表現(xiàn)

庫里:我對圣誕大戰(zhàn)沒什么特別回憶,因?yàn)槲覜]打出過好的表現(xiàn)

懂球帝
2025-12-24 11:25:35
又一個(gè)大V被封!任何政治狂熱,都是國家和人民的災(zāi)難!

又一個(gè)大V被封!任何政治狂熱,都是國家和人民的災(zāi)難!

深度報(bào)
2025-12-10 22:37:02
銀行人員說漏嘴:明年起,手里有定期存款的人,做好4個(gè)準(zhǔn)備

銀行人員說漏嘴:明年起,手里有定期存款的人,做好4個(gè)準(zhǔn)備

藍(lán)色海邊
2025-12-24 10:32:32
0+0+0!冒充NBA球員!開拓者用人方式引發(fā)質(zhì)疑

0+0+0!冒充NBA球員!開拓者用人方式引發(fā)質(zhì)疑

籃球教學(xué)論壇
2025-12-24 16:24:12
2025-12-24 17:36:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11986文章數(shù) 142517關(guān)注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

韓國財(cái)閥千金在柬埔寨被捕 被指涉嫌參與性交易和販毒

頭條要聞

韓國財(cái)閥千金在柬埔寨被捕 被指涉嫌參與性交易和販毒

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

曝闞清子女兒早產(chǎn)但沒保住

財(cái)經(jīng)要聞

重磅!北京市優(yōu)化調(diào)整住房限購政策

汽車要聞

“運(yùn)動(dòng)版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

游戲
健康
教育
手機(jī)
公開課

電競巴菲特?Faker慶功宴席位炒至近萬 隔壁桌看他吃

這些新療法,讓化療不再那么痛苦

教育要聞

家校共育大課堂 | 運(yùn)動(dòng)享健康,家校護(hù)成長

手機(jī)要聞

小米17 Ultra徠卡版外觀細(xì)節(jié)揭曉:自帶可樂標(biāo)+大師變焦環(huán)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 精品无码久久久久| 久久精品久久丫| 久热这里有精品视频播放 | 中文字幕理伦午夜福利片| 色欲久久久天天天综合网精品孕妇 | 少妇丰满爆乳被呻吟视频| 国产成人av乱码在线观看| 有码中文av无码中文av| 亚洲色大18成人网站www在线播放| 欧美成人家庭影院| 99热精品免费| 国产精品美女一区二区三区| 韩国三级丰满少妇高潮| 波多野结衣乱码中文字幕| 无码人妻黑人中文字幕| 精品视频一区二区| 亚洲欧美在线观看| 天美影视传媒有限公司免费| 亚洲人成网站在线播放无码| 亚洲人亚洲精品成人网站| 国产精品婷婷| 色偷偷www.8888在线观看| 亚洲熟妇无码AV在线少妇| 欧美成人a在线网站| AV天堂中文| 97在线碰| 精品sm捆绑调教网站免费观看| 97夜夜澡人人双人人人喊| 黑人一区久久| 久久ee热这里只有精品| а√天堂中文在线资源bt种子 | 奇米影视7777第四色| 人体艺术av| 大香蕉一区美女| 色综合久久久无码中文字幕篠田| 各种少妇正面着bbw撒尿视频| 激情五月色综合国产精品| 在线 中文 一区| 五月激情综合日本| 日本成熟少妇激情视频免费看| 蜜桃成人激情视频|