夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

三五條樣本擊敗英偉達,國內(nèi)首個超少樣本具身模型,還斬獲頂會冠軍

0
分享至




機器之心發(fā)布

機器之心編輯部

國內(nèi)首個少樣本通用具身操作基礎(chǔ)模型發(fā)布,跨越視覺語言與機器人操作的鴻溝。

具身智能領(lǐng)域終于要突破 “數(shù)據(jù)桎梏” 了嗎?

相較于自然語言、視覺領(lǐng)域,具身智能的數(shù)據(jù)天然稀缺。真實世界的機器人操作往往涉及復(fù)雜的物理交互、實時反饋與環(huán)境變化,導(dǎo)致數(shù)據(jù)采集不僅成本高、效率低,并且還難以規(guī)?;?。因此,現(xiàn)實中能達到數(shù)十萬以及百萬物理交互的數(shù)據(jù)集并不多見。

另外,當(dāng)前的視覺 - 語言 - 動作(VLA)模型雖然已經(jīng)具備了強大的語義理解能力,但在實際操作層面仍依賴大規(guī)模標(biāo)注數(shù)據(jù)來彌補泛化能力的不足。

如何讓具身機器人在極少樣本下也能快速學(xué)習(xí)、準(zhǔn)確執(zhí)行、靈活遷移,成為決定它們真正走出實驗室、進入工業(yè)生產(chǎn)與人機協(xié)作場景的關(guān)鍵因素。

近日,國內(nèi)通用具身智能創(chuàng)企中科第五紀(jì)(FiveAges)正式發(fā)布新一代具身操作基礎(chǔ)模型 FiveAges Manipulator-1(FAM-1),其核心架構(gòu)源于團隊入選 NeurIPS 2025 的《BridgeVLA: Bridging the Gap between Large Vision-Language Model and 3D Robotic Manipulation》,首次實現(xiàn)了大規(guī)模視覺語言模型(VLM)與三維機器人操作控制之間的高效知識遷移與空間建模融合。

特別地,該模型在少樣本學(xué)習(xí)、跨場景適應(yīng)及復(fù)雜任務(wù)理解方面實現(xiàn)重大突破,僅需 3-5 條機器人數(shù)據(jù) / 任務(wù)即可完成精準(zhǔn)具身操作學(xué)習(xí),成功率高達 97% 并且全面超越 SOTA?;谠撃P停瑘F隊斬獲 CVPR 2025 具身操作競賽冠軍,擊敗國內(nèi)外眾多競爭對手。

FAM-1:從 VLA 到 BridgeVLA,

國內(nèi)首個少樣本通用具身操作基礎(chǔ)模型

為了緩解缺少高質(zhì)量操作數(shù)據(jù)的困境,切實提升跨場景、跨任務(wù)下的泛化性,中科第五紀(jì)以 BridgeVLA 為核心框架,構(gòu)建首個少樣本通用具身操作基礎(chǔ)模型 FAM-1。

與傳統(tǒng)的 VLA 架構(gòu)相比,BridgeVLA 實現(xiàn)了以下兩個方面的技術(shù)創(chuàng)新:

  1. 整合多類型數(shù)據(jù),構(gòu)建多維度的操作知識庫,以二次預(yù)訓(xùn)練的方式挖掘 VLM 隱含知識,解決操作目標(biāo)和場景理解不準(zhǔn)確、泛化性差的問題;
  2. 利用三維熱力圖對齊 VLM 與 VLA 的輸出與輸入,通過 3-5 條非常少量的樣本微調(diào),解決視覺空間理解力弱、數(shù)據(jù)利用效率低的問題。

這些技術(shù)不僅在數(shù)個國際公開評測數(shù)據(jù)集上取得當(dāng)前 SOTA 性能,還在僅有少量標(biāo)注數(shù)據(jù)的真實開放場景下,穩(wěn)定實現(xiàn)跨光照、跨場景、跨任務(wù)的泛化性

具體來說,F(xiàn)AM-1 是由知識驅(qū)動的預(yù)訓(xùn)練(Knowledge-driven Pretraining, KP)和三維少樣本微調(diào)(3D Few-shot Fine-tuning, FF)兩大核心模塊組成:

知識驅(qū)動的預(yù)訓(xùn)練:目前大多數(shù)具身操作模型是基于非操作數(shù)據(jù)預(yù)訓(xùn)練的 VLM,僅能在一定程度上緩解操作目標(biāo)和場景泛化的問題。這種跨域差異性的存在,導(dǎo)致模型無法真正發(fā)揮 VLM 在泛化性方面的巨大潛力。因此,中科第五紀(jì)利用從網(wǎng)絡(luò)上收集海量圖像視頻數(shù)據(jù)并構(gòu)建面向操作場景的知識庫,然后對預(yù)訓(xùn)練的 VLM 進行二次預(yù)訓(xùn)練。通過挖掘和引導(dǎo)模型隱含的操作知識,對機械臂關(guān)鍵點位置和軌跡進行預(yù)測,進而逐步實現(xiàn)在操作場景下的跨域適應(yīng)。

三維少樣本樣本微調(diào):現(xiàn)有 VLM+VLA 架構(gòu)大多是將三維視覺信息壓縮到一維向量,然后再預(yù)測三維動作,形式上類似沙漏結(jié)構(gòu)。這種架構(gòu)中間的 “維度瓶頸” 讓模型損失大量三維結(jié)構(gòu)信息,導(dǎo)致需要依賴大規(guī)模有標(biāo)注數(shù)據(jù)進行暴力擬合。因此,中科第五紀(jì)將 VLM 和 VLA 的輸出和輸入升維到三維熱力圖。這樣在模型微調(diào)的過程中,不僅能充分利用三維空間結(jié)構(gòu)信息,更顯著降低了模型對于樣本數(shù)量的依賴。

主要實驗效果:

FAM-1 在國際基準(zhǔn)中全面超越 SOTA

基于 BridgeVLA 的創(chuàng)新架構(gòu),中科第五紀(jì)將 FAM-1 在國際公開評測基準(zhǔn) RLBench、Colosseum 等與微軟、MIT、斯坦福等頂尖團隊工作進行了公開比較,大量實驗結(jié)果驗證了模型的優(yōu)越性。

例如,在 RLBench 上,F(xiàn)AM-1 可以取得 88.2% 的操作成功率,遠(yuǎn)遠(yuǎn)超過 RVT-2、Act3D、3D Diffuser Actor 等 SOTA 模型 6% 以上,特別是在 “Insert Peg”、“Open Drawer”、“Sort Shape”、“Door Close”、“Hammer Strike” 等任務(wù)上成功率大幅領(lǐng)先,平均成功率大幅提升了 30% 以上。



真機部署效果:

少樣本下基礎(chǔ)任務(wù)成功率 97%,挑戰(zhàn)任務(wù)領(lǐng)先對比模型 30%+

中科第五紀(jì)還將 FAM-1 在真機上與 RVT-2(英偉達)、PI0(Physical Intelligence)、SpatialVLA(Shanghai AI Lab 等)等先進模型進行了全面對比,特別是在少樣本情況下的基礎(chǔ)任務(wù)(Basic)和挑戰(zhàn)任務(wù)(Distractor、Lighting、Background、Height、Combination、Category)上的對比。FAM-1 在僅使用 3-5 條樣本每個 Basic 任務(wù)的情況下,可以達到 97% 成功率,遠(yuǎn)超其它對比模型。

這些結(jié)果充分驗證了中科第五紀(jì)在少樣本實體部署方面的優(yōu)勢,尤其能夠在不同干擾物體、不同光照條件、不同背景絕大多數(shù)復(fù)雜因素且極具產(chǎn)業(yè)化價值的能力下顯著提升模型的泛化性。



總結(jié)與展望:

致力于打造工業(yè)級通用具身智能體系

FAM-1 是面向機械臂操作的少樣本通用基礎(chǔ)模型,通過遷移多模態(tài)大模型隱含知識和建模三維空間結(jié)構(gòu)信息,讓機器人獲得了前所未有的跨場景任務(wù)的泛化能力和少樣本快速學(xué)習(xí)能力。

基于此,中科第五紀(jì)未來將繼續(xù)深耕以下三大方向:

  1. 進一步面向操作場景,提升通用基礎(chǔ)模型的泛化性、可靠性和適應(yīng)性;
  2. 推動基礎(chǔ)模型在工業(yè)場景下的更多應(yīng)用;
  3. 面向?qū)Ш綀鼍巴瞥鐾ㄓ没A(chǔ)模型。

此外,團隊另一項成果 EC-Flow: Enabling Versatile Robotic Manipulation from Action-Unlabeled Videos via Embodiment-Centric Flow 已被 ICCV 2025 接收,展示了從無標(biāo)注人類操作視頻中自監(jiān)督學(xué)習(xí)操控策略的新路徑,進一步展現(xiàn)了中科第五紀(jì)在具身智能核心技術(shù)上的系統(tǒng)性創(chuàng)新能力。這意味著未來機器人或可通過觀察人類操作視頻,自主學(xué)習(xí)操控策略,進一步降低應(yīng)用門檻。

從定義具身大模型新標(biāo)準(zhǔn),到發(fā)布國內(nèi)首個少樣本通用具身操作基礎(chǔ)模型,中科第五紀(jì)的探索正推動具身智能從 “單點技術(shù)突破” 走向 “體系化落地”,為機器人真正走進工業(yè)生產(chǎn)、日常生活提供了技術(shù)支撐。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
A股:兩個因素,大跌過后,下周一,A股或迎來結(jié)構(gòu)性普漲?

A股:兩個因素,大跌過后,下周一,A股或迎來結(jié)構(gòu)性普漲?

興史興談
2025-10-17 20:12:25
皮爾洛本不想要C羅:高位逼搶能力全隊最差

皮爾洛本不想要C羅:高位逼搶能力全隊最差

野薔薇觀察所
2025-10-17 14:40:24
國民黨主席選前1天,朱立倫不裝了,對盧秀燕開火,鄭麗文大動作

國民黨主席選前1天,朱立倫不裝了,對盧秀燕開火,鄭麗文大動作

DS北風(fēng)
2025-10-17 13:54:04
未婚妻喬治娜曬合照,C羅又剪了一個超短寸頭

未婚妻喬治娜曬合照,C羅又剪了一個超短寸頭

懂球帝
2025-10-17 05:50:06
馬克龍心腹來華,見了中國外長,法方?jīng)Q心已下,加入稀土“混戰(zhàn)”

馬克龍心腹來華,見了中國外長,法方?jīng)Q心已下,加入稀土“混戰(zhàn)”

南權(quán)先生
2025-10-17 15:15:04
朱元璋查訪糧官,見其全家啃菜根贊其清廉,轉(zhuǎn)身對錦衣衛(wèi)說:抄家

朱元璋查訪糧官,見其全家啃菜根贊其清廉,轉(zhuǎn)身對錦衣衛(wèi)說:抄家

白云故事
2025-10-15 10:41:29
臺積電全線爆單!

臺積電全線爆單!

EETOP半導(dǎo)體社區(qū)
2025-10-15 12:31:23
李湘王岳倫一同回國,拎4萬手提包,被她的全身照嚇到:像一座山

李湘王岳倫一同回國,拎4萬手提包,被她的全身照嚇到:像一座山

陳意小可愛
2025-10-15 14:57:22
球員香!教練也香!去年奧斯卡 巴爾加斯?fàn)幹鴵?今年輪到海港穆帥

球員香!教練也香!去年奧斯卡 巴爾加斯?fàn)幹鴵?今年輪到海港穆帥

80后體育大蜀黍
2025-10-17 22:03:41
阿富汗塔利班不怕死,20年打敗美軍:為何24小時就被巴鐵打服氣?

阿富汗塔利班不怕死,20年打敗美軍:為何24小時就被巴鐵打服氣?

諦聽骨語本尊
2025-10-17 15:39:43
依舊不服!張本智和放狠話:太失望2-0被逆轉(zhuǎn) 一定會找中國隊復(fù)仇

依舊不服!張本智和放狠話:太失望2-0被逆轉(zhuǎn) 一定會找中國隊復(fù)仇

風(fēng)過鄉(xiāng)
2025-10-17 16:01:37
三觀炸裂!翟欣欣出軌聊天記錄流出,尺度大到咂舌,判12年都嫌少

三觀炸裂!翟欣欣出軌聊天記錄流出,尺度大到咂舌,判12年都嫌少

有范又有料
2025-09-29 14:21:11
世體:阿隆索迎回全部國家隊球員,姆巴佩傷愈可出戰(zhàn)赫塔費

世體:阿隆索迎回全部國家隊球員,姆巴佩傷愈可出戰(zhàn)赫塔費

懂球帝
2025-10-17 22:41:05
終于有比《懸崖》好看的諜戰(zhàn)劇,開播一天就爆了,演員陣容雄厚

終于有比《懸崖》好看的諜戰(zhàn)劇,開播一天就爆了,演員陣容雄厚

阿樂樂電影v
2025-10-17 15:40:55
食品安全很重要,為什么伊斯蘭國家的餐飲經(jīng)常大腸桿菌超標(biāo)?

食品安全很重要,為什么伊斯蘭國家的餐飲經(jīng)常大腸桿菌超標(biāo)?

老李觀歷史
2025-10-16 16:50:19
Shams:黃蜂即將裁掉32歲老將丁威迪;上賽季場均11分4.4助

Shams:黃蜂即將裁掉32歲老將丁威迪;上賽季場均11分4.4助

懂球帝
2025-10-17 01:39:05
連臺12小時手術(shù)喝葡萄糖竟被罰錢,我當(dāng)場走人,次日醫(yī)院換負(fù)責(zé)人

連臺12小時手術(shù)喝葡萄糖竟被罰錢,我當(dāng)場走人,次日醫(yī)院換負(fù)責(zé)人

紅豆講堂
2025-08-20 08:30:06
一個腫瘤科主任的臨終自白:別再為“無效治療”掏空家底了

一個腫瘤科主任的臨終自白:別再為“無效治療”掏空家底了

普陀動物世界
2025-10-16 00:22:01
中國這輪稀土管制,為何美國至今意難平?一明一暗2個細(xì)節(jié)!

中國這輪稀土管制,為何美國至今意難平?一明一暗2個細(xì)節(jié)!

環(huán)球策論
2025-10-17 22:31:00
江門大規(guī)模滅蚊原因曝光,接下來還將開展為期兩周愛國衛(wèi)生運動

江門大規(guī)模滅蚊原因曝光,接下來還將開展為期兩周愛國衛(wèi)生運動

映射生活的身影
2025-10-17 15:43:13
2025-10-17 23:20:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11494文章數(shù) 142484關(guān)注度
往期回顧 全部

科技要聞

對話投資人李強:硅谷AI創(chuàng)業(yè)者走“窄門”

頭條要聞

多家車企警告:因中荷爭端 缺少中資芯片可能傷害美國

頭條要聞

多家車企警告:因中荷爭端 缺少中資芯片可能傷害美國

體育要聞

楊瀚森回應(yīng)賽后哭泣:打得不好情緒比較激動

娛樂要聞

這5位明星,他們還能靠演技翻紅嗎?

財經(jīng)要聞

許家印家族財富隔離神話是如何破滅的?

汽車要聞

2026款海豹07 DM-i 功能全面升級/還有激光雷達

態(tài)度原創(chuàng)

時尚
本地
藝術(shù)
房產(chǎn)
數(shù)碼

今年秋冬最美的搭配:毛衣+裙子,減齡又氣質(zhì)!

本地新聞

考上警犬專業(yè),我和修勾一起卷編制

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

房產(chǎn)要聞

珠江畔再啟新章!未來方洲二期亮相,為廣州定制“一生幸福之城”

數(shù)碼要聞

銘瑄終結(jié)者B850 BKB主板亮相,背插PCIe接口適配AM5 CPU

無障礙瀏覽 進入關(guān)懷版 中文字幕久久精品波多野结| 亚洲日韩久久无码色欲色欲 | 欧美性色欧美精品视频| 成 人 社区在线视频| 成 人 色 网 站免费观看| 在线中文字幕亚洲日韩2020| avtt天堂网人妻系列| 国产成人亚洲欧美二区综合| 全黄激性性视频| 六月丁香婷婷久久| 爱爱无码小视频| 无码午夜福利免费区久久 | 中国少妇伦子伦视频播放| 国产无套流白浆视频免费| 国产精品粉嫩嫩的| 男女下面进入的视频| 淫荡娇妻av| 国内2020揄拍人妻在线视频| 天天做天天刁| 人人插人人操人人摸| 欧美 日韩 国产 另类 图片区| 女人张开双腿男人猛进猛出| 色香阁综合无码国产在线| avtt天堂网人妻系列| 久久久久久免费毛片精品 | 久久无码中文| 无码日本精品一区二区免费式 | 国产日产欧产精品精品蜜芽| 嗯 啊 好舒服视频| www.99热| 成人免费毛片aaaaaa片| 国产精品 Ⅹ| 国产精品天天看天天狠| 久c av在线播放| 中文字幕日韩有码一区| 国产精品呻吟久久人妻无吗| 欧美色图一区二区| :少妇乱子伦| 欧美综合影院| 午夜精品久久九九99蜜桃| 亚洲成av人在线视猫咪|