夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

全球最大開源具身大模型!中國機器人跑完馬拉松后開始學思考

0
分享至


新智元報道

編輯:好困

【新智元導讀】從馬拉松冠軍到最強大腦,這次的突破不再是四肢,而是靈魂。

中國人形機器人,再獲突破性進展!

昨天,全球參數(shù)量最大的具身智能多模態(tài)大模型——Pelican-VL 1.0正式開源。

它不僅覆蓋了7B到72B級別,能夠同時理解圖像、視頻和語言指令,并將這些感知信息轉(zhuǎn)化為可執(zhí)行的物理操作。

而且還針對目前具身能力短板,在空間理解、物理推理和思維鏈等維度實現(xiàn)了系統(tǒng)性提升,并在12個主流公開評測基準上達到行業(yè)領(lǐng)先水平。

可以說,Pelican-VL 1.0的提出,打通了從「看懂世界」到「動起來」的完整智能鏈路。


項目主頁:

https://pelican-vl.github.io/

Github:

https://github.com/Open-X-Humanoid/pelican-vl

Hugging Face:

https://huggingface.co/X-Humanoid/Pelican1.0-VL-72B

ModelScope:

https://modelscope.cn/models/X-Humanoid/Pelican1.0-VL-72B

而這背后,便是創(chuàng)造全球首個人形機器人馬拉松冠軍的團隊——北京人形機器人創(chuàng)新中心。

當前,通用大模型在遷移到具身智能任務(wù)時,仍面臨多維度能力欠缺的問題。

李飛飛教授提出過Think in Space的觀點,強調(diào)走向具身智能需要解決空間智能問題的重要性。英偉達和谷歌也在研究中指出,具身領(lǐng)域的大模型必須具備物理智能,并相繼推出了Cosmos-Reason和Gemini-RoboticsER這類面向具身場景的多模態(tài)大模型。

無獨有偶,創(chuàng)新中心也希望通過全面開源Pelican-VL這一基礎(chǔ)大腦模型,幫助更多具身智能體獲得更強的認知與決策能力,并在意圖理解、長程任務(wù)規(guī)劃推理等多類場景中實現(xiàn)性能提升。


具體來說,通過「刻意練習」(DPPO)訓練范式,Pelican-VL在不斷自我診斷與糾錯中提升推理與規(guī)劃能力,使模型像人類一樣在失敗中學習,從而實現(xiàn)了視覺理解、語言表達和物理執(zhí)行的深度融合。

憑借這一機制,Pelican-VL在多個維度展現(xiàn)出突破性能力:

  • 具備跨模態(tài)的理解與推理能力,能在復雜環(huán)境中識別目標、推斷物體功能與可供性;

  • 具備時間-空間認知,能理解動作的順序與因果關(guān)系。

模型的自進化循環(huán)使其在每一輪訓練后都能修正弱點,形成持續(xù)強化的學習閉環(huán)。Pelican-VL不僅是一種模型,更是一個能夠驅(qū)動機器人系統(tǒng)不斷進化的「智能引擎」。

總體上,論文報告稱相較基線模型,在空間理解和時間推理等能力上出現(xiàn)顯著提升,并在若干公開基準上超過了部分100B量級的開源模型。



Pelican-VL的推出不僅是一次技術(shù)突破,更為產(chǎn)業(yè)界與學術(shù)界帶來了雙重啟示。

它首先構(gòu)建了一套貫通「視覺理解—長程規(guī)劃—物理操作」的通用訓練范式,提供了一個可復用、可擴展的范式,降低了具身智能研發(fā)的門檻。

與此同時,團隊開放了模型與推理框架,為科研機構(gòu)和企業(yè)提供了一個可自由定制、快速迭代的智能基座,加速了從實驗到落地的過程。

更深層的意義在于,Pelican-VL讓「機器人自主學習和反思」從理念走向現(xiàn)實。

它的「刻意練習」機制使模型能在錯誤中總結(jié)經(jīng)驗、持續(xù)進化,如同人類通過反復訓練掌握技能。

這意味著未來的機器人不再只是機械執(zhí)行者,而是具備認知與改進能力的學習體。

可以想象,在家庭或工業(yè)場景中,它將能夠自主判斷物體用途、調(diào)節(jié)操作力度、優(yōu)化行動策略——從被動執(zhí)行邁向主動理解與自我成長,標志著具身智能邁入真正的「學習時代」。

智能抓取

實現(xiàn)精細抓取泛化操作新突破

當抓取一個水杯或一枚雞蛋時,基于Pelican-VL的大腦會瞬間完成一系列精密的操作:

通過視覺預判物體屬性、在接觸瞬間施加恰到好處的力道、并在觸碰后根據(jù)手感微調(diào)抓力。

這套由主動預測、觸覺適應(yīng)與記憶更新構(gòu)成的「感知運動閉環(huán)」,是靈巧抓取的關(guān)鍵。

而這項能力正是具身智能機器人與物理世界交互的基礎(chǔ),但卻面臨著觸覺感知與運動靈活的協(xié)同難、復雜場景下的泛化難、算法與數(shù)據(jù)制約等等難題,目前行業(yè)內(nèi)即便有相關(guān)技術(shù)突破,也仍未完全解決大規(guī)模落地的難題。

如今,Pelican-VL驅(qū)動的機器人抓取框架,成功復現(xiàn)并實現(xiàn)了這一高級智能。


仿生核心:Pelican-VL構(gòu)建的智能抓取閉環(huán)

技術(shù)框架嚴格遵循了人類感知運動的三個核心環(huán)節(jié),并將其轉(zhuǎn)化為可執(zhí)行的機器人系統(tǒng):

1. 主動預測:提供精準的「第一印象」

在機械臂接觸物體前,Pelican-VL大模型憑借其卓越的視覺感知與真實世界物理推理能力,僅通過視覺輸入,就能精準預測出物體的物理屬性(如材質(zhì)、易碎度),并生成初始抓取力。

這為機器人提供了如同人類般的「先見之明」,使其從指尖接觸的一刻起,就具備了恰到好處的基準夾持力,通過模型提供前饋信息縮短閉環(huán)控制穩(wěn)定時間。

2. 觸覺適應(yīng):實現(xiàn)毫秒級的「手感微調(diào)」

在抓取和操控過程中,指尖的觸覺傳感器會實時傳回微滑移、受力分布等數(shù)據(jù)。系統(tǒng)通過一個同步的在線摩擦估計與自適應(yīng)抓取控制模塊,像人類神經(jīng)反射一樣,持續(xù)、快速地微調(diào)抓力。

這不僅確保了抓取的穩(wěn)定性,更關(guān)鍵的是能動態(tài)適應(yīng)不確定因素,避免對精致、柔軟的物品造成損傷。

3. 記憶更新:打造持續(xù)進化的「經(jīng)驗庫」

每次抓取任務(wù)完成后,系統(tǒng)會對比預測與實際感官結(jié)果的差異,并將這次成功的交互經(jīng)驗存儲在一個物理記憶圖譜中

當下一次遇到相同或類似的物體時,Pelican-VL會優(yōu)先調(diào)用這個更新、更精確的記憶來指導預測。使機器人系統(tǒng)具備持續(xù)學習的能力,每一次抓取都在為下一次更精準、更柔和的操作打下基礎(chǔ)。

實戰(zhàn)驗證:輕松拿捏精致與柔軟物體

在實際機器人測試中,該框架展現(xiàn)出了卓越的性能。

從接近、加載、提升、持穩(wěn)到運輸歸還的完整七階段抓取流程中,Pelican-VL驅(qū)動的機器人能穩(wěn)定操作一系列精致與柔性物體。

  • 看得準:由Pelican-VL提供的精準初始力先驗,極大地加速了后續(xù)自適應(yīng)控制器的收斂過程。

  • 抓得穩(wěn):在線控制器在提升、移動過程中持續(xù)動態(tài)調(diào)整抓力,有效應(yīng)對慣性等擾動,確保抓取萬無一失。

  • 學得快:整個交互過程形成的經(jīng)驗被存入知識圖譜,系統(tǒng)像一位經(jīng)驗豐富的老師傅,越用越熟練。

通過將Pelican-VL大模型的強大認知能力與實時控制、記憶系統(tǒng)深度融合,機器人抓取從簡單的「執(zhí)行命令」升級為了具備預測、反應(yīng)與學習能力的智能行為。

這一能力使機器人在低成本、低樣本的條件下依然能夠?qū)崿F(xiàn)高度泛化、更加柔性的抓取表現(xiàn),為行業(yè)帶來了真正可規(guī)?;涞氐闹悄茏ト》桨?。

這不僅是技術(shù)上的一個里程碑,更為機器人在復雜、非結(jié)構(gòu)化環(huán)境中真正實現(xiàn)自主操作,打開了無限可能的大門。

VLM讓VLA實現(xiàn)能力躍遷

在典型的Vision–Language–Action(VLA)系統(tǒng)里,Pelican-VL扮演著「視覺語言大腦」的角色,為機器人提供強大的環(huán)境感知和指令理解能力。

它將攝像頭所見與自然語言指令結(jié)合,構(gòu)建起對場景的多模態(tài)表征,然后輸出可供后續(xù)決策單元使用的結(jié)構(gòu)化信息。

也就是說,Pelican-VL負責「看圖聽話」,理解指令和環(huán)境,VLA負責跨機器人應(yīng)用;二者組合可以在多種機器人上執(zhí)行多任務(wù)。

有了這樣的基礎(chǔ),系統(tǒng)可以完成長時序、多步驟的任務(wù)規(guī)劃和執(zhí)行。


Pelican-VL等具身智能模型可部署在商超、家居等多種真實場景中,通過視覺-語言感知輔助多步任務(wù)規(guī)劃

論文中演示了一個生活場景下的復合指令:例如「把鞋子放到鞋架上、將桌上的垃圾扔到垃圾桶,再把衣服放入洗衣機」。

Pelican-VL首先感知房間物體和布局,構(gòu)建出整個環(huán)境的語義表示;接著根據(jù)指令自動生成行動序列:依次移動到鞋架、垃圾桶和洗衣機位置并進行抓取和放置操作。

在這一過程中,模型不斷更新內(nèi)部環(huán)境狀態(tài),調(diào)整計劃并適應(yīng)實際情況,實現(xiàn)了自然語言指令的自主分解和執(zhí)行。

簡而言之,Pelican-VL構(gòu)成了VLA系統(tǒng)的認知前端,為長期規(guī)劃和指令執(zhí)行提供跨模態(tài)的信息支持,使機器人能夠像人類一樣將復雜任務(wù)拆解并落地操作。

商超場景-pelican超市收銀員

家庭場景-pelican家務(wù)整理助手

長程任務(wù)場景-pelican實驗助手

同時,在快慢系統(tǒng)、端到端等諸多架構(gòu)中,前沿探索者們也一直在致力于研究當VLA以VLM為基座時,VLM各項能力為度對VLA模型所帶來的性能增益。

例如DeepMind的RT-Affordance,李飛飛的ReKep以及Sergey Levine的Training Strategies for Efficient Embodied Reasoning等著名學者和機構(gòu)都曾探討過可供性、思維鏈等能力對于具身操作的重要性。

對此,Pelican-VL針對性地進行了能力提升,并在多個維度中達到行業(yè)領(lǐng)先水平。


RT-Affordance項目地址:https://snasiriany.me/rt-affordance


ReKep項目地址:https://rekep-robot.github.io/

跨本體具身大腦實現(xiàn)多機協(xié)作

Pelican-VL具備不同層級的機器人任務(wù)規(guī)劃調(diào)度能力,可根據(jù)場景生成機器人行為規(guī)劃,并將其轉(zhuǎn)化為具體機器人功能函數(shù)的執(zhí)行調(diào)用,作為多機器人系統(tǒng)的任務(wù)調(diào)度器。

論文中給出一個多機器人協(xié)作流水線的開發(fā)示例:

在一個燈泡質(zhì)檢流程中,Pelican-VL將任務(wù)按機器人拆分為若干行為層任務(wù),進而生成不同機器人動作層的函數(shù)調(diào)用。

例如,它會生成對「輪式人形機器人」執(zhí)行「檢查電控柜并啟動系統(tǒng)」的函數(shù)調(diào)用指令,也會為雙臂機器人生成「對燈泡進行結(jié)構(gòu)與功能檢測」的調(diào)用。

對于通用的操作函數(shù),生成所需的控制參數(shù),由專門的運動規(guī)劃模塊將其轉(zhuǎn)化為關(guān)節(jié)軌跡和夾爪動作。

這種方式類似于一個項目經(jīng)理給不同的團隊下達精確的工作指令,Pelican-VL則通過多輪對話和分步指令,確保多臺機器人的協(xié)同工作。

基于穩(wěn)定多視角可供性的零樣本操作

在更加通用的操作場景下,論文也給出了一個基于可供性進行任意物體操作的例子。

Pelican-VL先輸出詳細的視覺定位和功能性描述(如目標物體的抓取點、放置位置等),然后利用函數(shù)調(diào)用機制觸發(fā)操作。

例如在通用抓取演示中,它會先生成多視角下的一致性預估(如抓取點、避障區(qū)域)以保證空間定位準確;接著將這些計劃通過接口調(diào)用下發(fā)給運動控制單元。

這一流程就像「思維鏈」式的中間規(guī)劃:模型內(nèi)部先思考出清晰的步驟,再把每步落成可執(zhí)行的函數(shù)調(diào)用,確保執(zhí)行過程可控且透明。

通過函數(shù)調(diào)用,Pelican-VL不僅能處理單機任務(wù),也可管理多機器人協(xié)作任務(wù),進一步彰顯了其在復雜系統(tǒng)中的實用性。


結(jié)語

此次Pelican-VL的開源,對于人形機器人產(chǎn)業(yè)與研究而言帶來了兩個正向價值:

  • 首先它提供了一整套「視覺理解→長程規(guī)劃→物理操作」串聯(lián)的可復用訓練范式,降低了在機器人中使用 VLM 的門檻;

  • 其次,借助開源基礎(chǔ)模型和推理代碼,所有其他實驗室或企業(yè)都可以在這個「腦」上做定制化訓練,加速人形機器人在各行各業(yè)的落地探索。

作為拿下過全球首個人形機器人馬拉松冠軍、百米賽跑冠軍的團隊,北京人形機器人創(chuàng)新中心已經(jīng)推出了具身智能的通用硬件平臺「具身天工」和通用軟件平臺「慧思開物」兩個開放平臺,如今又在VLM上實現(xiàn)了重大突破。

不難看出,一切都是為產(chǎn)業(yè)落地提供更良好土壤,讓國內(nèi)的機器人廠商和開發(fā)者可以自由使用與定制人形機器人,加速研發(fā)進程,并且正在讓具身智能機器人從最能跑,演化到最聰明和最好用的更高階段。

根據(jù)了解,目前北京人形機器人創(chuàng)新中心還在推進「千臺機器人真實場景數(shù)據(jù)采集計劃」,讓上千臺機器人在工廠、倉庫、酒店等場景中執(zhí)行任務(wù)并采集數(shù)據(jù)。

而這些規(guī)模化的多模態(tài)數(shù)據(jù)與Pelican-VL結(jié)合,將推動其在制造業(yè)自動化、智能物流、零售無人化和家居服務(wù)等多領(lǐng)域的快速適配和優(yōu)化。

對于制造業(yè)企業(yè)來說,基于Pelican-VL快速開發(fā)特定場景下的應(yīng)用方案,可大大降低開發(fā)成本和難度。

長期來看,Pelican-VL及其后續(xù)版本將促進國內(nèi)形成完善的通用機器人智能平臺,推動更多種類的機器人像安裝「通用智能操作系統(tǒng)」一樣迅速獲取新能力,讓人形機器人更低門檻、低成本、高效率的走進不同制造業(yè)、工業(yè)體系。

參考資料:

https://pelican-vl.github.io/

https://github.com/Open-X-Humanoid/pelican-vl

https://huggingface.co/X-Humanoid/Pelican1.0-VL-72B

https://modelscope.cn/models/X-Humanoid/Pelican1.0-VL-72B

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
曾國藩的識人術(shù):飯桌上的這種人,切記不可深交,否則后患無窮

曾國藩的識人術(shù):飯桌上的這種人,切記不可深交,否則后患無窮

牛魔王與芭蕉扇
2025-11-11 10:16:23
壞消息,勇士隊喬納森·庫明加缺席對陣馬刺的比賽

壞消息,勇士隊喬納森·庫明加缺席對陣馬刺的比賽

好火子
2025-11-15 03:48:58
中國正在上演的詭異經(jīng)濟

中國正在上演的詭異經(jīng)濟

難得君
2025-10-29 19:26:55
什么調(diào)料最易致癌?是蠔油嗎?提醒:這3種調(diào)料做飯時盡量少放

什么調(diào)料最易致癌?是蠔油嗎?提醒:這3種調(diào)料做飯時盡量少放

泠泠說史
2025-09-30 11:17:46
江蘇省考超43萬人報名!最熱崗位在南京,競爭比2602:1

江蘇省考超43萬人報名!最熱崗位在南京,競爭比2602:1

荔枝新聞
2025-11-14 22:20:49
歐世預積分榜,德國2:0,與斯洛伐克同分,下輪兩者迎生死戰(zhàn)

歐世預積分榜,德國2:0,與斯洛伐克同分,下輪兩者迎生死戰(zhàn)

金風說
2025-11-15 05:58:38
男子56萬購入300塊和田玉,擱置10年后,急用錢才發(fā)現(xiàn)其真實價值

男子56萬購入300塊和田玉,擱置10年后,急用錢才發(fā)現(xiàn)其真實價值

蘭姐說故事
2025-11-14 17:15:03
吳石的后人有點意思:明明父親是烈士,兒子吳韶成在河南格外低調(diào)

吳石的后人有點意思:明明父親是烈士,兒子吳韶成在河南格外低調(diào)

小虎新車推薦員
2025-11-14 14:54:30
王思聰榨干21歲女友!攜懶懶喂鹿!不忘買成人用品,表情心事重重

王思聰榨干21歲女友!攜懶懶喂鹿!不忘買成人用品,表情心事重重

八星人
2025-11-12 13:58:57
調(diào)整!11月15日央視直播全運會乒乓球有變,樊振東+陳夢沖擊決賽

調(diào)整!11月15日央視直播全運會乒乓球有變,樊振東+陳夢沖擊決賽

侃球熊弟
2025-11-15 06:11:29
重慶榮昌多人到一處工地“挖寶”,社區(qū):這里沒有寶藏,是別處運來的泥土中有少量銅錢

重慶榮昌多人到一處工地“挖寶”,社區(qū):這里沒有寶藏,是別處運來的泥土中有少量銅錢

極目新聞
2025-11-14 12:14:34
《四喜》大結(jié)局:沈明珠和李景哲結(jié)婚,成為人生的大贏家

《四喜》大結(jié)局:沈明珠和李景哲結(jié)婚,成為人生的大贏家

手工制作阿殲
2025-11-15 02:11:15
一場2-0,給意大利續(xù)命了!9-0狂勝挪威=直通世界杯,小組3隊出局

一場2-0,給意大利續(xù)命了!9-0狂勝挪威=直通世界杯,小組3隊出局

侃球熊弟
2025-11-14 06:13:09
全球銷量第一,它獲選美國《時代》年度最佳發(fā)明之一!與DeepSeek和宇樹科技構(gòu)成“杭州創(chuàng)新軍團”

全球銷量第一,它獲選美國《時代》年度最佳發(fā)明之一!與DeepSeek和宇樹科技構(gòu)成“杭州創(chuàng)新軍團”

中國品牌
2025-11-14 19:01:29
意媒丨前米蘭老板李勇鴻已被宣布破產(chǎn)

意媒丨前米蘭老板李勇鴻已被宣布破產(chǎn)

米蘭圈
2025-11-14 09:06:29
不要玩火!中國嚴重警告日本首相作死言論!日本網(wǎng)友:她惹14億人干啥?!

不要玩火!中國嚴重警告日本首相作死言論!日本網(wǎng)友:她惹14億人干啥?!

英國報姐
2025-11-14 20:36:59
日本把“福建艦”視為首要目標,揚言優(yōu)先擊沉,實力懸殊自取其辱

日本把“福建艦”視為首要目標,揚言優(yōu)先擊沉,實力懸殊自取其辱

荷蘭豆愛健康
2025-11-15 05:55:37
鄭麗文會見三國駐臺代表,國民黨副主席張榮恭訪陸,侯友宜不裝了

鄭麗文會見三國駐臺代表,國民黨副主席張榮恭訪陸,侯友宜不裝了

南宮一二
2025-11-14 16:04:30
杭州保姆縱火案通靈實錄:通靈人與被害人交流,得知朱小貞真實死因

杭州保姆縱火案通靈實錄:通靈人與被害人交流,得知朱小貞真實死因

可兒故事匯
2024-08-29 12:50:53
4-0進決賽爭冠!國乒又一18歲新星崛起:追趕王楚欽林詩棟?

4-0進決賽爭冠!國乒又一18歲新星崛起:追趕王楚欽林詩棟?

李喜林籃球絕殺
2025-11-14 16:35:48
2025-11-15 07:07:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
13869文章數(shù) 66246關(guān)注度
往期回顧 全部

科技要聞

京東“失去的五年”后,找到新增長了嗎?

頭條要聞

中方連發(fā)六張雙語海報@高市早苗 媒體:總該看懂了吧

頭條要聞

中方連發(fā)六張雙語海報@高市早苗 媒體:總該看懂了吧

體育要聞

7-0狂勝!15萬人口小島離世界杯只差1分

娛樂要聞

王家衛(wèi)讓古二替秦雯寫劇情主線?

財經(jīng)要聞

財政部:加強逆周期和跨周期調(diào)節(jié)

汽車要聞

小鵬X9超級增程動態(tài)評測全網(wǎng)首發(fā) 高速實測車內(nèi)65分貝

態(tài)度原創(chuàng)

本地
藝術(shù)
房產(chǎn)
家居
手機

本地新聞

云游安徽 | 江聲浩蕩閱千年,文脈相承看蕪湖

藝術(shù)要聞

中國唯一建在溫泉上的城市,常年22℃,銀杏美了千年

房產(chǎn)要聞

共話產(chǎn)業(yè)變革下的投資新思維與新機遇|藍灣財富論壇精華

家居要聞

現(xiàn)代簡逸 尋找生活的光

手機要聞

雙11霸榜后再爆!iPhone17激活破1000萬,Pro Max憑新造型占近4成

無障礙瀏覽 進入關(guān)懷版 黄色国产精品一区二区三区| 男人影院亚洲人| 亚洲综合一区二区| 在线 | 一区二区三区| 人妻丰满熟妇无码区免费妖精视频| 高清无码你懂得| 国产精品jizz在线观看老狼| 野花香日本大全免费观看| 久久精品囯产精品亚洲| 欧美精品一区二区在在线| 亚洲精品伦理| 九色蝌蚪PORNY精品| 无遮挡1000部拍拍拍免费| 亚洲欧洲综合有码无码| 中文字幕亚洲色妞精品天堂| 女人被黑人躁得好爽视频| 在线a人片免费观看| 亚洲日本少妇一区| 性狠狠18禁久久久久久| 国产精品国产三级国产AⅤ下载| 精品国产丝袜自在线拍国语 | 区蜜桃av人摸人人人澡人人超碰| 热99久久国产| 两根大肉大捧一进一出好爽视频| 久久久久久夜精品精品免费啦老人| HEYZO人妻无码| 男人天堂久久| 97国产视频| 欧美黑人性爱视频| 国产亚洲产品影市在线产品| 无码人妻一区二区三区免费视频| 亚洲AV无码一区东京热久久| 人人舔人人呢| 日韩成人无码v清免费| 日日噜狠狠噜天天噜av| 国产乱色熟女一二三四区 | 成人AV片在线| av免费在线观看网址| 人轮片无码中文字幕| 久久99国产精品成人欧美| 精品无码av无码免费专区|