夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

北京人形開源最新VLM模型,推動具身智能再邁關(guān)鍵一步 !

0
分享至

11月13日,北京人形機器人創(chuàng)新中心全面開源具身智能VLM模型——Pelican-VL 1.0。該模型覆蓋7B、72B參數(shù)規(guī)模,是迄今為止“最大規(guī)模的開源具身多模態(tài)大模型”,同時,也是迄今為止全球性能最強大的具身智能VLM模型,根據(jù)測試,其性能超越GPT-5 同類模型15.79% ,與Google gemini 系列模型相比提升19.25%,同時也超越通義千問、書生萬象等國內(nèi)模型,成為了目前最強的開源具身多模態(tài)大模型 。



另外值得注意的是,Pelican-VL的核心主創(chuàng)團隊都是由女性組成,這也充分體現(xiàn)了女性力量在我國科技研發(fā)中的重要貢獻。該團隊還提出了一套全新的DPPO(刻意訓(xùn)練)訓(xùn)練范式,是全球首創(chuàng)的具身多模態(tài)大模型后訓(xùn)練自進化算法框架。憑借DPPO,Pelican-VL 實現(xiàn)【性能最強】這一目標(biāo)使用的數(shù)據(jù)量為200K,僅僅是其他大模型的1/10甚至1/50,是名副其實的開源VLM性價比之王。

Pelican-VL 1.0 的開源,能夠大幅提升具身智能在商業(yè)服務(wù)、工業(yè)泛工業(yè)、高危特種作業(yè)、家庭服務(wù)等多種真實場景中,通過視覺-語言感知輔助多步任務(wù)規(guī)劃的能力。而VLM作為目前實現(xiàn)機器人全自主的核心,Pelican的開源也將推動我國具身智能全自主發(fā)展。



本次開源的Pelican-VL 1.0的核心優(yōu)勢在于深度整合海量數(shù)據(jù)與自適應(yīng)學(xué)習(xí)機制,在由 1000+ A800 GPU 組成的集群上訓(xùn)練,單次檢查點訓(xùn)練耗費超過 50,000 A800 GPU-小時;團隊從原始數(shù)據(jù)中蒸餾出的包含數(shù)億 token 的高質(zhì)量元數(shù)據(jù)以做訓(xùn)練基石。基于上述優(yōu)勢,Pelican-VL 1.0實現(xiàn)了在基線基礎(chǔ)上性能提升20.3%,平均超過Qwen3-VL系列、InternVL3.5系列等同級別開源模型10.6%。

得益于“刻意練習(xí)”DPPO(Deliberate Practice Policy Optimization)訓(xùn)練范式,Pelican-VL 就像一名刻苦鉆研的學(xué)生:每次訓(xùn)練循環(huán)都會“看視頻—自主練習(xí)—發(fā)現(xiàn)錯誤—糾正提升”。通過DPPO 模仿人類元認知的學(xué)習(xí)方式,通過強化學(xué)習(xí)(RL)探索弱點、生成失敗樣本,再進行有針對性的監(jiān)督微調(diào)(SFT),讓模型不斷自我糾錯和迭代進步。

就像學(xué)生做錯題后總結(jié)經(jīng)驗一樣,Pelican-VL 能在訓(xùn)練中發(fā)現(xiàn)“薄弱知識點”并補齊,從而持續(xù)提高在視覺-語言和具身任務(wù)上的能力。通過這種機制,Pelican-VL 能夠更準(zhǔn)確地理解圖像內(nèi)容、語言指令和物理常識,最終在決策和操作執(zhí)行環(huán)節(jié)中,實現(xiàn)了具身智能在空間-時間推理和動作規(guī)劃方面的大幅突破。

VLM,讓具身擁有智能

人形機器人無疑是目前AI技術(shù)在普通人認知里最具象的展現(xiàn),而讓機器人真正能夠做到服務(wù)人類,一直都是全球研發(fā)團隊所追求的目標(biāo),但這并不容易,背后是具身智能體對于空間-時間的理解不足,以及多步驟長線程復(fù)雜決策的能力缺失造成的困境。

在典型的Vision–Language–Action (VLA) 系統(tǒng)里,Pelican-VL 扮演著“視覺語言大腦”的角色,為機器人提供強大的環(huán)境感知和指令理解能力。它將攝像頭所見與自然語言指令結(jié)合,構(gòu)建起對場景的多模態(tài)表征,然后輸出可供后續(xù)決策單元使用的結(jié)構(gòu)化信息。也就是說,Pelican-VL負責(zé)“看圖聽話”,理解指令和環(huán)境,VLA負責(zé)跨機器人應(yīng)用;簡而言之,Pelican-VL 構(gòu)成了VLA系統(tǒng)的認知前端,為長期規(guī)劃和指令執(zhí)行提供跨模態(tài)的信息支持,使機器人能夠像人類一樣將復(fù)雜任務(wù)拆解并落地操作。

而由于端到端VLA直出的模型存在黑箱性,機器人雖然可以理解人類指令,但最終執(zhí)行的動作卻不可控,而分層的模型則是先建模、再規(guī)劃、最后執(zhí)行,雖然解決了黑箱風(fēng)險,但也產(chǎn)生了新的信息傳導(dǎo)誤差問題,信息隨著每一層模型的傳遞,可能會在某一層產(chǎn)生微小誤差,這一誤差會在后續(xù)環(huán)節(jié)呈現(xiàn)指數(shù)級的擴散。

北京人形的解法是讓VLM和世界模型相互糾偏作為大腦,再與VLA等構(gòu)建的技能庫模型協(xié)作。通過將VLM部署在云端,用于理解指令、規(guī)劃任務(wù)與生成策略,世界模型則對物理世界進行建模與預(yù)測,VLM規(guī)劃的策略在世界模型中進行預(yù)演,預(yù)測執(zhí)行策略后的結(jié)果。二者通過反饋機制相互作用,具象化的理解策略的后果,根據(jù)好壞精進能力,VLM能力提升后又反向修正和提升世界模型的預(yù)測準(zhǔn)確性,以此幫助機器人實現(xiàn)能力躍遷的關(guān)鍵。

以下面這個復(fù)合指令為例:“把鞋子放到鞋架上、將桌上的垃圾扔到垃圾桶,再把衣服放入洗衣機”。Pelican-VL 首先將會感知房間物體和布局,構(gòu)建出整個環(huán)境的語義表示;接著根據(jù)指令自動生成行動序列:依次移動到鞋架、垃圾桶和洗衣機位置并進行抓取和放置操作。



作為創(chuàng)造全球首個人形機器人馬拉松冠軍的團隊,北京人形致力于讓具身智能體從最能跑到最聰明、最好用的演進,本次Pelican-VL的開源也代表著北京人形在具身智能領(lǐng)域的又一重大突破。

而Pelican-VL代表了國內(nèi)具身智能的一種端到端解法,它和Google提出的RT-2有著相似特點,都是追求單模型解決感知到執(zhí)行,但不同于RT-2基于PaLM-E、PaLI-X等預(yù)訓(xùn)練模型微調(diào)的思路,Pelican-VL是從零開始構(gòu)建大規(guī)模具身訓(xùn)練集并使用DPPO循環(huán)自我演練,而與SayCan、GPT-5相比,它則更強調(diào)開放性和端到端的控制輸出,為不同機器人提供統(tǒng)一的智能“大腦”解決方案。

因此,Pelican-VL不僅具備目前具身智能大模型里最大的規(guī)模、最強的性能,也能夠幫助人形機器人更好的感知空間-時間、實現(xiàn)具身交互,并且在訓(xùn)練中進行自我糾錯與迭代。

開源當(dāng)天,北京人形進行了直播演示和技術(shù)解讀,邀請了《商業(yè)漫談 Jane’s Talk》創(chuàng)始人、科技媒體人衛(wèi)詩婕與主創(chuàng)成員深度對話,不僅詳細展現(xiàn)了具身智能大腦Pelican-VL全面領(lǐng)先的性能,并拆解Pelican-VL創(chuàng)新的技術(shù)架構(gòu),還充分展示了女性研發(fā)成員在具身智能模型領(lǐng)域的創(chuàng)新力量。



用“最低”的門檻,激發(fā)“最高”的產(chǎn)業(yè)活力

北京人形希望通過Pelican-VL 的開放為產(chǎn)業(yè)落地提供更良好土壤,讓廣大機器人廠商和開發(fā)者可以自由使用與定制這一模型,加速研發(fā)進程。例如,北京人形機器人創(chuàng)新中心還在推進“千臺機器人真實場景數(shù)據(jù)采集計劃”,讓上千臺機器人在工廠、倉庫、酒店等場景中執(zhí)行任務(wù)并采集數(shù)據(jù)。而這些規(guī)?;亩嗄B(tài)數(shù)據(jù)與Pelican-VL結(jié)合,將推動其在制造業(yè)自動化、智能物流、零售無人化和家居服務(wù)等多領(lǐng)域的快速適配和優(yōu)化。

Pelican-VL 的開源特點和多場景覆蓋能力可以視作機器人生態(tài)的“開放型大腦”,作為具身智能的基礎(chǔ)軟件平臺,廠商可以基于它快速開發(fā)特定場景下的應(yīng)用方案,大大降低開發(fā)成本和難度。長期來看,Pelican-VL 及其后續(xù)版本將促進國內(nèi)形成完善的通用機器人智能平臺,推動更多種類的機器人像安裝“通用智能操作系統(tǒng)”一樣迅速獲取新能力。

Pelican-VL 1.0 的開源標(biāo)志著具身智能進入了一個以數(shù)據(jù)驅(qū)動、開放協(xié)同為核心的新階段。它不僅在技術(shù)上實現(xiàn)了視覺、語言和行動的深度融合,也為產(chǎn)業(yè)鏈帶來了全新的合作模式。隨著更多研究機構(gòu)和企業(yè)參與生態(tài)建設(shè),北京人形致力于通過通用機器人“大腦”市場的發(fā)展,讓更多機器人在可見的未來中具備“通用智能”、靈活自適應(yīng)的能力。

VLM模型——Pelican-VL 1.0主頁

https://pelican-vl.github.io/

Github

GitHub - Open-X-Humanoid/pelican-vl: Pelican-VL 1.0 is a new family of open-source embodied brain mo

Huggingface

https://huggingface.co/X-Humanoid/Pelican1.0-VL-72B

Modelscope

https://modelscope.cn/models/X-Humanoid/Pelican1.0-VL-72B

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
必看!埃基蒂克 23 分鐘封神后,斯洛特該這樣排兵救利物浦

必看!埃基蒂克 23 分鐘封神后,斯洛特該這樣排兵救利物浦

奶蓋熊本熊
2025-11-15 02:28:24
江蘇全運三人男籃被判全隊奪權(quán)離場后續(xù):組委會對江蘇隊追加禁賽

江蘇全運三人男籃被判全隊奪權(quán)離場后續(xù):組委會對江蘇隊追加禁賽

狼叔評論
2025-11-14 18:14:29
萬萬沒有想到,特朗普站隊中國,嘲笑日本沒實力,高市被懟不虧!

萬萬沒有想到,特朗普站隊中國,嘲笑日本沒實力,高市被懟不虧!

飛花逐月大帝
2025-11-15 10:04:41
下一站德乙!王鈺棟即將加盟沙爾克04隊!已簽約歐洲經(jīng)紀(jì)公司!

下一站德乙!王鈺棟即將加盟沙爾克04隊!已簽約歐洲經(jīng)紀(jì)公司!

海浪星體育
2025-11-14 14:39:37
扎哈羅娃警告北約:俄將全力回應(yīng)任何攻擊

扎哈羅娃警告北約:俄將全力回應(yīng)任何攻擊

環(huán)球網(wǎng)資訊
2025-11-15 06:46:12
戾氣越來越重了!

戾氣越來越重了!

深度報
2025-11-13 23:06:32
分享解剖學(xué)知識,破除多年來的G點謠傳

分享解剖學(xué)知識,破除多年來的G點謠傳

遠方青木
2025-10-25 00:06:11
中方會見泰國國王和王后 泰國國王:中泰是至親

中方會見泰國國王和王后 泰國國王:中泰是至親

看看新聞Knews
2025-11-14 20:57:02
蔣萬安立場堅定:拒絕兩岸統(tǒng)一,鄭麗文對統(tǒng)一話題的回避讓人震驚

蔣萬安立場堅定:拒絕兩岸統(tǒng)一,鄭麗文對統(tǒng)一話題的回避讓人震驚

觀星賞月
2025-11-08 09:34:33
中國唯一建在溫泉上的城市,常年22℃,銀杏美了千年

中國唯一建在溫泉上的城市,常年22℃,銀杏美了千年

中國藝術(shù)家
2025-11-15 05:34:52
泰國國王和王后首次訪華,王后穿斗篷千鳥格大衣,高貴端莊又超美

泰國國王和王后首次訪華,王后穿斗篷千鳥格大衣,高貴端莊又超美

小魚愛魚樂
2025-11-15 09:32:30
腐敗有人查、問題有人管、利益有人護!遼寧省委書記:省、市兩級對自收涉基層問題線索全部提級、直查直辦

腐敗有人查、問題有人管、利益有人護!遼寧省委書記:省、市兩級對自收涉基層問題線索全部提級、直查直辦

政知新媒體
2025-11-14 20:47:36
案情越來越清晰!長治“狗咬人引發(fā)命案”的致命傷,或與被告無關(guān)

案情越來越清晰!長治“狗咬人引發(fā)命案”的致命傷,或與被告無關(guān)

火山詩話
2025-11-14 08:58:55
老鄉(xiāng)們就是擠破頭也要涌入上海這個不宜居的城市,爭先恐后

老鄉(xiāng)們就是擠破頭也要涌入上海這個不宜居的城市,爭先恐后

上海云河
2025-11-14 15:08:39
紅軍長征,項英為何喜形于色地留下?陳毅:他的想法讓人哭笑不得

紅軍長征,項英為何喜形于色地留下?陳毅:他的想法讓人哭笑不得

顧史
2025-11-14 10:14:17
惹怒中國后,高市宣布參加G20峰會,或與中方當(dāng)面溝通臺海問題

惹怒中國后,高市宣布參加G20峰會,或與中方當(dāng)面溝通臺海問題

我心縱橫天地間
2025-11-14 13:37:31
誰說屁股大就不能穿瑜伽褲?黃色T恤搭薄荷綠瑜伽褲,成熟有活力

誰說屁股大就不能穿瑜伽褲?黃色T恤搭薄荷綠瑜伽褲,成熟有活力

小喬古裝漢服
2025-11-12 11:46:01
終于低下高貴頭顱,美國公開表示:若中國要大豆,希望先找美國

終于低下高貴頭顱,美國公開表示:若中國要大豆,希望先找美國

三農(nóng)老歷
2025-11-15 09:55:51
泰倫·盧收到了來自快船老板史蒂夫·鮑爾默的信息

泰倫·盧收到了來自快船老板史蒂夫·鮑爾默的信息

葉赫那拉菲菲
2025-11-15 05:37:16
一夜負債200億?電動車巨頭轟然倒塌:活成賈躍亭信徒

一夜負債200億?電動車巨頭轟然倒塌:活成賈躍亭信徒

歸史
2025-11-15 09:25:00
2025-11-15 11:12:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11676文章數(shù) 176330關(guān)注度
往期回顧 全部

科技要聞

撕掉流量外衣,小米還剩什么?

頭條要聞

業(yè)主爆改一梯一戶 公攤電梯廳成火鍋涮菜區(qū)和私人影院

頭條要聞

業(yè)主爆改一梯一戶 公攤電梯廳成火鍋涮菜區(qū)和私人影院

體育要聞

7-0狂勝!15萬人口小島離世界杯只差1分

娛樂要聞

爭議!評委張藝謀被質(zhì)疑保送易烊千璽

財經(jīng)要聞

小米之“惑”

汽車要聞

小鵬X9超級增程動態(tài)評測全網(wǎng)首發(fā) 高速實測車內(nèi)65分貝

態(tài)度原創(chuàng)

藝術(shù)
健康
手機
房產(chǎn)
本地

藝術(shù)要聞

書法界驚呆了!14字狂草為何讓專家稱贊不已?

金振口服液助力科學(xué)應(yīng)對呼吸道疾病

手機要聞

CounterPoint稱iPhone Air成鯰魚,倒逼中國手機企業(yè)緊跟eSIM

房產(chǎn)要聞

共話產(chǎn)業(yè)變革下的投資新思維與新機遇|藍灣財富論壇精華

本地新聞

云游安徽 | 江聲浩蕩閱千年,文脈相承看蕪湖

無障礙瀏覽 進入關(guān)懷版 香港经典a毛片免费观看hd| 视频一区二区熟女| 少妇高潮喷水惨叫久久久久电影| AV 激情小说| 乱中年女人伦av三区| 1777米奇色狠俺去| 人人愛人人操| 98国产精品综合一区二区三区| 很很的日视频| 97在线无码免费人妻短视频| 国产一卡2卡3卡四卡精品网站免费国| 自慰被室友看见强行嗯啊男男| 五月丁香六月狠狠爱综合| 无码免费的毛片基地网站| 国产精品 视频一区 二区三区| 国产成人亚洲日韩欧美| 亚讲AV无码国产精品色| 最新AV手机在线| 成人无码免费一区二区三区| 国产天堂AV网| 国产裸舞福利在线视频合集| 亚1州区2区3区4区产品乱码2021| 国产好大好爽久久久久久久| 国产一二三视频| 99久久精品国产一区二区蜜芽| 国产精品自在线拍国产| 久久肥臀爆乳大屁股| 免费真人av| 国产精品无码久久久久久蜜臀aⅴ| 久久永久视频| 清纯唯美一区二区三区| 清纯唯美二区| 成人亚洲欧美一区二区三区| 国内精品久久久| 国产干逼免费视频| 被拉到野外强要好爽| 国产成人无码免费一区二区三区| 欧美人与zoxxxx乱叫| 亚洲精品拍拍央视网出文| 少妇高潮尖叫黑人激情在线| 老色鬼天堂appiOS|