夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GAIR 2025 「數(shù)據(jù)&一腦多形」分論壇,激辯 AI 演進(jìn)路徑

0
分享至



過去十年,AI的核心突破是從專用走向通用的語(yǔ)言理解;未來(lái)十年的關(guān)鍵戰(zhàn)役,或許就是將這種通用性,從語(yǔ)言世界拓展到物理世界。

作者丨吳彤 劉欣 齊鋮湧 梁丙鑒

編輯丨林覺民 馬曉寧


在12月13日舉行的第八屆GAIR全球人工智能與機(jī)器人大會(huì)“數(shù)據(jù)&一腦多形”分論壇上,兩個(gè)看似獨(dú)立卻緊密交織的技術(shù)前沿——數(shù)據(jù)的價(jià)值重構(gòu)與一腦多形(One Brain, Many Forms)的架構(gòu)革命,成為探索下一代智能系統(tǒng)的核心焦點(diǎn)。

一方面,數(shù)據(jù)正從傳統(tǒng)的“資源”角色,向更本質(zhì)的“認(rèn)知基礎(chǔ)”與“價(jià)值載體”演進(jìn)。

隨著多模態(tài)大模型的爆發(fā),高質(zhì)量、結(jié)構(gòu)化、富有邏輯鏈的數(shù)據(jù)已不再是模型的“養(yǎng)料”那么簡(jiǎn)單,它正演化為定義模型認(rèn)知邊界與價(jià)值對(duì)齊的核心框架。

本次論壇深入探討了如何在數(shù)據(jù)洪流中構(gòu)建更具解釋性、可信度與進(jìn)化能力的知識(shí)體系,以及如何通過數(shù)據(jù)流動(dòng)重塑產(chǎn)業(yè)智能化的閉環(huán)。數(shù)據(jù)不再僅僅是起點(diǎn),更是驅(qū)動(dòng)智能持續(xù)進(jìn)化、與人和社會(huì)和諧共生的核心紐帶。

另一方面,“一腦多形”的范式正在重新定義智能的構(gòu)建方式。

它超越了單一模型解決特定任務(wù)的局限,指向一個(gè)更具適應(yīng)性與擴(kuò)展性的未來(lái):一個(gè)統(tǒng)一的底層認(rèn)知核心(“一腦”),能夠動(dòng)態(tài)衍生出適應(yīng)不同場(chǎng)景、模態(tài)與任務(wù)的多種形態(tài)。這不僅是架構(gòu)效率的革命,更是智能向通用性與自主性邁進(jìn)的關(guān)鍵一步。

論壇聚焦于如何讓同一個(gè)“大腦”理解語(yǔ)言、解析視覺、操控實(shí)體,并在不同形態(tài)間共享知識(shí)、遷移能力,最終實(shí)現(xiàn)從“專用智能”到“統(tǒng)一智能”的躍遷。

兩者的融合,恰恰勾勒出通往更高級(jí)人工智能的路徑:以革新性的數(shù)據(jù)方法論,滋養(yǎng)和約束一個(gè)具有統(tǒng)一認(rèn)知且形態(tài)多樣的智能核心。

這不僅是技術(shù)的耦合,更是對(duì)智能本質(zhì)的深度思考——如何讓機(jī)器在理解復(fù)雜世界的同時(shí),也能靈活、可靠地服務(wù)于這個(gè)世界的無(wú)限場(chǎng)景。因此,本次分論壇的討論,正是這一宏大征程的重要注腳。

01

新數(shù)據(jù)范式:驅(qū)動(dòng)模型演進(jìn)的核心基礎(chǔ)設(shè)施

諾亦騰機(jī)器人創(chuàng)始人&CEO戴若犁:用動(dòng)作捕捉技術(shù)構(gòu)建具身智能數(shù)據(jù)工廠


在下午的“數(shù)據(jù) & 一腦多形”專場(chǎng)中,首場(chǎng)分享由諾亦騰機(jī)器人(Noitom Robotics)創(chuàng)始人/CEO 戴若犁博士帶來(lái),主題為《用動(dòng)作捕捉技術(shù)構(gòu)建具身智能數(shù)據(jù)工廠》。

深耕動(dòng)作捕捉與運(yùn)動(dòng)相關(guān)技術(shù)研究十余年,戴若犁博士在分享中回顧了自己對(duì)技術(shù)路徑與產(chǎn)業(yè)方向的長(zhǎng)期思考,并指出,人形機(jī)器人所代表的具身智能,正在成為一個(gè)天花板足夠高、且對(duì)高質(zhì)量數(shù)據(jù)有強(qiáng)烈需求的新賽道。

他提到,隨著人形機(jī)器人和具身智能研究逐步進(jìn)入工程化階段,行業(yè)對(duì)高質(zhì)量、大規(guī)模數(shù)據(jù)的關(guān)注度顯著提升,越來(lái)越多的企業(yè)開始系統(tǒng)性地思考數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量與模型能力之間的關(guān)系。

在談到數(shù)據(jù)商業(yè)模式時(shí),戴若犁博士強(qiáng)調(diào),不同領(lǐng)域的數(shù)據(jù)生產(chǎn)邏輯存在本質(zhì)差異。具身智能對(duì)數(shù)據(jù)的獲取方式、結(jié)構(gòu)形式以及可遷移性提出了更高要求,這也決定了如果甲方獲取生數(shù)據(jù)的能力和乙方平權(quán),那這個(gè)領(lǐng)域的毛利天花板注定是可觀的。

在案例分享環(huán)節(jié),他介紹了與西湖機(jī)器人在全身遙操作(whole-body teleoperation)方向上的合作實(shí)踐,戴博團(tuán)隊(duì)提供的動(dòng)作捕捉設(shè)備為相關(guān)研究提供了技術(shù)支持,貢獻(xiàn)了一份自己的力量。

同時(shí),戴若犁博士也從工程實(shí)踐出發(fā),客觀分析了遙操作作為數(shù)據(jù)獲取手段所面臨的三大結(jié)構(gòu)性挑戰(zhàn)(“原罪”),包括:

  • 成本效率:昂貴而緩慢,成功率很低。

  • 能力局限性:比如靈巧性高的手內(nèi)的操作(in-hand manipulation)、高精度依賴力觸覺的雙手協(xié)同、非視覺引導(dǎo)操作(vision non-guided manipulation)無(wú)法執(zhí)行,只有pick and place最成熟。

  • 以及跨本體泛化能力等問題。

這些現(xiàn)實(shí)痛點(diǎn),正推動(dòng)行業(yè)進(jìn)一步探索更加通用、可擴(kuò)展的數(shù)據(jù)獲取范式。24年7月份,全球包括戴博團(tuán)隊(duì)在內(nèi)的五個(gè)組都開始探索“如何讓數(shù)據(jù)能夠跨本體”。

正是在這樣的背景下,行業(yè)開始將視角逐步拓展至以人為中心(human-centric)的數(shù)據(jù)路徑,嘗試構(gòu)建不與單一機(jī)器人本體強(qiáng)綁定的數(shù)據(jù)體系,從而提升數(shù)據(jù)在不同形態(tài)、不同平臺(tái)之間的復(fù)用價(jià)值。

圍繞這一思路,戴若犁博士介紹了諾亦騰機(jī)器人(Noitom Robotics)建設(shè)具身智能數(shù)據(jù)工廠的實(shí)踐經(jīng)驗(yàn)。相關(guān)數(shù)據(jù)采集工作覆蓋標(biāo)準(zhǔn)化采集與真實(shí)場(chǎng)景采集等多種形式,并在持續(xù)迭代中不斷優(yōu)化數(shù)據(jù)結(jié)構(gòu)與生產(chǎn)流程。

分享中,他還展示了具身智能數(shù)據(jù)的“數(shù)據(jù)金字塔”框架,并提出:在設(shè)計(jì)不同層級(jí)的數(shù)據(jù)獲取方案時(shí),理解每一層數(shù)據(jù)的“第一性問題”至關(guān)重要,只有明確數(shù)據(jù)的核心價(jià)值,才能在工程和商業(yè)層面形成可持續(xù)的路徑。

演講最后,戴若犁博士引用Sergey Levine的學(xué)界作結(jié),以形象的“勺叉”比喻強(qiáng)調(diào)技術(shù)與產(chǎn)品取舍的重要性:與其追求“什么都能做”,不如聚焦于真正關(guān)鍵、能夠解決核心問題的能力,從而在復(fù)雜系統(tǒng)中構(gòu)建清晰而有效的價(jià)值?!叭绻阆覃湲?dāng)勞里的勺叉,不僅在喝湯的時(shí)候會(huì)漏,還叉不起來(lái)雞塊。既要又要的結(jié)果就是個(gè)勺叉,咱不當(dāng)勺叉,咱們當(dāng)一個(gè)好用的叉子就行。”

極數(shù)迭代CEO,深圳AIRS訪問研究員佟顯喬:具身智能的數(shù)據(jù)工程解決方案思考


接下來(lái)分享的是極數(shù)迭代 CEO、深圳 AIRS 訪問研究員佟顯喬,他的分享主題是《具身智能的數(shù)據(jù)工程解決方案思考》。在該領(lǐng)域,佟顯喬積累了大量一線經(jīng)驗(yàn)。

一開場(chǎng),他率先拋出觀點(diǎn):無(wú)論具身模型如何演進(jìn),數(shù)據(jù)始終是基石。他預(yù)測(cè),未來(lái)幾年具身數(shù)據(jù)體量將爆發(fā)式增長(zhǎng),“具身數(shù)據(jù)服務(wù)”會(huì)成為機(jī)器人賽道里下一個(gè)“Scale AI”級(jí)別的確定性機(jī)會(huì)。

結(jié)合過往實(shí)踐,佟顯喬梳理出當(dāng)前幾大數(shù)據(jù)瓶頸:機(jī)器人泛化能力差,與數(shù)據(jù)量呈冪律關(guān)系——現(xiàn)有數(shù)據(jù)遠(yuǎn)不能達(dá)到較高成功率;大規(guī)模、高質(zhì)量數(shù)據(jù)采集成本極高,真機(jī)與動(dòng)作捕捉投入巨大,難以負(fù)擔(dān);模型能力難以跨本體遷移,數(shù)據(jù)孤島化且缺乏統(tǒng)一評(píng)估標(biāo)準(zhǔn)……這些底層采集方案與數(shù)據(jù)標(biāo)準(zhǔn)設(shè)計(jì)上的挑戰(zhàn),恰恰意味著行業(yè)新機(jī)會(huì)。

隨后,他梳理出當(dāng)下主流技術(shù)路線:大腦(system 2)負(fù)責(zé)理解物理世界常識(shí)與人類指令,分解復(fù)雜任務(wù);小腦負(fù)責(zé)技能,如抓取、按壓等,需人類示教與標(biāo)注數(shù)據(jù)。二者需端到端融合訓(xùn)練。不同流派都需要大量異構(gòu)數(shù)據(jù)、人工參與,以及跨場(chǎng)景、跨任務(wù)的泛化能力。

佟顯喬把數(shù)據(jù)采集現(xiàn)狀歸納為兩條路徑:

真機(jī)端:以末端執(zhí)行器動(dòng)捕、人類視覺示教、同構(gòu)遙操及“光慣混合操作”為主;

仿真端:圍繞軌跡合成、資產(chǎn)合成、預(yù)測(cè)生成與決策生成等維度展開。

作為極數(shù)迭代聯(lián)合創(chuàng)始人兼 CEO、機(jī)器人與自動(dòng)駕駛領(lǐng)域?qū)<?,佟顯喬曾在百度美研、蘋果、英偉達(dá)等公司深耕多年。接著,他分享了具身智能數(shù)據(jù)平臺(tái)的設(shè)計(jì)思路。

一方面,平臺(tái)化可針對(duì)場(chǎng)景做系統(tǒng)化設(shè)計(jì),在高效與可靠之間取得平衡,鎖定數(shù)據(jù)標(biāo)準(zhǔn),提升真機(jī)與仿真采集效率,并優(yōu)化部署對(duì)接;另一方面,通過兼容性設(shè)計(jì)與低代碼接口降低使用門檻。

他還提出真機(jī)數(shù)據(jù)的“萬(wàn)物皆可達(dá)”、仿真數(shù)據(jù)的“萬(wàn)物皆可生”兩大系統(tǒng),并引入 AI Agent 概念,借助大模型完成自動(dòng)標(biāo)注、資源管理與模型評(píng)測(cè),構(gòu)建完整數(shù)據(jù)工具鏈。實(shí)測(cè)下來(lái),真實(shí)世界數(shù)據(jù)集構(gòu)建速度提升 30×,仿真數(shù)據(jù)生成提升 3.5×,以數(shù)據(jù)飛輪方式加速模型迭代。

分享結(jié)尾,佟顯喬給出判斷數(shù)據(jù)好壞的經(jīng)典洞察:“從最終模型反推——能讓模型表現(xiàn)優(yōu)異的數(shù)據(jù),就是好數(shù)據(jù)?!?/p>

圓桌論壇:具身數(shù)據(jù)如何塑造行業(yè)未來(lái)?


數(shù)據(jù)專場(chǎng)的最后環(huán)節(jié),以具身數(shù)據(jù)為主題的圓桌論壇在王建明的主持下正式開始。王建明、戴若犁、佟顯喬、丁琰四位嘉賓圍繞具身數(shù)據(jù)采集、數(shù)據(jù)飛輪等議題展開了深度對(duì)話。

對(duì)機(jī)器人而言,什么是好的數(shù)據(jù)?王建明以數(shù)據(jù)質(zhì)量切入,幾位嘉賓就“以終為始”達(dá)成了共識(shí),最終的模型性能、訓(xùn)練中機(jī)器人的受益程度反映著數(shù)據(jù)的質(zhì)量。丁琰進(jìn)一步指出,采集成本和各種數(shù)采方式對(duì)于不同場(chǎng)景和硬件的適配與否,都是決定數(shù)據(jù)質(zhì)量的關(guān)鍵環(huán)節(jié)。

未來(lái)的數(shù)據(jù)采集方式或?qū)⒆呦蚨嘣?。作為一家有?shù)據(jù)能力的創(chuàng)業(yè)公司,丁琰表示,鹿明機(jī)器人正在籌建自己的數(shù)采廠。出于成本考慮,現(xiàn)階段采用UMI方式進(jìn)行數(shù)據(jù)采集,但未來(lái)仍可能引進(jìn)更多方案。“遙操作、UMI(Universal Manipulation Interface)、動(dòng)捕、仿真數(shù)據(jù),存在即合理。”丁琰強(qiáng)調(diào)。

戴若犁就In-the-wild的數(shù)據(jù)采集方式發(fā)出了提醒,他指出這是一種高度考驗(yàn)技術(shù)水平的方案,其落地需要先后克服軟硬件易用性、組織管理能力兩道難關(guān),而在當(dāng)前的時(shí)間節(jié)點(diǎn),邁過前者的技術(shù)門檻無(wú)疑更為重要。

具體而言,在采集階段需要低摩擦、高精度、多模態(tài)的數(shù)采設(shè)備,野采數(shù)據(jù)的利用,還需要從稀疏原始數(shù)據(jù)中得到稠密信息的技術(shù)方案。戴若犁認(rèn)為,一條可行的鏈路是通過世界模型進(jìn)行先驗(yàn)估計(jì)。相較之下,遠(yuǎn)未到比拼人力組織能力的時(shí)間。

佟顯喬認(rèn)為,數(shù)據(jù)采集行業(yè)仍處于早期階段,數(shù)據(jù)、本體、模型公司仍在相互磨合。不同的模型公司提出了不同的需求,這意味著數(shù)據(jù)采集公司不能停留于堆人力的體力活階段,而是要懂模型、給建議?!澳P凸疽残枰愕膋nowledge”,佟顯喬強(qiáng)調(diào),“一個(gè)個(gè)批次之后,大家才能一起做得更好?!?/p>

02

AI的“大腦”革命:一腦,何以多形?

過去兩年,具身智能的火熱源于一個(gè)共同期待:大語(yǔ)言模型的出色能力有目共睹,若將其接入機(jī)器人,有望賦予機(jī)器人更聰明的大腦,從而為行業(yè)打開新空間。

然而熱鬧兩年后,具身智能仍沒有標(biāo)準(zhǔn)答案。在眾多技術(shù)路線中,“一腦多形”被提及得最多——同一套智能系統(tǒng),可適配人形、車形等不同形態(tài),只要場(chǎng)景需要,外形可變,核心大腦不變。

接下來(lái)登場(chǎng)的嘉賓們,對(duì)“一腦多形”帶來(lái)了不同方向的詮釋和分享。

微分智飛創(chuàng)始人高飛教授:智能飛行機(jī)器人研究進(jìn)展及產(chǎn)業(yè)應(yīng)用


率先登場(chǎng)的,是微分智飛創(chuàng)始人高飛教授,他帶來(lái)的分享主題是《智能飛行機(jī)器

人研究進(jìn)展及產(chǎn)業(yè)應(yīng)用》。

高飛的演講風(fēng)格極具畫面感:他用《普羅米修斯》的無(wú)人機(jī)編隊(duì)鏡頭引出“分布式集群”終極形態(tài),又用《流浪地球》的混亂場(chǎng)景對(duì)比“去中心化”的重要性。

一開場(chǎng),他拋出判斷:通用飛行智能正處于爆發(fā)前夜。

隨后列出行業(yè)“老大難”問題:氣流擾動(dòng)大,擦碰即墜機(jī);機(jī)載算力弱,傳感器廉價(jià);數(shù)據(jù)稀缺,采集比車輛/行人困難得多。

高飛認(rèn)為,這些行業(yè)難題是困難,也是機(jī)會(huì),目前他們團(tuán)隊(duì)正逐步攻克這些難關(guān),也因此會(huì)形成自己的技術(shù)護(hù)城河。

在接下來(lái)的演講里,他從五個(gè)方面展示了團(tuán)隊(duì)的技術(shù)突破。

首先是敏捷輕量的多任務(wù)小腦,高飛教授現(xiàn)場(chǎng)展示了一鏡到底的實(shí)飛視頻,畫面里無(wú)人機(jī)的飛行能力非??犰琶艚?,可以穿越各種狹窄縫隙,比專業(yè)的飛手操作更熟練。

為了更形象說(shuō)明這一點(diǎn),他展示了一場(chǎng)長(zhǎng)鏈路動(dòng)作下飛手和機(jī)器人的人機(jī)對(duì)抗,其中包含連續(xù)倒轉(zhuǎn)穿過六個(gè)框的特技飛行等動(dòng)作。實(shí)驗(yàn)表明,相比高水平飛手,算法完成的軌跡質(zhì)量有明顯提升。

這里他還提到一個(gè)細(xì)節(jié),他們團(tuán)隊(duì)最小的端到端神經(jīng)網(wǎng)絡(luò)可以運(yùn)行在 自重僅50 克左右的無(wú)人機(jī)上,其機(jī)載算力低于 1 Tops。借助團(tuán)隊(duì)研發(fā)的自動(dòng)化數(shù)據(jù)采集系統(tǒng)和合成數(shù)據(jù)生成管線,有效數(shù)據(jù)采集成本大大降低,

大腦方面,高飛老師認(rèn)為跨本體和跨場(chǎng)景非常重要。

他展示了一個(gè)飛行器在無(wú)GPS和人為操作的環(huán)境下走迷宮,還展示了復(fù)雜地下空間場(chǎng)景中飛行器的自主決策和自主導(dǎo)航過程。

他突出了集群系統(tǒng)和分布式群腦飛行,展示了多個(gè)一鏡到底的 demo :無(wú)人機(jī)集群穿越復(fù)雜稠密竹林的自主導(dǎo)航,以及五臺(tái)飛行機(jī)器人協(xié)同搬運(yùn)載荷。

最后,高飛教授還放了一個(gè)彩蛋。

在家庭空間里,飛行操作一體化的飛行機(jī)器人可以幫人拿飲料、拿物品,高飛教授表示,他們已經(jīng)可以做到通過單電機(jī)線驅(qū)動(dòng)機(jī)構(gòu)實(shí)現(xiàn)飛行機(jī)械手的多自由度形變,使其在穩(wěn)定飛行同時(shí)展現(xiàn)出指尖捏取和掌心抓握等交互操作能力。這種新構(gòu)型飛行器雖然操作自由度不高,但可實(shí)現(xiàn)抓了就跑,充分發(fā)揮本體移動(dòng)性優(yōu)勢(shì),未來(lái)有望應(yīng)用于短途物品運(yùn)送,還可作為人手的空間延伸,通過端側(cè)輔助駕駛完成復(fù)雜任務(wù)。

這些技術(shù)的展示充滿了對(duì)技術(shù)落地應(yīng)用的想象力。

最后高飛對(duì)研發(fā)成果的潛在應(yīng)用也做了總結(jié),憑借“小腦-大腦-群腦”三位一體方案,飛行具身智能體目前已經(jīng)可以代替人進(jìn)入高危環(huán)境完成信息采集,也正在推進(jìn)在安防巡檢、物流運(yùn)輸?shù)葓?chǎng)景的落地應(yīng)用。

寧波東方理工大學(xué)的助理教授金鑫:空間智能技術(shù)在自動(dòng)駕駛及具身機(jī)器人中的初步探索與應(yīng)用


寧波東方理工大學(xué)的助理教授金鑫,做了題為《空間智能技術(shù)在自動(dòng)駕駛及具身機(jī)器人中的初步探索與應(yīng)用》的分享。

金鑫表示,其團(tuán)隊(duì)圍繞空間智能在自動(dòng)駕駛與機(jī)器人領(lǐng)域的應(yīng)用進(jìn)行了初步探索。他將空間智能分為三個(gè)層級(jí):基礎(chǔ)的空間感知(構(gòu)建3D世界)、進(jìn)階的空間交互(支持智能體與環(huán)境的互動(dòng))以及最終的空間理解與生成(基于對(duì)世界的理解創(chuàng)造數(shù)據(jù))。

團(tuán)隊(duì)將工作細(xì)分為空間構(gòu)建與智能體訓(xùn)練兩部分,并形成了“建模-訓(xùn)練-迭代優(yōu)化”的閉環(huán)研發(fā)飛輪。

在自動(dòng)駕駛領(lǐng)域,針對(duì)真實(shí)數(shù)據(jù)采集難以覆蓋極端場(chǎng)景的痛點(diǎn),團(tuán)隊(duì)提出了以“占據(jù)柵格”(Occupancy)為中心的生成方案UniScene(CVPR25)。金鑫指出,Occupancy是連接場(chǎng)景理解與多模態(tài)生成的理想橋梁,它兼顧了必要的語(yǔ)義和幾何信息。

基于此,團(tuán)隊(duì)開發(fā)了兩階段生成流程:先由鳥瞰圖布局生成語(yǔ)義Occupancy,再以此衍生出激光雷達(dá)點(diǎn)云與多視角視頻。該方案的迭代版本(UniScene V2)新增了深度與語(yǔ)義分割模態(tài),并支持按傳感器位置生成數(shù)據(jù),目前已與理想汽車合作測(cè)試其在復(fù)雜場(chǎng)景下的泛化能力。

更進(jìn)一步,團(tuán)隊(duì)在近期的工作OmniNWM中,引入了“規(guī)劃-生成”的閉環(huán)機(jī)制。

金鑫解釋道,該模型能將規(guī)劃的軌跡作為條件輸入,預(yù)測(cè)未來(lái)場(chǎng)景變化,并在世界模型內(nèi)部通過計(jì)算Occupancy的物理指標(biāo)(如碰撞、速度)實(shí)現(xiàn)獎(jiǎng)勵(lì)反饋與閉環(huán)優(yōu)化,從而構(gòu)建“萬(wàn)能駕駛導(dǎo)航世界模型”。

在機(jī)器人領(lǐng)域,團(tuán)隊(duì)將相同方法論遷移,用于生成機(jī)器人訓(xùn)練數(shù)據(jù),提出ORV框架。

針對(duì)第一人稱視角數(shù)據(jù)稀缺的問題,團(tuán)隊(duì)構(gòu)建了InterVLA數(shù)據(jù)集,通過學(xué)生模擬機(jī)器人并佩戴GoPro,配合動(dòng)捕設(shè)備,采集了包含語(yǔ)言指令、多視角視頻與動(dòng)作軌跡的數(shù)據(jù)。同時(shí),團(tuán)隊(duì)與北京銀河通用合作研發(fā)的DreamVLA模型,其核心思想是將大語(yǔ)言模型的“思維鏈”思想引入視覺-語(yǔ)言-動(dòng)作模型,讓模型在輸出最終動(dòng)作前,先在潛在空間中推理出“世界知識(shí)”(如哪些物體需移動(dòng)、深度估計(jì)等),從而提升決策的可解釋性與泛化能力。

此外,針對(duì)機(jī)器人方位感知弱的問題,團(tuán)隊(duì)還提出了模塊化的“方位基礎(chǔ)模型”,使其能像人一樣抓取物體的合適部位(如瓶身而非瓶蓋)。最后,金鑫介紹了將“解耦學(xué)習(xí)”嵌入世界模型的工作(DisWM,ICCV25),旨在從仿真環(huán)境的視覺輸入中分離出與任務(wù)無(wú)關(guān)的干擾因素(如光照、紋理),使智能體能更專注于關(guān)鍵信息,從而提升訓(xùn)練效率與在真實(shí)世界的魯棒性。

他表示,上述技術(shù)正逐漸嘗試走出實(shí)驗(yàn)室,探索產(chǎn)業(yè)化可能。

上海人工智能實(shí)驗(yàn)室青年科學(xué)家王靖博:人形機(jī)器人,從“盲動(dòng)”走向“感知驅(qū)動(dòng)”


隨后,上海人工智能實(shí)驗(yàn)室青年科學(xué)家王靖博帶來(lái)了主題演講《從虛擬走向現(xiàn)實(shí),構(gòu)建通用人形機(jī)器人控制與交互策略》。

長(zhǎng)期以來(lái),人形機(jī)器人的研究是否必要一直存在著爭(zhēng)議。演講伊始,王靖博博士就對(duì)此做出了回應(yīng)。他指出,由人類搭建的真實(shí)生活環(huán)境,也面向人類的各種需求,這決定了人形必然是一種相對(duì)通用的方案。在數(shù)據(jù)維度,互聯(lián)網(wǎng)上有大量來(lái)源于人類日常生活的第一人稱及第三人稱數(shù)據(jù),其中包含的運(yùn)動(dòng)邏輯和操作邏輯,對(duì)于模型訓(xùn)練來(lái)說(shuō)都是可用資源。在應(yīng)用層,人形機(jī)器人的交互邏輯、安全性等研究,最終也會(huì)回饋到人自身。

而人形機(jī)器人現(xiàn)階段研究的核心問題之一,就是如何在仿真中訓(xùn)練機(jī)器人,并使其在真實(shí)世界中實(shí)現(xiàn)穩(wěn)定、可泛化的運(yùn)動(dòng)與控制。由于仿真環(huán)境與真實(shí)物理世界之間存在的差異,人形機(jī)器人的技能訓(xùn)練與部署長(zhǎng)期面臨著Sim2Real的鴻溝。對(duì)此,王靖博博士介紹了其團(tuán)隊(duì)的最新成果,通過對(duì)日常生活環(huán)境的集成性構(gòu)造,以及創(chuàng)新的感知和表示方案,顯著提升了復(fù)雜地形下運(yùn)動(dòng)策略的遷移成功率。其核心在于用體素化的點(diǎn)云表示壓縮環(huán)境信息,并在仿真中引入機(jī)器人本體的激光雷達(dá)自掃描,以更好地對(duì)齊仿真與真實(shí)的傳感器數(shù)據(jù)分布,從而使機(jī)器人能提前感知地形變化,如臺(tái)階、吊頂,并預(yù)先規(guī)劃動(dòng)作,而非依賴碰撞后的力反饋。

此外,王靖博博士在演講中提到了構(gòu)建統(tǒng)一的動(dòng)作技能表征,作為基礎(chǔ)的人形機(jī)器人運(yùn)動(dòng)控制模型,可以進(jìn)一步拓展在有效的可遷移的人形機(jī)器人感知方案下的動(dòng)作與技能選擇,使得人形機(jī)器人可以在基礎(chǔ)的運(yùn)動(dòng)之外完成和場(chǎng)景的交互已經(jīng)多種球類運(yùn)動(dòng)。

在演講中,王靖博博士進(jìn)一步指出,人形機(jī)器人的控制策略正從“盲走盲動(dòng)”轉(zhuǎn)向“感知驅(qū)動(dòng)”,融合視覺、激光雷達(dá)等環(huán)境感知,以實(shí)現(xiàn)機(jī)器人在復(fù)雜、非結(jié)構(gòu)化環(huán)境中的自主導(dǎo)航與交互是必然趨勢(shì)。關(guān)于人形機(jī)器人的未來(lái),王靖博博士認(rèn)為,當(dāng)前的模型參數(shù)量和學(xué)習(xí)方式限制了技能容量和更多元控制形式的探索。長(zhǎng)遠(yuǎn)來(lái)看,構(gòu)建容量更大,更高效利用數(shù)據(jù)的方案,例如離線的監(jiān)督學(xué)習(xí),是提升機(jī)器人技能通用性和長(zhǎng)程控制能力的可行路徑。

一腦多形圓桌論壇:探索?落地?未來(lái)


演講過后,一場(chǎng)關(guān)于“一腦多形”的圓桌論壇,將整個(gè)會(huì)場(chǎng)氣氛推向高潮。在英諾天使基金ED王建明的主持下,浙江大學(xué)控制學(xué)院副教授,微分智飛創(chuàng)始人高飛,寧波東方理工大學(xué)助理教授金鑫,上海人工智能實(shí)驗(yàn)室青年科學(xué)家王靖博三位嘉賓圍繞著具身智能、世界模型等話題進(jìn)行了熱烈討論。

首先,王建明拋出一個(gè)共性問題,邀請(qǐng)三位嘉賓用簡(jiǎn)短的話語(yǔ),概括近兩年具身智能在學(xué)術(shù)與產(chǎn)業(yè)領(lǐng)域的發(fā)展進(jìn)展。

對(duì)此,高飛直言:“現(xiàn)在還沒到技術(shù)路線收斂的時(shí)候,行業(yè)仍處于探索階段。這一波技術(shù)浪潮的本質(zhì),是 AI 與機(jī)器人本體結(jié)合后,帶來(lái)的智能性與泛化性飛躍。” 他同時(shí)強(qiáng)調(diào),從業(yè)者要時(shí)刻牢記做具身智能的初心。金鑫對(duì)此表示認(rèn)同,并補(bǔ)充道:“這兩年高校在具身智能領(lǐng)域的機(jī)會(huì),相較于產(chǎn)業(yè)界其實(shí)要少一些。未來(lái)不妨將核心關(guān)鍵問題交由高校攻關(guān),產(chǎn)業(yè)界則專注于技術(shù)落地轉(zhuǎn)化。”

王靖博也分享了自己的觀察:“人形機(jī)器人其實(shí)十年前就有波士頓動(dòng)力在做運(yùn)動(dòng)能力的展示,但一直沒能真正走進(jìn)大眾的應(yīng)用場(chǎng)景。而當(dāng)軟硬件的code design的理念出現(xiàn)后,整個(gè)領(lǐng)域的發(fā)展節(jié)奏明顯加快了?!?/p>

隨后,王建明針對(duì)各個(gè)嘉賓的研究方向分別提出了不同的問題。首先向高飛的demo提出稱贊,高飛認(rèn)為自己相對(duì)來(lái)講,是無(wú)人機(jī)比較懂AI的,是AI里比較懂無(wú)人機(jī)的。無(wú)人機(jī)的技術(shù)范式會(huì)往端到端的方向傾斜,端到端則是指:進(jìn)來(lái)的是圖像等傳感器數(shù)據(jù),輸出的是電機(jī)控制指令。最后,高飛表示,端到端是一種范式,強(qiáng)化學(xué)習(xí)是一種解法,黑箱是一種模式,三者是不一樣的概念,不宜直接畫等號(hào)。

后面,又對(duì)世界模型進(jìn)行了探討,現(xiàn)在世界模型的定義都沒有達(dá)成共識(shí),金鑫認(rèn)為,自動(dòng)駕駛和機(jī)器人這兩個(gè)任務(wù)對(duì)世界模型的要求和技術(shù)范式都是有很大的區(qū)別的,世界模型是一個(gè)非常大的概念。而在自動(dòng)駕駛中,視頻生成比較主流一些,因?yàn)樯婕暗桨踩缘膯栴}。

金鑫還指出,世界模型與 VLA 模型并非對(duì)立關(guān)系,二者完全可以結(jié)合應(yīng)用。他提到,他與清華、科大合作的一篇survey前一天剛上線,文章專門探討了這一問題,要么先建世界模型再做policy learning,要么兩個(gè)一起做。

當(dāng)被問及 “何時(shí)能實(shí)現(xiàn)性能優(yōu)異的通用控制器” 時(shí),王靖博從仿真與現(xiàn)實(shí)兩個(gè)維度給出答案:如果是在仿真器里面,不去做例舉的限制,實(shí)現(xiàn)一個(gè)還不錯(cuò)的控制器還可以,只是要精度和平衡性之間找到最優(yōu)解。如果是在真實(shí)世界上,這個(gè)就得看算法和硬件了。他以自己實(shí)驗(yàn)室的實(shí)踐舉例,相同的算法在不同的人形機(jī)器人上運(yùn)行,會(huì)得出截然不同的結(jié)果,最終得由硬件性能來(lái)決定。

論壇尾聲,嘉賓們將話題拉回到技術(shù)落地這一核心議題。高飛暢想:未來(lái)說(shuō)不定我們會(huì)在生活中看到各種各樣的無(wú)人機(jī),這也是他的夢(mèng)想,他還調(diào)侃道,如果未來(lái)沒有各種無(wú)人機(jī)高空作業(yè)或者送人送貨的活,這是他們這幫學(xué)者、創(chuàng)業(yè)者的失敗。

金鑫對(duì)于具身智能的落地則表示,不想回到工業(yè)自動(dòng)化的階段,但現(xiàn)在工業(yè)自動(dòng)化那邊的需求很著急,希望趕緊把機(jī)器人用起來(lái)。這是一個(gè)很大的gap,創(chuàng)業(yè)者腦海中的想法和實(shí)際情況有差距,上級(jí)會(huì)讓你快讀落地,投資人在其中扮演的角色是既讓技術(shù)人員很著急,又讓需求方不能那么著急,將這種困境概括成一句話就是——“既要星辰大海,也要趕緊賺錢?!?/p>

王靖博則基于自身的觀察給出了審慎的判斷:落地還比較遙遠(yuǎn),但今年已經(jīng)給大家看到了很多希望,至少我們?cè)诂F(xiàn)實(shí)生活中,已經(jīng)能見到相關(guān)技術(shù)的落地應(yīng)用,而不再是像看波士頓動(dòng)力的 Atlas 機(jī)器人那樣,如同觀看科幻大片。

伴隨著對(duì)未來(lái)的暢想與探討,數(shù)據(jù)&一腦多形分論壇圓滿落幕。

未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁(yè)、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來(lái)源并插入本公眾號(hào)名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
亞洲周刊曝郭禮典接到多個(gè)恐嚇電話!公布龐叔令實(shí)名舉報(bào)徐鶯信件

亞洲周刊曝郭禮典接到多個(gè)恐嚇電話!公布龐叔令實(shí)名舉報(bào)徐鶯信件

古希臘掌管松餅的神
2025-12-24 19:22:09
漢字存在缺陷?諾貝爾獎(jiǎng)得主羅素一針見血:漢字有這3大缺點(diǎn)!

漢字存在缺陷?諾貝爾獎(jiǎng)得主羅素一針見血:漢字有這3大缺點(diǎn)!

興趣知識(shí)
2025-12-24 00:31:53
68歲相聲演員娶小30歲洋妻,生一屋混血兒移居國(guó)外,如今過得怎樣

68歲相聲演員娶小30歲洋妻,生一屋混血兒移居國(guó)外,如今過得怎樣

豐譚筆錄
2025-12-24 00:09:46
小區(qū)樓上天天晚上都有女的大聲叫。。。

小區(qū)樓上天天晚上都有女的大聲叫。。。

微微熱評(píng)
2025-12-24 00:26:04
沒有回旋余地,中國(guó)下令直接收回,17萬(wàn)日本人淚奔,高市闖禍了!

沒有回旋余地,中國(guó)下令直接收回,17萬(wàn)日本人淚奔,高市闖禍了!

凡知
2025-12-23 19:25:31
一球制勝?zèng)_468萬(wàn)元獎(jiǎng)金!澳網(wǎng)官方:鄭欽文將參加“一分大滿貫”

一球制勝?zèng)_468萬(wàn)元獎(jiǎng)金!澳網(wǎng)官方:鄭欽文將參加“一分大滿貫”

全景體育V
2025-12-24 09:54:17
江蘇4家村鎮(zhèn)銀行獲批解散,全國(guó)已有100多家!

江蘇4家村鎮(zhèn)銀行獲批解散,全國(guó)已有100多家!

深水財(cái)經(jīng)社
2025-12-24 10:44:19
難以想象!上?!案欢?年花光1300萬(wàn),“每頓飯一萬(wàn)多,出去一次一百多萬(wàn)……”

難以想象!上?!案欢?年花光1300萬(wàn),“每頓飯一萬(wàn)多,出去一次一百多萬(wàn)……”

環(huán)球網(wǎng)資訊
2025-12-23 19:51:46
《時(shí)代》雜志評(píng)選100部最偉大的長(zhǎng)篇小說(shuō)

《時(shí)代》雜志評(píng)選100部最偉大的長(zhǎng)篇小說(shuō)

美劇組|人人影視
2025-12-22 22:59:23
明確禁止!武漢發(fā)布跨年重要通告

明確禁止!武漢發(fā)布跨年重要通告

魯中晨報(bào)
2025-12-24 17:05:08
離譜!楊書記為何敢直接拿走博物館的瓷花瓶?

離譜!楊書記為何敢直接拿走博物館的瓷花瓶?

仕道
2025-12-22 09:20:15
阿隆索糾錯(cuò)!皇馬6000萬(wàn)前鋒蛻變:邊緣人晉升主力 全隊(duì)受益

阿隆索糾錯(cuò)!皇馬6000萬(wàn)前鋒蛻變:邊緣人晉升主力 全隊(duì)受益

葉青足球世界
2025-12-24 07:58:11
《阿凡達(dá)3》:平庸的偉大

《阿凡達(dá)3》:平庸的偉大

非典型佛教徒
2025-12-24 00:11:47
胖東來(lái)新店售賣簽名球衣,包括梅西、姆巴佩等球星,最貴喬丹球衣138000元,客服:已有人購(gòu)買

胖東來(lái)新店售賣簽名球衣,包括梅西、姆巴佩等球星,最貴喬丹球衣138000元,客服:已有人購(gòu)買

極目新聞
2025-12-24 19:01:24
鄭州中原保時(shí)捷中心疑似突然閉店“跑路”,當(dāng)?shù)厣虅?wù)局回應(yīng):有關(guān)部門已成立專班介入

鄭州中原保時(shí)捷中心疑似突然閉店“跑路”,當(dāng)?shù)厣虅?wù)局回應(yīng):有關(guān)部門已成立專班介入

揚(yáng)子晚報(bào)
2025-12-24 19:13:41
天下要大亂了,美國(guó)公布最新戰(zhàn)略:為了中國(guó),特朗普決心放棄世界

天下要大亂了,美國(guó)公布最新戰(zhàn)略:為了中國(guó),特朗普決心放棄世界

興史興談
2025-12-24 07:40:42
炸裂!大帽NBA首輪秀!開拓者主帥批評(píng)楊瀚森

炸裂!大帽NBA首輪秀!開拓者主帥批評(píng)楊瀚森

籃球?qū)崙?zhàn)寶典
2025-12-24 22:01:47
美烏20條“和平協(xié)議”內(nèi)容曝光,雙方都做了讓步

美烏20條“和平協(xié)議”內(nèi)容曝光,雙方都做了讓步

史政先鋒
2025-12-24 18:29:42
“家貧而貌美,不是好事!”小學(xué)女生發(fā)成熟視頻,評(píng)論區(qū)太真實(shí)!

“家貧而貌美,不是好事!”小學(xué)女生發(fā)成熟視頻,評(píng)論區(qū)太真實(shí)!

知曉科普
2025-12-24 10:44:29
為了得到巔峰期的伊萬(wàn)卡,姆巴佩到底花了多少“轉(zhuǎn)會(huì)費(fèi)”?

為了得到巔峰期的伊萬(wàn)卡,姆巴佩到底花了多少“轉(zhuǎn)會(huì)費(fèi)”?

羅氏八卦
2025-12-24 11:56:24
2025-12-25 07:20:49
AI科技評(píng)論 incentive-icons
AI科技評(píng)論
點(diǎn)評(píng)學(xué)術(shù),服務(wù)AI
7022文章數(shù) 20717關(guān)注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

幼兒園8人遇難兒童母親:女兒4歲 今年9月入讀

頭條要聞

幼兒園8人遇難兒童母親:女兒4歲 今年9月入讀

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財(cái)經(jīng)要聞

北京進(jìn)一步放松限購(gòu) 滬深是否會(huì)跟進(jìn)?

汽車要聞

“運(yùn)動(dòng)版庫(kù)里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

數(shù)碼
家居
藝術(shù)
健康
教育

數(shù)碼要聞

AMD Zen 6與Intel Nova Lake或?qū)⑸涎?88 MB 3D緩存“大戰(zhàn)”

家居要聞

法式大平層 智能家居添彩

藝術(shù)要聞

William Whitaker作品精選 | 美國(guó)當(dāng)代畫家

這些新療法,讓化療不再那么痛苦

教育要聞

調(diào)皮搗蛋的孩子,能給他安排一個(gè)班干部職位嗎?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 国产一级二级农民工老女人黄色| 国产精品久久久久久无毒不卡| 开心色播五月| 色AV色婷婷| 一本大道av人久久综合| 精品无码人妻一区二区三区蜜乳| 国产高清一国产av| 免费看无码毛片| 国产午夜亚洲精品不卡福利| 欧洲精品欧美一区区好区aaa| 欧洲亚洲精品免费二区| 蜜臀AV一区二区三区张婉莹| 国产片婬乱18一级毛片视频尚| 国产无套内射在线观看| 成人尤物网站| 91欧美亚洲国产五月天| 国产精品丝袜在线播放| 国产久9视频这里只有精品| 夜夜躁狠狠躁日日躁2021| 久久久久久亚洲中文字幕无码| 亚洲爆乳无码专区www| 日本无人区码卡1卡2卡免费 | 99热国产这里只有精品6| 国产精品欧美福利久久| 五月激情六月婷婷| 中国毛片网| 后入淫荡少妇屁股| 性夜久久一区国产9人妻| 亚洲AV无码精品天堂天天牛牛网| 亚洲亚洲中文字幕无线码| 亚洲av网页| 一区三区不卡| 久久久久亚洲av成人片乱码| 久久综合网丁香五月| 天天av综合| 欧美黑吊大战白妞| 国产一区二区女内射| 丁香五月天亚洲综合4438网| 无码av一区二区| 日本 欧美一区二区| 中字幕AV一区|