機(jī)器之心報(bào)道
機(jī)器之心編輯部
當(dāng)大模型幾乎能回答所有問題,那 AI 的下一站將在何方?當(dāng)「數(shù)字認(rèn)知」的潛力被空前釋放,我們又如何將其轉(zhuǎn)化為「物理世界」的真實(shí)生產(chǎn)力?
隨著行業(yè)的不斷發(fā)展,答案正變得越來越清晰:行動(dòng),或是智能的終極體現(xiàn)。而實(shí)現(xiàn)這一跨越的載體,便是具身智能。
如今,技術(shù)已將其推至產(chǎn)業(yè)變革的商業(yè)化臨界點(diǎn)。但我們?nèi)员仨毣卮鹑齻€(gè)關(guān)鍵問題:需要怎樣的顛覆性創(chuàng)新,才能賦予具身智能真正的泛化行動(dòng)能力?又如何跨越從「技術(shù)可行」到「商業(yè)成功」的鴻溝,找到其不可替代的價(jià)值錨點(diǎn)?這場(chǎng)由「行動(dòng)」驅(qū)動(dòng)的革命,又將會(huì)把我們帶往何方?
或許這一切問題,我們都可以在這里找到答案。
9 月 11 日下午,機(jī)器之心聯(lián)合張江具身智能機(jī)器人有限公司共同出品的 2025 Inclusion?外灘大會(huì) 「具身智能:從泛化到行動(dòng),重塑產(chǎn)業(yè)未來」見解論壇在上海隆重舉辦。在這場(chǎng)圍繞具身智能展開的盛會(huì)上,多位來自學(xué)界和業(yè)界的代表分享了他們?cè)诰呱碇悄苄袠I(yè)發(fā)展的經(jīng)驗(yàn)和看法。
主題演講
孫富春:訓(xùn)練場(chǎng)為破解具身智能「數(shù)據(jù)瓶頸」提供了關(guān)鍵突破口
清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授、博士生導(dǎo)師;清華大學(xué)人工智能研究院智能機(jī)器人中心主任孫富春發(fā)表了主題為《具身智能訓(xùn)練場(chǎng)與產(chǎn)業(yè)落地》的演講。
他認(rèn)為,早期研究中的具身智能是指給機(jī)器一個(gè)物理身體,來實(shí)現(xiàn)與物理世界的交互,如今的具身智能實(shí)際上是一個(gè)沉浸式感知過程的構(gòu)建。
為了構(gòu)建沉浸式環(huán)境,業(yè)界早期嘗試基于視覺點(diǎn)云來實(shí)現(xiàn)數(shù)字孿生,但生成的環(huán)境遠(yuǎn)遠(yuǎn)達(dá)不到沉浸式感知,于是開始構(gòu)建物理數(shù)字系統(tǒng),讓物理學(xué)的各種視覺、觸覺等感知過程融入其中。結(jié)果顯示,魯棒性和泛化能力大幅提升。而當(dāng)下,數(shù)據(jù)問題是制約具身智能發(fā)展的核心挑戰(zhàn),訓(xùn)練場(chǎng)為破解這一「數(shù)據(jù)瓶頸」提供了關(guān)鍵突破口。
「現(xiàn)在全國(guó)各地都掀起了一股構(gòu)建具身智能訓(xùn)練場(chǎng)的熱潮。」孫富春說道。
從整體來看,訓(xùn)練場(chǎng)具有降本增效、安全模擬、標(biāo)準(zhǔn)統(tǒng)一、并行加速、軟硬解耦、虛實(shí)一體等核心價(jià)值。但同時(shí),也存在著分散化、重復(fù)化、低效化等「各自為戰(zhàn)」現(xiàn)象,亟需業(yè)界共同努力,制定標(biāo)準(zhǔn)來推動(dòng)行業(yè)協(xié)同、有序發(fā)展。
談及具身智能未來發(fā)展,孫富春認(rèn)為,具身智能是一個(gè)結(jié)合本體、數(shù)據(jù)知識(shí)和場(chǎng)景的具身智能體,以及學(xué)習(xí)和進(jìn)化架構(gòu)四大核心要素的綜合體,彼此之間需要相互協(xié)同,既要依賴沉浸式訓(xùn)練場(chǎng)與多模態(tài)數(shù)據(jù)采集,又要結(jié)合大模型的泛化與推理,推動(dòng)具身智能的產(chǎn)業(yè)落地應(yīng)用,并通過不斷地學(xué)習(xí)與進(jìn)化,最終邁向真正智能。
江磊:訓(xùn)練場(chǎng)就是 AI 時(shí)代的新型「數(shù)據(jù)工廠」
國(guó)地共建人形機(jī)器人創(chuàng)新中心首席科學(xué)家江磊,帶來了主題為《構(gòu)建跨場(chǎng)景高效的「仿真 — 現(xiàn)實(shí)」數(shù)據(jù)飛輪》的演講。
他提到,這一輪人形機(jī)器人技術(shù)的發(fā)展重構(gòu)了一個(gè)新的研發(fā)范式:AI + 機(jī)器人,即開發(fā)完機(jī)器人后,直接做訓(xùn)練場(chǎng)收集數(shù)據(jù),完成數(shù)據(jù)收集再去做具身智能或具身大模型,之后再推向各種應(yīng)用智能體。
在這一新的范式下,訓(xùn)練場(chǎng)扮演著重要角色,「訓(xùn)練場(chǎng)就是 AI 時(shí)代的新型數(shù)據(jù)工廠?!?/p>
在江磊看來,當(dāng)下具身智能領(lǐng)域主要有智能駕駛、機(jī)械臂、腿足式機(jī)器人以及芯片研發(fā)等四路玩家,技術(shù)路徑遠(yuǎn)沒有收斂。而無論哪種技術(shù)路徑一定要用到大數(shù)據(jù)集,所以訓(xùn)練場(chǎng)的重要性與意義不可忽視,需要更多人參與進(jìn)來,「它不僅是一個(gè)基礎(chǔ)設(shè)施,更是關(guān)鍵技術(shù)。」
而國(guó)地共建人形機(jī)器人創(chuàng)新中心在做的事情就是聚焦數(shù)據(jù)采集與訓(xùn)練場(chǎng)建設(shè),聯(lián)合業(yè)界一起打造一個(gè)低代碼、可開發(fā)、可發(fā)布的具身智能領(lǐng)域的 MCP,適用于所有機(jī)器人,助力具身智能行業(yè)快速發(fā)展。
許華哲:和全球開發(fā)者摸一條名為 Scaling Law 的「胡須」
星海圖首席科學(xué)家;清華大學(xué)交叉信息研究院助理教授,博導(dǎo),清華大學(xué)具身智能實(shí)驗(yàn)室負(fù)責(zé)人許華哲,帶來了主題為《開啟具身智能下一站》的演講。
許華哲介紹,星海圖新發(fā)布的全身智能 VLA 模型 G0,采用 100% 的開放真實(shí)世界數(shù)據(jù),配合「慢思考 + 快執(zhí)行」的協(xié)同,經(jīng)過 VLA 預(yù)訓(xùn)練,以及少量樣本的后訓(xùn)練,可實(shí)現(xiàn)端到端模型的泛化操作,在新場(chǎng)景中完成系列復(fù)雜任務(wù)。過程中如果遇到失誤,機(jī)器人可以自動(dòng)修正動(dòng)作,不再是傳統(tǒng)做法中通過控制實(shí)現(xiàn)百分之百精準(zhǔn)度,而是基于智能能力進(jìn)行自我修正。
當(dāng)前,具身智能的公認(rèn)路徑主要圍繞數(shù)據(jù)進(jìn)行探索,星海圖走的也是「模仿學(xué)習(xí) + 高質(zhì)量數(shù)據(jù)」路徑,并將真實(shí)數(shù)據(jù)作為主要載體。整體來看,具身智能領(lǐng)域數(shù)據(jù)主要包括真實(shí)數(shù)據(jù)、仿真數(shù)據(jù)、以及互聯(lián)網(wǎng)數(shù)據(jù),在許華哲看來,真實(shí)數(shù)據(jù)雖然昂貴但質(zhì)量好,仿真和互聯(lián)網(wǎng)數(shù)據(jù)更便宜、更容易獲取,可永遠(yuǎn)存在著真實(shí)到仿真、真實(shí)到互聯(lián)網(wǎng)的 Gap。不過,即使是真實(shí)數(shù)據(jù)可能也存在 Real2real 的 Gap,這會(huì)極大影響最終訓(xùn)練出來的模型質(zhì)量。
為此,星海圖搭建 R1 Lite 數(shù)據(jù)采集平臺(tái),進(jìn)行開放世界的數(shù)據(jù)采集,涵蓋酒店、餐廳、廚房、辦公室等 50 個(gè)場(chǎng)景,并對(duì)這些數(shù)據(jù)進(jìn)行標(biāo)注。如今星海圖已將這一數(shù)據(jù)集開源,不久之后模型 G0 也將開源。
未來,星海圖希望與業(yè)界一起構(gòu)建具身智能生態(tài),為全球開發(fā)者搭建一塊開放的、夯實(shí)的、高效的場(chǎng)地,一同去摸一條名為具身智能 Scaling Law 的「胡須」,攜手業(yè)界一起走向通用具身人工智能。
張直政:大規(guī)模機(jī)器人數(shù)據(jù)合成仿真 + Sim2Real,破解具身數(shù)據(jù)難題
銀河通用機(jī)器人聯(lián)合創(chuàng)始人、大模型負(fù)責(zé)人張直政,進(jìn)行了主題為《仿真合成數(shù)據(jù)驅(qū)動(dòng)具身大模型實(shí)現(xiàn)產(chǎn)業(yè)智能化》的分享。
當(dāng)下,我們對(duì)具身智能的訴求不僅是行走、跳舞,最重要的是能夠干活,為此要直面一個(gè)行業(yè)重點(diǎn)問題:訓(xùn)練數(shù)據(jù)從哪里來?
在張直政看來,目前行業(yè)已摸索出了一系列有效途徑,比如采用真機(jī)遙操作,但費(fèi)時(shí)費(fèi)力,且隨著硬件更新,數(shù)據(jù)復(fù)用性有限,并非通往具身智能的最佳路徑。因?yàn)榫呱泶竽P鸵嬲龑?shí)現(xiàn)跨行業(yè)、跨任務(wù)泛化,可能需要上萬億條數(shù)據(jù),全部采用真實(shí)數(shù)據(jù)不可行,也不可持續(xù)。相較之下,仿真合成數(shù)據(jù)優(yōu)勢(shì)明顯,更可控、更可擴(kuò)展。
銀河通用從創(chuàng)立到現(xiàn)在已經(jīng)摸索出一條非常高效的通往落地的技術(shù)路線,主要分為兩階段:第一階段用大規(guī)模仿真合成數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,可以理解為「義務(wù)教育」,為機(jī)器人提供通用知識(shí);第二階段采集少量真實(shí)世界數(shù)據(jù),讓機(jī)器人學(xué)習(xí)如何把大規(guī)模仿真合成學(xué)到的技能應(yīng)用到對(duì)應(yīng)場(chǎng)景中,以迎合不同場(chǎng)景、復(fù)雜任務(wù)的具體要求,相當(dāng)于「職業(yè)教育」崗前培訓(xùn),進(jìn)一步強(qiáng)化它的專業(yè)知識(shí)和專業(yè)技能。
圍繞這樣的訓(xùn)練范式,銀河通用構(gòu)建了一個(gè)全棧團(tuán)隊(duì)和全棧能力,確?;P头€(wěn)定性與硬件一致性。
金國(guó)強(qiáng):人形機(jī)器人蘊(yùn)藏著下一個(gè)萬億美元的產(chǎn)業(yè)變革機(jī)遇
NVIDIA 資深解決方案架構(gòu)師金國(guó)強(qiáng),帶來了《NVIDIA Physical AI 平臺(tái)加速具身智能研發(fā)與落地》的主題分享。
蘇洋:好的靈巧手要能夠「用得上、買得到、買得起、不怕用」
靈心巧手聯(lián)合創(chuàng)始人兼首席 AI 架構(gòu)師蘇洋,帶來了《通往靈巧手的靈巧泛化之路》的主題演講。
作為一家初創(chuàng)公司,靈心巧手目前聚焦靈巧手和靈巧手相關(guān)的技術(shù)和產(chǎn)品研發(fā),客戶涵蓋科研機(jī)構(gòu)、人形機(jī)器人制造商,以及工業(yè)領(lǐng)域公司。
在蘇洋看來,靈巧手的技術(shù)與手機(jī)應(yīng)用類似,強(qiáng)調(diào)多技能泛化,使其能夠在各種場(chǎng)景中得到廣泛應(yīng)用。而好的靈巧手關(guān)鍵在于能夠「用得上、買得到、買得起、不怕用」,只有這些條件都達(dá)到才能實(shí)現(xiàn)靈巧手的泛化,「如果大家都覺得貴,那么泛化將無從談起?!?/p>
而當(dāng)前最貴的是數(shù)據(jù),大家之所以都在做合成數(shù)據(jù),就是因?yàn)檎鏅C(jī)數(shù)據(jù)太貴。但問題是,合成數(shù)據(jù)雖然非常有價(jià)值,可能夠遷移到真機(jī)上的勝率很低,因?yàn)榇嬖谔辔锢砑s束,比如做靈巧手的廠商很多,可彼此的標(biāo)準(zhǔn)、電機(jī)、結(jié)構(gòu)、手在不同任務(wù)下的物理磨損等都不一樣。
因此,要想大幅降低實(shí)驗(yàn)開發(fā)成本、降低合成數(shù)據(jù)使用難度,使其能夠遷移泛化,應(yīng)該加大機(jī)器人的廣泛應(yīng)用。
「這就好比當(dāng)業(yè)界有 100 萬個(gè)真實(shí)的人形機(jī)器人或輕巧手運(yùn)行后,故事就變了?!固K洋說道,那時(shí),每天上傳的數(shù)據(jù)將超過 2025 年全球一整年采集的數(shù)據(jù)。
而未來,靈心巧手將繼續(xù)通過高性價(jià)比的靈巧手技術(shù),讓具身智能產(chǎn)品進(jìn)入家庭,推動(dòng)行業(yè)的快速發(fā)展,也希望與更多的開發(fā)者、伙伴一起實(shí)現(xiàn)這一目標(biāo)。
思辨:通往通用泛化的兩條路
思辨環(huán)節(jié),在機(jī)器之心聯(lián)合創(chuàng)始人、主編李亞洲的主持下,上海人工智能實(shí)驗(yàn)室青年科學(xué)家、具身智能中心負(fù)責(zé)人龐江淼;星海圖首席科學(xué)家;清華大學(xué)交叉信息研究院助理教授,博導(dǎo),清華大學(xué)具身智能實(shí)驗(yàn)室負(fù)責(zé)人許華哲,圍繞「通往通用泛化的兩條路」進(jìn)行了討論。
當(dāng)前具身智能的探索路線有哪些?
許華哲認(rèn)為,具身智能的發(fā)展還處于早期階段,技術(shù)路線尚未收斂,各路玩家都在沿著各自路線進(jìn)行探索。當(dāng)前比較火的是 VLA 這一路徑,真實(shí)數(shù)據(jù) + 大模型,包括語言大模型到多模態(tài)大模型,再到多模態(tài)具身大模型,一條完全端到端的 VLA 路徑。另外還有通過做數(shù)據(jù)仿真到現(xiàn)實(shí)的遷移路徑等。
但在他看來,具身智能發(fā)展的關(guān)鍵在于數(shù)據(jù),用什么數(shù)據(jù)、如何用好這些數(shù)據(jù),這些都是需要深度思考的。
龐江淼也認(rèn)同這一點(diǎn),他認(rèn)為,數(shù)據(jù)是技術(shù)路線劃分的關(guān)鍵維度,比如真機(jī)數(shù)據(jù)、仿真數(shù)據(jù)、視頻數(shù)據(jù)等。而模型側(cè)的路線要有好多種,一種是端到端,但有些人也會(huì)覺得分層是更好的方式,還涉及一些世界模型相關(guān)的路線。
而當(dāng)下上海 AI Lab,目前在數(shù)據(jù)維度采用的路線是 Real2SIM2Real 的方式,模型側(cè)更關(guān)注端到端方式。
人形一定是具身智能的最終形態(tài)嗎?
龐江淼認(rèn)為,當(dāng) AI 發(fā)展到一定程度的時(shí)候,本體形態(tài)是什么樣并不重要,因?yàn)閿?shù)據(jù)采集方式、模型訓(xùn)練方式對(duì)本體沒有那么敏感。
從終局狀態(tài)來看,人形機(jī)器人不一定是唯一載體,而當(dāng)下技術(shù)還不成熟,正處于一個(gè)從專用逐漸走向通用的螺旋式發(fā)展過程。如果聚焦有限場(chǎng)景、有限技能,先把機(jī)器人做到局部通用的維度來看,協(xié)作臂或輪式雙臂機(jī)器人都是非常好的載體。
而在許華哲看來,大家看法不同是因?yàn)橐暯遣煌?。如果從科研視角來看,人們?duì)具身智能做的事情充滿了想象,比如人形機(jī)器人要上火星種樹、蓋房子,把火星改造得宜居,那這樣的話,人形機(jī)器人就是一個(gè)理想的形態(tài)。
而對(duì)創(chuàng)業(yè)公司來說,這種設(shè)想某種意義上是「戴著鐐銬跳舞」,因?yàn)橘Y源有限,無法像特斯拉那樣擁有長(zhǎng)期支持和規(guī)劃,需要在工廠和實(shí)際場(chǎng)景中逐步探索應(yīng)用場(chǎng)景。如果人形機(jī)器人只能做一兩項(xiàng)簡(jiǎn)單任務(wù),那就無法支撐高成本的生產(chǎn),難以盈利,只有當(dāng)人形機(jī)器人能夠執(zhí)行多項(xiàng)任務(wù)時(shí),它的成本效益才能夠體現(xiàn)出來,未來商業(yè)模式也會(huì)更加成熟。
是否有必要做世界模型?
許華哲認(rèn)為世界模型和人形機(jī)器人類似,都是建立在遠(yuǎn)大愿景上的科學(xué)預(yù)測(cè),當(dāng)下來看其研究意義重大,但距離在具體場(chǎng)景的實(shí)際應(yīng)用,還需要很多時(shí)間打磨。
龐江淼也持相似看法,從學(xué)術(shù)角度來說,世界模型代表著人對(duì)未來的預(yù)測(cè)能力,能夠賦能具身智能的早期階段,但距離實(shí)際應(yīng)用還有非常長(zhǎng)的路要走。
具身智能距離正式進(jìn)入人們?nèi)粘I钸€需要多長(zhǎng)時(shí)間?
許華哲認(rèn)為,這取決于具身智能在家庭中發(fā)揮的作用,比如掃地機(jī)器人已經(jīng)進(jìn)入家庭,如果還希望它能夠做飯、打掃衛(wèi)生間等,則還需要再久一點(diǎn)。整體來看,這是一個(gè)漸進(jìn)式過程,真正意義上達(dá)到保姆級(jí)別或者管家級(jí)別,可能還需要 5 到 10 年時(shí)間。
龐江淼則認(rèn)為,10 年是一個(gè)很長(zhǎng)的時(shí)間,科技發(fā)展將會(huì)帶來非常大的進(jìn)步與變化。未來 2 到 3 年內(nèi),具身智能可能仍處于非常早期的階段,技術(shù)路線沒有完全收斂。另外,由于大家對(duì)機(jī)器人的預(yù)期往往偏高,尤其在精準(zhǔn)度和執(zhí)行能力上,比如疊衣服要疊好、人形機(jī)器人走路不能摔跤,在未來 4 到 5 年時(shí)間里,將是一個(gè)雙方雙向修正的過程,人類降低期待值,機(jī)器人進(jìn)行更高標(biāo)準(zhǔn)的技術(shù)打磨和完善。
圓桌對(duì)話:我們的下一個(gè) “超級(jí)助手”:需求、場(chǎng)景與落地
在圓桌對(duì)話環(huán)節(jié),西門子 Xcelerator 中國(guó)區(qū)總經(jīng)理(兼主持人) 秦成,開普勒人形機(jī)器人 CEO 胡德波,Robopoet 珞博智能創(chuàng)始人、首席執(zhí)行官孫兆治,小苗朗程合伙人趙沛舟,螞蟻靈波科技 CEO 朱興,圍繞《我們的下一個(gè)「超級(jí)助手」:需求、場(chǎng)景與落地》進(jìn)行了討論。
具身智能「超級(jí)助手」應(yīng)該是什么樣子的?
今年,在大模型落地應(yīng)用的新敘事下,具身智能成為熱門話題,而在一波又一波的討論之余,也讓大家對(duì)于具身智能領(lǐng)域的「超級(jí)助手」產(chǎn)生了各種各樣的設(shè)想,它將是什么樣的?對(duì)于這一點(diǎn),各位嘉賓展開了他們的想象……
在秦成看來,在工業(yè)場(chǎng)景里,「超級(jí)助手」是能聽懂自然語言、直接驅(qū)動(dòng)機(jī)器行動(dòng)的智能體。就像西門子 Industrial Copilot 智能體系統(tǒng),它不是替代現(xiàn)有自動(dòng)化,而是疊加一顆 AI 「大腦」,讓工廠更靈活、更好用。與其說是工廠的「超級(jí)助手」更像是「工業(yè)現(xiàn)場(chǎng)指揮家」。
胡德波認(rèn)為,「超級(jí)助手」可以是工具人,也可以是生活伙伴,幫助并解決人與人之間的情感交互。例如在家庭場(chǎng)景中解決大家不愿意做的家務(wù)問題,在工業(yè)場(chǎng)景替代傳統(tǒng)協(xié)作工種。
孫兆治心中理想的「超級(jí)助手」就像電影《Her》中的薩曼莎(Samantha),可以與人類進(jìn)行自然交互、平等溝通,同時(shí)又能主動(dòng)幫助并預(yù)想人類需求,他認(rèn)為未來的「超級(jí)助手」更注重自然交互與主動(dòng)交互。
趙沛舟則認(rèn)為,從投資角度的終局思維來看,「超級(jí)助手」是長(zhǎng)遠(yuǎn)的夢(mèng)想,具有巨大的市場(chǎng)潛力。雖然目前更多在工廠中使用,但未來也有可能拓展到采購(gòu)、財(cái)務(wù)等崗位,甚至企業(yè)除老板外,所有職位都可能由機(jī)器人代替。
而在朱興看來,「超級(jí)助手」首先要足夠聰明,具備高度的泛化能力,提供比較好的交互體驗(yàn)和個(gè)性化服務(wù),具備更好的自我學(xué)習(xí)能力;其次,它也要有足夠安全,隨著人形機(jī)器人逐步進(jìn)入家庭和更多場(chǎng)所,安全和倫理問題需要更加關(guān)注,確保機(jī)器人以安全、可靠的方式發(fā)揮作用。
當(dāng)前具身智能存在的困難與挑戰(zhàn)有哪些,又該如何做?
雖然各位嘉賓關(guān)于「超級(jí)助手」的設(shè)想都很美好,但不得不承認(rèn),當(dāng)下還處于具身智能發(fā)展的早期階段,還有很多制約性的挑戰(zhàn)存在。為此,各位嘉賓也分享了當(dāng)下的困難與挑戰(zhàn),以及如何做的。
胡德波認(rèn)為,當(dāng)前人形機(jī)器人進(jìn)入工業(yè)場(chǎng)景的挑戰(zhàn)主要有以下幾個(gè)方面:一是硬件本體的可靠性、精準(zhǔn)度和一致性還不太成熟;二是由于具身智能模型和數(shù)據(jù)(發(fā)展)還未收斂,模型的泛化性和部署便捷性方面還存在很多問題。另外,在工業(yè)場(chǎng)景作業(yè)中,機(jī)器人在執(zhí)行搬運(yùn)和上下料等具體任務(wù)時(shí),面臨許多工程化問題,需要通過細(xì)化任務(wù)、結(jié)合端到端模型、強(qiáng)化學(xué)習(xí)和觸覺感知來解決。總結(jié)來看,結(jié)合開普勒企業(yè)發(fā)展,整體策略是先垂直再通用、先落地再泛化,同時(shí)關(guān)注整個(gè)模型和數(shù)據(jù)的閉環(huán)。
在孫兆治看來,當(dāng)前具身智能的技術(shù)尚未完全成熟,尤其是當(dāng)它面臨家庭和情感陪伴需求時(shí),達(dá)不到預(yù)期目標(biāo)。但可以先找到一些局部、專用場(chǎng)景來突破,比如「Fuzozo」芙崽作為情感陪伴交互,以可愛、互動(dòng)性強(qiáng)為切入點(diǎn),與用戶之間形成俯視關(guān)系,從而可以被允許犯錯(cuò),降低用戶期待,迎合用戶需求。「技術(shù)在不同階段,從產(chǎn)品設(shè)計(jì)角度來說都有相應(yīng)解法可以做出對(duì)用戶有價(jià)值的產(chǎn)品?!?/p>
趙沛舟則強(qiáng)調(diào),當(dāng)前具身智能仍處于早期、解決單點(diǎn)問題狀態(tài),單點(diǎn)問題不解決,后面的泛化將沒有任何現(xiàn)實(shí)價(jià)值。與 LLM 發(fā)展類似,具身智能也在進(jìn)行從基礎(chǔ)模型到 Agent 能力的突破上,同時(shí)泛化問題也在探索解決中。
朱興認(rèn)為,在未來規(guī)?;M(jìn)入家庭的偉大目標(biāo)下,當(dāng)前具身智能在軟件和硬件上仍處于非常早期階段。軟件上,模型的泛化性和數(shù)據(jù)是當(dāng)前的主要挑戰(zhàn);硬件上,圍繞人形機(jī)器人進(jìn)入現(xiàn)實(shí)世界,如何看得更清楚、摸得更明白,還有很多工作要做。
秦成總結(jié)道,具身智能整體的技術(shù)鏈條很長(zhǎng),軟件、硬件、算力、算法等方面的問題尚未完全解決。而結(jié)合工業(yè)場(chǎng)景來看,主要的挑戰(zhàn)涉及數(shù)據(jù)治理、軟硬件結(jié)合、行業(yè) know-how 等。生產(chǎn)數(shù)據(jù)往往存儲(chǔ)在不同的系統(tǒng)中,如何將數(shù)據(jù)整合并進(jìn)行高質(zhì)量治理,成為了工業(yè)領(lǐng)域落地的瓶頸。為此,我們需要擁抱產(chǎn)業(yè)鏈生態(tài),大家一起共贏、共生。
對(duì)產(chǎn)業(yè)鏈上下游協(xié)同以及對(duì)合作伙伴有怎樣的期待?
就像秦成所言,具身智能是一個(gè)涉及非常長(zhǎng)技術(shù)鏈條的行業(yè),需要彼此協(xié)作,共同推動(dòng)行業(yè)發(fā)展。為此,在談及應(yīng)該構(gòu)建一個(gè)怎樣的產(chǎn)業(yè)生態(tài)時(shí),各位嘉賓也分享了各自的期待。
胡德波認(rèn)為,硬件是我國(guó)特別擅長(zhǎng)且越來越成熟,但結(jié)合行業(yè)發(fā)展目前缺少基座模型。結(jié)合開普勒做機(jī)器人本體、解決方案的經(jīng)驗(yàn)來看,如果有一個(gè)具有通識(shí)物理智能的基座模型,就可以結(jié)合開普勒的本體特點(diǎn)去采集數(shù)據(jù),甚至在仿真環(huán)境中生成機(jī)器人仿真數(shù)據(jù),繼而對(duì)基座模型進(jìn)行調(diào)優(yōu)或繼續(xù)后訓(xùn)練,那就有可能將原始基礎(chǔ)模型 80%-90% 的準(zhǔn)確率、可靠性提升到 99.9% 以上。在核心零部件領(lǐng)域,開普勒聯(lián)合多家企業(yè)合作深耕,致力于打造 “硬件夢(mèng)之隊(duì)”,以提升人形機(jī)器人本體能力,推動(dòng)生態(tài)發(fā)展。
孫兆治認(rèn)為,珞博智能本身擅長(zhǎng)做「技術(shù)到用戶價(jià)值的轉(zhuǎn)變」,且團(tuán)隊(duì)是一群深耕具身智能、大模型等方向的技術(shù)人員。所以即便公司很年輕,但也已經(jīng)與很多知名企業(yè)進(jìn)行合作,整個(gè)合作過程不單是做項(xiàng)目,更多是為了開辟新的品類,從而帶來更大的價(jià)值。這也是他們選擇合作伙伴的原則,不僅限于技術(shù)層面,還涉及芯片、模型、音視頻交互技術(shù)、云服務(wù)等多個(gè)領(lǐng)域的融合,為的是共同去實(shí)現(xiàn)終局目標(biāo)。
在朱興看來,螞蟻靈波科技主要聚焦在智能層面,重點(diǎn)發(fā)展動(dòng)作基礎(chǔ)模型、空間智能、末端靈巧控制等未來具身智能需要解決的重要問題,也希望能夠與行業(yè)合作伙伴共同加速解決這些問題,特別是數(shù)據(jù)集標(biāo)準(zhǔn)化、數(shù)據(jù)共享,以及模型開源等。
趙沛舟認(rèn)為,短期來看,生態(tài)融合并不顯眼,比如他們投資的穹徹智能,目前在做具身智能在食品加工領(lǐng)域的一些落地應(yīng)用,毛利雖低,但對(duì)精準(zhǔn)度要求非常高,這依然不夠「性感」。而從長(zhǎng)期來看,需要更多的伙伴一起參與,從而推動(dòng)整個(gè)生態(tài)向更廣泛的應(yīng)用場(chǎng)景發(fā)展。
結(jié)語
本場(chǎng)論壇是一場(chǎng)碰撞智慧、激活潛能的頂級(jí)思想盛宴,我們有幸匯聚了這么多專家學(xué)者共同探討具身智能的技術(shù)變革,從多視角勾勒了具身智能走向泛化的發(fā)展藍(lán)圖。相信在各方的共同努力下,具身智能將為我們的生活和產(chǎn)業(yè)帶來更多的驚喜和變革。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.