夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

在具身智能的岔路口,這場(chǎng)論壇把數(shù)據(jù)、模型、Infra聊透了

0
分享至



機(jī)器之心原創(chuàng)

作者:張倩

當(dāng)機(jī)器人成為各大科技展會(huì)最受矚目的焦點(diǎn),當(dāng)具身智能論壇場(chǎng)場(chǎng)爆滿、一票難求,我們不難發(fā)現(xiàn):這個(gè)領(lǐng)域正在經(jīng)歷前所未有的關(guān)注熱潮。

然而,熱潮之下,仍有諸多關(guān)鍵議題懸而未決:面對(duì)數(shù)據(jù)稀缺,有人寄希望于合成數(shù)據(jù)的突破,有人堅(jiān)持真機(jī)數(shù)據(jù)才是根本;在技術(shù)路線之爭(zhēng)中,有人押注端到端的整體范式,有人則認(rèn)為分層架構(gòu)更符合演進(jìn)規(guī)律;至于模型形態(tài),有人視 VLA 為智能的最終歸宿,也有人認(rèn)為世界模型才是真正的未來(lái)。

現(xiàn)階段出現(xiàn)這種分歧非常正常,因?yàn)檎麄€(gè)行業(yè)的發(fā)展路徑尚未收斂。有些問(wèn)題甚至還沒(méi)有來(lái)得及系統(tǒng)討論,比如量產(chǎn)之后會(huì)出現(xiàn)哪些新的卡點(diǎn),誰(shuí)來(lái)解決?

正是因?yàn)榇嬖谶@些問(wèn)題,業(yè)界迫切需要一個(gè)開(kāi)放的對(duì)話平臺(tái)。在今年云棲大會(huì)的具身智能論壇上,我們見(jiàn)證了這樣一場(chǎng)深度交鋒:不同派系的代表坐到同一張桌子前,將技術(shù)分歧、商業(yè)思考和基礎(chǔ)設(shè)施需求一并攤開(kāi)討論,試圖在碰撞中尋找新的共識(shí)。

論壇過(guò)后,我們也和這場(chǎng)論壇的發(fā)起者 ——阿里云聊了聊。這家云計(jì)算巨頭選擇在此時(shí)深度介入具身智能領(lǐng)域,本身就值得關(guān)注。

聊完之后,我們發(fā)現(xiàn),他們真正的入局其實(shí)是在四五年前,如今更是在提前為具身智能行業(yè)即將到來(lái)的數(shù)據(jù)量的指數(shù)級(jí)增長(zhǎng)以及算力需求、模型規(guī)模的爆發(fā)做準(zhǔn)備。這種給行業(yè)未來(lái) 3 到 5 年打「提前量」的布局既體現(xiàn)了阿里云對(duì)技術(shù)周期的敏銳判斷,也暗示著云廠商在具身智能時(shí)代所扮演的角色 —— 不只是提供算力,更是在為具身智能行業(yè)提前搭建起未來(lái)幾年最關(guān)鍵的基礎(chǔ)設(shè)施。他們相信,在各方的共同努力下,具身智能的「FSD V12 時(shí)刻」很快就會(huì)到來(lái),而他們已經(jīng)為此做好了準(zhǔn)備。

真機(jī)派 vs. 合成派

哪個(gè)更有前景?

具身智能的數(shù)據(jù)饑荒已成為行業(yè)共識(shí)。為了解決這個(gè)問(wèn)題,行業(yè)逐漸劃分出兩個(gè)派系:真機(jī)派和合成派。真機(jī)派堅(jiān)持以遙操或者互聯(lián)網(wǎng)的形式獲取數(shù)據(jù),基于 VLA 做模仿學(xué)習(xí);仿真派則相信合成數(shù)據(jù)可行性,在仿真環(huán)境中合成數(shù)據(jù),用作模型訓(xùn)練,并大量使用強(qiáng)化學(xué)習(xí)。雙方都有充足的理由堅(jiān)持自己的路線。

銀河通用是仿真合成派的代表。在現(xiàn)場(chǎng),該公司聯(lián)合創(chuàng)始人兼大模型負(fù)責(zé)人張直政從成本和可擴(kuò)展性的角度闡述了他們選擇該路線的理由。



張直政指出,今天的具身智能大模型要想實(shí)現(xiàn)通用的、跨任務(wù)的泛化能力,可能需要上萬(wàn)億條數(shù)據(jù),全部真機(jī)采集既難以實(shí)現(xiàn)也不可持續(xù)。特斯拉的 Optimus 就是一個(gè)例證,他們?cè)屢粋€(gè) 40 多人的團(tuán)隊(duì)耗時(shí)一個(gè)月采集了數(shù)十萬(wàn)條遙操數(shù)據(jù),用來(lái)訓(xùn)練機(jī)器人完成電池取放任務(wù),但泛化性依然很差。在相關(guān)負(fù)責(zé)人離職后,Optimus 開(kāi)始嘗試通過(guò)人類視頻讓機(jī)器人學(xué)習(xí)任務(wù)。

因此,銀河通用選擇的路線是:先通過(guò)大規(guī)模仿真合成數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,構(gòu)建通用基座大模型,再利用少量高精度的真實(shí)數(shù)據(jù)進(jìn)行后訓(xùn)練。通過(guò)這種方式,他們實(shí)現(xiàn)了良好的泛化性能,并且把真實(shí)數(shù)據(jù)后訓(xùn)練的樣本效率提高到了 Optimus 的一千倍,大大降低了落地的邊際成本。

「仿真極為重要,沒(méi)有仿真,我認(rèn)為我們幾十年內(nèi)都無(wú)法制造出能在現(xiàn)實(shí)世界中發(fā)揮作用的機(jī)器人」。NVIDIA 機(jī)器人與邊緣 AI 副總裁 Deepu Talla 在現(xiàn)場(chǎng)說(shuō)道。此外,他還分享了 Isaac Sim、Isaac Lab 等工具,有了這些工具,機(jī)器人的仿真數(shù)據(jù)生產(chǎn)和模型訓(xùn)練顯著加速。



但值得注意的是,并不是在所有的情況下,仿真數(shù)據(jù)都更容易獲取。清華大學(xué)助理教授、星海圖首席科學(xué)家趙行就指出,「有些仿真數(shù)據(jù)的 scaling law 來(lái)自于你擁有的博士生數(shù)量,像流體、柔性物體的仿真只有圖形學(xué)博士才能做」。在這種情況下,在真實(shí)世界做一個(gè)物理實(shí)驗(yàn)反而更便宜(比如杯子打翻,水灑在一塊布上),而且得到的數(shù)據(jù)質(zhì)量更高,多樣性也更好。千尋智能聯(lián)席首席科學(xué)家解浚源也指出,仿真數(shù)據(jù)其實(shí)是「?jìng)螖?shù)據(jù)驅(qū)動(dòng)」,因?yàn)榉抡嫫餍枰槍?duì)每個(gè)物體和場(chǎng)景定制開(kāi)發(fā),這本質(zhì)上是一種「研發(fā)人力驅(qū)動(dòng)」的方式。此外,仿真數(shù)據(jù)的數(shù)據(jù)效率也是一大問(wèn)題,自變量機(jī)器人創(chuàng)始人、CEO 王潛給出了一個(gè)令人驚訝的數(shù)字:仿真數(shù)據(jù)和真實(shí)數(shù)據(jù)的效率可能會(huì)差 5-6 個(gè)數(shù)量級(jí),這在實(shí)際訓(xùn)練中會(huì)大大削弱仿真數(shù)據(jù)的成本優(yōu)勢(shì)。

仿真未必便宜,真機(jī)也未必貴到不可承受。作為「真機(jī)派」的代表,解浚源還對(duì)「真機(jī)數(shù)據(jù)昂貴稀少」的共識(shí)提出了挑戰(zhàn)。他認(rèn)為,真機(jī)數(shù)據(jù)真正的瓶頸在于缺乏投入,而非數(shù)據(jù)本身成本過(guò)高?!笇?shí)際上真機(jī)數(shù)據(jù)并沒(méi)有想象中那么貴,在國(guó)內(nèi)供應(yīng)鏈的支持下,把單個(gè)機(jī)器人成本打到 10 萬(wàn)以下是很容易的?!菇饪T磳⒋伺c大模型廠商的投入進(jìn)行對(duì)比,指出當(dāng)前一塊高端訓(xùn)練顯卡的成本遠(yuǎn)高于一個(gè)國(guó)產(chǎn)機(jī)器人的成本。既然大模型廠商能以萬(wàn)卡甚至幾十萬(wàn)卡的規(guī)模投入算力,那么將采集數(shù)據(jù)的機(jī)器人規(guī)模擴(kuò)展到上千臺(tái)、上萬(wàn)臺(tái),絕非不可想象的成本。



此外,在采集方式上,遙操作并不是唯一的選擇。千尋智能自研的可穿戴機(jī)械臂可以把采集成本降到遙操作的 1/20,同時(shí)保持有效采集精確度不變。

解浚源相信,唯有高質(zhì)量的真實(shí)數(shù)據(jù)才能訓(xùn)練出世界領(lǐng)先的模型,所以他們致力于構(gòu)建一個(gè)基于真實(shí)數(shù)據(jù)的全鏈路數(shù)據(jù)生態(tài),從而打造一個(gè)數(shù)據(jù)飛輪,讓機(jī)器人借助真實(shí)數(shù)據(jù)實(shí)現(xiàn)能力的不斷升級(jí)。

端到端 vs. 分層,VLA vs. 世界模型

哪個(gè)是終局?

無(wú)論是合成數(shù)據(jù)還是真機(jī)數(shù)據(jù),最終都是要為模型的訓(xùn)練去提供服務(wù)。隨著大模型與機(jī)器人領(lǐng)域融合的加深,一些問(wèn)題開(kāi)始浮出水面:具身智能領(lǐng)域需要什么樣的大模型?端到端和分層架構(gòu)哪個(gè)更有前景?VLA 是終局嗎?世界模型又將帶來(lái)哪些價(jià)值?圍繞這些問(wèn)題,幾位具身智能行業(yè)領(lǐng)袖、資深研究者展開(kāi)了討論。



針對(duì)第一個(gè)問(wèn)題,王潛表示,具身智能大模型不是虛擬世界大模型在現(xiàn)實(shí)世界的簡(jiǎn)單應(yīng)用,而是獨(dú)立的基礎(chǔ)模型。因?yàn)槭紫龋Z(yǔ)言和視覺(jué)無(wú)法精確描述物理動(dòng)作;其次,物理接觸過(guò)程的復(fù)雜性遠(yuǎn)超虛擬世界模型的建模能力。

趙行同意這個(gè)說(shuō)法,并進(jìn)一步指出,具身基礎(chǔ)模型是一個(gè)平行于語(yǔ)言模型的存在。猴子、猩猩等動(dòng)物沒(méi)有豐富的語(yǔ)言,但它們的具身智能能力卻非常強(qiáng)大,這種能力很有可能來(lái)自視覺(jué)和動(dòng)作這兩個(gè)模態(tài)的交互學(xué)習(xí)。這說(shuō)明視覺(jué) - 動(dòng)作模態(tài)本身就蘊(yùn)含著強(qiáng)大的智能潛力,可以平行于語(yǔ)言模態(tài)發(fā)展出自己的智能。

但在構(gòu)建具身智能基礎(chǔ)模型的方式上,兩人出現(xiàn)了分歧 —— 趙行青睞分層架構(gòu),王潛則堅(jiān)信端到端。

最初選擇分層架構(gòu),趙行更多考慮的是現(xiàn)實(shí)部署約束,因?yàn)樵诙藗?cè)實(shí)時(shí)跑大模型受限于端側(cè)芯片的迭代速度。通過(guò)大小腦分層、分別部署在邊緣側(cè)和端側(cè)的設(shè)計(jì),機(jī)器人更容易落地。此外,他認(rèn)為分層架構(gòu)更符合生物進(jìn)化規(guī)律,畢竟人腦不同分區(qū)各司其職同樣工作得很好。針對(duì)不同層之間能力無(wú)法互通、梯度無(wú)法回傳的質(zhì)疑,趙行表示這不是本質(zhì)問(wèn)題,可通過(guò)強(qiáng)化學(xué)習(xí)等技術(shù)解決。

但王潛認(rèn)為分層架構(gòu)存在致命缺陷:前層的微小錯(cuò)誤會(huì)在后續(xù)環(huán)節(jié)快速放大,而且更多的人為干預(yù)往往會(huì)降低模型效果。更重要的是,高層模型不理解物理約束,常常分配不可能完成的任務(wù);而底層模型缺乏語(yǔ)義理解,學(xué)會(huì)抓橘子卻不會(huì)抓蘋(píng)果。為解決層間理解鴻溝,最終還是要針對(duì)各層缺陷注入不同知識(shí),結(jié)果就是各層越來(lái)越像,不如直接采用統(tǒng)一模型。對(duì)于部署壓力,王潛回應(yīng)說(shuō),雖然端到端在訓(xùn)練階段只訓(xùn)一個(gè)模型,但推理階段可以拆開(kāi)或壓縮,然后分布式部署。

不過(guò),從某種意義上來(lái)說(shuō),端到端和分層架構(gòu)并不一定是完全對(duì)立的。北京大學(xué)計(jì)算機(jī)學(xué)院研究員仉尚航指出,分層的關(guān)鍵在于如何定義「層」。如果分層是指必須拆分成兩個(gè)獨(dú)立模型,那確實(shí)與端到端相沖突;但如果是在一個(gè)統(tǒng)一模型內(nèi)實(shí)現(xiàn)功能分區(qū) —— 比如一部分側(cè)重推理決策,另一部分專注動(dòng)作生成,那就既保持了端到端的完整性,又實(shí)現(xiàn)了類似大小腦的分工,兩條路線就可以收斂到一起。

針對(duì)當(dāng)前聲量比較高的 VLA 和世界模型,各位嘉賓也發(fā)表了自己的觀點(diǎn)。北京人形機(jī)器人創(chuàng)新中心 CTO 唐劍指出了世界模型的幾個(gè)重要作用:一是輔助機(jī)器人大腦 VLM 進(jìn)行自主學(xué)習(xí)探索,像「做夢(mèng)者」一樣模擬各種任務(wù)場(chǎng)景;二是自動(dòng)生成可執(zhí)行的動(dòng)作序列,作為真機(jī)數(shù)據(jù)的高效補(bǔ)充;三是為 VLA 等模型提供底座支撐。他認(rèn)為世界模型與 VLA 并非沖突關(guān)系,而是可以相互配合的技術(shù)組合。

趙行則認(rèn)為,VLA是當(dāng)下更有潛力的技術(shù)路線,因?yàn)槭澜缒P瓦^(guò)于依賴 first-principle 假設(shè),要求必須預(yù)測(cè)出未來(lái)圖像才能做規(guī)劃,但人類學(xué)習(xí)主要靠「熟能生巧」。另外,從數(shù)據(jù)效率看,100 條數(shù)據(jù)用來(lái)訓(xùn)練端到端 VLA 就能產(chǎn)生效果,但訓(xùn)練世界模型至少需要萬(wàn)級(jí)甚至億級(jí)數(shù)據(jù)量。所以在他看來(lái),世界模型是一個(gè)非常終局的路線,只有在數(shù)據(jù)不受限制的時(shí)候才更有價(jià)值。

具身智能 Scaling Law 已初見(jiàn)端倪

誰(shuí)來(lái)為行業(yè)托底?

嘉賓們的分享足夠尖銳,也足夠真誠(chéng):真機(jī)派與合成派的路徑之爭(zhēng)、端到端與分層架構(gòu)的優(yōu)劣、VLA 與世界模型的對(duì)比…… 這些關(guān)鍵問(wèn)題被一并擺上桌面,讓行業(yè)當(dāng)下的卡點(diǎn)一目了然。

同時(shí),還有一些關(guān)鍵信息值得關(guān)注,比如王潛提到,他們已經(jīng)在內(nèi)部數(shù)據(jù)中觀察到了具身智能的 scaling law,ICLR 2025 的一篇論文(「DATA SCALING LAW IN IMITATION LEARNING FOR ROBOTIC MANIPULATION」)也提到了這一點(diǎn)。這意味著,在具身智能領(lǐng)域繼續(xù)擴(kuò)大模型和數(shù)據(jù)規(guī)模也極有可能是有效的。

此外,我們也看到,現(xiàn)場(chǎng)有多位嘉賓分享了具身智能的落地情況,比如上海傅利葉智能科技股份有限公司創(chuàng)始人兼首席執(zhí)行官顧捷分享了他們?cè)谌藱C(jī)交互、康復(fù)及陪伴場(chǎng)景的探索,中科云谷科技有限公司副總經(jīng)理?xiàng)钶x介紹了中聯(lián)重科在工業(yè)制造場(chǎng)景下的機(jī)器人落地思考與實(shí)踐,加速進(jìn)化副總裁趙維晨則講述了人形機(jī)器人普及路徑及教育、競(jìng)賽等落地思路。從中可以看出,整個(gè)具身智能行業(yè)的落地速度正在加快,越來(lái)越多的公司開(kāi)始走向量產(chǎn)。







但當(dāng)議題從「怎么造機(jī)器人」切換到「怎么把機(jī)器人量產(chǎn)」,討論就必須引入一個(gè)此前近乎隱形的主角 —— 云廠商。

我們建議,具身智能公司從第一天起就要做好云架構(gòu)、AI Infra 的規(guī)劃。」阿里云智能集團(tuán)公共云事業(yè)部副總裁、華北大區(qū)總經(jīng)理,同時(shí)也是阿里云智能集團(tuán)公共云事業(yè)部具身智能負(fù)責(zé)人高飛在采訪中提到。



這背后的邏輯并不復(fù)雜。正如嘉賓們所言,大模型技術(shù)已經(jīng)廣泛應(yīng)用于具身智能行業(yè),scaling law 的顯現(xiàn)和機(jī)器人落地速度的加快都讓數(shù)據(jù)和算力規(guī)模變得愈發(fā)重要。論壇嘉賓分享的提效手段讓數(shù)據(jù)采集、合成越來(lái)越快,未來(lái)幾年行業(yè)數(shù)據(jù)量將穩(wěn)步攀升,對(duì)應(yīng)的清洗、存儲(chǔ)和訓(xùn)練壓力也會(huì)隨之放大。

但僅憑具身智能公司一己之力,這樣的壓力是很難頂住的。首先,數(shù)據(jù)激增帶來(lái)的需求難以預(yù)測(cè),企業(yè)自建的 IT 基礎(chǔ)設(shè)施很難跟上業(yè)務(wù)發(fā)展,也會(huì)因?yàn)槿狈椥远y以滿足訓(xùn)練、仿真等并發(fā)需求。其次,大多數(shù)具身智能團(tuán)隊(duì)源自科研背景,這讓他們?cè)谒惴ㄍ黄品矫嬗稳杏杏?,但工程化?jīng)驗(yàn)相對(duì)有限,開(kāi)發(fā)工具鏈和運(yùn)維能力也常常不足。

一旦公司開(kāi)始量產(chǎn),數(shù)據(jù)開(kāi)始指數(shù)級(jí)增長(zhǎng),這些矛盾就會(huì)被瞬間放大。僅數(shù)據(jù)的遷移、處理工作就會(huì)造成巨大的 IT 開(kāi)銷,給企業(yè)發(fā)展帶來(lái)阻力。

阿里云非常清楚這一過(guò)程給企業(yè)帶來(lái)的痛苦,因?yàn)樵谥悄荞{駛行業(yè),他們已經(jīng)經(jīng)歷過(guò)一輪類似的發(fā)展歷程,也幫助很多頭部車企順利渡過(guò)了難關(guān)。如今,越來(lái)越多的具身智能公司找到他們,希望在量產(chǎn)之前完成云架構(gòu)的規(guī)劃,少走一些彎路。

對(duì)于這些需求,阿里云已經(jīng)在過(guò)去的四五年中沉淀了不少相關(guān)能力:

首先是處理大量數(shù)據(jù)的能力。

阿里云智能集團(tuán)公共云事業(yè)部具身智能解決方案負(fù)責(zé)人王旭文提到,阿里云最初誕生就定位為「以數(shù)據(jù)為中心的云計(jì)算」,之后深度入局的智能駕駛、AI 也都是數(shù)據(jù)密集型行業(yè),如今大量具身智能數(shù)據(jù)涌來(lái),他們已經(jīng)有足夠強(qiáng)大的基礎(chǔ)設(shè)施和經(jīng)驗(yàn)來(lái)從容應(yīng)對(duì)。



具體來(lái)說(shuō),在最根本的數(shù)據(jù)生產(chǎn)環(huán)節(jié),無(wú)論企業(yè)是「真機(jī)派」還是「仿真派」,他們都有全套的技術(shù)支持。

真機(jī)數(shù)據(jù)生產(chǎn)的鏈條非常長(zhǎng),也非常復(fù)雜,涉及采集、標(biāo)注、傳輸上云、存儲(chǔ)、質(zhì)量校驗(yàn)、清洗脫敏、數(shù)據(jù)分析等多個(gè)環(huán)節(jié)。對(duì)此,阿里云能夠提供一整套云上的大數(shù)據(jù)處理能力來(lái)支撐這個(gè)復(fù)雜流程,包括云上托管的數(shù)據(jù)處理引擎和湖倉(cāng)一體架構(gòu),實(shí)現(xiàn)統(tǒng)一的元數(shù)據(jù)管理和超大規(guī)模數(shù)據(jù)的有序生產(chǎn)。

對(duì)于仿真數(shù)據(jù)生產(chǎn),阿里云同樣做了充分準(zhǔn)備。他們適配了市面上主流的仿真軟件運(yùn)行環(huán)境,并通過(guò)自身的產(chǎn)研能力對(duì)這些軟件進(jìn)行了深度的性能優(yōu)化與評(píng)估,幫助用戶選擇最適合的算力規(guī)格,顯著提升仿真計(jì)算效率并降低成本。此外,他們的多款云產(chǎn)品已經(jīng)和第三方工具鏈深度集成,可以做到開(kāi)箱即用,比如阿里云人工智能平臺(tái) PAI 已經(jīng)完成與 NVIDIA Physical AI 全棧工具鏈的整合;無(wú)影云電腦可以彈性掛載多種規(guī)格的 GPU,并且預(yù)置了多款國(guó)內(nèi)外仿真軟件,用開(kāi)箱即用的開(kāi)發(fā)機(jī)加速整個(gè)仿真過(guò)程。

但無(wú)論如何,當(dāng)前數(shù)據(jù)的稀缺依然是一大難題,所以數(shù)據(jù)的流轉(zhuǎn)和共享已經(jīng)成為一種產(chǎn)業(yè)需求。傳統(tǒng)的線下數(shù)據(jù)拷貝方式效率極低 —— 很多公司需要派人拿著硬盤到對(duì)方公司去拷貝,這種以周為單位的數(shù)據(jù)傳輸方式顯然無(wú)法適應(yīng)行業(yè)發(fā)展需要。阿里云通過(guò) OSS 跨地域、跨賬號(hào)的數(shù)據(jù)遷移服務(wù),能夠?qū)⑦@個(gè)過(guò)程縮短到小時(shí)級(jí)別。同時(shí),他們也在聯(lián)合生態(tài)伙伴,推動(dòng)云上數(shù)據(jù)存儲(chǔ)和安全數(shù)據(jù)分享的行業(yè)最佳實(shí)踐。

其次是獨(dú)一無(wú)二的模型原廠優(yōu)勢(shì)。

通義千問(wèn)系列模型在 AI 領(lǐng)域的地位有目共睹 —— 其衍生模型數(shù)量已超過(guò) 17 萬(wàn)個(gè),穩(wěn)居全球開(kāi)源模型的頭部陣營(yíng)。但更值得關(guān)注的是,這種影響力正在向具身智能領(lǐng)域延伸。

最近一段時(shí)間我跑了大概 30 家具身智能公司,跟他們的 CEO 深度溝通后了解到,他們大部分都在用 Qwen-VL 模型去做后訓(xùn)練。」高飛在采訪中提到。

這種不約而同的選擇背后有著充分的技術(shù)理由。Qwen-VL 在空間感知、動(dòng)態(tài)視覺(jué)理解、2D/3D Grounding、路徑規(guī)劃等方面的能力,恰好契合了具身智能對(duì)「大腦」的核心需求。更重要的是,堅(jiān)持開(kāi)源策略讓通義千問(wèn)形成了一個(gè)全球性的開(kāi)發(fā)者生態(tài),大量國(guó)內(nèi)外開(kāi)發(fā)者在基于這個(gè)模型進(jìn)行二次開(kāi)發(fā)和優(yōu)化。而且,作為模型原廠,阿里云還可以提供模型服務(wù)的深度支持,比如定向開(kāi)源特定版本 checkpoint,提供專業(yè)的模型訓(xùn)練工程化支持等。這種從模型底層到應(yīng)用層的全鏈路支撐能力,讓阿里云在具身智能賽道擁有了一個(gè)幾乎不可復(fù)制的競(jìng)爭(zhēng)優(yōu)勢(shì)。

在論壇現(xiàn)場(chǎng),通義千問(wèn)實(shí)驗(yàn)室算法科學(xué)家白帥還分享了他們最新的 Qwen3-VL 模型,這個(gè)模型針對(duì)細(xì)粒度視覺(jué)理解、視頻時(shí)序理解、3D 感知與規(guī)劃以及帶圖推理和視覺(jué)交互能力進(jìn)行了優(yōu)化,為具身智能落地提供了更強(qiáng)的基礎(chǔ)模型支撐。



當(dāng)然,通義以外的模型,阿里云也提供高性價(jià)比的、穩(wěn)定的調(diào)用服務(wù)。阿里云百煉不僅集成了自研的全系列模型,還匯聚了國(guó)內(nèi)主流模型和國(guó)外開(kāi)源模型。在這些模型背后,阿里云提供統(tǒng)一的基礎(chǔ)設(shè)施保障,確保服務(wù)的可用性、穩(wěn)定性和大規(guī)模集群支持。對(duì)于那些在數(shù)據(jù)安全和定制化方面有特殊需求的客戶,阿里云還支持在 VPC 環(huán)境中獨(dú)立部署模型。

模型之外,工程化能力也很重要。

「工程這件事需要時(shí)間和經(jīng)驗(yàn)的積累,做過(guò)和沒(méi)做過(guò)的就是不一樣。這一過(guò)程沒(méi)有捷徑?!雇跣裎脑诓稍L中強(qiáng)調(diào)。

他還觀察到,由于具身智能尚處于規(guī)?;捌?,一些工程方面的痛點(diǎn)還沒(méi)有充分暴露,所以很多具身智能公司還沒(méi)有在工程方面做好準(zhǔn)備,這與成熟的 AI 行業(yè)形成了鮮明對(duì)比。

好在,阿里云是準(zhǔn)備好了的,因?yàn)樵谶^(guò)去幾年服務(wù)頭部大模型公司和汽車新勢(shì)力的過(guò)程中,他們通過(guò)「一步一步踩坑」的方式積累了大量的基礎(chǔ)設(shè)施和實(shí)戰(zhàn)經(jīng)驗(yàn),并將這些東西沉淀成了可標(biāo)準(zhǔn)化交付的產(chǎn)品和服務(wù)能力,包括完整的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施、數(shù)百 P 級(jí)數(shù)據(jù)處理能力等。

這些東西之所以能夠復(fù)用,是因?yàn)榫呱碇悄芎椭悄荞{駛在工程架構(gòu)方面有著高度的相似性。首先是基礎(chǔ)設(shè)施層面,無(wú)論是集群組網(wǎng),還是資源管理調(diào)度、性能優(yōu)化,兩個(gè)領(lǐng)域所需的底層能力幾乎一致。操作系統(tǒng)、運(yùn)行環(huán)境、開(kāi)發(fā)框架等技術(shù)棧也沒(méi)有本質(zhì)區(qū)別。其次是工具鏈層面,兩個(gè)行業(yè)的研發(fā) Pipeline 高度重合,對(duì)數(shù)據(jù) Pipeline 構(gòu)建的基礎(chǔ)能力需求也基本相同。更有意思的是,許多具身智能從業(yè)者本身就來(lái)自智能駕駛背景,他們使用的模型架構(gòu)很多是在智能駕駛模型基礎(chǔ)上改進(jìn)而來(lái)的。這種人員和技術(shù)的傳承,讓阿里云此前在智能駕駛領(lǐng)域積累的工程經(jīng)驗(yàn)?zāi)軌驇缀鯚o(wú)縫地移植到具身智能場(chǎng)景中。

智能駕駛行業(yè)規(guī)模已經(jīng)如此之大、體系如此成熟,它所積累的經(jīng)驗(yàn)完全可以先復(fù)用,然后再看有什么差異。它所踩過(guò)的坑,具身智能企業(yè)沒(méi)必要從頭再踩一遍」,王旭文以「過(guò)來(lái)人」的口吻說(shuō)道,這也是他們反復(fù)強(qiáng)調(diào)具身智能公司一定要在業(yè)務(wù)爆發(fā)之前就做好基礎(chǔ)設(shè)施規(guī)劃的重要原因。

目前,阿里云已經(jīng)服務(wù)了一些已經(jīng)或正在走向量產(chǎn)階段的具身智能企業(yè)。在這一過(guò)程中,他們發(fā)現(xiàn)自己可以做的事情其實(shí)非常多,比如提供全鏈路可觀測(cè)服務(wù),提供回傳數(shù)據(jù)的實(shí)時(shí)采集和實(shí)時(shí)分析以輔助故障診斷與定責(zé),通過(guò) Qwen-Omni、Qwen-ASR 能力增強(qiáng)機(jī)器人的對(duì)話和娛樂(lè)互動(dòng)性,通過(guò)無(wú)影云電腦提供工作站環(huán)境從而支持仿真和數(shù)據(jù)采集工作等。

看來(lái),在量產(chǎn)機(jī)器人這條路上,阿里云正在幫整個(gè)行業(yè)掃清障礙。

從非共識(shí)走向共識(shí)

阿里云準(zhǔn)備好了

阿里云發(fā)起的這個(gè)具身智能論壇持續(xù)了 4 個(gè)小時(shí),現(xiàn)場(chǎng)座無(wú)虛席。

可以看到,整個(gè)具身智能行業(yè)還有很多非共識(shí),技術(shù)路線還尚未收斂。高飛說(shuō),這其實(shí)很像四五年前的智能駕駛。但 FSD v12 出來(lái)之后,大家看到了「端到端 + 數(shù)據(jù)驅(qū)動(dòng)閉環(huán)」在真實(shí)世界的可行性,于是技術(shù)路線迅速收斂,整個(gè)行業(yè)也迎來(lái)數(shù)據(jù)的爆炸式增長(zhǎng)。他相信,具身智能也會(huì)經(jīng)歷這個(gè)過(guò)程。

這一過(guò)程中,有一些顯而易見(jiàn)的趨勢(shì),比如云邊端協(xié)同。端側(cè)受物理空間和功耗限制,無(wú)法承載大算力需求;而長(zhǎng)期任務(wù)規(guī)劃、復(fù)雜推理等高級(jí)能力又需要強(qiáng)大的計(jì)算資源支持;此外,多機(jī)協(xié)作、工具調(diào)用等場(chǎng)景也必須通過(guò)云端實(shí)現(xiàn)統(tǒng)一調(diào)度,這讓云廠商的重要性日益凸顯。阿里云積蓄的力量也將在這一階段爆發(fā)。

不過(guò),高飛也指出,除了基礎(chǔ)設(shè)施支撐,具身智能的落地還離不開(kāi)廣大開(kāi)發(fā)者群體的參與。為此,阿里云在生態(tài)建設(shè)方面做出了多方面努力,包括堅(jiān)持通義系列大模型的開(kāi)源策略,降低開(kāi)發(fā)者使用門檻;基于阿里云數(shù)百萬(wàn)開(kāi)發(fā)者基礎(chǔ),連接具身智能公司與開(kāi)發(fā)者社群;提供系統(tǒng)化的培訓(xùn)、產(chǎn)品試用和資源支持;在魔搭社區(qū)專門開(kāi)設(shè)具身智能專區(qū),匯聚相關(guān)模型和數(shù)據(jù)集等。

在這個(gè)充滿不確定性的非共識(shí)階段,阿里云選擇為各種技術(shù)路線都做好準(zhǔn)備,用平臺(tái)能力和生態(tài)資源為整個(gè)行業(yè)的未來(lái)發(fā)展夯實(shí)基礎(chǔ)。當(dāng)具身智能的「FSD V12 時(shí)刻」真正到來(lái)時(shí),這些提前布局的能力將成為推動(dòng)行業(yè)躍遷的關(guān)鍵力量。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
太震撼了!上海虹橋站“人從眾”模式開(kāi)啟,多地高鐵站人山人?!?>
    </a>
        <h3>
      <a href=太震撼了!上海虹橋站“人從眾”模式開(kāi)啟,多地高鐵站人山人海… 火山詩(shī)話
2025-10-01 09:42:22
莎頭組合3-0橫掃奪冠!倆喜訊到手,這默契誰(shuí)看了不夸?

莎頭組合3-0橫掃奪冠!倆喜訊到手,這默契誰(shuí)看了不夸?

迎男而上
2025-10-03 23:51:41
西貝羊肉串整改后用的依舊是冷凍肉,9元一串肉有28克

西貝羊肉串整改后用的依舊是冷凍肉,9元一串肉有28克

映射生活的身影
2025-10-03 19:22:23
10月2日長(zhǎng)沙真的有一億人!特別是五一路:人山人海,挪不動(dòng)腳了

10月2日長(zhǎng)沙真的有一億人!特別是五一路:人山人海,挪不動(dòng)腳了

火山詩(shī)話
2025-10-02 21:00:58
為了“掏空”老百姓的錢袋子,編造出來(lái)的5大謊言,誰(shuí)信誰(shuí)倒霉?

為了“掏空”老百姓的錢袋子,編造出來(lái)的5大謊言,誰(shuí)信誰(shuí)倒霉?

貓叔東山再起
2025-09-18 08:40:06
多地突降大雪!

多地突降大雪!

太原全接觸
2025-10-02 13:33:24
英國(guó)警方公布曼徹斯特恐襲案嫌疑人身份

英國(guó)警方公布曼徹斯特恐襲案嫌疑人身份

新京報(bào)
2025-10-03 07:49:43
我駐守邊疆9年,補(bǔ)貼從2.2萬(wàn)降到4000,我提返崗申請(qǐng),領(lǐng)導(dǎo)看后慌了

我駐守邊疆9年,補(bǔ)貼從2.2萬(wàn)降到4000,我提返崗申請(qǐng),領(lǐng)導(dǎo)看后慌了

溫情郵局
2025-09-26 11:47:09
驚艷!美媒:東風(fēng)-26D再次試射,“關(guān)島殺手”射程漲至5000公里!

驚艷!美媒:東風(fēng)-26D再次試射,“關(guān)島殺手”射程漲至5000公里!

書(shū)中自有顏如玉
2025-10-03 16:26:16
梁天現(xiàn)狀:66歲獨(dú)居,幫去世大哥還清400萬(wàn)債務(wù),對(duì)宋丹丹心懷愧疚

梁天現(xiàn)狀:66歲獨(dú)居,幫去世大哥還清400萬(wàn)債務(wù),對(duì)宋丹丹心懷愧疚

春秋論娛
2025-09-25 19:16:49
禍從口出!網(wǎng)友:別著急封殺他,讓全世界都看看他的自作自受

禍從口出!網(wǎng)友:別著急封殺他,讓全世界都看看他的自作自受

我不叫阿哏
2025-10-03 11:22:47
副部級(jí)李詠箑,新職明確!黃建發(fā)履新,任中組部分管日常工作的副部長(zhǎng)!

副部級(jí)李詠箑,新職明確!黃建發(fā)履新,任中組部分管日常工作的副部長(zhǎng)!

藍(lán)色海邊
2025-10-04 06:02:36
澳大利亞對(duì)中國(guó)稀土開(kāi)首槍,中方叫停交易,訂單清零,澳總理急了

澳大利亞對(duì)中國(guó)稀土開(kāi)首槍,中方叫停交易,訂單清零,澳總理急了

朗威游戲說(shuō)
2025-10-03 11:27:27
女優(yōu)石川澪美少女天花板,10位男優(yōu)連續(xù)撞擊要壞掉!

女優(yōu)石川澪美少女天花板,10位男優(yōu)連續(xù)撞擊要壞掉!

葫蘆哥愛(ài)吐槽
2025-10-04 04:13:15
河南女孩發(fā)朋友圈借錢,300人給她轉(zhuǎn)賬,一夜到賬30萬(wàn):她還了嗎

河南女孩發(fā)朋友圈借錢,300人給她轉(zhuǎn)賬,一夜到賬30萬(wàn):她還了嗎

輝哥說(shuō)動(dòng)漫
2025-10-01 11:41:20
市委書(shū)記的女兒進(jìn)入縣財(cái)政局工作,局長(zhǎng)膽大包天,竟然打她的主意

市委書(shū)記的女兒進(jìn)入縣財(cái)政局工作,局長(zhǎng)膽大包天,竟然打她的主意

喬生桂
2025-09-29 12:44:40
真敢拍!這部美劇要是被封禁,一點(diǎn)不冤

真敢拍!這部美劇要是被封禁,一點(diǎn)不冤

來(lái)看美劇
2025-10-01 17:16:07
兒子被執(zhí)行死刑前,我奔赴千里之外的杭州與他會(huì)見(jiàn),談話15分鐘!

兒子被執(zhí)行死刑前,我奔赴千里之外的杭州與他會(huì)見(jiàn),談話15分鐘!

人間百態(tài)大全
2025-10-01 07:10:03
10月將要發(fā)布的 12 款新車

10月將要發(fā)布的 12 款新車

藍(lán)色海邊
2025-10-03 13:33:23
李湘參加派對(duì)胖到不忍直視,肚子太大,被旁邊美女比下去了

李湘參加派對(duì)胖到不忍直視,肚子太大,被旁邊美女比下去了

西樓知趣雜談
2025-10-02 05:06:52
2025-10-04 07:24:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11396文章數(shù) 142464關(guān)注度
往期回顧 全部

科技要聞

OpenAI硬剛馬斯克:別用訴訟欺負(fù)我的人

頭條要聞

特朗普:哈馬斯必須在美東時(shí)間5日18時(shí)前同意協(xié)議

頭條要聞

特朗普:哈馬斯必須在美東時(shí)間5日18時(shí)前同意協(xié)議

體育要聞

四冠中鋒,比所有人更早開(kāi)始新賽季

娛樂(lè)要聞

繼王晶、向太后 周杰再曝潛規(guī)則

財(cái)經(jīng)要聞

國(guó)家出手!三大世界級(jí)城市群定了

汽車要聞

元戎啟行9月合作車型 交付量突破3萬(wàn)臺(tái)

態(tài)度原創(chuàng)

時(shí)尚
教育
健康
游戲
藝術(shù)

伊姐十一熱推:電視劇《沉默的榮耀》;電視劇《是風(fēng)動(dòng)、是心動(dòng)》......

教育要聞

第一學(xué)歷重要嗎?職院??破瘘c(diǎn),田素坤就跨界玩成北大博導(dǎo)

內(nèi)分泌科專家破解身高八大謠言

《最終幻想7-3》未受Xbox內(nèi)存影響 已有大量可玩內(nèi)容

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫(xiě)法

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 www.国产九九.com| 国产对白熟女受不了了| 免费无码中文字幕A级毛片HD| 亚洲日韩国产精品第一页一区| 国产精品老熟女久久久久| 国产精品自在在线午夜蜜芽tv在线| 日本一区熟女| 成全高清在线播放电视剧| 国产午夜福利精品视频| 欧美无人区码一码二码三码的区别| 美女被扒开内裤桶屁股眼视频网站| av永久天堂一区| аⅴ天堂中文在线网官网| 亚洲岛国av一区二区| 人人爽亚洲精品美女久久久| 婷婷十月无码| 日本免码VA在线看免费最新| 丰满人妻熟妇乱又伦精品视| 日本xxxx色视频在线播放 | 精品乱码Av一区二区三区| 色欲AⅤ精品无码一区二区pro| 亚洲VR永久无码精品vr版| 国产精品无码久久久久久久久久| 国产精品亚洲综合一区| 人人妻碰碰碰免费| 国产精品中文字幕二区| 国产Videos视频| 国产综合久久99久久| 成午夜福利人试看120秒| 国产一区二区三区不卡在线观看| 免费黄色在线| 亚洲日本va99在线| 苍井空一区二区三区精品| 国产精品亚洲а∨天堂网不卡 | www.99pao| 丰满少妇猛烈进入免费看高潮| 中国极品少妇XXXX做受| 免费牲交视频| 亚洲成av人综合在线观看| 国产色一区二区| 69精品人人人人人|