王興興的大實(shí)話,在高通攢的這場(chǎng)局上,全交代了。
目前機(jī)器人領(lǐng)域技術(shù)路線都不一樣,導(dǎo)致看著熱鬧,但是進(jìn)展沒那么顯著;
既然現(xiàn)在大家開發(fā)的模型都還不能部署直接用,那還不如開放出來(lái),就像OpenAI開源GPT-1/2一樣;
宇樹前幾天開源的世界模型也無(wú)法直接在工廠中落地使用;
現(xiàn)在機(jī)器人和芯片廠商都忽視了芯片對(duì)于機(jī)器人的重要程度;
手機(jī)芯片等類似芯片用到機(jī)器人身上是非常有想象空間的。
侯紀(jì)磊對(duì)話王興興
所有終端都被AI、Agent賦予新想象,因?yàn)樽銐騨ew,具身智能成為被影響最大的那一個(gè)領(lǐng)域。但也因?yàn)樽銐騨ew,具身智能的熱鬧下必然存在諸多爭(zhēng)議與挑戰(zhàn)。
宇樹科技,長(zhǎng)期站在聚光燈下的明星玩家,此時(shí)此刻將行業(yè)中的諸多難題直接剖開。
或許不為別的,而是高通攢的這個(gè)局太難得。2025驍龍峰會(huì)·中國(guó),聚集了國(guó)內(nèi)外終端領(lǐng)域的核心玩家,覆蓋上下游產(chǎn)業(yè)鏈。在這開誠(chéng)布公討論的問(wèn)題,或許將馬上成為行業(yè)最關(guān)注的熱點(diǎn),進(jìn)而能更快得到解決。
而不止王興興,來(lái)自硬件、模型、操作系統(tǒng)等層級(jí)的玩家,也都暢所欲言、應(yīng)聊盡聊:
理想汽車副總裁、智能空間研發(fā)負(fù)責(zé)人勾曉菲
面壁智能CEO李大海
中科創(chuàng)達(dá)聯(lián)合創(chuàng)始人、執(zhí)行總裁耿增強(qiáng)
侯紀(jì)磊對(duì)話實(shí)踐者
高通全球AI研發(fā)負(fù)責(zé)人侯紀(jì)磊與他們進(jìn)行對(duì)話。
為完整體現(xiàn)各位大咖的思考和理解,我們?cè)诓桓淖冊(cè)獾幕A(chǔ)上將對(duì)話內(nèi)容進(jìn)行整理,希望您能從中有所收獲。
算力散熱通信,說(shuō)到底機(jī)器人應(yīng)該加強(qiáng)對(duì)芯片的關(guān)注
Agent落地終端的終極想象,或許就是具身智能。
宇樹科技創(chuàng)始人、CEO、CTO王興興表示,他們的目標(biāo)還是希望能夠有通用的AI放在通用的機(jī)器人上,干各種活,無(wú)論是在工廠還是家用。
當(dāng)機(jī)器人能在未見過(guò)的環(huán)境中,憑自然語(yǔ)言指令完成任務(wù)時(shí),就是機(jī)器人的ChatGPT時(shí)刻。
他將這個(gè)目標(biāo)拆解為幾個(gè)階段分別完成:
1、固定動(dòng)作演示 → 已實(shí)現(xiàn)(如舞蹈、武術(shù))。2、實(shí)時(shí)生成任意動(dòng)作 → 預(yù)計(jì)最快今年底/明年初實(shí)現(xiàn)。3、在陌生場(chǎng)景執(zhí)行任務(wù) → 預(yù)計(jì)明年底左右能做到(如拿水、整理桌子)。4、高成功率與精細(xì)操作 → 需要再數(shù)年,目標(biāo)是接近99.9%成功率,能完成拆裝手機(jī)等細(xì)致任務(wù)。
示意圖
如果想要機(jī)器人能夠做到這些,一個(gè)非常關(guān)鍵的問(wèn)題是對(duì)物理環(huán)境、自然語(yǔ)言指令的實(shí)時(shí)理解和處理,這就對(duì)于端側(cè)AI的通信能力有更高要求。
王興興表示,通信是非常重要的。
目前我覺得包括很多機(jī)器人廠商或者芯片廠商,都有點(diǎn)點(diǎn)忽視芯片對(duì)于機(jī)器人的重要程度。
就像新能源汽車一樣,最近十幾年最大的變化是隨著新通信協(xié)議出現(xiàn),線纜數(shù)量減少了很多。早年間一輛油車的線纜數(shù)量是非??鋸埖?,可能一輛車?yán)锞€纜重量就有100公斤。
在機(jī)器人領(lǐng)域也是一樣的,一個(gè)通信線纜是4根或5根線,有時(shí)為了降低電線數(shù)量會(huì)花費(fèi)很多時(shí)間和精力。因?yàn)閷?duì)于一臺(tái)機(jī)器人來(lái)說(shuō),性能越來(lái)越好、機(jī)器人越來(lái)越可靠,降低線纜數(shù)量是很重要的。迄今為止,工業(yè)機(jī)器人最常見的故障就是線纜出問(wèn)題,可能占到60-70%。
對(duì)于一臺(tái)機(jī)器人來(lái)說(shuō),減少線纜數(shù)量的最大問(wèn)題是要提高整體通信協(xié)議、提升通信質(zhì)量。
我相信未來(lái)機(jī)器人的終極想象是每一個(gè)手臂上就只有一根線纜,別的都沒有了,多干凈整潔,想要實(shí)現(xiàn)這個(gè)目標(biāo)還有非常多工作要做,但這非常值得做。
此外,在底層芯片上,王興興提到了終端難以部署大規(guī)模算力的難題。
機(jī)器人本身的空間就那么大,很多時(shí)候高算力的芯片都裝不進(jìn)去;同時(shí)電池容量、散熱,對(duì)于這么大的機(jī)器人來(lái)說(shuō)都是很難解決的問(wèn)題。
示意圖
他覺得未來(lái)具身智能身上部署的算力,峰值功耗最好控制在100W以內(nèi),平均正常功耗可能只要20-30W,可能就相當(dāng)于幾個(gè)手機(jī)的功耗。
太大是不行的。我覺得手機(jī)芯片等類似芯片用到機(jī)器人身上是非常有想象空間的。
目前處在黎明前的前夜,前夜反而是比較麻煩的。最大的問(wèn)題是行業(yè)內(nèi)各家技術(shù)路線差別很大,都有各自的想法,這就會(huì)導(dǎo)致這個(gè)領(lǐng)域非常熱鬧,但整體進(jìn)展沒那么快。
當(dāng)下想要真正把具身智能的通用AI模型做出來(lái),在這個(gè)階段,大家還是可以保持更開放的態(tài)度,反正大家做出來(lái)的模型都沒法部署用,不如開放一點(diǎn)。
前段時(shí)間宇樹開源了一個(gè)基于視頻生成的世界模型,不只是權(quán)重參數(shù),包括模型本身、數(shù)據(jù)集、訓(xùn)練源代碼、部署源代碼通通開源。
宇樹開源模型
王興興說(shuō),這個(gè)模型真正放在工廠或者生活中是不能直接用的,那不如開源出來(lái)。這有一點(diǎn)像OpenAI早年間的時(shí)候,因?yàn)榇竽P偷纳虡I(yè)價(jià)值或者說(shuō)距離落地還有點(diǎn)遠(yuǎn),GPT-1、GPT-2都是開源的。
我們也是希望更多開源能夠讓大家共同來(lái)推動(dòng)這一領(lǐng)域共同進(jìn)步。
至于現(xiàn)在大家總是討論的VLA模型和世界模型之間的問(wèn)題,說(shuō)實(shí)在的很難講得非常清楚,因?yàn)槟呐戮褪荲LA模型、世界模型本身也都有非常多變種。我們公司會(huì)保持開放的態(tài)度,嘗試各種模型,包括自己開發(fā)以及和第三方合作等。
我個(gè)人覺得在AI領(lǐng)域要保持謙卑的態(tài)度,永遠(yuǎn)有更聰明、更開放的人做更好的東西出來(lái),我們保持謙卑的態(tài)度去學(xué)習(xí)。
有時(shí)候我還希望應(yīng)該把過(guò)去很多年的東西盡量忘掉,不要被過(guò)去限制了自己的邏輯。
我們的目標(biāo)是讓機(jī)器人真正在家庭和工廠里用起來(lái)。我認(rèn)為無(wú)論是芯片、通信協(xié)議、算力、通信架構(gòu)、甚至是整個(gè)無(wú)線通信架構(gòu)可能都需要一些調(diào)整。
包括安全問(wèn)題。現(xiàn)在機(jī)器人賣得越來(lái)越多,有些黑客專門破解我們的機(jī)器人,這讓我們也非常頭大。
在機(jī)器人領(lǐng)域還沒有那么成熟前,可以從很多其他領(lǐng)域借鑒學(xué)習(xí),包括手機(jī)、新能源汽車等,去進(jìn)行更加規(guī)范的體系建設(shè)、數(shù)據(jù)采集、模型訓(xùn)練等。
當(dāng)下這個(gè)領(lǐng)域確實(shí)太新了,我們每時(shí)每刻都會(huì)面臨一些新的挑戰(zhàn)和問(wèn)題,這不是單個(gè)公司能解決的。我們也希望更多人參與進(jìn)來(lái)解決問(wèn)題,比如我們一般用的Linux系統(tǒng)本身還有很多漏洞,我們?cè)陂_發(fā)時(shí)需要把底層漏洞完全解決,這還是比較花時(shí)間的,如果有一家第三方公司能把這些問(wèn)題解決,我們也非常愿意合作,這是一件非常有價(jià)值的事。
端側(cè)模型將是Agent系統(tǒng)中最核心的編排者
Agent根本上是大模型的應(yīng)用形式,目前Agent的形態(tài)更偏向云端,但是隨著落地趨勢(shì)逐步推進(jìn),端云協(xié)同將是必然。
面壁智能CEO李大海認(rèn)為,端云協(xié)同現(xiàn)在已經(jīng)是行業(yè)共識(shí),這樣能提供更好的用戶體驗(yàn)。云端相較于端側(cè)可以提供近乎無(wú)限的算力和資源,負(fù)責(zé)解決復(fù)雜問(wèn)題;端側(cè)離用戶更近,它需要響應(yīng)速度非常快、同時(shí)保障用戶隱私。
端側(cè)有一個(gè)非常重要的優(yōu)勢(shì),就是“永遠(yuǎn)在線”,它可以持續(xù)感知世界、實(shí)現(xiàn)基于設(shè)備隱私的上下文理解、協(xié)同云端不同Agent區(qū)組織編排完成復(fù)雜任務(wù)。
具體到實(shí)際的終端上,比如在汽車座艙里面,就應(yīng)該有比較強(qiáng)的端側(cè)模型,它能夠理解用戶需求然后去和云側(cè)的模型溝通。
舉一個(gè)簡(jiǎn)單的例子,比如說(shuō)如果在座艙里面通過(guò)端側(cè)模型感知到后面的小朋友有哭鬧的情況,就可以通過(guò)端側(cè)先去開啟一個(gè)云端比較強(qiáng)的語(yǔ)言交互模型,說(shuō)要不要一起聊聊天,分散一下注意力,給他講一個(gè)故事。但這個(gè)開啟的過(guò)程一定是要通過(guò)端側(cè)來(lái)判斷,而不是讓云側(cè)隨時(shí)有一個(gè)模型在觀察我們的座艙里面在做什么,這對(duì)隱私的暴露是非常大的。
示意圖
我認(rèn)為終端的端側(cè)模型未來(lái)其實(shí)是整個(gè)Agent系統(tǒng)里最核心的編排者。
那么未來(lái)AI行業(yè)對(duì)于端側(cè)模型的需求是什么?
李大海認(rèn)為,永遠(yuǎn)要去提高端側(cè)模型的知識(shí)密度。
因?yàn)槎藗?cè)模型部署在各種硬件設(shè)備、走入千家萬(wàn)戶和不同用戶場(chǎng)景發(fā)生交互,它需要具備很好的自主學(xué)習(xí)能力,尤其是基于探索的內(nèi)容進(jìn)行自我迭代和個(gè)性化發(fā)展。所以端側(cè)模型提升知識(shí)密度非常重要,面壁智能提出了知識(shí)密度每三個(gè)月提升一倍的觀點(diǎn)。相對(duì)而言,云側(cè)模型會(huì)更關(guān)注智能水平的提升,這二者之間的差異還是很大的。
在模型自我發(fā)展的同時(shí),和芯片、終端、系統(tǒng)之間也應(yīng)該更深度協(xié)同。
在這之中,李大海提到了深度合作非常重要。
站在作為端側(cè)模型公司角度講,我們跟高通這樣的芯片廠商有非常深度的合作,只有這樣深度合作才能夠把端側(cè)模型的知識(shí)密度能夠真正發(fā)揮出來(lái),能夠去用更低的功耗去做到同樣的工作。
另外在應(yīng)用側(cè),他認(rèn)為現(xiàn)在只有MCP這一種智能體協(xié)作方式肯定是不夠的,還需要有更多基于用戶認(rèn)證的、安全的協(xié)同方式,這些是原來(lái)在移動(dòng)互聯(lián)網(wǎng)時(shí)代建設(shè)過(guò)的基礎(chǔ)設(shè)施,現(xiàn)在需要在AI時(shí)代重新做一遍。
Agent的核心是提供服務(wù)的能力
終端硬件是Agent的物理載體,因?yàn)锳gent的到來(lái),手機(jī)、PC、汽車等硬件終端都煥發(fā)新活力。
對(duì)于汽車而言,它本身就已處在智能化升級(jí)進(jìn)程中,Agent的到來(lái)使這種升級(jí)更加全面深入。
理想汽車副總裁、智能空間研發(fā)負(fù)責(zé)人勾曉菲認(rèn)為,汽車能夠?qū)崿F(xiàn)自動(dòng)駕駛是行業(yè)基本共識(shí)了,實(shí)現(xiàn)自動(dòng)駕駛后,汽車空間內(nèi)能夠提供怎樣的服務(wù)就會(huì)變成各家車企的差異化競(jìng)爭(zhēng)手段。
示意圖
AI孕育了一個(gè)非常大的機(jī)會(huì)點(diǎn),它有機(jī)會(huì)把看似割裂的生態(tài)集中起來(lái)。其實(shí)很多終端現(xiàn)在都是一個(gè)生態(tài)的孤島,比如PC的交互是鼠標(biāo)鍵盤+圖形界面,手機(jī)的交互是基于觸控,AI這種基于對(duì)話的、更加自然的交互會(huì)是一個(gè)跨終端的統(tǒng)一交互模態(tài)。
現(xiàn)在大家都在談?wù)揂gent,Agent是什么?
今天當(dāng)大家談?wù)揥indows時(shí),默認(rèn)Windows背后有一大堆服務(wù);在談?wù)摪沧康臅r(shí)候,也默認(rèn)安卓背后有一大堆服務(wù)。同理,在未來(lái)大家選擇使用哪個(gè)Agent其實(shí)是看它到底能帶來(lái)多少服務(wù)。
今年理想汽車也在聚焦做這樣的事,理想同學(xué)作為理想汽車的Agent,它接入了大量和汽車出行相關(guān)的服務(wù)。今年我們也開始接入車內(nèi)空間以外的生活場(chǎng)景和服務(wù),比如讓理想同學(xué)點(diǎn)一杯咖啡、交一下水電費(fèi)、叫一個(gè)代駕等。它會(huì)覆蓋更多、更廣泛的服務(wù),我們相信未來(lái)用戶選擇Agent的核心和現(xiàn)在選擇操作系統(tǒng)的邏輯是一樣的。
Agent需要形成行業(yè)標(biāo)準(zhǔn)
而談到Agent的服務(wù)能力,滿足用戶需求是一方面,更關(guān)鍵在于如何讓Agent應(yīng)用、操作系統(tǒng)和底層硬件之間緊密協(xié)同,從而進(jìn)一步提升應(yīng)用體驗(yàn)。
中科創(chuàng)達(dá)聯(lián)合創(chuàng)始人、執(zhí)行總裁耿增強(qiáng)認(rèn)為,現(xiàn)階段AI在不同設(shè)備上的應(yīng)用高度碎片化。底層芯片不同、運(yùn)行操作系統(tǒng)各異、上層模型和Agent框架也不統(tǒng)一。這導(dǎo)致行業(yè)內(nèi)存在非常多組合方案,重復(fù)開發(fā)成本高,缺乏統(tǒng)一標(biāo)準(zhǔn)。
核心問(wèn)題還是缺乏一個(gè)跨終端通用的AI OS或者統(tǒng)一的Agent Framework。盡管目前MCP、A2A已經(jīng)取得了一定進(jìn)展,但距離形成行業(yè)公認(rèn)的標(biāo)準(zhǔn)還很遠(yuǎn)。
示意圖
不過(guò)可以確定的是,未來(lái)在Agent的“穿針引線”下,還是可以形成一個(gè)跨終端的操作系統(tǒng),提供流轉(zhuǎn)的智能服務(wù)。
這種新時(shí)代OS的架構(gòu),可以將云端視作一個(gè)巨大的Cloud OS,各個(gè)終端就是Agent,與Cloud OS協(xié)同工作,跨平臺(tái)的一部分由Cloud OS來(lái)實(shí)現(xiàn)。從單設(shè)備來(lái)看,傳統(tǒng)的Linux、Android等系統(tǒng)將被視為虛擬化層,AI是一種全新的UI,必然催生新的AI OS。
聚焦到廠商該如何做,其實(shí)還是產(chǎn)業(yè)共建、協(xié)同合作。
耿增強(qiáng)認(rèn)為,很多事需要“自然發(fā)生”,但行業(yè)可以共建一些基礎(chǔ)設(shè)施。比如中科創(chuàng)達(dá)已經(jīng)和高通共建了智能汽車創(chuàng)新中心、智能物聯(lián)網(wǎng)創(chuàng)新中心,通過(guò)這兩個(gè)創(chuàng)新中心支持智能汽車和智能物聯(lián)網(wǎng)不同設(shè)備里終端廠商共同的客戶以及生態(tài)的合作伙伴。
在AI方面,中科創(chuàng)達(dá)和火山引擎成立了理想智能汽車混合AI聯(lián)合實(shí)驗(yàn)室,將火山引擎的云上AI和中科創(chuàng)達(dá)的端側(cè)AI形成一個(gè)混合式AI方案,經(jīng)過(guò)高通平臺(tái)優(yōu)化后可以更好支持設(shè)備廠商、客戶創(chuàng)新。
目前還聚焦在單設(shè)備智能,但是下一步將走向設(shè)備之間的Agent協(xié)作。
本文來(lái)自微信公眾號(hào)“量子位”,作者:關(guān)注前沿科技,36氪經(jīng)授權(quán)發(fā)布。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.