在人工智能從數(shù)字世界向物理世界滲透的浪潮中,具身智能成為打通AI能力與現(xiàn)實(shí)價(jià)值的關(guān)鍵樞紐。9月18日,華為在《智能世界2035》報(bào)告中,罕見以構(gòu)建萬物互聯(lián)的智能世界為核心,系統(tǒng)勾勒了具身智能的發(fā)展藍(lán)圖,在華為的構(gòu)想中,具身智能并非指某個(gè)單一技術(shù)突破,而更多是融合AI、感知交互、計(jì)算存儲(chǔ)、通信網(wǎng)絡(luò)與能源技術(shù)的一套綜合體系,更是通用人工智能(AGI)落地物理世界的核心載體。
在華為未來的藍(lán)圖中,智能機(jī)器人不僅能承擔(dān)家務(wù)勞動(dòng),還將提供情感陪伴,顯著提升居家的幸福感,預(yù)計(jì)10年后,中國家庭將超過90%擁有智能機(jī)器人。與此同時(shí),人類將逐漸進(jìn)入全息生活空間的時(shí)代,家庭場(chǎng)景將迎來一場(chǎng)由技術(shù)驅(qū)動(dòng)的沉浸式變革。在企業(yè)領(lǐng)域,由AI Agent驅(qū)動(dòng)的自主決策組織將重塑生產(chǎn)范式。據(jù)預(yù)測(cè),到2035年人工智能應(yīng)用率超過85%,AI可提升勞動(dòng)生產(chǎn)率60%,產(chǎn)品缺陷率降低至0.05%以下。
本文試圖從技術(shù)底色到落地方法論,從競(jìng)爭(zhēng)策略到場(chǎng)景擴(kuò)張,再到對(duì)發(fā)展邊界的清醒認(rèn)知,拆解華為的具身智能之路鮮明特征。
▍具身智能的戰(zhàn)略底色:核心定義與戰(zhàn)略定位
華為對(duì)具身智能的認(rèn)知,始終圍繞AI走向物理世界這一核心展開,其底色可概括為三維定位,構(gòu)成了華為布局具身智能的基礎(chǔ)認(rèn)知框架。
不同于純軟件形態(tài)的生成式AI,華為將具身智能定義為擁有實(shí)體身軀與實(shí)時(shí)互動(dòng)能力的智能形態(tài),是跨域融合的物理AI載體,它融合了視覺-觸覺-語言-動(dòng)作模型(VTLA)、世界模型、感知交互(觸覺傳感器、腦機(jī)接口)、計(jì)算存儲(chǔ)(仿生計(jì)算、邊緣計(jì)算)、通信網(wǎng)絡(luò)(5G/5.5G)與能源技術(shù)(氫燃料電池、固態(tài)電池)等多領(lǐng)域技術(shù),本質(zhì)是AI技術(shù)與物理實(shí)體的深度耦合。例如,智能機(jī)器人需同時(shí)具備VTLA模型的多模態(tài)理解能力、邊緣計(jì)算的實(shí)時(shí)響應(yīng)能力,以及固態(tài)電池的長(zhǎng)效續(xù)航能力,才能完成家庭場(chǎng)景的復(fù)雜任務(wù)。
其次,在華為的AGI演進(jìn)邏輯中,具身智能是連接虛擬認(rèn)知與物理行動(dòng)的關(guān)鍵橋梁。報(bào)告明確提出,走向物理世界是AGI形成的必由之路,而具身智能正是AI感知-認(rèn)知-決策-行動(dòng)閉環(huán)的物理載體,它能讓AI像人類一樣通過身體感知環(huán)境、在互動(dòng)中學(xué)習(xí),解決通用大模型困于概率統(tǒng)計(jì)、缺乏物理推理的痛點(diǎn)。例如,AlphaFold依賴電子顯微鏡的蛋白質(zhì)數(shù)據(jù)實(shí)現(xiàn)突破,而未來具身智能可通過工業(yè)機(jī)器人的實(shí)時(shí)操作數(shù)據(jù),讓AI掌握復(fù)雜制造工藝的物理規(guī)律。
在新質(zhì)生產(chǎn)力的核心引擎下,華為同樣將具身智能視為驅(qū)動(dòng)千行百業(yè)AI原生重構(gòu)的核心力量,而非單純的技術(shù)補(bǔ)充。它不僅是執(zhí)行工具,更類似一種能深入行業(yè)機(jī)理、融合物理模型與專業(yè)知識(shí)的行業(yè)級(jí)大腦。這種定位決定了華為的具身智能落地不局限于消費(fèi)端,而是更關(guān)注產(chǎn)業(yè)端的效率革命。
▍具身智能路徑方法論:架構(gòu)分層+分域演進(jìn)
在華為整體戰(zhàn)略下,公司不會(huì)短期直接切入具身智能,其實(shí)現(xiàn)具身智能的方法論,主要圍繞技術(shù)架構(gòu)分層與分領(lǐng)域階段突破展開,形成了底層技術(shù)筑基-中層場(chǎng)景驗(yàn)證-頂層生態(tài)協(xié)同的落地路徑,避免了技術(shù)空轉(zhuǎn)或場(chǎng)景脫節(jié)的問題。
華為將具身智能的底層技術(shù)架構(gòu)拆分為六大核心模塊的協(xié)同創(chuàng)新,整體構(gòu)建了感知-決策-行動(dòng)-支撐的全鏈路技術(shù)架構(gòu),每個(gè)模塊均有明確的技術(shù)突破方向,以及具體的指標(biāo),華為把關(guān)最終技術(shù)的考核。
例如在認(rèn)知核心層面,主要以視覺-觸覺-語言-動(dòng)作模型(VTLA)與世界模型為核心,前者實(shí)現(xiàn)多模態(tài)信息的統(tǒng)一理解,后者模擬物理世界規(guī)律;例如在感知交互方面,需要突破觸覺傳感器、腦機(jī)接口、超高清攝像頭等技術(shù),讓具身智能精準(zhǔn)感知環(huán)境;例如在計(jì)算存儲(chǔ)方面,重點(diǎn)是采用仿生計(jì)算、邊緣計(jì)算、超分辨三維存儲(chǔ),解決實(shí)時(shí)決策與數(shù)據(jù)留存的矛盾;在通信網(wǎng)絡(luò)層面,主要依托5G-A/5.5G的高可靠低時(shí)延特性,實(shí)現(xiàn)多具身智能體的協(xié)同;在能源支撐層面,主要針對(duì)不同場(chǎng)景突破能源技術(shù),讓機(jī)器人采用固態(tài)電池能量密度>1000Wh/L;還有例如安全保障層面,需要融入量子加密、AI安全治理,確保具身智能的可靠運(yùn)行。
在執(zhí)行路徑上,華為制定了分領(lǐng)域演進(jìn)的路徑,認(rèn)為具身智能會(huì)逐步從技術(shù)驗(yàn)證過渡到規(guī)模商用的階段。華為具身智能的擴(kuò)張路徑,遵循從核心場(chǎng)景突破,再向全行業(yè)滲透的邏輯,核心是以三大領(lǐng)域?yàn)殄^點(diǎn),帶動(dòng)產(chǎn)業(yè)鏈升級(jí),目前已形成清晰的擴(kuò)張藍(lán)圖。
為此,華為并未追求一步到位的具身智能,而是按應(yīng)用場(chǎng)景的技術(shù)成熟度,制定了分領(lǐng)域、分階段的演進(jìn)路線,核心覆蓋智能駕駛、智能機(jī)器人、低空經(jīng)濟(jì)三大場(chǎng)景,定下了2025年、2030年、2035年三階段目標(biāo),其認(rèn)為這種分階段落地的方法論,既避免了技術(shù)超前于需求的資源浪費(fèi),也通過工業(yè)場(chǎng)景的驗(yàn)證反哺技術(shù)迭代,如工業(yè)機(jī)器人的協(xié)作算法可遷移至家庭場(chǎng)景。
因此短期來看,目前華為人形機(jī)器人計(jì)劃面向的客戶依然是工廠和商業(yè)個(gè)人。在工廠類客戶中,能源行業(yè)如煤炭、石油、石化、電力等有零散的定制人形機(jī)器人;在醫(yī)療教育方面,華為已經(jīng)與樂聚合作探索相關(guān)人形機(jī)器人的賦能業(yè)務(wù)。而人形機(jī)器人后期主要目標(biāo)是教育型以及家庭醫(yī)療護(hù)理老人照顧方面,這被華為認(rèn)為是未來的藍(lán)海和重點(diǎn)。
▍競(jìng)爭(zhēng)策略:以差異化生態(tài)構(gòu)建壁壘
華為認(rèn)為,在全球具身智能競(jìng)爭(zhēng)中,需要謹(jǐn)慎避免陷入技術(shù)參數(shù)競(jìng)賽,而是更多通過生態(tài)協(xié)同、數(shù)據(jù)差異化、端云融合三大策略,構(gòu)建獨(dú)特競(jìng)爭(zhēng)優(yōu)勢(shì),核心是不做單點(diǎn)冠軍,做生態(tài)樞紐。報(bào)告提出,具身智能的核心矛盾是復(fù)雜任務(wù)的算力需求與物理交互的低時(shí)延需求,需要平衡算力強(qiáng)度與響應(yīng)速度,因此提出端云協(xié)同的架構(gòu)策略。
云側(cè)主要承擔(dān)大模型訓(xùn)練、復(fù)雜任務(wù)規(guī)劃,依托華為云的智算中心提供EFLOPS級(jí)算力,處理PB級(jí)多模態(tài)數(shù)據(jù);端側(cè)主要部署邊緣計(jì)算芯片,負(fù)責(zé)實(shí)時(shí)響應(yīng)、本地?cái)?shù)據(jù)處理,降低云端依賴與通信成本。這種模式既解決了純端側(cè)算力不足的問題,也避免了純?cè)苽?cè)時(shí)延過高的缺陷,例如在智能駕駛中,端側(cè)處理激光雷達(dá)的實(shí)時(shí)障礙物數(shù)據(jù),云側(cè)則優(yōu)化長(zhǎng)期路線規(guī)劃,兩者協(xié)同實(shí)現(xiàn)安全與效率兼顧。
華為敏銳地發(fā)現(xiàn),具身智能的核心數(shù)據(jù)需求與通用大模型截然不同,通用大模型依賴網(wǎng)絡(luò)上的海量通用數(shù)據(jù),而行業(yè)具身智能需要的是罕見事件數(shù)據(jù),如工廠的災(zāi)難性故障、醫(yī)療的罕見病例等。因此,華為的競(jìng)爭(zhēng)策略之一是聯(lián)合行業(yè)伙伴構(gòu)建垂直數(shù)據(jù)平臺(tái)。例如與制造企業(yè)合作,采集設(shè)備的故障數(shù)據(jù),訓(xùn)練具身智能的故障預(yù)測(cè)模型,與醫(yī)療機(jī)構(gòu)共建仿生設(shè)備交互數(shù)據(jù)庫,提升具身智能的人機(jī)適配性。這種行業(yè)定制化數(shù)據(jù)策略,可以讓華為具身智能在垂直領(lǐng)域的精度遠(yuǎn)超通用大模型,形成差異化壁壘。
華為也深知,具身智能涉及跨產(chǎn)業(yè)、跨國家的協(xié)作,因此提出開放生態(tài)策略,核心是輸出工具平臺(tái),共建行業(yè)標(biāo)準(zhǔn)。華為希望成為“賣鏟人”角色,通過開放技術(shù)工具,提供具身智能開發(fā)套件,從而降低中小企業(yè)的開發(fā)門檻,最終基于華為的開發(fā)平臺(tái)快速迭代算法。報(bào)告指出,華為也將聯(lián)合行業(yè)組織制定具身智能的接口標(biāo)準(zhǔn),避免碎片化生態(tài),最終與高校、企業(yè)共建聯(lián)合實(shí)驗(yàn)室,共享研發(fā)資源,實(shí)現(xiàn)全球合作研發(fā)。這種開放生態(tài)策略,有望讓華為從技術(shù)提供者轉(zhuǎn)變?yōu)樯鷳B(tài)組織者,通過伙伴的力量覆蓋更多場(chǎng)景,形成眾人拾柴的效應(yīng)。
▍邊界:清醒認(rèn)知技術(shù)與商業(yè)的局限性
華為在布局具身智能時(shí),并未回避發(fā)展中的邊界問題,這主要是技術(shù)瓶頸與商業(yè)限制的挑戰(zhàn)。
在技術(shù)邊界上,具身智能實(shí)現(xiàn)精細(xì)操作與觸覺感知依然是卡脖子難題,目前具身智能的核心技術(shù)瓶頸還集中在物理交互的精細(xì)化與環(huán)境適應(yīng)的泛化性。雖然智能機(jī)器人在工業(yè)場(chǎng)景的搬運(yùn)、分揀已成熟,但家庭場(chǎng)景的精細(xì)操作如廚房切菜、衣物折疊仍難以實(shí)現(xiàn),其核心是手部自由度與觸覺感知能力缺陷,原因在于感知精度不足,世界模型難以預(yù)測(cè)人類的非理性行為,需突破多模態(tài)融合的實(shí)時(shí)推理能力。家庭機(jī)器人的續(xù)航問題也在報(bào)告中被提及,華為認(rèn)為這可能需要突破24小時(shí)才能保證機(jī)器人的基本運(yùn)行效率,華為雖布局固態(tài)電池、光儲(chǔ)融合,但仍需產(chǎn)業(yè)鏈協(xié)同突破。
同時(shí),如果具身智能直接與人類物理交互,由于缺乏統(tǒng)一交互標(biāo)準(zhǔn)以適配個(gè)性化需求,倫理安全風(fēng)險(xiǎn)必然遠(yuǎn)高于純軟件AI,華為將AI向善作為不可逾越的邊界,同時(shí)提到數(shù)據(jù)隱私和責(zé)任界定問題,其認(rèn)為端側(cè)如何處理敏感數(shù)據(jù)、在具身智能體中嵌入安全護(hù)欄都是較大問題,可能仍需要設(shè)置禁止接觸人體要害部位的硬件約束,才能保證具身智能真正進(jìn)入家庭,但在此之前,可能仍需聯(lián)合行業(yè)制定具身智能事故責(zé)任框架,明確廠商、用戶、算法的責(zé)任劃分,才能真正推動(dòng)具身智能的普及。
雖然未來具身智能機(jī)器人將實(shí)現(xiàn)“角色躍遷”,但華為承認(rèn),這些技術(shù)瓶頸需5~10年的迭代,同時(shí),也因?yàn)槿A為的核心優(yōu)勢(shì)在機(jī)器人大平臺(tái)和大腦方面,在全球貿(mào)易收緊趨勢(shì)下,全球能做機(jī)器人“大腦”賦能的企業(yè)較少,除了英偉達(dá)之外寥寥無幾,這使得目前華為合作的人形機(jī)器人企業(yè)伙伴越來越多。
華為的想法很明確,人形機(jī)器人達(dá)到通用型水平可能需要7~10年不斷升級(jí),但因?yàn)槿诵螜C(jī)器人對(duì)于算力、大模型、數(shù)據(jù)有著剛需,未來全世界做機(jī)器人的企業(yè)可能會(huì)使用英偉達(dá)或者華為的“大腦”,做大腦賦能的蛋糕要遠(yuǎn)大于直接做機(jī)器人硬件,未來華為像英偉達(dá)一樣創(chuàng)造軟環(huán)境,幫助機(jī)器人在軟環(huán)境里學(xué)得更快,而不是依賴硬件實(shí)體環(huán)境,從而降低成本。
根據(jù)目前的技術(shù)迭代,華為可能會(huì)構(gòu)建很多泛化算法,生態(tài)賦能支持合作伙伴能源源不斷產(chǎn)出新的想法與創(chuàng)意,華為通過合作伙伴生態(tài),一方面能基于模型樣本讓數(shù)據(jù)越來越精確,生態(tài)賦能的蛋糕更大,另一方面,未來還會(huì)和硬件廠家聯(lián)合研發(fā)配套芯片等,而硬件如激光雷達(dá)、力矩傳感器等完全可以讓車企做OEM代工,聯(lián)合開發(fā)和孵化也能獲得更多可能性。
這種做法避免了做硬件的重資產(chǎn)投資,做迭代增值服務(wù)也可以持續(xù)、更快地獲得更多費(fèi)用,這綜合起來使得華為的商業(yè)邊界非常清晰,即避免過度承諾消費(fèi)端場(chǎng)景,聚焦工業(yè)等半結(jié)構(gòu)化場(chǎng)景,快速賦能合作伙伴。
▍結(jié)語:華為具身智能的長(zhǎng)期主義底色
從《智能世界2035》的藍(lán)圖中可見,華為的具身智能之路并非激進(jìn)的技術(shù)冒險(xiǎn),而是嘗試穩(wěn)扎穩(wěn)打,以物理世界需求為錨,以生態(tài)協(xié)同為翼,以風(fēng)險(xiǎn)可控為界的長(zhǎng)期主義實(shí)踐。它的底色是AGI落地的物理載體,方法論是分階段技術(shù)迭代,競(jìng)爭(zhēng)策略是生態(tài)樞紐構(gòu)建,擴(kuò)張路徑是核心場(chǎng)景帶動(dòng)全行業(yè),而邊界認(rèn)知?jiǎng)t體現(xiàn)了技術(shù)局限以及倫理上向善的責(zé)任感。
未來十年,華為的具身智能之路,透露出的關(guān)鍵思考在于,如何平衡技術(shù)突破的速度與生態(tài)成熟的節(jié)奏,這需要保證既不因技術(shù)瓶頸而停滯,也不因追求速度而忽視倫理與安全。
正如華為在報(bào)告中所言:“技術(shù)作為驅(qū)動(dòng)人類文明躍遷的引擎,其根本在于融入生活、家庭、企業(yè)與環(huán)境,以實(shí)現(xiàn)更美好的生活、更溫馨的家庭、更高效的企業(yè)和更可持續(xù)的環(huán)境。”
這或許正是華為具身智能之路的核心邏輯:技術(shù)服務(wù)于人類,而非反之。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.