當(dāng)前,全球具身智能產(chǎn)業(yè)正處于從“實驗室演示”邁向“產(chǎn)業(yè)化初步應(yīng)用”的階段。技術(shù)不斷迭代,資本關(guān)注持續(xù)走高,具身智能被認(rèn)為是“會思考的大腦”與“能感知和行動的身體”的結(jié)合。作為具身智能的代表,“人形機器人第一股”優(yōu)必選近期市場動作頻頻:5月,Walker S1系列機器人進駐東風(fēng)柳汽工廠;7月中標(biāo)9000萬元機器人訂單,創(chuàng)全球人形機器人企業(yè)中標(biāo)金額最大訂單;8月獲得Infini Captial簽署10億美元戰(zhàn)略融資授信額度;近期,又宣布與空間智能頭部企業(yè)特斯聯(lián)達成戰(zhàn)略合作。仔細分析會發(fā)現(xiàn),這些動作背后,是優(yōu)必選之于人形機器人下半場的先手棋布局。
空間智能:讓機器人看到世界、看懂世界、“聯(lián)動”世界
人形機器人在大規(guī)模商業(yè)化落地前,需要解決技術(shù)瓶頸、計算資源、應(yīng)用場景等多方挑戰(zhàn)?,F(xiàn)實世界中復(fù)雜、多變、非結(jié)構(gòu)化的真實場景,如:光線變化、物體遮擋、不平整的地面等,無不對具身智能的泛化落地提出挑戰(zhàn)。要使機器真正“看到”物理世界、“看懂”物理世界,并實現(xiàn)與物理世界真正自主的交互,空間智能是其中的關(guān)鍵。
從定義來講,空間智能指的是機器在物理空間和實踐中感知、推理和行動的能力。以優(yōu)必選此次合作的特斯聯(lián)為例,圍繞空間智能戰(zhàn)略目標(biāo),特斯聯(lián)將其業(yè)務(wù)分拆為AIoT基礎(chǔ)設(shè)施、AIoT領(lǐng)域模型、AIoT智能體,分別對應(yīng)空間智能的三重能力。其中的前兩層,AIoT基礎(chǔ)設(shè)施、AIoT領(lǐng)域模型負(fù)責(zé)的即是讓機器看得到和看得懂。
以AIoT起家,軟件與硬件的結(jié)合是特斯聯(lián)的技術(shù)基因。特斯聯(lián)使機器與世界交互的邏輯是,通過深入現(xiàn)實世界各環(huán)節(jié)的端側(cè)硬件,集納豐富、實時的多模態(tài)異構(gòu)數(shù)據(jù),供部署在端-邊-云的底層軟件系統(tǒng)(空間智能底座TacOS)進行孿生建模、結(jié)構(gòu)化處理,經(jīng)處理的結(jié)構(gòu)化數(shù)據(jù)隨后交由空間大模型進行符合物理世界規(guī)律的分析以及推理。
換言之,TacOS協(xié)同端側(cè)硬件是讓機器“看到”的關(guān)鍵;而空間大模型,區(qū)別于傳統(tǒng)的大語言模型,基于其多模態(tài)融合及推理能力,不僅能夠識別文字、語言,更能理解重力、摩擦力、三維關(guān)系等物理規(guī)律,完成復(fù)雜任務(wù)的規(guī)劃,使機器能“看懂”。
空間智能構(gòu)建人形機器人的物理映射模擬訓(xùn)練環(huán)境
除對物理空間理解的匱乏外,稀缺的的高質(zhì)量標(biāo)注數(shù)據(jù)及由此帶來的底層模型訓(xùn)練難題,是機器人行業(yè)面臨的又一挑戰(zhàn),制約著其從訓(xùn)練到落地的各個環(huán)節(jié)。而精度達0.1mm的TacOS仿真建模系統(tǒng),疊加空間大模型的空間理解能力,則有機會為以Walker S系列為代表的人形機器人提供在虛擬仿真環(huán)境下的訓(xùn)練平臺。
仿真訓(xùn)練平臺能夠?qū)崿F(xiàn)逼真場景的快速高效模擬,為機器人學(xué)習(xí)提供強大的虛擬環(huán)境,使開發(fā)人員能夠在該環(huán)境中測試和驗證機器人,從而大幅降低訓(xùn)練成本及周期。同時,作為特斯聯(lián)空間智能AIoT基礎(chǔ)設(shè)施層的核心組件,TacOS過往匯集的高質(zhì)量空間數(shù)據(jù),得以進一步生成用于機器人底層模型訓(xùn)練的合成數(shù)據(jù),降低訓(xùn)練數(shù)據(jù)的獲取成本。
這種AI模型疊加仿真系統(tǒng)的機器人訓(xùn)練邏輯,同樣反映在黃仁勛的“three-computer solution”中。據(jù)英偉達官方透露,以物理AI模型Cosmos Reason賦予機器人自主推理能力,結(jié)合Omniverse仿真平臺,得以將機器人的訓(xùn)練效率提升10倍以上,加速其適應(yīng)現(xiàn)實環(huán)境。
從披露的合作內(nèi)容來看,優(yōu)必選與特斯聯(lián)亦將人形機器人的仿真訓(xùn)練,作為此次攜手的重點——通過TacOS系統(tǒng)打通設(shè)計(CAD)、生產(chǎn)(MES)、物流(WMS)全流程數(shù)據(jù),人形機器人可在虛擬空間或仿真的工廠、物流等環(huán)境中預(yù)先演練生產(chǎn)流程,從而達到實體工廠良品率提升的最終目的。
混合推理引擎使能復(fù)雜端側(cè)推理
另一方面,具身智能,特別是人形機器人也對包括計算資源在內(nèi)的基礎(chǔ)設(shè)施提出著極高要求——無論是多模態(tài)傳感器數(shù)據(jù)的并行處理,還是端側(cè)VLM模型的復(fù)雜推理均需要更高的計算性能、更低的延遲,以及更快的響應(yīng)速度。
在此背景下,機器人公司與智算廠商的雙向奔赴,在全球并非少數(shù)。今年6月,芯片巨頭英偉達與三星電子分別宣布,斥資千萬美元,收購美國機器人初創(chuàng)企業(yè)Skild AI的少數(shù)股權(quán),以搶占消費機器人產(chǎn)業(yè)的戰(zhàn)略高地。更早些時候,2022年成立的人形機器人初創(chuàng)企業(yè),F(xiàn)IgureAI同樣獲得了英偉達、亞馬遜創(chuàng)始人貝索斯、OpenAI、微軟等智算巨頭的投資。一方面,智算廠商得以借助具身智能的觸角拓展至物理世界更廣闊的場域,另一方面,機器人所需的高性能計算資源(如云端算力、端側(cè)算力、高帶寬內(nèi)存等),也能帶動智算廠商的核心業(yè)務(wù),形成產(chǎn)業(yè)鏈協(xié)同效應(yīng)。
在特斯聯(lián)三層空間智能架構(gòu)中,智算業(yè)務(wù)(AIoT基礎(chǔ)設(shè)施)同樣占據(jù)著重要的戰(zhàn)略地位。特斯聯(lián)AIoT基礎(chǔ)設(shè)施業(yè)務(wù)以前文提到的TacOS空間智能底座、混合推理智算平臺(HICP),及智算集群為核心產(chǎn)品?;氐娇臻g智能的技術(shù)邏輯,如果說TacOS負(fù)責(zé)的是向上統(tǒng)籌海量的端側(cè)感知設(shè)備,構(gòu)建仿真空間,那么HICP負(fù)責(zé)的則是向下統(tǒng)籌異構(gòu)算力資源,實現(xiàn)資源層面的統(tǒng)一納管,輸出高質(zhì)量算力。
資料顯示,特斯聯(lián)智算基礎(chǔ)設(shè)施現(xiàn)已實現(xiàn)對昆侖芯、曦望、沐曦、燧原、壁仞等十余種主流信創(chuàng)芯片的兼容適配。HICP采用vLLM和SGlang技術(shù),統(tǒng)一算子接口與通信協(xié)議,屏蔽異構(gòu)芯片的復(fù)雜性,替換CUDA依賴為國產(chǎn)異構(gòu)計算框架,實現(xiàn)異構(gòu)多機多卡環(huán)境下的靈活調(diào)度。無疑,與特斯聯(lián)的攜手,亦能夠為優(yōu)必選機器人提供充沛的高性能計算資源。
空間智能與具身智能的雙向奔赴:構(gòu)建“感知-決策-行動”閉環(huán)
在天平的另一端,對特斯聯(lián)而言,與優(yōu)必選的結(jié)合在為特斯聯(lián)直接帶來基礎(chǔ)設(shè)施及模型層訂單的同時,更通過人形機器人補足了空間智能“行動”的能力,助其打開全新的場景象限。
值得注意的是,特斯聯(lián)自身也是國內(nèi)最早發(fā)力機器人的企業(yè)之一。不同于優(yōu)必選戰(zhàn)略核心圍繞“具身智能”技術(shù),以人形機器人為載體,聚焦工業(yè)制造、生產(chǎn)場景;特斯聯(lián)機器人業(yè)務(wù)強調(diào)統(tǒng)一智能體中樞調(diào)控下的集群協(xié)作。2021年,迪拜世博會期間,特斯聯(lián)曾為世博園區(qū)提供了超過150臺智能服務(wù)機器人集群,為游客提供表演、接待、消殺、遞送等服務(wù)。
據(jù)其官方資料,特斯聯(lián)智能體強調(diào)類人思考、長時記憶、高維感知、團隊協(xié)作四重能力,以智能可穿戴設(shè)備與機器人為核心載體?;诖舜魏献?,特斯聯(lián)能夠得到機器人產(chǎn)品形態(tài)的補充,構(gòu)建以通用智能體驅(qū)動的人形機器人,其全??臻g智能產(chǎn)品及解決方案更有機會進入到工業(yè)、制造等全新場景,打造城市級的“感知-決策-執(zhí)行”人機協(xié)同閉環(huán)。
可以說,空間智能與具身智能的結(jié)合,其意義遠非簡單的技術(shù)疊加,更在于構(gòu)建下一代AI的核心路徑。空間智能為具身智能提供高精度的環(huán)境感知、三維語義理解能力,使其能夠“看懂”并適應(yīng)復(fù)雜物理世界;而具身智能則賦予空間智能精準(zhǔn)的物理交互和任務(wù)執(zhí)行能力,使其能“動手”完成實際操作。兩者結(jié)合,將有機會催生出不受物理空間限制、自主完成任務(wù)、單機提供多樣化服務(wù)的通用AI,帶來從“單點自動化”到“全域自主化”的顛覆體驗。
一個人機協(xié)同、全域智能的未來或許已在招手。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.