機(jī)器之心報(bào)道
編輯:澤南
會(huì)整理家務(wù)、制作香囊,還能比心比耶。
具身智能已經(jīng)進(jìn)化到這種程度了,真實(shí)滿(mǎn)足用戶(hù)需求似乎指日可待。
今天上午,2025 世界機(jī)器人大會(huì) WRC 正式開(kāi)幕。最近的 AI 技術(shù)突破,讓參展的公司紛紛拿出了新技術(shù),人頭攢動(dòng)的展臺(tái)之間,我們看到了一眾「具身智能」加持的機(jī)器人,其中很多還是首次發(fā)布。
它們從整理家務(wù)、工業(yè)物流、制造裝配到跳舞表演可謂無(wú)所不能,形態(tài)也各式各樣,頗有些前不久大模型「百模大戰(zhàn)」的樣子。不過(guò)在這其中,有一家的公司反其道而行之,實(shí)現(xiàn)了「一腦多用」的真?通用智能。
國(guó)內(nèi)頭部創(chuàng)業(yè)公司「自變量機(jī)器人」給具身智能定義了一個(gè)新的標(biāo)準(zhǔn)。
一腦多用
覆蓋多種場(chǎng)景
在 WRC 的展臺(tái)上,自變量的通用輪式雙臂機(jī)器人「小量」在制作香囊,為看展觀眾們送上專(zhuān)屬小禮物。
它內(nèi)置自變量自研的通用具身大模型 WALL-A,短短幾天時(shí)間內(nèi)就學(xué)會(huì)了自主制作香囊,而且工作時(shí)不挑環(huán)境 —— 不論展會(huì)現(xiàn)場(chǎng)周遭的聲光環(huán)境有多復(fù)雜,人群動(dòng)向如何,都不會(huì)干擾到它的「細(xì)活」。
如果提出指令,機(jī)器人能根據(jù)觀眾的喜好,自主拾取不同的香包,在不到 10cm 的空間中,雙臂精巧配合,處理柔性物體的復(fù)雜形變,完成香囊的制作,最后一步貼上徽章,跟隨觀眾手掌的移動(dòng)將香囊成功地遞至手中。
當(dāng)它發(fā)現(xiàn)香囊制作物料缺乏時(shí),將主動(dòng)從制作吧臺(tái)避障,移動(dòng)到物料中轉(zhuǎn)區(qū),雙臂協(xié)同,先后將空的物料筐放到置貨架上,隨后拿取物料盤(pán)完成補(bǔ)料?;谧宰兞孔匝械恼Z(yǔ)義導(dǎo)航技術(shù),「小量」能夠迅速適應(yīng)陌生的展位環(huán)境,并自主避障完成補(bǔ)貨。
展臺(tái)另一邊,你可以向機(jī)器人「小白」發(fā)出語(yǔ)音指令:「小白,客廳有點(diǎn)亂,請(qǐng)整理一下!」它會(huì)在展位模擬的客廳環(huán)境中自主移動(dòng),在未對(duì)周邊環(huán)境進(jìn)行建模的情況下,通過(guò)語(yǔ)義導(dǎo)航功能和視覺(jué)系統(tǒng)實(shí)時(shí)判斷,一邊移動(dòng)一邊精準(zhǔn)操作完成收納清理。
它可以拾取地面上的廢紙、飲料瓶、塑料袋等各種不規(guī)則形狀的垃圾,耐心清理完地面后,再把沙發(fā)上隨意堆疊的多件衣物收納到臟衣簍。
此外,除了制作香囊,完成日常家務(wù),憑借 WALL-A 模型的強(qiáng)大泛化性,自變量的機(jī)械臂也在現(xiàn)場(chǎng)展示了在物流和工業(yè)場(chǎng)景中的應(yīng)用操作,并且速度媲美人為操作。
自變量現(xiàn)場(chǎng)展示的能力相對(duì)少見(jiàn):他們的產(chǎn)品基于端到端的具身智能大模型,能夠自主規(guī)劃并完成一整套長(zhǎng)序列復(fù)雜操作,在開(kāi)放隨機(jī)的環(huán)境里能真正做到自主感知、決策與高精度操作,能像人類(lèi)一樣快速學(xué)習(xí),不斷進(jìn)行思考、推理、判斷、決策,舉一反三。
在展會(huì)現(xiàn)場(chǎng),自變量用同一個(gè)模型完成了制作香囊、分揀快遞、家務(wù)清潔、分揀快遞、環(huán)繞皮帶等涉及多場(chǎng)景的完全不同種類(lèi)的任務(wù)??v觀世界機(jī)器人大會(huì)現(xiàn)場(chǎng),自變量機(jī)器人是唯一真正做到「一腦多用」—— 利用同一個(gè)基座大模型,僅通過(guò)短期、少樣本的訓(xùn)練就能夠在開(kāi)放環(huán)境下勝任不同的任務(wù)。
「量子 2 號(hào)」問(wèn)世
五指靈巧手加持
在現(xiàn)場(chǎng),自變量還展示了兩臺(tái)全新仿人形機(jī)器人,基于自變量自研的臂手一體外骨骼技術(shù),在市場(chǎng)首個(gè)實(shí)現(xiàn)仿人機(jī)械臂和高自由度靈巧手的一體化遙操控制。這也為未來(lái)機(jī)器人真正完成靈巧操作奠定基礎(chǔ)。
它們的動(dòng)作精準(zhǔn)且自然,一臺(tái)負(fù)責(zé)提供情緒價(jià)值,能夠與觀眾即時(shí)互動(dòng),打招呼碰拳比心。
一臺(tái)展示了在通用場(chǎng)景中深度清潔的能力,通過(guò)夾持工具后的自旋轉(zhuǎn)功能,使用清潔刷、拖布頭,能夠輕松實(shí)現(xiàn) 360 度無(wú)死角全方位清潔。
這是自變量首次亮相的輪式雙臂仿人形機(jī)器人「量子 2 號(hào)」。在過(guò)去不到半年時(shí)間內(nèi),完成研發(fā)面世,包括靈巧手,均由自變量全棧自研實(shí)現(xiàn)。
量子 2 號(hào)采用輪式通用底盤(pán),可以在家庭的各個(gè)房間、商店、工廠貨架等狹小空間靈活穿梭。它的雙臂控制范圍達(dá)到 2 米,末端速度達(dá)到 2 米 / 秒,力度控制精確度達(dá)到 0.1N,既可以拿起一支筆,也可以搬起一箱水。全身具有高達(dá) 62 個(gè)自由度,配備視覺(jué)、觸覺(jué)及力位感知等多種傳感器,在復(fù)雜通用任務(wù)操作中,每個(gè)動(dòng)作都貼近人類(lèi)的運(yùn)動(dòng)邏輯和表現(xiàn)。
其中,五指靈巧手采用仿生結(jié)構(gòu)設(shè)計(jì),單手擁有 20 個(gè)自由度、15 個(gè)驅(qū)動(dòng)單元,并可以感知細(xì)微的壓力變化。據(jù)了解,這款靈巧手能夠做到捏起薯片不會(huì)碎,握起玻璃杯不滑落。配合自變量自研的機(jī)械外骨骼遙操器,它就可以學(xué)習(xí)人類(lèi)的手部動(dòng)作,采集行為數(shù)據(jù),用作進(jìn)一步訓(xùn)練基礎(chǔ)模型。
綜合來(lái)看,量子 2 號(hào)的多處細(xì)節(jié)設(shè)置均完美適配人類(lèi)生活空間:不論是遞送物品、協(xié)助家務(wù),還是與人類(lèi)配合作業(yè),量子 2 號(hào)在設(shè)計(jì)時(shí)都考慮到了高安全冗余和動(dòng)態(tài)質(zhì)心設(shè)計(jì),確保在人類(lèi)身邊工作時(shí)的安全與穩(wěn)定。
從 WALL-A 大模型、靈巧手再到整機(jī)本體,量子 2 號(hào)背后擁有一套軟硬件結(jié)合的完整技術(shù)棧,這不僅讓它看起來(lái)更「像人類(lèi)」,也讓它在未來(lái)的家庭、商業(yè)、工業(yè)場(chǎng)景中,具備了更廣闊的通用化任務(wù)潛力。
具身智能「大腦」
躋身全球第一梯隊(duì)
在生成式 AI 技術(shù)興起之后,機(jī)器人領(lǐng)域經(jīng)歷了一波技術(shù)革新,一家家創(chuàng)業(yè)公司的 demo 吸引著全世界的眼球。我們似乎只需要「人形 + 大模型 + AI 視覺(jué)」就能很快構(gòu)建起能勝任各種任務(wù)的機(jī)器人,替代人類(lèi)的大量工作。
但如果深入了解一下技術(shù)你就會(huì)發(fā)現(xiàn),如今很多機(jī)器人完成的動(dòng)作,仍然是提前編排好的動(dòng)作序列、后臺(tái)人工遙控,以及視頻剪輯修飾的結(jié)果。
對(duì)于很多具身智能產(chǎn)品來(lái)說(shuō),大模型技術(shù)尚未成熟,更不用說(shuō)進(jìn)行商業(yè)驗(yàn)證了。故事講完,大規(guī)模的實(shí)踐才剛剛開(kāi)始。
實(shí)際上,要想構(gòu)建我們想象中「物理世界的 AI」,不僅需要具身智能模型做到精確歸類(lèi)識(shí)別,極強(qiáng)的泛化推理能力,還要求機(jī)器人軟硬件能夠高度協(xié)同,以操作任意形狀、位置的物體。這對(duì)算法和數(shù)據(jù)提出了前所未有的要求。
自變量機(jī)器人提出的具身智能基座模型 WALL-A 已經(jīng)摸到了這個(gè)門(mén)檻。
作為一個(gè)端到端統(tǒng)一的 VLA(Vision Language Action)模型,WALL-A 能夠像人類(lèi)一樣思考和工作,不再依賴(lài)模塊化的信息傳遞,而是可以直接解析圖像、語(yǔ)言信息,進(jìn)行跨模態(tài)的因果推理并生成動(dòng)作指令,實(shí)現(xiàn)了從感知輸入直接映射到機(jī)器人控制動(dòng)作的完整閉環(huán)能力。
物理世界 AI 的另一頭,自動(dòng)駕駛正在掀起「端到端 2.0」的技術(shù)革命,這一波架構(gòu)的革新就是來(lái)源于機(jī)器人領(lǐng)域。人們已經(jīng)意識(shí)到了具身智能的突破不會(huì)來(lái)自對(duì)現(xiàn)有基于視覺(jué) - 語(yǔ)言基礎(chǔ)模型的修補(bǔ),而是需要一個(gè)統(tǒng)一的架構(gòu)。
在基于 VLA 架構(gòu)的 WALL-A 模型中,系統(tǒng)對(duì)多模態(tài)信息建立了對(duì)應(yīng)關(guān)系。經(jīng)過(guò)大量針對(duì)性數(shù)據(jù)的訓(xùn)練,WALL-A 已初步展示出了類(lèi)似于大語(yǔ)言模型(LLM)的智能涌現(xiàn),它可以理解人類(lèi)的手寫(xiě)涂鴉與文字之間對(duì)應(yīng)的關(guān)系,也擁有了空間推理能力,可以看著圖片,用積木搭出與之匹配的形狀。
基于 WALL-A 的系統(tǒng)在面對(duì)復(fù)雜的環(huán)境,能夠整合視覺(jué)觀察、空間記憶和常識(shí)知識(shí),構(gòu)建出連貫的推理鏈條,具備推理鏈和一定的自主探索能力。簡(jiǎn)單來(lái)說(shuō),它驅(qū)動(dòng)的機(jī)器人「有常識(shí)」,并能進(jìn)行靈活決策。
也正是因?yàn)槎说蕉四P偷慕y(tǒng)一框架,在實(shí)際應(yīng)用中 WALL-A 可以實(shí)現(xiàn)很快的執(zhí)行速度,面對(duì)前所未見(jiàn)的物體、場(chǎng)景可以理解并輸出正確的響應(yīng)。它可以支持超過(guò)百類(lèi)高精度、高復(fù)雜度操作任務(wù),實(shí)現(xiàn)了很好的的通用與跨場(chǎng)景泛化能力。
有這一套基座模型能力的加持,在今年的世界機(jī)器人大會(huì)上,我們才見(jiàn)證了機(jī)器人技術(shù)的一次躍遷。
回想自變量機(jī)器人這家明星公司的發(fā)展歷程,可以發(fā)現(xiàn)它的實(shí)力不可小覷:一邊是研發(fā)速度快,一邊是技術(shù)還能做到足夠扎實(shí)。
2023 年底成立的自變量機(jī)器人,已經(jīng)在短短一年半的時(shí)間里完成了「大模型 + 本體」的搭建。
在去年 4 月,自變量發(fā)布初版具身智能底座大模型,隨即展示了特定任務(wù)上的少樣本學(xué)習(xí)、自發(fā)跨任務(wù)遷移能力。
去年 10 月,自變量機(jī)器人訓(xùn)練出最大參數(shù)規(guī)模的具身智能通用操作大模型「WALL-A」,在很多任務(wù)的操作上達(dá)到世界一流水平。
去年 11 月,自變量自研的大規(guī)模數(shù)據(jù)采集設(shè)備投入使用,在數(shù)據(jù)質(zhì)量控制與數(shù)據(jù)收集效率方面達(dá)到世界領(lǐng)先水平,展現(xiàn)出長(zhǎng)序列訓(xùn)推能力和泛化性,模型魯棒性、成功率優(yōu)勢(shì)顯著。
今年 4 月,自變量機(jī)器人率先在具身思維鏈等方面取得突破,WALL-A 模型在部分未見(jiàn)的新任務(wù)場(chǎng)景中展現(xiàn)出零樣本泛化能力,自研本體「量子一號(hào)」也率先在開(kāi)放場(chǎng)景實(shí)現(xiàn)商業(yè)化落地。
如今,自變量正式對(duì)外發(fā)布新一代具身輪式仿人形機(jī)器人量子 2 號(hào)(Quanta X2),至此,自變量機(jī)器人已經(jīng)形成了從算法到落地,軟件 + 硬件一體化的全自研技術(shù)棧,機(jī)器人「大腦」也迅速躋身全球具身智能第一梯隊(duì)。
具身智能的落地
才剛剛開(kāi)始
自變量創(chuàng)始人王潛表示,未來(lái) 3 到 5 年,通用機(jī)器人就有望逐步進(jìn)入到消費(fèi)端。
隨著具身智能的引入,機(jī)器人的智慧不斷提升,我們會(huì)在不久的將來(lái)看到它們?cè)诤芏囝I(lǐng)域大展身手。從世界機(jī)器人大會(huì)上看過(guò)來(lái),可見(jiàn)的應(yīng)用方向包括但不限于:
- 居家服務(wù):機(jī)器人自主完成打掃、整理收納等各種家務(wù),進(jìn)行買(mǎi)菜補(bǔ)貨,甚至完成做飯等任務(wù)。
- 商業(yè)場(chǎng)景:在零售、酒店等環(huán)境中承擔(dān)各種服務(wù),或進(jìn)入康養(yǎng)旅居產(chǎn)業(yè)擔(dān)任導(dǎo)游、護(hù)工等工作。
- 科研教育:部署在前沿研究機(jī)構(gòu)和高校中,作為實(shí)驗(yàn)平臺(tái)幫助人們探索新技術(shù)。
- 工業(yè)制造:在傳統(tǒng)工業(yè)機(jī)器人的基礎(chǔ)上,具身智能方法能夠快速完成操作指令設(shè)定,降低編程和調(diào)試成本。
對(duì)于具身智能的落地來(lái)說(shuō),這些場(chǎng)景都具有深耕價(jià)值。而且在自變量展示的范式中,基礎(chǔ)模型可以在真實(shí)世界中持續(xù)迭代。
在建立技術(shù)體系的同時(shí),自變量也在持續(xù)推動(dòng)具身智能的大規(guī)模落地。據(jù)介紹,自變量目前在與頭部客戶(hù)合作,還計(jì)劃圍繞模型和硬件建立開(kāi)放生態(tài),賦能更多合作伙伴。
在可預(yù)見(jiàn)的未來(lái),具身智能的第一批落地場(chǎng)景,也將成為自變量大展身手的舞臺(tái)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.