出品|虎嗅科技組
作者|余楊
編輯|苗正卿
頭圖|視覺(jué)中國(guó)
10月10日消息,F(xiàn)igure宣布上新,推出了第三代AI人形機(jī)器人。
產(chǎn)品更新的主要突破點(diǎn)是感官套件和手部系統(tǒng),F(xiàn)igure的工程師在軟硬件領(lǐng)域均做了調(diào)整,用于實(shí)現(xiàn) Helix - Figure 專(zhuān)有的視覺(jué)-語(yǔ)言-動(dòng)作 AI。簡(jiǎn)單來(lái)說(shuō),F(xiàn)igure03 給機(jī)器人手指都裝上了“眼睛”,卷起來(lái)了。
今日最新消息,英特爾推出機(jī)器人AI套件,據(jù)稱(chēng),研發(fā)團(tuán)隊(duì)可借此在更低風(fēng)險(xiǎn)下評(píng)估、適配和擴(kuò)展機(jī)器人方案,從而降本增效。
英特爾此舉可以說(shuō)是聞風(fēng)而至,緊跟Figure 03 的結(jié)構(gòu)性更新,給機(jī)器人廠商和企業(yè)之間搭了一座橋。
具身智能也需要提高“認(rèn)知”
Figure宣稱(chēng),F(xiàn)igure 03 改進(jìn)了無(wú)線充電、語(yǔ)音推理音頻系統(tǒng)以及電池安全,使其在家庭環(huán)境中用起來(lái)更加方便和安全。在打消用戶群體安全顧慮的同時(shí),F(xiàn)igure主要提升了機(jī)器人的感知流。
Figure設(shè)計(jì)了新一代視覺(jué)系統(tǒng),用于實(shí)現(xiàn)高頻的視覺(jué)運(yùn)動(dòng),在新攝像頭架構(gòu)中,03捕捉的幀率提升了一倍,延遲降低了四分之一,每個(gè)攝像頭的視野也擴(kuò)大了 60%,但在外形上保持了緊湊。
這種架構(gòu)有著更大的景深,為 Helix 提供了更密集、更穩(wěn)定的感知流。這對(duì)于在家庭等復(fù)雜、雜亂的空間中進(jìn)行智能導(dǎo)航和精確操控非常有幫助。
此外,F(xiàn)igure 03 每只機(jī)械手都集成了一個(gè)嵌入式手掌攝像頭,擁有了“眼睛”。這帶來(lái)了更寬的視野和更低的延遲傳感,可以在抓握過(guò)程中提供更多的近距離視覺(jué)反饋。也就是說(shuō),即使在主攝像頭被遮擋的情況下,例如,伸手進(jìn)入柜子或在狹窄空間內(nèi)工作時(shí))這些攝像頭也能使 Helix 保持視覺(jué)感知,并實(shí)現(xiàn)持續(xù)的實(shí)時(shí)自適應(yīng)控制。
大致想象一下,當(dāng)我們摸黑在光線不足的空間找東西時(shí),由于識(shí)別困難,會(huì)反復(fù)拿錯(cuò)物品?,F(xiàn)在,這種困難被解決了,“礦工的手指”不僅自帶了照明,還安上了“放大鏡”,在需要精細(xì)操作的場(chǎng)景,機(jī)器人能夠最大限度的獲取到細(xì)節(jié)信息,感知流再回傳到“中樞系統(tǒng)”,對(duì)信息加以處理并快速?zèng)Q策,為機(jī)器人帶來(lái)更加高效的響應(yīng)。
不僅如此,機(jī)械手的觸覺(jué)也得到了改良。Figure 03有著更加柔軟靈敏的指尖,與物品的接觸面積相應(yīng)擴(kuò)大,抓取物品變得更加穩(wěn)定和靈巧。據(jù)官方測(cè)試,每個(gè)指尖傳感器都能檢測(cè)到低至3克的壓力,其靈敏度足以感知回形針在手指上的重量?,F(xiàn)在,不論是易碎、不規(guī)則,抑或是移動(dòng)著的物體,新一代機(jī)器人都能輕松“拿捏”。
此外,AI 機(jī)器人與傳統(tǒng)機(jī)器人的最大區(qū)別在于,AI 機(jī)器人被寄予了“主動(dòng)學(xué)習(xí)”的厚望。Figure 03 被加入了 10 Gbps 毫米波數(shù)據(jù)卸載功能,允許整個(gè)機(jī)隊(duì)上傳以 TB 為單位的數(shù)據(jù),這使得 Figure 03 具備獨(dú)特的大規(guī)模、端到端像素到動(dòng)作學(xué)習(xí)能力,在解放人類(lèi)雙手的基礎(chǔ)之上,還解放了人類(lèi)的頭腦。
機(jī)器人穿上了“衣服”
Figure 創(chuàng)立之初的目標(biāo)即是打造一款能夠執(zhí)行類(lèi)似人類(lèi)的任務(wù)并直接向人類(lèi)學(xué)習(xí)的通用機(jī)器人,其工業(yè)化應(yīng)用方面早已與BMW等企業(yè)達(dá)成合作,而Figure 03 則為進(jìn)入家庭進(jìn)行了針對(duì)性的提高。
為了更好的適應(yīng)家庭環(huán)境,03 首先在重量減輕了 9%,體積也顯著減小,這樣更容易在家庭空間中移動(dòng)。
不僅如此,03 還首次穿上了“衣服",如上圖所示的灰色和黑色“針織外套”,但03的外套顯然要更加結(jié)實(shí),衣服采用耐切割和耐用材料制成,不僅可以拆卸、清洗、更換,還支持個(gè)性化定制。在不遠(yuǎn)的未來(lái),人類(lèi)或?qū)碛屑t的藍(lán)的白的自定義RGB色機(jī)器人。
同時(shí),為了更容易與機(jī)器人自然交流,F(xiàn)igure 03 升級(jí)了音頻硬件系統(tǒng),以實(shí)現(xiàn)更好的實(shí)時(shí)語(yǔ)音轉(zhuǎn)換。與 Figure 02 相比,它的揚(yáng)聲器尺寸增加了一倍,功率增加了近四倍,麥克風(fēng)的位置也進(jìn)行了重新調(diào)整,以提高性能和清晰度。
Figure 一直致力于實(shí)現(xiàn)完全自主、無(wú)線系統(tǒng)的愿景,這次更新還實(shí)現(xiàn)了無(wú)線感應(yīng)充電和無(wú)線數(shù)據(jù)卸載。Figure 03 的腳部被內(nèi)置了充電線圈,踏上無(wú)線支架即可以充電。這意味著,在家庭環(huán)境中,F(xiàn)igure 03 不需要人類(lèi)“喂飯”,機(jī)器人可以根據(jù)自身電量自動(dòng)對(duì)接并充電。
如何“克隆”機(jī)器人
為了實(shí)現(xiàn)大批量生產(chǎn)和商業(yè)化,F(xiàn)igure 卯足了勁對(duì)具身智能的生產(chǎn)“基因”進(jìn)行排列組合,重塑生產(chǎn)流程。
要做到機(jī)器人的批量生產(chǎn),首先需要將可制造性和成本納入考慮,為此,F(xiàn)igure 的機(jī)械和電氣工程團(tuán)隊(duì)減少了配件數(shù)量和裝配步驟,總的來(lái)說(shuō)還是“泰勒制”標(biāo)準(zhǔn)化生產(chǎn)那一套。雖然前期的投資較大,但從長(zhǎng)期看,F(xiàn)igure將在薄利多銷(xiāo)的思路中占據(jù)更為廣大的市場(chǎng),在推動(dòng)具身智能普及的同時(shí)實(shí)現(xiàn)商業(yè)利益。
為了擴(kuò)大規(guī)模,F(xiàn)igure甚至構(gòu)建了一條全新的供應(yīng)鏈。Figure 選擇對(duì)多個(gè)關(guān)鍵模塊的構(gòu)建進(jìn)行垂直整合,包括執(zhí)行器、電池、傳感器、結(jié)構(gòu)和電子設(shè)備,所有這些模塊均完全由公司內(nèi)部設(shè)計(jì)。而對(duì)于單個(gè)組件,F(xiàn)igure 戰(zhàn)略性地選擇并與能夠滿足團(tuán)隊(duì)要求的產(chǎn)量、時(shí)間表和嚴(yán)格質(zhì)量標(biāo)準(zhǔn)的供應(yīng)商合作。也就是說(shuō),這條供應(yīng)鏈或?qū)⒈P(pán)活一條全新的全球生產(chǎn)網(wǎng)絡(luò),實(shí)現(xiàn)各個(gè)環(huán)節(jié)的利益分配。
值得一提的是,F(xiàn)igure 成立了BotQ 作為專(zhuān)用制造工廠。在Figure 的預(yù)期中,BotQ 的第一代生產(chǎn)線初期每年可生產(chǎn)多達(dá) 12,000 臺(tái)人形機(jī)器人,并計(jì)劃在未來(lái)四年內(nèi)實(shí)現(xiàn) 100,000 臺(tái)機(jī)器人的年產(chǎn)量。為了嚴(yán)格控制質(zhì)量、迭代和速度,F(xiàn)igure 將最關(guān)鍵系統(tǒng)的生產(chǎn)轉(zhuǎn)移至內(nèi)部。BotQ 工廠配備了最先進(jìn)的系統(tǒng)和數(shù)字化集成,并以?xún)?nèi)部開(kāi)發(fā)的制造執(zhí)行系統(tǒng) (MES) 為支撐。每個(gè)子組件和最終組裝件都經(jīng)過(guò)這條生產(chǎn)線,并具有完全的可追溯性,從而確保了質(zhì)量、可重復(fù)性和持續(xù)改進(jìn)。
最后,F(xiàn)igure 強(qiáng)調(diào)了03 在商用市場(chǎng)的潛力,表示自己在關(guān)注家用市場(chǎng)的同時(shí)將對(duì)商業(yè)應(yīng)用毫不放松,總的來(lái)說(shuō)是“既要又要還要”。在官方視頻中,03 以更快的速度“打包物品”、“送快遞”,介紹文本中更是“花式營(yíng)銷(xiāo)”。
但在筆者看來(lái),F(xiàn)igure 最后的這一波“求生欲”恰恰暴露了當(dāng)前具身智能的技術(shù)盲區(qū)。
手指上的攝像頭、觸覺(jué)增強(qiáng)、無(wú)線充電與語(yǔ)音系統(tǒng),確實(shí)拓寬了人機(jī)交互與作業(yè)精度的邊界,但它并沒(méi)有解決“家用機(jī)器人”真正的關(guān)鍵難題——即低成本、低功耗與高冗余安全性。
在宣傳中,03 強(qiáng)調(diào)“面向家庭”,但從感知架構(gòu)、算力部署到訓(xùn)練體系,其底層仍然是工業(yè)機(jī)器人邏輯的延伸:追求高精度、高帶寬和可批量復(fù)制的制造流程,而非貼近生活的實(shí)用性與情感適配。它展示了具身智能的上限,卻沒(méi)有觸及人機(jī)共處的下限。
當(dāng)機(jī)器人依舊依賴(lài)昂貴的傳感堆疊與集中式訓(xùn)練,而非生態(tài)級(jí)別的學(xué)習(xí)網(wǎng)絡(luò)時(shí),“通用機(jī)器人”只能停留在演示與資本敘事的交匯點(diǎn)。Figure 的技術(shù)實(shí)力毋庸置疑,但它距離真正的“家用智能生命體”,還有一整個(gè)生活世界的距離。
畢竟,問(wèn)題不只是它能否看見(jiàn)、能否學(xué)習(xí),而是——你,真的愿意讓 Figure 03 成為你生活的一部分嗎?
本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表虎嗅立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系 hezuo@huxiu.com
本文來(lái)自虎嗅,原文鏈接:https://www.huxiu.com/article/4791730.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.