文:澤平宏觀團(tuán)隊
2025年政府工作報告提出要“建立未來產(chǎn)業(yè)投入增長機(jī)制,培育生物制造、量子科技、具身智能、6G等未來產(chǎn)業(yè)”。
作為人工智能的重要分支,人形機(jī)器人是具身智能的重要發(fā)展方向,浪潮將至。 人形機(jī)器人是具身智能的典型代表,其有著接近于人類的外觀設(shè)計與身體構(gòu)造,在大模型的加持下又具備了學(xué)習(xí)進(jìn)化的能力,因此被寄望于未來也能夠像人一樣會使用各種各樣的工具、執(zhí)行各種各樣的任務(wù),即實現(xiàn)“通用性”。
年初以來,宇樹科技等生產(chǎn)的人形機(jī)器人熱度不斷,堪稱DeepSeek以外最受關(guān)注的賽道。當(dāng)前,人形機(jī)器人商業(yè)化到了什么階段?產(chǎn)業(yè)研發(fā)制造接下來的重點方向是什么?
1 人形機(jī)器人:具身智能的典型代表,終極愿景是“通用性”
具身智能是人工智能的下一個浪潮,人形機(jī)器人是典型代表。
2025年政府工作報告提出:要“建立未來產(chǎn)業(yè)投入增長機(jī)制,培育生物制造、量子科技、具身智能、6G等未來產(chǎn)業(yè)”。作為人工智能的重要分支,具身智能浪潮將至。
人工智能有兩條發(fā)展路徑:一條是非具身智能,即聚焦于抽象計算所需的智能;非具身智能不具備物理身體,在數(shù)字世界運(yùn)行,通常表現(xiàn)為程序、算法等;典型案例如Deepseek、ChatGPT。
另一條則是具身智能,核心在于“具身”二字。即用物理實體來承載AI,從而構(gòu)成一個可感知真實世界、可理解問題并制定規(guī)劃、可在真實世界中行動的智能系統(tǒng),特點是形成“感知——行動”閉環(huán);典型案例如智能駕駛、人形機(jī)器人,前者是“AI+新能源汽車”,后者則是“AI+類人機(jī)器”。
與傳統(tǒng)機(jī)器人不同,人形機(jī)器人的終極愿景是實現(xiàn)“通用性”。人形機(jī)器人有著接近于人類的外觀設(shè)計與身體構(gòu)造,在大模型的加持下又具備了學(xué)習(xí)進(jìn)化的能力,因此被寄望于未來也能夠像人一樣會使用各種各樣的工具、執(zhí)行各種各樣的任務(wù),即實現(xiàn)“通用性”;這有別于傳統(tǒng)的工業(yè)機(jī)器人和服務(wù)機(jī)器人,因為它們通常專用于單一任務(wù),如工業(yè)機(jī)械臂、掃地機(jī)器人等等。
以“通用性”為終極愿景,雙足、全尺寸人形機(jī)器人是企業(yè)當(dāng)前主攻的產(chǎn)品形態(tài)。按移動方式,人形機(jī)器人有雙足和輪式兩種形態(tài)。二者的區(qū)別主要體現(xiàn)在下半身:雙足人形機(jī)器人完全擬人,有雙腿和雙腳;而輪式人形機(jī)器人的下半身則采用輪式底盤。按尺寸,人形機(jī)器人有中小尺寸和全尺寸之分。嚴(yán)格來講“全尺寸”的身高應(yīng)與成人類似,一般在1.6米-1.8米之間;與之相比,中小尺寸一般在1.1米-1.5米之間。盡管雙足、全尺寸人形機(jī)器人在站立、行進(jìn)和作業(yè)時都面臨著更復(fù)雜的平衡性問題,研發(fā)制造更為困難,但卻仍是企業(yè)目前主攻的產(chǎn)品形態(tài),也是本輪賽道熱潮中大眾的關(guān)注焦點。邏輯在于:人類社會中的許多工具與空間都是圍繞著人類設(shè)計的,理論上講完全擬人形態(tài)的人形機(jī)器人其適用場景會更為廣泛。即,以“通用性”為終極愿景,雙足、全尺寸形態(tài)是最優(yōu)解。
2 人形機(jī)器人商業(yè)化:部分已進(jìn)入B端試水,結(jié)構(gòu)化環(huán)境+單一重復(fù)性任務(wù)+單機(jī)作業(yè)
人形機(jī)器人要經(jīng)歷從實驗環(huán)境到工廠環(huán)境再到家庭環(huán)境的跨越,其商業(yè)化可分為三個階段:
第一個階段是將人形機(jī)器人用于科研教育、娛樂表演等。
第二個階段面向B端,人形機(jī)器人替代人從事重復(fù)枯燥性、高危險性的工作。
第三個階段面向C端,人形機(jī)器人成為智能家居的一環(huán),提升居住生活體驗,甚至滿足人的養(yǎng)老陪護(hù)需求。
當(dāng)前,產(chǎn)業(yè)重心仍處在研發(fā)環(huán)節(jié),商業(yè)化尚不成熟,不過已有部分人形機(jī)器人進(jìn)入B端試水。總體來講,人形機(jī)器人在B端的應(yīng)用遵循著三個演進(jìn)方向:
一是作業(yè)環(huán)境從結(jié)構(gòu)化環(huán)境向非結(jié)構(gòu)環(huán)境演進(jìn);二是作業(yè)任務(wù)從單一、重復(fù)的任務(wù)向多元、靈活的任務(wù)演進(jìn);三是作業(yè)方式從單機(jī)作業(yè)向多機(jī)協(xié)作演進(jìn)。
目前,人形機(jī)器人試水的工業(yè)場景主要是汽車工廠和物流工廠這樣的結(jié)構(gòu)化環(huán)境;在其中執(zhí)行簡易裝配、搬運(yùn)碼垛、分揀等工作,任務(wù)相對重復(fù)且單一;作業(yè)方式基本是單機(jī)作業(yè)。
人形機(jī)器人在物流公司部署的代表是:Agility Robotics(美國)的Digit系列機(jī)器人。繼成功試點后,2024年6月,Agility與全球物流巨頭GXO簽署了一份多年期合作協(xié)議,這使Agility成為首家正式商業(yè)化部署人形機(jī)器人的公司,該協(xié)議也成為業(yè)界首個機(jī)器人即服務(wù) (RaaS) 人形機(jī)器人部署。截至2024年8 月,Agility 的 Digit系列機(jī)器人在 GXO 倉庫完成了10000 個訂單履約。
人形機(jī)器人在車廠測試的代表是:Figure AI(美國)的Figure系列機(jī)器人。2024年1月,F(xiàn)igure AI宣布與寶馬簽署了一項合作協(xié)議,計劃在寶馬美國唯一一家制造工廠“斯帕坦堡工廠”部署其Figure系列人形機(jī)器人。2024年11月,F(xiàn)igure02在“斯帕坦堡工廠”的最新測試視頻更新,F(xiàn)igure AI創(chuàng)始人Brett Adcock表示,二代機(jī)器人比一代的速度提升了400%,執(zhí)行任務(wù)的準(zhǔn)確率提升了7倍。
“進(jìn)廠”是人形機(jī)器人驗證其可用性的必經(jīng)之路。目前,人形機(jī)器人企業(yè)正陸續(xù)與B端企業(yè)建立合作關(guān)系,為機(jī)器人試點尋找實際場景,其中第一大場景是車廠、第二大場景是物流。也有一些人形機(jī)器人企業(yè)和電子制造企業(yè)建立了合作,例如優(yōu)必選和富士康、Apptronik(美)和Jabil(捷普)。此外,部分企業(yè)在2024年也透露了其人形機(jī)器人的銷售情況或量產(chǎn)計劃,基本在數(shù)百或者數(shù)千臺。
3 人形機(jī)器人價格:目前在60萬以上,未來有望降低至10-20萬
目前,人形機(jī)器人價格基本處在60萬以上。例如宇樹科技H1-2的參考價格為70萬。樂聚機(jī)器人Kuavo(夸父)價格區(qū)間在60-80萬。傅利葉的機(jī)器人目前價格大概維持在100萬元人民幣左右。波士頓動力電驅(qū)版Atlas價格約在15萬美元,即約110萬人民幣。
未來,人形機(jī)器人的價格有望落在10-20萬區(qū)間。例如2025年1月,特斯拉在2024年四季度財報電話會中表示,一旦達(dá)到年產(chǎn)100萬臺, Optimus的成本將低于2萬美元。樂聚機(jī)器人曾表示家庭服務(wù)場景將是公司重點拓展方向,計劃將KUAVO(夸父)的售價降低至約20萬元。Apptronik曾表示目標(biāo)是將機(jī)器人的成本壓低至“低于汽車價格”。
4 人形機(jī)器人產(chǎn)業(yè)兩大方向:更強(qiáng)的“大腦”和“小腦”、更低成本的“身體”
人形機(jī)器人由“大腦”、“小腦”和“身體”三部分構(gòu)成。其中“大腦”負(fù)責(zé)語言交互、環(huán)境理解、任務(wù)理解、決策規(guī)劃;“小腦”負(fù)責(zé)將“大腦”的決策轉(zhuǎn)化為流暢且穩(wěn)定的動作指令,實現(xiàn)對機(jī)器人的運(yùn)動控制和身體協(xié)調(diào);“身體”則負(fù)責(zé)具體的動作執(zhí)行。
人形機(jī)器人的產(chǎn)業(yè)重心仍處在研發(fā)制造環(huán)節(jié),有兩大方向:一是利用大模型使人形機(jī)器人有更強(qiáng)的“大腦”、使用機(jī)器學(xué)習(xí)技術(shù)讓其有更強(qiáng)的“小腦”功能。二是核心上游零件突破技術(shù)壁壘,推動人形機(jī)器人做優(yōu)整機(jī)以及降低造價。
方向一:更強(qiáng)的“大腦”和“小腦”能力
應(yīng)用大模型,讓人形機(jī)器人有真正的“大腦”。傳統(tǒng)的工業(yè)機(jī)器人、服務(wù)機(jī)器人的智能是“被動智能”,它們被編碼以實現(xiàn)特定任務(wù),不具備自主思考的能力。而人形機(jī)器人要實現(xiàn)的卻是“自主智能”,即像人一樣具備自主思考的能力,而這得益于大模型的出現(xiàn)。從2022年ChatGPT席卷全球到DeepSeek橫空出世,大模型技術(shù)迅速推動非具身智能發(fā)展到了前所未有的高度,同時也為具身智能帶來了新的發(fā)力點。搭載大模型后,對人形機(jī)器人的“大腦”功能有兩個影響,一是它顯著提升了機(jī)器人對環(huán)境的理解能力,通過利用視覺感知大模型,人形機(jī)器人的感知能力已經(jīng)可實現(xiàn)對復(fù)雜場景的精確分割和物體識別;二是大語言模型賦予了人形機(jī)器人邏輯推理和語言處理等高級決策能力,使它可以更好地進(jìn)行任務(wù)理解和拆解。
應(yīng)用機(jī)器學(xué)習(xí),讓人形機(jī)器人的“小腦”更好地成長。“小腦”能力對人形機(jī)器人至關(guān)重要,它充當(dāng)把大腦的抽象決策轉(zhuǎn)化成具體指令的角色,直接決定了人形機(jī)器人動作的精確性和穩(wěn)定性。當(dāng)前,人形機(jī)器人的控制技術(shù)主要包括模型預(yù)測控制(MPC)、強(qiáng)化學(xué)習(xí)和模仿學(xué)習(xí)3類。MPC基于精確的運(yùn)動學(xué)和動力學(xué)模型,實現(xiàn)對機(jī)器人動作的精準(zhǔn)控制,適用于特定任務(wù)的自動化執(zhí)行,然而通用性卻不足。而模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)正成為重要的研究方向。二者都是機(jī)器學(xué)習(xí)方法,前者指智能體通過觀察專家的行為來學(xué)習(xí)如何執(zhí)行特定任務(wù);后者則是一種基于試錯的學(xué)習(xí)方法,智能體通過與環(huán)境的交互來學(xué)習(xí)如何最大化獎勵。當(dāng)前,通過引入機(jī)器學(xué)習(xí)技術(shù)后,運(yùn)動控制系統(tǒng)能實時分析環(huán)境并自動調(diào)整參數(shù)。現(xiàn)在的機(jī)器人已經(jīng)能夠更加精準(zhǔn)地感知、采集和理解周圍的環(huán)境信息,實時構(gòu)建更高精度的空間模型。
近期,隨著人形機(jī)器人產(chǎn)業(yè)的火熱,多個企業(yè)展示了大小腦模型的最新成果,對機(jī)器人泛化能力的提升效果突出。2月,F(xiàn)igure AI發(fā)布自研機(jī)器人視覺-語言-行動 (VLA) 模型Helix,并宣布搭載該模型后,F(xiàn)igure機(jī)器人只使用了8個小時的訓(xùn)練數(shù)據(jù),便學(xué)會了如何在物流線上擔(dān)任分揀工作。3月,智元機(jī)器人與上海人工智能實驗室聯(lián)合推出通用具身基座大模型GO-1,開創(chuàng)性提出了Vision-Language-Latent-Action(ViLLA)架構(gòu),實現(xiàn)了利用人類視頻進(jìn)行學(xué)習(xí)和小樣本快速泛化。3月,北京人形機(jī)器人創(chuàng)新中心發(fā)布全球首個一腦多能、一腦多機(jī)的通用具身智能平臺“慧思開物”。這一平臺可以為機(jī)器人配備更聰明的“大腦”和“小腦”,實現(xiàn)從任務(wù)理解到執(zhí)行的全流程智能化,讓機(jī)器人更聰明流暢地完成拼積木、工業(yè)分揀、桌面清理、打包快遞等各項任務(wù)。
方向二:核心上游零件降本,諧波減速器、行星滾柱絲杠、六維力傳感器等
人形機(jī)器人零件較多,其中諧波減速器、行星滾柱絲杠、六維力傳感器等技術(shù)壁壘與價值量較高,未來降本空間較大。
1、諧波減速器
減速器是一種用于降低轉(zhuǎn)速、增加扭矩的機(jī)械裝置,有諧波減速器、行星減速器、RV減速器等類型。諧波傳感器體積小、重量輕,卻具備良好的傳動能力,可實現(xiàn)高效、精確的減速效果,是人形機(jī)器人的重要零件。
以特斯拉Optimus為例,其軀干共有 28 個關(guān)節(jié),旋轉(zhuǎn)關(guān)節(jié)和直線關(guān)節(jié)各14 個,每一個旋轉(zhuǎn)關(guān)節(jié)處都有一個諧波減速器,共14個。價值量方面,單個諧波減速器約1600元,即單機(jī)價值量超過2.2萬元。
市場格局方面,日本的哈默納科在全球諧波減速器市場占據(jù)主導(dǎo)地位,市占率達(dá)80%以上。國產(chǎn)諧波減速器廠商有30多家,排在頭部的有綠的諧波、來福諧波、同川科技、大族傳動等。其中綠的諧波實力最強(qiáng),是國產(chǎn)諧波傳感器龍頭;其創(chuàng)始團(tuán)隊自 2003 年開始研究諧波傳動技術(shù),產(chǎn)品性能達(dá)到國際先進(jìn)水平,全球市占率可達(dá)7%(第二);在中國市場率約25%,僅次于哈默納科的35%。
2、行星滾柱絲杠
絲杠是一種傳動部件,用于將旋轉(zhuǎn)運(yùn)動轉(zhuǎn)化成線性運(yùn)動。主流絲杠方案包括梯形、滾珠、行星滾柱三類。行星滾柱絲杠由于具備承載能力強(qiáng)、體積小、壽命長等優(yōu)點,成為人形機(jī)器人中的重要零件。
以特斯拉Optimus為例,直線關(guān)節(jié)共14 個,每一個直線關(guān)節(jié)處都有一根行星滾柱絲杠(反式),共14根,分別位于大臂(2個)、小臂(4個)、大腿(4個)和小腿(4個)。價值量方面,單根標(biāo)準(zhǔn)行星滾柱絲杠約2000元,而用于人形機(jī)器人的反式行星滾柱絲杠將更高,即單機(jī)價值量超過2.8萬元。
行星滾柱絲杠工藝要求高、精磨設(shè)備供給有限,目前還沒有得到廣泛應(yīng)用,尚處于產(chǎn)業(yè)早期。2023年中國絲杠市場規(guī)模25.7億,行星滾柱絲杠僅占 4%。產(chǎn)業(yè)格局上,國外行星滾柱絲杠龍頭制造商GSA(瑞士)在中國市場的份額超過50%,GSA與Ewellix(瑞典)、Rexroth(德國)合計份約80%。國內(nèi)廠商生產(chǎn)能力不足,僅有南京工藝、博特精工等少數(shù)企業(yè)具備出貨能力。
3、六維力傳感
六維力傳感是一種高維度力傳感器,是高性能人形機(jī)器人的標(biāo)配,通常安裝在人形機(jī)器人的末端執(zhí)行器處,具體位置如手腕、腳踝,對人形機(jī)器人實現(xiàn)手部精細(xì)化操作與腳步站立或行走平衡性十分重要。
力/力矩傳感器是一種能感知力/力矩并將其轉(zhuǎn)換成電信號的裝置,作用是幫助人形機(jī)器人感知與外界環(huán)境的交互力。按維度,常見的力傳感器有一維力傳感器、三維力傳感器和六維力傳感器。六維力傳感器是當(dāng)前測量維度最多的力傳感器,它能夠同時測量三個正交力和三個正扭矩,給出最為全面和精準(zhǔn)的力覺數(shù)據(jù)。
相比于其他部位,人形機(jī)器人的手腕和腳踝會面臨更隨機(jī)的力變化,因此需要使用六維力傳感器這樣的高維力傳感器,裝在手腕處可提高人形機(jī)器人靈巧手的精細(xì)化作業(yè)水平、裝在腳踝處則有利于提升人形機(jī)器人站立或行走的平衡性。單臺人形機(jī)器人需使用4個六維力傳感器,手腕、腳踝各兩個。價格方面,根據(jù)MIR調(diào)研,六維力傳感器的成本在數(shù)千元,產(chǎn)品單價可達(dá)2-4萬元。單機(jī)價值可達(dá)數(shù)萬元。
六維力傳感器研發(fā)制造難度非常高,規(guī)模效應(yīng)尚未形成。以國內(nèi)市場為例,出貨量在萬套水平;用于人形機(jī)器人的則更少,占比不足5%。六維力傳感器全球市場中,美國ATI擁有絕對主導(dǎo)地位,其他海外主要品牌有德國Schunk、美國AMT以及瑞士Kistler。目前國內(nèi)具備批量化產(chǎn)品供應(yīng)能力的廠商仍然偏少,其中宇立儀器競爭力最強(qiáng),是國產(chǎn)廠商里市場份額最高的;其他已具備批量化生產(chǎn)的企業(yè)有坤維科技、鑫精誠、藍(lán)點觸控、瑞爾特、海伯森等。
未來,隨著諧波減速器、行星滾柱絲杠、六維力傳感器等核心上游零件廠商的技術(shù)突破以及人形機(jī)器人的需求拉動作用,人形機(jī)器人整機(jī)的性能會更加優(yōu)化,而成本也有較大的下降空間。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.