文 | 晏川
周天財經 原創(chuàng)出品
近一個月,資本市場風云卷動,幾十億人民幣蜂擁砸入具身智能產業(yè)。
宇樹科技于7月18日正式開啟上市輔導,開始向IPO發(fā)起沖刺,此時距宇樹科技進行股改剛過去2個月。而在一個月前,6月19日宇樹科技宣布完成C+輪戰(zhàn)略融資,據I桔子估算,此輪融資后宇樹估值已達130億人民幣。
與宇樹科技同為第一梯隊的智元機器人在7月8日拋出重磅炸彈,出資至少21億元收購A股科創(chuàng)板上市公司上緯新材63.62%股份。盡管智元機器人聲稱此次收購不涉及業(yè)務和重大資產的重組上市,但二十多億真金白銀砸出去收購一個和機器人產業(yè)毫無關聯(lián)的公司, 若說其中沒有別的目的似乎有些掩耳盜鈴。藍橋資本創(chuàng)始人王超在和晚點的對話中就將智元機器人的這一行為稱為「類借殼上市」,其靠近資本市場的野心顯而易見。
兩家頭部企業(yè)的IPO賽跑,體現(xiàn)出上頭針對人形機器人的定向放水,意圖清晰。閘門打開,也驅使一二級市場聯(lián)動起來。
也是最近幾天,「杭州六小龍」之一的杭州云深處宣布完成近5億元人民幣新一輪融資。它石智航宣布完成由美團戰(zhàn)投領投的1.22億美元天使+輪融資。
值得注意的是,這不是美團第一次出現(xiàn)在具身智能投資方中,據不完全統(tǒng)計,宇樹、智元,包括下文將要提到的星海圖和自變量機器人等具身智能企業(yè),背后都有美團的影子??梢哉f,美團撐起了具身智能的半壁江山。
另外半壁,京東想要接手。
7月21日,眾擎機器人、千尋智能、逐際動力等三家機器人公司同時宣布獲得京東領投的新一輪融資。前兩者融資規(guī)模分別達到近10億元和近6億元。京東似乎要和美團杠上了,雙方戰(zhàn)線從「外賣大戰(zhàn)」蔓延到了具身智能產業(yè)。
北京小雨智造完成由滴滴領投的億元級A+輪融資,這是滴滴第一次投資具身智能賽道。
此外,清華系具身智能企業(yè)星動紀元完成近5億元A輪融資。主攻倉儲機器人和智慧物流業(yè)務的極智嘉在港交所主板掛牌上市,成為「全球AMR倉儲機器人第一股」。星海圖接連完成A4輪及A5輪戰(zhàn)略融資,兩輪合計融資金額超過1億美元。還有圖速科技、跨維智能等多家公司在近期完成融資。自變量機器人創(chuàng)始人兼CEO王潛更是坦言「我們上半年融了三輪」。
如此之多的融資發(fā)生近一個月內,眼花繚亂,體現(xiàn)了資本市場對于具身智能這一未來產業(yè)的期望,眾多企業(yè)紛紛入局,以期在這一片藍海的賽道中提前布局,早早落位。但即便是如此規(guī)模的融資,在王潛看來速度也還不夠快,規(guī)模還不夠大,在接受每經記者采訪時,他表示,「具身智能是中國可以和美國站在同一起跑線角逐的大賽道,但與美國公司相比,中國公司不管是融資規(guī)模還是企業(yè)估值,都有著一個數(shù)量級的差距」。
但是熱潮已經起來了,這是一個好的啟動。
01 信心來自何處
具身智能(Embodied AI)和機器人并不是新奇的物種。1950年,圖靈在他的論文中就提出了人工智能的兩條發(fā)展路徑:一條是抽象智能,依賴算法和符號推理;另一條就是具身交互,即為機器配備感官設備,使其能夠通過感官體驗和環(huán)境交互學習技能。
然而直到今日,具身智能才如此頻繁地被提及,眾多初創(chuàng)公司毅然下場造機器人,并成功吸引了大量資本的眼球。那么問題來了,走過了PC時代和手機時代,為什么在這個時間,一個之前不被傾注太多注意力的產業(yè),突然立地飛升,如日中天?
這其中涉及到兩次關鍵的范式轉變。
第一次范式轉變發(fā)生在機器人的本體。這是從液壓驅動路線向電驅路線的變革。
宇樹創(chuàng)始人王興興曾說他在2013年以前就看出來液壓方案無法商業(yè)化,原因簡單:它都是精密的機械零件,一旦涉及到精密的機械零件,成本都會下不來。并且,所有的液壓系統(tǒng)都會漏油,連家用轎車都不怎么用液壓系統(tǒng)了。
在液壓技術路線上走了幾十年的老巨頭進展寥寥。2018年,日本ASIMO機器人宣布停止研發(fā),這使得全球人形機器人行業(yè)墜入低谷期。直到馬斯克確立了電驅動路線,成為一次拯救全球機器人行業(yè)的關鍵技術轉折。
電驅帶來的大規(guī)模零件精簡,使其具有了規(guī)模效應,而押錯科技樹的液壓派,哪怕是積累了半個世紀的技術壁壘,也在一夜之間被新的小巨頭趕超,波士頓動力如今年銷量僅為宇樹的十分之一,可能會逐漸退出歷史舞臺。
因此,電驅動的一個巨大紅利,就是為中國小至創(chuàng)業(yè)公司,大到智能家電巨頭再到汽車制造和互聯(lián)網巨頭,這些后發(fā)者,一下子打開了趕超的窗口,大小玩家們都站到了同一起跑線上。
這也得益于新能源電動車成熟的產業(yè)鏈,電機造型變小,力矩變大,電池的能量密度也在不斷提高,技術轉移到機器人產業(yè)鏈上,就可以提升機器人的運動能力和續(xù)航。像滾雪球一樣,一個零部件一個零部件地摳出來高性能與低成本,步步逼近產業(yè)拐點。
第二次范式轉變發(fā)生在機器人的「大腦」。這是大模型技術帶來的變革。
機器人公司魔法原子總裁吳長征說,2023、24年,行業(yè)井噴,ChatGPT3.5的出現(xiàn)至關重要,大模型技術發(fā)展,給機器人智能水平提升帶來了一種新范式。生成式AI出現(xiàn)了千倍萬倍的能力提升,讓我們意識到,大模型+機器人,具身智能存在無限潛力。機器人在環(huán)境和感知與理解、推理、決策和任務規(guī)劃方面,都會產生一種新的范式。在這種新范式下,機器人能力會有千倍萬倍的增長。
大模型的出現(xiàn)顛覆了傳統(tǒng)機器人只能當「遙控玩具」的印象?,F(xiàn)在大模型所展現(xiàn)的復雜場景理解能力和長序列的任務規(guī)劃能力,都是以往機器人所不具備的,以往機器人的任務序列是人為事先編寫好的,但大模型通過不斷地訓練和學習,能讓機器人理解周圍環(huán)境,還能結合環(huán)境和目標任務進行自主的任務規(guī)劃,就像人擁有了大腦一樣。
當然,這并不意味著可以直接把現(xiàn)有的大模型拿來塞進機器人里。大模型通過語言進行交互,語言可以作為人機交互的媒介,但不能視作機器人所擁有的智能。銀河通用創(chuàng)始人兼CTO王鶴說,「智能的本質是對一種情況做相應reaction的能力」,對于機器人來說,通過視覺、聽覺、觸覺與周圍的環(huán)境產生交互,具備理解當下環(huán)境并采取行動的能力才至關重要。
因此,適用于機器人的具身大模型成為了行業(yè)共識。雖然走到這一步仍需要技術攻堅,但是方向已經明確,前進的關口已經打開,接下來就是等待一個屬于機器人產業(yè)的GPT4時刻。
但前路仍然漫長曲折。
02 攔路虎未除
就當下而言,具身智能離理想中的模樣還相去甚遠。此時的具身智能市場,如同2010s的新能源汽車市場,處于行業(yè)野蠻發(fā)展的初期,技術尚未成熟,離商業(yè)化落地更差著十萬八千里。
具身智能想要書寫的故事和當下的現(xiàn)實產生了割裂。
首先,具身智能的訓練需要海量的交互數(shù)據作為支撐,千尋智能具身智能項目負責人解浚源就表示,「數(shù)據就是目前最大的難點,很多的問題在數(shù)據量上去之后就自動的不是問題了」。
目前數(shù)據的主要采集來源分為真實數(shù)據和仿真數(shù)據兩種。真實數(shù)據通過機器人的實操,來獲取機器人在與真實物理世界交互過程中的反饋,主要通過遙操和動捕兩種方式進行。仿真數(shù)據則通過渲染虛擬環(huán)境,模擬機器人與物體交互,生成訓練數(shù)據。
由于是實機交互,真機數(shù)據采集的數(shù)據質量最高,但其短板也是顯而易見:數(shù)據采集工作量大且成本高昂。高擎機電生態(tài)合伙人同濟子豪兄就提到「我用主從機械臂教機器人抓小龍蝦,重復一百次后手已經很疲勞了」。王鶴也指出目前雇人遙操采真實數(shù)據的成本非常高,「萬臺級機器人數(shù)據采集每個月的成本在數(shù)億到十億之間」。
仿真數(shù)據可以訓練成千上萬次,但是虛擬世界與現(xiàn)實世界存在鴻溝,仿真環(huán)境中的物理規(guī)律和機器人感知同現(xiàn)實世界存在偏差,通過仿真得來的數(shù)據有可能在現(xiàn)實中失效。子豪兄表示「目前主流方案是‘仿真 + 少量真實數(shù)據’混合訓練,但如何縮小‘仿真 - 現(xiàn)實鴻溝’仍是核心難題」。
泛化不夠,意味著任務成功率低,再加上價格高昂,人形機器人短期內難以走進千家萬戶,成為消費級商品。
千尋智能聯(lián)合創(chuàng)始人高陽在和晚點對話時將具身智能的階段劃分為L0-L5:L0為無智能的工業(yè)機器人;L1為單一任務智能;L2為單場景多任務智能;L3為單場景可完成70%-80%人類任務;L4為單場景100%任務;L5為跨場景全能?!刚麄€行業(yè)現(xiàn)在正在從L1到L2的路上」。人形機器人公司們要占據消費市場,仍然需要很長的時間。
高陽說,「現(xiàn)在到L2、L3的提升最主要的挑戰(zhàn)就是泛化性,很難把所有任務數(shù)據都采集一遍,所以需要泛化性來支持機器人舉一反三」。泛化性的意思是,讓智能體在真實、開放、動態(tài)變化的物理世界中,能夠將其在單一環(huán)境、任務或實體上學到的能力,有效地遷移和適應到前所未見的環(huán)境、任務或實體上。這種能在開放世界終身適應的能力,是具身智能最終走向實用化的關鍵瓶頸和核心目標。
目前多數(shù)機器人只能在高度受控環(huán)境下工作。王興興曾向周天財經談道,「當下的問題是,一個任務目標可以完成,但是場景和任務稍微換一下,成功率就會暴跌」,這就是泛化性不足帶來的問題。之前機器人公司們整出來的花活,無論是跳舞還是其他諸如后空翻等看起來很唬人的動作,本質都是固定動作或遙操,與傳統(tǒng)機器人還未產生本質區(qū)別。這也是機器人目前無法進入通用場景的原因。
一位資深投資人士表示「現(xiàn)在純人形最大的市場是科研院所,他們需要類人構型做整機控制研究。其他場景都是噱頭——商場展覽、拍廣告,甚至可以租來用一兩次,這說明需求不是長期高頻的?!?/p>
宇樹科技創(chuàng)始人王興興一個月前在夏季達沃斯論壇上宣布宇樹年營收已超過10億元人民幣,為上市預熱。而據硅基實驗室的統(tǒng)計,科研類高校撐起了宇樹訂單的大頭,其余則由央國企、政府單位等采購。
就在不久前的7月11日,宇樹科技和智元機器人一起拿下目前為止國內人形機器人企業(yè)的最大訂單——總預算為1.2405億美元的雙足機器人代工服務采購項目。這筆訂單來自中移(杭州)信息技術有限公司。
從以上種種,可以窺見人形機器人公司目前的商業(yè)化瓶頸。在各類不利因素的影響下,機器人的落地部署場景被限制在狹小的區(qū)間內,甚至更多是實驗科研需要,機器人公司們的營收來源在短期內還無法囊括廣闊的消費市場。
人形機器人公司想要走近消費者,還任重道遠。但資本方目前給出的高溢價,主要就是為消費級可能性而買單。
03 未來指向何處
資金涌入代表了創(chuàng)業(yè)者和投資人們對前景非常樂觀。
王興興就斷言「2025年年底的技術進步會上升一個臺階,會給全球產業(yè)界打一個更大的雞血,熱度、市場規(guī)模翻十倍是沒問題的」。
當下走向具身智能的主流技術路線有兩種:一種是端到端模型,一種是分層決策模型。端到端路線直接將原始傳感器輸入如攝像頭圖像、激光雷達、觸覺信號等映射到機器人的動作輸出,不依賴人工設計的中間模塊,通過單一模型完成從感知到決策的全流程。
分層決策的核心是將任務分解為多個層級,每層專注于特定的子功能,從感知到執(zhí)行之間的各環(huán)節(jié)是獨立的,各模塊可分別優(yōu)化或采用混合技術方案。
實際上,端到端模型已經成為大部分從業(yè)者的共識。這一路線是特斯拉選擇的方案,同時國內耳熟能詳?shù)木呱碇悄艹鮿?chuàng)企業(yè)如星動紀元、星海圖等采取的也都是端到端的解決方案。端到端當下的主要決策模型是VLA(Vision-Language-Action), 旨在通過統(tǒng)一模型將視覺信息、語音指令和物理動作控制深度融合,從而使機器人在開放世界中具備自主推理、決策和執(zhí)行的能力。
有研究者認為,今天的具身智能接近于自動駕駛2010年的那個階段,為什么是2010年?因為當年谷歌展示了相當不錯的自動駕駛原型Demo,還舉行了像無人車競賽這樣的學術前沿性活動,展示了激光雷達、高精地圖定位、SLAM等技術方式,證明汽車自動駕駛是可行的,但離真正規(guī)模化應用仍有很大差距。今天智能機器人展示的很多能力和Demo,從完成度上來看,非常接近于2010年自動駕駛所展示的。而到了2025年,特斯拉FSD才趨于成熟,理想汽車的端到端也基本能用,又是一個15年的gap。
因此盡管在當下來看,在端到端方面下功夫或許還需要較長的時間才能等到技術臨界點出現(xiàn)。手動分層或許可以在短期內占得工程上的便宜,但從長遠來看遲早會被淘汰。高陽在和晚點的對談中就提到「2016年我們剛開始做自動駕駛的端到端,當時沒人相信,但是我們從那個年代就開始相信端到端了」。
適合具身智能發(fā)展的各種要素已經準備好了,只待AI能力達到新的臨界點,具身智能賽道將迎來井噴式的爆發(fā)。王興興在和周天財經對談時表示:「最大的點還是行業(yè)天花板是機器人AI的天花板決定的,如果AI天花板不突破的話,增長也就是50-100%的線性增速,如果突破了臨界點,整個產業(yè)就會大爆發(fā),所有大公司都會加入進來的。」
這是一個漫長的征途,性能拉升需要時間,而在真正屬于具身智能的時代到來之前,該怎么活到那一天才是目前相關公司們需要考慮的事情。微軟全球原副總裁、院士張亞勤心中的時間表是:需要10-20年。他認為,信息智能的AGI 5年內可達到;物理智能的AGI分階段達成,如人形機器人大約需要10年達到。
王鶴曾向晚點表示未來五年是具身智能的關鍵期:「若頭部企業(yè)做不到萬臺級自主機器人應用,行業(yè)可能重蹈工業(yè)視覺覆轍——故事講得大,實際營收僅幾億?!?/p>
部分企業(yè)的策略是兩步走,曲線救國,先拿到專用工業(yè)場景里跑數(shù)據,再逐漸泛化通用。梅卡曼德機器人創(chuàng)始人邵天蘭對「牛白丁」表示,「全球約10-20億人從事制造、物流及相關工作,而工業(yè)機器人存量僅400萬臺。即使僅替代1%的崗位,也將形成千萬級市場,規(guī)模遠超當前存量?!?/p>
初步可預見的是,在未來的幾年內,具身智能先落地工業(yè)、商超等場景,規(guī)模鋪開之后,機器人和真實物理世界形成大量交互,產生的數(shù)據量級暴增,從而為下一級的機器人訓練提供寶貴的真實數(shù)據,這樣形成良性循環(huán),催生機器人向跨任務全場景全能型邁進。
《銀河帝國》中,阿西莫夫虛構了一個存活三萬年的機器人角色,它已經進化出了自己的意識,擁有遠超人類的智能,為保護人類的利益默默守護了兩萬年。眼下,我們正在向這種夢想靠近。
*僅介紹公司,不構成推薦股票的建議
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.