夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

機器人的“最后一公里”:深聊靈巧手的“不可能三角”與六大技術(shù)門派

0
分享至

文 | 硅谷101

大家覺得讓機器人學(xué)會走路難,還是讓它學(xué)會打開一聽可樂難?我猜大部分人都會說走路難吧,畢竟人類花了幾百萬年才學(xué)會直立行走,波士頓動力的機器人摔了無數(shù)次才學(xué)會后空翻。

但我最近在采訪的時候,才發(fā)現(xiàn)一個完全顛覆我認知的事實:在機器人世界里,開可樂這件事比走路可難太多了!也就是說,控制靈巧手要比控制軀體難上至少十倍,而從目前的售價對比上我們也能感受到:


中國Unitree G1人形機器人(會走路):1.6萬美元;

波士頓動力Atlas機器人(會后空翻):預(yù)估14萬美元;

英國Shadow Robot的靈巧手(會擰瓶蓋):價格未公開,但業(yè)內(nèi)估計超過10萬美元

也就是說:一只手的價格接近一個完整的頂級機器人!這是什么概念?這好比一個方向盤的價格接近整輛特斯拉。所以機器人的靈巧手為什么難做?目前技術(shù)發(fā)展到什么階段了?業(yè)內(nèi)的技術(shù)派系有哪些、有什么值得關(guān)注的公司?

今天我們就來聊聊,這個讓全世界頂級機器人工程師都頭疼的終極難題——機器人靈巧手。以及我們與特斯拉前靈巧手負責人創(chuàng)業(yè)的團隊TetherIA一起聊聊,一個300多美元的“Android版機器人靈巧手”如何試圖顛覆這個被壟斷了30年的高端市場。

01 機器人的“最后一公里”

為什么我們能看到機器人在工廠里分揀產(chǎn)品,在倉庫里搬運貨物,但卻很少看到它們能像人一樣靈活地擰開可樂瓶蓋,或者精準地拿起一顆螺絲釘?答案就在于:手的復(fù)雜性遠超我們的想象


人類的手有27個自由度,包含27塊骨頭、29個關(guān)節(jié)、34塊肌肉,以及數(shù)不清的神經(jīng)末梢——這是一個經(jīng)過了數(shù)百萬年進化的“精密儀器”。更神奇的是,這個“儀器”讓我們能夠既有力量握緊工具,又有精度穿針引線。這樣的能力造就了人類文明,但對機器人來說,要復(fù)刻這樣的能力,就非常有挑戰(zhàn)了。


Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 大家看一下人手的構(gòu)造,就會發(fā)現(xiàn)其實人手非常靈活,里面關(guān)節(jié)非常多。我們以大拇指舉例:大拇指從上往下,有IP joint(拇指指間關(guān)節(jié))、MCP joint(拇指掌指關(guān)節(jié)),這兩個關(guān)節(jié)都可以實現(xiàn)屈伸和彎曲。再往下的關(guān)節(jié)叫CMC joint(拇指腕掌關(guān)節(jié)),這個關(guān)節(jié)就明顯靈活很多,可以做側(cè)擺動作,也可以做彎曲和伸直動作,甚至還能原地旋轉(zhuǎn)。而且它的運動范圍非常大。你會看到,關(guān)節(jié)之間的連接非常小,這就是為什么人手既能靈活,又能保持非常小的體積的原因。

而這,就是機器人工程師們面臨的終極挑戰(zhàn)——機器人靈巧手,英文叫Dexterous Hand,在機器人學(xué)里,它專門指高度仿人、具有多自由度、能夠完成精細操作的機器人手。它能夠模擬人手的抓取、操作和感知功能。那什么樣的機器人手才能稱得上“靈巧”?

第一,它得有足夠多的“關(guān)節(jié)”。我們?nèi)耸钟?7個自由度,而機器人靈巧手通常需要6個以上,高端產(chǎn)品能達到20-27個。這就像是給機器人裝上了真正能“動手指”的手。

第二,它得有“繡花”般的精細控制。我們說的是毫米級甚至更精細的操作——想象一下用機器人手穿針引線,或者像我們一會兒要看到的那樣,精準抓取只有5毫米的M5螺絲釘。

第三,它得有“觸覺”。不只是能看到,還要能“感受”。觸覺傳感器、力覺傳感器、位置傳感器等等,就像給機器人裝上了神經(jīng)系統(tǒng),讓它知道抓得是輕是重,是軟是硬。

第四,它得會“察言觀色”。遇到圓的就用一種抓法,遇到方的就換另一種??吹讲AП洼p拿輕放,看到鐵塊就可以用力一些。這就是自適應(yīng)抓取的能力。

最后,它得長得像人手。人類世界的所有工具都是為人手設(shè)計的。如果機器人能夠模仿人手的結(jié)構(gòu)、功能和配置,它們就能快速且經(jīng)濟高效地應(yīng)用,而無需改變我們的環(huán)境。

如果我們看看歷史會發(fā)現(xiàn),靈巧手從有這個概念,到現(xiàn)在逐步趨向成熟,已經(jīng)走過了40多年的歷程。


  • 1980年代:開山之作

Stanford/JPL Hand開創(chuàng)了靈巧手的先河,3根“人形”手指,每根三個關(guān)節(jié),配備觸覺/力反饋。但它更像是證明“這事兒能做”的概念機。


  • 1990-2000年代:百家爭鳴到夾爪稱王

Utah/MIT Hand、DLR Hand等各顯神通,技術(shù)路線百花齊放,但都停留在實驗室:能演示,但離實用還差十萬八千里。

就在靈巧手還在實驗室“紙上談兵”時,簡單粗暴的兩指夾爪已經(jīng)占領(lǐng)了工廠。雖然只能“抓”和“放”,但便宜、穩(wěn)定、夠用。這就像是功能機時代——雖然簡陋,但解決了核心需求。


  • 2000-2010年代:商業(yè)化破冰

Shadow Robot、Allegro Hand等陸續(xù)商業(yè)化,價格高達數(shù)萬美元,主要服務(wù)科研機構(gòu)。這個階段就像早期個人電腦——功能有了,但普通人買不起。

2020年代:巨頭入場

特斯拉入局改變游戲規(guī)則。馬斯克不只要做靈巧手,還要規(guī)?;a(chǎn)。同時,GPT等AI大模型的突破為機器人控制打開了新世界的大門。


  • 2025年:轉(zhuǎn)折點

特斯拉22個自由度的新手、TetherIA的300美元開源革命、各路開源項目涌現(xiàn)。靈巧手即將迎來“智能手機時刻”——從極客玩具變成人人可得的工具。

然而,靈巧手雖然迎來了巨大的突破,但還是有很多的難點。這個難點并不僅僅在技術(shù)上的突破,更重要的是要兼顧性能,成本還有可靠性,這就成了一個“不可能三角”。

02 靈巧手的“不可能三角”:性能、成本、可靠性

在現(xiàn)場采訪中,我才知道一個可能會顛覆很多人認知的觀點:靈巧手的控制比整機控制要難10倍!

在TetherIA位于硅谷的辦公室,我見到了他們一路以來設(shè)計的各種迭代版本,以及他們剛發(fā)布上線的這款開源的靈巧手產(chǎn)品Aero Hand Open。

在我自己真正上手嘗試去控制靈巧手之前,我都非常不理解,一個完整的人形機器人要平衡、要走路、要導(dǎo)航,怎么可能比一只手還簡單呢?但當我自己嘗試去控制這只手的時候,發(fā)現(xiàn)真是沒那么容易。


Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 我們覺得這個難點其實是多方面的。因為機器人是一個復(fù)雜的系統(tǒng),現(xiàn)在大家比較關(guān)注的是AI控制的層面,主要是VLA模型(Vision-Language-Action 視覺-語言-動作)的泛化能力,這毫無疑問是一個很大的難點。 另外,我們覺得從整個整機系統(tǒng)角度來說,這個手的硬件本身也是很大的一個卡點。人手是非常靈巧的,它的相對尺寸很小,每個關(guān)節(jié)都很靈活,手指又非常纖細,還能做到速度和力量之間的平衡,并且特別經(jīng)久耐用。
我們?nèi)祟愔饕强侩p手和外界進行接觸,但在傳統(tǒng)的機器人里,更多的是避免機器人和外界接觸,因為一旦接觸就是碰撞,對機器人就有損傷,而手恰恰需要和外界接觸,所以綜合起來,這些都是硬件上的難點。 除了硬件和控制的難點,其實還有很多更不為外行所知的地方。比如,你在控制的同時,希望能夠讓human-in-the-loop(人機回圈),讓人在其中對機器人產(chǎn)生影響和作用,這就牽扯到遙操系統(tǒng),以及開發(fā)過程當中的仿真系統(tǒng),以及背后整個體系。其實都有很多的困難。

我在操作的過程中感覺到視覺與力量的協(xié)作,是非常關(guān)鍵的。由于我是完全感知不到觸感和力度,我抓握的完全是空氣,只能憑借我的眼睛觀察靈巧手與物體的接觸反饋來及時調(diào)整。這就很像軟件驅(qū)動靈巧手的過程。

我們知道,人類的抓握過程依賴于神經(jīng)系統(tǒng)、肌肉控制和多模態(tài)感知


人類抓握力的調(diào)整分為兩個閉環(huán)控制:第一是前饋控制(Feedforward Control),也就是大腦基于視覺和經(jīng)驗,在抓取前預(yù)測所需力量。例如,看見一瓶水時,大腦會預(yù)估重量,先設(shè)定一個初始抓力。

第二個階段是反饋控制(Feedback Control),在手指接觸物體后,實時通過觸覺和滑動信息進行調(diào)整。如果物體開始滑動,神經(jīng)系統(tǒng)將在<100毫秒內(nèi)反射性增加力量。這是一種快速的“感知和反應(yīng)”的閉環(huán)。

如果靈巧手要完全復(fù)制人手的這個反饋閉環(huán),需要的不只是傳感器和控制算法的堆疊,而是一個更接近人類神經(jīng)系統(tǒng)的分層控制架構(gòu)。可以類比為“大腦控制”和“小腦控制”:大腦控制依賴視覺、經(jīng)驗和推理,用于規(guī)劃動作和做出高層決策;而小腦控制則依靠觸覺、力反饋和實時的平衡調(diào)整,負責細節(jié)上的動態(tài)微調(diào)與協(xié)調(diào)。


把多模態(tài)傳感(力/力矩、觸覺、視覺)與感知—判斷—調(diào)整的閉環(huán)控制結(jié)合,再通過深度強化學(xué)習不斷優(yōu)化整個系統(tǒng)的策略,真的是非常有挑戰(zhàn)的研發(fā)過程。

所以在2023年年底,BC特斯拉的第二代人形機器人Tesla Optimus Gen 2發(fā)布捏雞蛋的demo那么受到關(guān)注,正是因為它基于視覺的“大腦”和基于力控的“小腦”在協(xié)作進步。

雖然實現(xiàn)這一切很難,但要真正實現(xiàn)機器人在多場景下的應(yīng)用,還真是得依靠靈巧手不可。這個邏輯很簡單:人類世界是為人類設(shè)計的。所有的工具、設(shè)備、環(huán)境都是按照人的尺寸和能力來設(shè)計的。要讓機器人真正融入人類世界,最有效的方法就是讓它們具備類似人類的能力。

所以,要想讓靈巧手真的走向產(chǎn)業(yè)化、還有一個難題要解決,那就是靈巧手的”不可能三角”。如果把機器人靈巧手比作一個三角形,那么它的三個頂點分別是:性能、成本、可靠性,而這個三角形有個殘酷的特點:你只能優(yōu)化其中兩個角,第三個必然會受到犧牲。


而如果想要高性能,英國Shadow Robot公司的靈巧手就是完美的例子。它擁有超過120個傳感器,可實現(xiàn)觸覺感知,擁有20個電動關(guān)節(jié)和24個自由度,其尺寸、形狀和運動范圍與人手相當,非常適合執(zhí)行專為人手設(shè)計和優(yōu)化的任務(wù)。但是,它的價格超過10萬美元!


想要低成本?市面上有很多開源項目,比如DexHand和Amazing Hand,可以3D打印,成本能控制在300美元。但性能嘛...只能說是“擺造型”,抓取功能基本是沒法使用的,甚至一些入門級的商業(yè)產(chǎn)品在這方面也不足。

想要高可靠性?那就得簡化設(shè)計,減少故障點。越復(fù)雜的系統(tǒng),維護成本越高,故障率也越高。但這樣一來,性能又會大打折扣。

Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 因為機械手每一個關(guān)節(jié)、每一個自由度的運動都需要有電機來控制,如果把電機做得很小,它的功率輸出和性能就會相應(yīng)變?nèi)酢K?,要想匹配人手的自由度、人手的尺寸、以及人手的力輸出和速度,就是一個非常困難的“不可能三角”。

這就像是在玩一個永遠無法獲勝的游戲,除非你能夠找到突破這個三角形的新方法,而在產(chǎn)業(yè)中,大家一直在尋找這樣的方法來突破不可能三角,這也衍生出了靈巧手江湖中的6大門派。

03 技術(shù)流派大揭秘:6大門派的江湖恩怨

為了解決靈巧手的“不可能三角”,在機器人靈巧手的江湖里,主要有六大門派,各自有著不同的武功路數(shù):

Chapter 3.1 直驅(qū)派:簡單粗暴的“搭積木選手”


這一派的哲學(xué)很簡單:需要動哪里,就在哪里放個電機。就像韓國Wonik Robotics的Allegro Hand,16個自由度,16個電機,電機“一對一”服務(wù);還有最新出的國產(chǎn)產(chǎn)品SharpaWave,Wuji Hand以及XHand,都是這個路線。

這種設(shè)計的優(yōu)點在于方便精細控制。缺點在于,電機驅(qū)動器體積小、抗沖擊差、不可反驅(qū)、指末端力輸出小,而且維護和維修都不太方便。


Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 因為機械手每一個關(guān)節(jié)、每一個自由度的運動都需要有電機來控制,如果把電機做得很小,它的功率輸出和性能就會相應(yīng)變?nèi)?。所以,要想匹配人手的自由度、人手的尺寸、以及人手的力輸出和速度,就是一個非常困難的“不可能三角”。
Chapter 3.2 繩驅(qū)派:最接近人體的“仿生學(xué)大師”


這一派的代表是特斯拉的Optimus和Shadow Robot。特斯拉大家都熟悉了,而Shadow Robot這家英國公司就像是靈巧手界的“勞斯萊斯”。近30年的技術(shù)積累讓他們在高端市場占據(jù)統(tǒng)治地位,但高昂的價格也限制了他們的市場擴張。

他們的設(shè)計思路最接近人體:把“肌肉”(電機)放在前臂,通過“肌腱”(鋼絲繩或高強度合成纖維)來控制手指運動。

這就像是控制木偶一樣——所有的線都連到一個中央控制臺,通過拉動不同的線來實現(xiàn)復(fù)雜的動作。這種設(shè)計的優(yōu)點是輕量化、力量輸出穩(wěn)定、具備一定自適應(yīng)能力,而且布局和人體更接近。特斯拉最新的Optimus手宣稱它擁有22個自由度,已經(jīng)非常接近人手的27個自由度了。我們實地探訪的TetherIA他們現(xiàn)在推出的這款高性價比靈巧手也是采用的繩驅(qū)方案。


但是,繩驅(qū)動也有自己的麻煩。

Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 雖然特斯拉是堅定走“繩驅(qū)”路線——但是我們看到其實很多創(chuàng)業(yè)公司,真正跟隨特斯拉技術(shù)路線的并不多,而且很多人會質(zhì)疑特斯拉。為什么呢?我們覺得,因為“繩驅(qū)”最根本的優(yōu)勢,就是剛才我介紹的,能夠?qū)崿F(xiàn)比較好的力輸出和自適應(yīng)。但它根本的劣勢在于,尤其是對于欠驅(qū)動來說,它沒有辦法實現(xiàn)精準控制。因為它是欠驅(qū)動,每個地方的力輸出會隨著自適應(yīng)的情況不同而不同。 這個時候,就需要我們能夠在軟件里,對“繩驅(qū)靈巧手”的各個模塊進行精準的建模。只有你很好地理解這個手在不同條件下會發(fā)生什么樣的變化,你才可能實現(xiàn)精準的控制。
Chapter 3.3 液壓派:追求極致力量的“暴力美學(xué)”


加拿大Sanctuary AI公司就走的液壓驅(qū)動派系。他們的Phoenix機器人配備了21個自由度的液壓手,能夠產(chǎn)生強大的力量輸出。

液壓系統(tǒng)的優(yōu)勢是力量大、響應(yīng)快、功率密度高,能完成高負載任務(wù),但傳統(tǒng)上液壓系統(tǒng)都很龐大。Sanctuary AI的突破在于將液壓組件小型化到硬幣大小,并且經(jīng)過了20億次循環(huán)測試而無泄漏。

這就像是把挖掘機的液壓系統(tǒng)縮小到了手表的尺寸,技術(shù)難度可想而知。不過,液壓系統(tǒng)依然面臨成本、維護、噪音和能效方面的挑戰(zhàn),因此目前主要用于特定工業(yè)和研發(fā)場景。

Chapter 3.4 連桿派:發(fā)揮機械美學(xué)的“優(yōu)雅派”


這一派的代表作是源自韓國研究團隊提出的ILDA靈巧手,通過精巧的連桿設(shè)計實現(xiàn)高自由度動作。它的哲學(xué)是:將驅(qū)動器全部集成在手掌內(nèi)部,用連桿、搖臂、滑塊等機構(gòu)把多個直線動作“分配”到多個關(guān)節(jié),讓手指多個關(guān)節(jié)彎曲,擺出類似人類手指的各種姿態(tài)。

這種方案的優(yōu)點是結(jié)構(gòu)緊湊、自由度高、外形優(yōu)雅,充分展現(xiàn)了機械設(shè)計的美感;但它的缺點也很突出——抗沖擊性較差,在復(fù)雜或高負載場景下可靠性不足,導(dǎo)致整體實用性偏低。

Chapter 3.5 混合派:工程師的“中庸之道


還有一些設(shè)計嘗試將直驅(qū)、繩驅(qū)、連桿機構(gòu)等組合起來,折中成本、重量和性能。例如一些開源或?qū)W術(shù)手就采用連桿+部分驅(qū)動的方案,用較少的執(zhí)行器實現(xiàn)更多自由度,在科研和教學(xué)中很受歡迎。

混合方案之前一直停留在學(xué)術(shù)研究領(lǐng)域,而TetherIA正在通過混合派路線,開發(fā)他們旗下的另外一款高自由度靈巧手方案。他們通過剖析人手的具體功能和結(jié)構(gòu)(結(jié)合繩驅(qū)及拉桿方案),將上面提過的繩驅(qū)、拉桿等方案有機結(jié)合在一起,通過強大的工程化實現(xiàn)能力,開發(fā)出了一款既高效又可靠的高自由度靈巧手方案。

Chapter 3.6 值得一提的“開源派”


他們是亂拳打死老師傅——不拼技術(shù)精度,不比硬件豪華,而是用開源的方式打破行業(yè)壁壘。雖然單個產(chǎn)品可能不如Shadow Robot那樣精密,但它們的威力在于“群狼戰(zhàn)術(shù)”:把靈巧手的價格門檻做到最低,讓全世界的工程師都能玩得起靈巧手,從而反過來推動技術(shù)的進步。

從DexHand到ORCA Hand,越來越多的開源項目正在降低技術(shù)門檻。這就像是Android系統(tǒng)對手機行業(yè)的影響一樣,可能會徹底改變游戲規(guī)則。

而TetherIA在研發(fā)一款高自由度、非常接近人手性能的靈巧手的同時,發(fā)現(xiàn)系統(tǒng)其實可以極致簡化,于是也做出了一款低自由度、但據(jù)說也是市面上性能最好之一的靈巧手。這款靈巧手已經(jīng)在前陣子發(fā)布,并全部開源,售價僅僅為300美元。


團隊對我們說,他們這款靈巧手是極度任務(wù)導(dǎo)向的。雖然自由度較低,但能完成很多接近人手的任務(wù)。那我們就來看看,這雙手已經(jīng)能完成哪些復(fù)雜的任務(wù)。

04 四個Deomo背后的技術(shù)密碼

接下來通過四個TetherIA的最新產(chǎn)品展示demo,我們來看看每個看似簡單的動作背后隱藏著什么樣的技術(shù)挑戰(zhàn)。

Chapter 4.1 抓取螺絲釘

M5螺絲釘直徑只有5毫米,這個demo看起來簡單,實際上是對精細控制能力的終極考驗。


Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 小物體的難度在于也是多方面的:一個是在于它的精準控制能力;另外一個是在于,當你抓小物體的時候,如果力輸出的方向沒有辦法很好的配合,往往會把小物體抓飛。這其實都體現(xiàn)了:既要有硬件設(shè)計上實現(xiàn)很好的自適應(yīng),以及力輸出的一致性,另外其實也是我們整個軟件系統(tǒng)要相應(yīng)配合,實現(xiàn)對這個相對復(fù)雜的“繩驅(qū)靈巧手”的精準操作。
Chapter 4.2 抓取大物件

抓大盒子的挑戰(zhàn)完全不同。這時候,機器人手只有指尖的一小部分在接觸物體,就像是用指甲尖去抓握一個籃球。


Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 因為這個盒子幾乎和機器人的手一樣大,因此必須非常精準地去抓住它?;旧线@種情況下,你只能用指尖來施力,也就是靠機器手最后一節(jié)關(guān)節(jié)來提供力量。所以對于機械手來說,這樣的抓取就變得相當棘手。這個盒子的大小,已經(jīng)是人手大小能夠抓的最接近的尺寸了。手的大小對于人類來說是限制,對于機器人靈巧手來說也是。但是你可以看到我們的靈巧手,對于處理這種接近它手大小極限的物體的時候也是沒有問題的。
Chapter 4.3 開可樂

開可樂是最讓人印象深刻的dem,因為它真正展現(xiàn)了機器人手的“人性化”特征。


Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 這是體現(xiàn)了我們硬件結(jié)構(gòu)設(shè)計上的一些創(chuàng)新,以及我們對手的實用性的一些理解。我們覺得,其實人在很多情況下,指甲都起到很重要的作用。一個就是您剛才提到的可樂瓶,我們需要有一個自適應(yīng),能夠在狹小的空間里實現(xiàn)相對較大的力輸出。 另外,在生活中很多細節(jié)上,比如洗菜、做飯、剝菜的過程中,其實都會用到。我們這里不僅僅是一個“指甲”,更重要的是手前端的設(shè)計,能夠用軟物質(zhì)包裹,自適應(yīng),而且曲率非常接近人手的曲率,所以才能夠?qū)崿F(xiàn)這些功能。


我本來想使個壞,使勁搖晃了下可樂罐,本來想讓靈巧手給我開個“噴氣式”可樂的,但是...怎么這么平靜?這次使壞失敗,大家如果知道怎么能讓可樂罐搖晃打開能噴出來的給我留個言,我下次再去找靈巧手試試。

Chapter 4.4 拿iPhone——桌面操作的“終極考驗”

這個看似最簡單的動作,實際上是技術(shù)含量最高的。iPhone緊貼桌面,手指必須伸入只有幾毫米的縫隙中,還不能與桌面發(fā)生硬碰撞。


Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 我們發(fā)現(xiàn)iPhone其實是一個非常窄小的空間,需要在這個狹小空間里使用比較大的力,并且拿穩(wěn)。這個過程中有若干難點,其中一個難點是:很多靈巧手的末端設(shè)計,如果曲率是向外的,在抓的過程中,力的方向會斜向外,不容易抓穩(wěn)。 另外一個難點是:抓的時候,手指會不可避免地跟桌面接觸,從而增加靈巧手損傷的概率。我們的手能解決這些問題:一是有自適應(yīng)過程,在抓的時候能夠調(diào)整力的方向,讓它抓穩(wěn)并拿起來;二是因為我們是“繩驅(qū)”方案,讓手在接觸桌面的時候自適應(yīng),而不是直接碰撞和對抗,從而減少損傷。
05 AI大模型時代的靈巧手

目前,我們正處在一個特殊的歷史時刻:AI大模型的突破為機器人技術(shù)帶來了前所未有的可能性。

比如前面說的Vision-Language-Action(VLA)模型,就給機器人的“大腦升級”。傳統(tǒng)的機器人需要為每個任務(wù)編寫專門的程序,而VLA模型讓機器人能夠理解自然語言指令,并將其轉(zhuǎn)化為具體的動作。這就像是給機器人裝上了“翻譯機”——它能夠?qū)ⅰ皫臀业贡边@樣的自然語言翻譯成具體的動作序列。


Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 我們發(fā)現(xiàn)我在做的過程當中靈巧手的操縱很大的一個難點,就是如何進行遙操。因為它的自由度比較多會比夾爪復(fù)雜很多,特別是對于我們繩驅(qū)的方案,所以我們基于這個痛點做了一款A(yù)I小腦,這個AI小腦在用戶操縱的過程當中能夠?qū)崿F(xiàn)自適應(yīng),對于不同的任務(wù),用戶并不需要精準地告訴操縱我們靈巧手的力輸出甚至力輸出的方向,手會給予任務(wù)來進行自適應(yīng)的調(diào)整,極大的提高了這個遙操的絲滑程度。


此外,Sim2Real(仿真到現(xiàn)實)技術(shù)正在解決機器人訓(xùn)練的成本問題。在虛擬環(huán)境中,機器人可以進行數(shù)百萬次的試錯,而不用擔心損壞硬件。但是,仿真和現(xiàn)實之間總是存在差距。

Evan Tao TetherIA聯(lián)合創(chuàng)始人兼CEO 這個的確是機器人在做的過程中的一些難點,主要是在于,因為物理世界是非常復(fù)雜的,我們仿真的過程中肯定是簡化了很多的一些參數(shù)。比如像物體比較多的摩擦力、剛性、柔軟的程度,仿真的模型并不能夠很好的去體現(xiàn)。并且我們在物理世界設(shè)計機械手、生產(chǎn)機械手的過程也會有一些的誤差,所以這也是我們一直在克服的東西。

這就像是在游戲中練習開車和在現(xiàn)實中開車的區(qū)別——基本技能可以學(xué)會,但真正的路感還是需要實際體驗。

不僅如此,甚至在硬件上,AI也在發(fā)力。機器人昂貴的一個原因,是它的供應(yīng)鏈比較缺乏。很多這種驅(qū)動器都是專門為了機器人定制的,目前來說產(chǎn)量也比較低,所以整個行業(yè)的成本還沒有辦法做得非常便宜。并且,傳統(tǒng)機器人的設(shè)計是通過不斷提高產(chǎn)品的精度,來實現(xiàn)很多高級、炫酷的功能。但是現(xiàn)在有了AI的加持,對機器人硬件的精度要求就不會再繼續(xù)那么高,所以整體的價格我們相信會越來越低。


而TetherIA推出的這款繩驅(qū)方案的開源靈巧手,就是想讓硬件以便宜的價格被更多機器人和科技愛好者所采用,在此之上去更好的用AI開發(fā)軟件來加速靈巧手和機器人的技術(shù)進步。

Xu Dong TetherIA聯(lián)合創(chuàng)始人兼CTO 我們這款低自由度的產(chǎn)品,是結(jié)合了我們在設(shè)計高自由度的過程當中,對于整個整體結(jié)構(gòu)設(shè)計的一些經(jīng)驗,然后并且采用了市面上主流的off-the-shelf(現(xiàn)成的)的這種電機,所以能夠做到極致的低成本。


Evan Tao TetherIA聯(lián)合創(chuàng)始人兼CEO 我們的計劃和特斯拉是不一樣的,因為我們不像特斯拉有那么多的資金去完全投入在研發(fā)中,我們是要和我們的社群一起去成長的過程。為什么我們對我們低自由度的手非常有信心,而且覺得會是一個爆款的產(chǎn)品,是在于我們通過300美金的硬件成本能夠做到超越別人幾千美金、甚至幾萬美金的產(chǎn)品的功能性。這樣的好處是,不僅僅是很多很頂尖的公司和很頂尖的科研院所可以使用這樣的產(chǎn)品,更多的愛好者也可以一起參與到這個靈巧手算法的應(yīng)用的開發(fā)過程中來。

這就像是Google的Android策略——雖然蘋果的iOS可能在單個產(chǎn)品上更優(yōu)秀,但Android通過開放生態(tài)獲得了更大的市場份額。而且通過開源硬件,全世界的研究者都成為數(shù)據(jù)貢獻者。

06 機器人走進家庭的前夜:從擁有一雙真正靈巧的手開始

回顧機器人靈巧手的發(fā)展史,其實就是人類技術(shù)進步的一個縮影。我們從模仿自然開始,逐步理解其中的原理,然后用工程的方式去實現(xiàn),最終可能會超越自然的原型。

我們在采訪中發(fā)現(xiàn),TetherIA的故事特別有意思,因為它代表了一種新的發(fā)展模式:通過開源降低門檻,通過眾包加速創(chuàng)新,通過生態(tài)建設(shè)推動產(chǎn)業(yè)發(fā)展。這就像是Linux對操作系統(tǒng)行業(yè)的影響,或者Android對移動行業(yè)的影響一樣。

當然,從300多美元的開源版本到真正實用的家庭機器人,這中間還有很長的路要走。技術(shù)上的挑戰(zhàn)、成本上的壓力、應(yīng)用場景的探索,每一個環(huán)節(jié)都充滿了不確定性。


但是,正如受訪者在采訪最后說的那樣:我們相信五年之后,我們會看到機器人在很多地方部署,它不會是一個停留在視頻里或者概念里的東西,就像我們現(xiàn)在每天接觸ChatGPT一樣,它會真正在我們生活當中產(chǎn)生巨大的價值。

也許再過數(shù)年,我們回頭看2025年,會發(fā)現(xiàn)這是機器人真正走向普及的起點。到那時,每個家庭都可能有一個機器人助手,能夠幫我們做飯、打掃、照顧老人、陪伴孩子。而這一切的起點,就是讓機器人擁有一雙真正靈巧的手。

以上就是我們機器人系列的第一期的內(nèi)容,之后我們還會走訪硅谷明星初創(chuàng)公司和一線研發(fā)機器人的團隊,從大腦、AI算法、數(shù)據(jù)、腦機接口等多個維度來深度聊聊機器人如今的研發(fā)現(xiàn)狀。關(guān)于機器人,大家還有什么想問的、想聊的,歡迎在評論區(qū)一起告訴我們吧。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
超薄+eSIM!華為新機首秀:10月1日,這配置太炸裂了

超薄+eSIM!華為新機首秀:10月1日,這配置太炸裂了

手機講壇
2025-10-01 00:28:14
70歲老漢半夜心梗離世,醫(yī)生提醒:夜間再口渴,也不要喝這5種水

70歲老漢半夜心梗離世,醫(yī)生提醒:夜間再口渴,也不要喝這5種水

白宸侃片
2025-09-29 15:52:18
徹底爆了!昆明多家公司已停止接單

徹底爆了!昆明多家公司已停止接單

掌上春城
2025-09-30 22:13:23
撤回版權(quán)不到一年,54歲的刀郎再次傳來喜訊,給云朵上了一課

撤回版權(quán)不到一年,54歲的刀郎再次傳來喜訊,給云朵上了一課

楓塵余往逝
2025-10-01 00:01:44
美媒:法國達索公司首席執(zhí)行官提議,向中國臺灣地區(qū)出售“陣風”

美媒:法國達索公司首席執(zhí)行官提議,向中國臺灣地區(qū)出售“陣風”

零度Military
2025-09-30 13:14:56
江蘇一公司老板季晨陽去世,提新車沒多久,女兒12歲,妻子很漂亮

江蘇一公司老板季晨陽去世,提新車沒多久,女兒12歲,妻子很漂亮

史行途
2025-09-29 15:36:45
四川倆兄弟去世,哥哥7歲剛上一年級,搬新家僅8天,媽媽透露死因

四川倆兄弟去世,哥哥7歲剛上一年級,搬新家僅8天,媽媽透露死因

180視角
2025-09-30 12:55:34
江蘇省人民代表大會常務(wù)委員會決定免職名單

江蘇省人民代表大會常務(wù)委員會決定免職名單

魯中晨報
2025-09-30 12:31:05
比爾:和哈登合作讓我感到興奮,我希望能夠長期留在快船效力

比爾:和哈登合作讓我感到興奮,我希望能夠長期留在快船效力

稻谷與小麥
2025-10-01 01:56:36
開懷暢飲!追夢:巴特勒的酒窖像皇帝的一樣

開懷暢飲!追夢:巴特勒的酒窖像皇帝的一樣

林子說事
2025-09-30 15:43:26
1950年5000土匪圍攻138名解放軍,生死一線時一句話,奇跡發(fā)生了

1950年5000土匪圍攻138名解放軍,生死一線時一句話,奇跡發(fā)生了

天夢見證
2025-09-26 22:51:28
美人口不到3.35億,俄不到1.5億,為何中國14億人還擔憂人口問題

美人口不到3.35億,俄不到1.5億,為何中國14億人還擔憂人口問題

科普100克克
2025-09-29 07:31:16
研究發(fā)現(xiàn):馬齒莧可在48小時內(nèi)清除肝臟80%的毒素,是真的嗎?

研究發(fā)現(xiàn):馬齒莧可在48小時內(nèi)清除肝臟80%的毒素,是真的嗎?

素衣讀史
2025-09-30 10:38:13
斯諾克國錦賽連爆大冷:斯佳輝晉級,王雨晨爆冷,中國豪取4連勝

斯諾克國錦賽連爆大冷:斯佳輝晉級,王雨晨爆冷,中國豪取4連勝

老垯科普
2025-10-01 00:18:35
江西46歲富豪猝死:戴金佛珠、老婆29歲、女兒才3歲,結(jié)果命沒了

江西46歲富豪猝死:戴金佛珠、老婆29歲、女兒才3歲,結(jié)果命沒了

禾寒敘
2025-09-30 19:13:57
可惜:中超30歲名將參加蘇超,曾被稱為白斬雞,如今委身業(yè)余賽場

可惜:中超30歲名將參加蘇超,曾被稱為白斬雞,如今委身業(yè)余賽場

國足風云
2025-09-30 11:23:02
李蘭迪拍沙漠大片遇尷尬?褲襠鼓包似山,網(wǎng)友:顏值這回難救場!

李蘭迪拍沙漠大片遇尷尬?褲襠鼓包似山,網(wǎng)友:顏值這回難救場!

智凌縱橫
2025-09-15 09:27:37
收割機從兩墳之間開過被索要3萬,當?shù)嘏沙鏊翰粚儆谇迷p勒索

收割機從兩墳之間開過被索要3萬,當?shù)嘏沙鏊翰粚儆谇迷p勒索

映射生活的身影
2025-09-28 10:52:36
2018年世界杯法國隊奪冠主力現(xiàn)狀:僅有姆巴佩一人還是球隊主力

2018年世界杯法國隊奪冠主力現(xiàn)狀:僅有姆巴佩一人還是球隊主力

天光破云來
2025-10-01 01:29:20
一場被視為“虐狗”的攀登:盲人王營營,和她未登頂?shù)奶┥?>
    </a>
        <h3>
      <a href=新京報
2025-09-30 12:35:32
2025-10-01 06:08:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
124463文章數(shù) 861129關(guān)注度
往期回顧 全部

科技要聞

宇樹回應(yīng)機器人安全漏洞:已完成大部分修復(fù)

頭條要聞

以軍一天內(nèi)襲擊加沙多地 已致59人死亡

頭條要聞

以軍一天內(nèi)襲擊加沙多地 已致59人死亡

體育要聞

詹姆斯:愿為東契奇調(diào)整打法 失去熱愛時就會退役

娛樂要聞

和張藝謀離婚后,前妻肖華現(xiàn)狀

財經(jīng)要聞

洽洽凈利暴跌73% 經(jīng)銷商遭壓貨被迫清盤

汽車要聞

升級端到端高快NOA 上汽大眾Pro家族2026款上市

態(tài)度原創(chuàng)

教育
藝術(shù)
時尚
數(shù)碼
家居

教育要聞

孩子不愿意讀書,怎么辦?

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

救命!馬思純都瘦脫相了,她到底經(jīng)歷了什么?

數(shù)碼要聞

OPPO Find X9系列新品發(fā)布會再預(yù)熱:Pad 5、Watch S同步亮相

家居要聞

市區(qū)綠洲 鏈接社區(qū)商業(yè)

無障礙瀏覽 進入關(guān)懷版 国产真人无码作爱视频免费| 性生活一aAV一欧美一中式| 亚洲综合Aⅴ一区二区三区| 久久免费少妇| 日本东京热官网| 最新亚洲人成网站在线影院| 伊人久久综合| 一级毛片基地| 综合色婷婷一区二区亚洲欧美国产| 亚洲熟女一区大奶| 西西大胆午夜人体视频| 天天日日夜夜| 业余 自由 性别 成熟视频 视频| FC2免费人成在线视频| xxxx欧美xxxx短片| 成熟熟女国产一区二区| 医院人妻闷声隔着帘子被中出| 精品粉嫩国产一区二区三区| 无码日韩人妻AV一区二区三区 | 一区二区在线欧美日韩中文| xxx/国产50| 国产精品美女久久久久| 操操爽人人爽| 亚洲国产精品久久电影欧美| 久久天堂综合亚洲伊人HD | 奇米影视最新电影电视剧| 亚洲色无码中文字幕在线| 丰满熟女大屁股水多多| 精精国产xxxx视频在线播放| 亚洲精品无码不卡在线| 人妻少妇国语| 爆乳熟妇一区二区三区爆乳视频| 忘忧草日本高清频道| 亚洲综合熟女久久久30p| 国产成人亚洲精品青草| 午夜精品久久久久久久无码护士| 任你躁在线精品免费6| 国产国拍亚洲精品永久不卡| 日韩精品卡2卡3卡4卡5| 久欠精品国产77777| 熟妇人妻av无码一区二区三区|