時(shí)令 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
不怕故障的機(jī)器人大腦來(lái)了!
肢體斷裂?馬達(dá)卡???通通沒(méi)問(wèn)題。
只要機(jī)器人身體能動(dòng),這個(gè)大腦就能讓它動(dòng)起來(lái)。
踩高蹺?適應(yīng)外力?負(fù)載重物?也是so easy。
除此之外,它還能完成更精細(xì)的動(dòng)作,比如放置碗碟。
這個(gè)大腦,就是估值已達(dá)45億美元(截至今年6月)的Skild AI新推出的Skild Brain,它在一個(gè)包含十萬(wàn)種機(jī)器人姿態(tài)的虛擬環(huán)境中,訓(xùn)練了相當(dāng)于一千年的時(shí)間才得以成型。
更值得一提的是,此模型從未在這些機(jī)器人上進(jìn)行過(guò)訓(xùn)練,它對(duì)它們的控制能力完全是涌現(xiàn)出來(lái)的。
下面具體來(lái)看。
只要機(jī)器人能動(dòng),大腦就能讓它動(dòng)
由于生活中總有很多事情是難以預(yù)料的,所以即使很多機(jī)器人在視頻中表現(xiàn)驚人,但在現(xiàn)實(shí)生活中卻不可避免要面臨失敗。
為什么會(huì)這樣呢?
答案就在于機(jī)器人的編程方式。
以機(jī)器人的運(yùn)動(dòng)為例,大多數(shù)控制器都是針對(duì)特定機(jī)器人訓(xùn)練的,控制它的AI會(huì)記住該機(jī)器人的運(yùn)動(dòng)策略,就像是記住了考試答案一樣,對(duì)通過(guò)考試有用,但對(duì)學(xué)習(xí)如何得出答案卻毫無(wú)幫助。
當(dāng)AI面臨從未見(jiàn)過(guò)的情況,例如馬達(dá)卡住、肢體斷裂或者是全新的身體時(shí),記住的方案就毫無(wú)用處。
Skild AI是如何解決的呢?
他們?cè)O(shè)計(jì)了一個(gè)AI無(wú)法作弊的“測(cè)試”,讓其不僅學(xué)習(xí)控制一臺(tái)機(jī)器人,而是訓(xùn)練它去控制一個(gè)擁有不同身體形態(tài)的機(jī)器人多元宇宙。
這時(shí),它就無(wú)法為某一臺(tái)機(jī)器人記住固定的解決方案,而是要找到適用于所有機(jī)器人的通用策略。
基于上述思想,Skild AI創(chuàng)造了一個(gè)包含十萬(wàn)臺(tái)不同機(jī)器人的宇宙。在經(jīng)過(guò)一千年的模擬時(shí)間后,系統(tǒng)涌現(xiàn)出了一個(gè)能夠適應(yīng)陌生場(chǎng)景的大腦。
這個(gè)大腦可以在面對(duì)陌生場(chǎng)景時(shí)快速匹配十萬(wàn)種身體中的任意一種。
比如把一臺(tái)四足機(jī)器人放置在直立位置,并啟動(dòng)它的大腦。大腦被喚醒時(shí),完全不知道自己控制的是什么身體。
出乎意料的是,它竟然決定將這臺(tái)機(jī)器人當(dāng)作一個(gè)小型人形來(lái)控制,而不是四足機(jī)器人。
但由于普通的人形機(jī)器人有踝關(guān)節(jié)馬達(dá)和寬大的雙腳來(lái)保持穩(wěn)定,這個(gè)被限制前腿的四足機(jī)器人腿部只有一個(gè)被動(dòng)旋鈕,與地面只有一個(gè)接觸點(diǎn)。
所以這個(gè)新大腦必須在極短時(shí)間內(nèi)判斷出身體類(lèi)型并穩(wěn)定姿態(tài)。但由于時(shí)間太短,機(jī)器人還是摔倒了。
這難道就是大腦的極限了嗎?當(dāng)然不可能。新大腦還能從失敗中進(jìn)行上下文學(xué)習(xí),即使機(jī)器人在第一次和第二次嘗試時(shí)都失敗了,但在第三次獲得了成功。
這就得提提Skild Brain非凡的記憶力了,大多數(shù)機(jī)器人的控制策略?xún)?nèi)存都只有幾百毫秒,但是這個(gè)新大腦的上下文窗口比前者長(zhǎng)了100多倍。
此外,團(tuán)隊(duì)還嘗試將機(jī)器人的大小腿綁在一起,以模擬其失去肢體的情況。
這一操作不僅縮短了機(jī)器人的肢體長(zhǎng)度,還讓其減少四個(gè)自由度。起初,機(jī)器人并沒(méi)有辦法進(jìn)行有效移動(dòng),只能十分吃力的原地踏步。
然而,在經(jīng)過(guò)7-8秒的適應(yīng)后,新大腦發(fā)現(xiàn)大幅度擺動(dòng)大腿關(guān)節(jié)可克服困境,最終成功實(shí)現(xiàn)了有效行走。與此同時(shí),僅針對(duì)單一機(jī)器人訓(xùn)練的專(zhuān)用控制器則徹底失敗,甚至翻倒。
不僅如此,團(tuán)隊(duì)還通過(guò)在軟件中鎖定機(jī)器人膝蓋來(lái)模擬關(guān)節(jié)故障,這會(huì)使四足機(jī)器人變成三足機(jī)器人,而此前它并未接受過(guò)這種訓(xùn)練。
最開(kāi)始,機(jī)器人會(huì)向前傾斜,但后來(lái)它學(xué)會(huì)了將重心向后轉(zhuǎn)移到三條腿上,甚至在適應(yīng)2-3秒后就能行走。此類(lèi)行為同樣也發(fā)生在輪式四足機(jī)器人身上。
那如果突然把機(jī)器人的輪子卡住呢?
這個(gè)大腦會(huì)感知到發(fā)送給車(chē)輪的指令不再使機(jī)器人前進(jìn),隨后,它會(huì)切換到類(lèi)似標(biāo)準(zhǔn)雙足機(jī)器人的行走步態(tài),當(dāng)車(chē)輪再次解鎖時(shí),大腦會(huì)重新切換回更高效的滾動(dòng)模式。
為了更有效地測(cè)試機(jī)器人面對(duì)不同情況時(shí)的平衡狀況,團(tuán)隊(duì)還給其腿部安裝了額外的支柱,也就是讓機(jī)器人踩高蹺。
可以看出,剛開(kāi)始機(jī)器人邁出的幾步很不穩(wěn)定,但其很快就能調(diào)整步頻和腳的位置,以適應(yīng)更長(zhǎng)的腿部。
Skild AI認(rèn)為,未來(lái)在物理世界中能實(shí)現(xiàn)可靠運(yùn)行的AGI絕不是僅僅依靠記憶,它必須具備適應(yīng)世界的能力,而實(shí)現(xiàn)這一目標(biāo)的途徑就是訓(xùn)練一個(gè)可以控制所有身體的“大腦”。
Skild AI公司介紹
Skild AI創(chuàng)立于2023年,旨在開(kāi)發(fā)適用于不同硬件和任務(wù)的自適應(yīng)AI大腦,擁有約6名員工,總部位于賓夕法尼亞州匹茲堡,共有Deepak Pathak和Abhinav Gupta兩位創(chuàng)始人。
Deepak Pathak,本科就讀于印度理工學(xué)院坎普爾分校,博士畢業(yè)于加州大學(xué)伯克利分校,隨后繼續(xù)在該學(xué)校從事博士后研究。曾在Meta擔(dān)任了一年的研究員,現(xiàn)任卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院助理教授。
在學(xué)術(shù)方面,他的總被引次數(shù)已超2.7w,h-index為52,i10-index達(dá)92。
另一位創(chuàng)始人Abhinav Gupta,本科也就讀于印度理工學(xué)院坎普爾分校,博士畢業(yè)于馬里蘭大學(xué),隨后在卡內(nèi)基梅隆大學(xué)擔(dān)任博士后研究員,現(xiàn)為該學(xué)校教授。
他還曾在谷歌擔(dān)任過(guò)兩年計(jì)算機(jī)視覺(jué)和大規(guī)模視覺(jué)學(xué)習(xí)項(xiàng)目的教師顧問(wèn),后在Meta擔(dān)任過(guò)四年的研究經(jīng)理兼組長(zhǎng),在多個(gè)領(lǐng)域取得了若干關(guān)鍵創(chuàng)新,包括自監(jiān)督學(xué)習(xí)、觸覺(jué)感知、機(jī)器人導(dǎo)航和操作等。
Abhinav Gupta的論文總被引次數(shù)已超8萬(wàn),h-index為117,i10-index達(dá)323。
自2023年成立以來(lái),Skild AI除了完成1450萬(wàn)美元的種子輪融資外,還完成了A、B兩輪融資,共籌集4.14億美元,確立了其在人工智能機(jī)器人創(chuàng)新領(lǐng)域的領(lǐng)先地位。
2024年7月,Skild AI完成A輪融資3億美元,資金將用于擴(kuò)展Skild的機(jī)器人AI基礎(chǔ)模型、擴(kuò)充團(tuán)隊(duì)規(guī)模以及推進(jìn)產(chǎn)品開(kāi)發(fā),當(dāng)時(shí),該公司的估值已達(dá)15億美元。
今年6月,Skild AI融資1億美元,旨在支持公司的市場(chǎng)擴(kuò)張,并建立戰(zhàn)略合作伙伴關(guān)系,以加速其物理AI機(jī)器人平臺(tái)的部署。此輪融資使Skild的估值達(dá)到45億美元。
除此之外,Skild AI的主要投資者也可圈可點(diǎn),包括但不限于軟銀、光速創(chuàng)投、英偉達(dá)、三星、紅杉資本、亞馬遜、卡內(nèi)基梅隆大學(xué)和凱迪拉克等。
參考鏈接:
[1]https://x.com/SkildAI/status/1970940614234771579
[2]https://www.skild.ai/blogs/omni-bodied
[3]https://exa.ai/websets/directory/skild-funding?utm_source=chatgpt.com
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.