衡宇 發(fā)自 上海
量子位 | 公眾號 QbitAI
好你個稚暉君,居然搞突襲,一腳踹飛了機器人二次開發(fā)的高門檻。
在智元機器人首屆合作伙伴大會上,智元機器人聯合創(chuàng)始人、CTO稚暉君(彭志輝),發(fā)布了機器人動作與表達創(chuàng)作平臺靈創(chuàng)平臺(LinkCraft)。
他首先陳述了一個當下的現象:
大家能看到網上有很多展示機器人靈活、生動、自然表現的視頻,但翻來覆去就那幾段動作。
對此,他的解釋是這樣的——
這些機器人的開發(fā)門檻太高了,想要讓機器人實現這種高動態(tài)的全身控制,需要有非常深厚的強化學習加模仿學習的訓練技巧——這都是專業(yè)人士才能做的事情。
所以一般都是由廠商針對某些問題訓得比較好之后,開放OTA升級,升級一個動作的OTA,機器人才能多會一個動作。
因為希望有一個方便大家二次開發(fā)機器人的東西,所以智元推出了靈創(chuàng)平臺。
它被稚暉君稱為殺手級應用。
靈創(chuàng)平臺是個啥?
靈創(chuàng)平臺定位為一個AI加持、面向創(chuàng)作者和開發(fā)者的機器人動作與表達創(chuàng)作平臺,未來愿景是“讓機器人像人一樣表達,讓創(chuàng)作者像導演一樣自由編排”。
具體來說,你買回來一臺人形機器人,想要它有demo視頻中的良好表現,或者無痛學會新的動作技能,不需要再費勁訓練它。
丟給靈創(chuàng)平臺,像用剪映剪視頻一樣,在3D場景里“剪輯”你想讓機器人完成的行為。
底層邏輯很清晰——
用AI把機器人二次開發(fā)復雜的過程抽象成一個個模塊化工具,以此支持機器人動作的自由編排和表達定制。
稚暉君介紹時表示:“以往的機器人動作演示需要專業(yè)人員進行調試,操作難度較大,靈創(chuàng)平臺可以提供各類標準動作模板,降低創(chuàng)作者編排調試機器人動作演示的難度。”
用戶生成自創(chuàng)機器人動作后,就成了自己的資產,不僅能反復調用,還可以與他人共享、組合、混剪。
稚暉君介紹,這套玩法背后是智元一整套自研AI模型在底層托舉。
據悉,靈創(chuàng)平臺并不是為某一臺機器人量身打造的。
當前靈創(chuàng)平臺已經適配了智元旗下的人形機器人靈犀X2,以后將擴展至更多形態(tài)的硬件設備。
今年10月,靈創(chuàng)平臺將上線beta版本。
所謂“0門檻”,怎么用?
稚暉君在大會現場展示了靈創(chuàng)平臺的用法——
在電腦或手機上打開靈創(chuàng)平臺官網,屏幕分左右兩欄。
左邊有包含動作庫、prompt輸入區(qū)等在內的各種選項,右邊窗口負責預覽和更精細調整機器人動作。
最簡單的用法,就是在左側的既定動作庫中,選擇你想讓機器人學會的新動作,比如打哈欠、揮手、鞠躬、鼓掌……隨點隨看,每一個動作都實時在右側窗口預覽。
如果你覺得它學得還ok,就可以給現實世界里的機器人安排上了。
有沒有感覺到,照這個辦法,以前有0代碼編程,現在有0代碼二次開發(fā)機器人了~
官方介紹也表示,靈創(chuàng)平臺“可將機器人二次開發(fā)難度降低到0門檻”。
稚暉君介紹,靈創(chuàng)平臺動作庫中目前已有上百個標準化動作,智元官方還會繼續(xù)填充動作庫。
這里有個有點意思的玩法,用戶有自己想“教”機器人的動作,可以錄制一段真人演示視頻(不需要任何動捕設備),上傳到靈創(chuàng)平臺,AI會識別原視頻中人物肢體動作,再由AI作retarget,變成右邊窗口里能預覽的機器人成品動作效果。
根據動作難度的不同,訓練時間從幾十秒到幾十個小時不等。
右側的窗口里,可以靠拖動來增減具體參數,進行更精細的動作編輯,對機器人動作“逐幀雕刻”。
此外,靈創(chuàng)平臺可以根據用戶上傳的音頻,自動分析其中的語義和情緒,并生成與之匹配的自然動作。
比如給它一段悲傷語調的音頻,靈創(chuàng)平臺會生成機器人耷拉肩膀、低頭的動作。
另一個功能很像“演繹編排”:
在靈創(chuàng)平臺輸入文本,AI合成語音,然后選定想要的詞語,規(guī)定說該詞語時對應要做出的動作,機器人就能按部就班地乖乖聽話開始它的“表演”。
One More Thing
大會現場,智元秀出了新款機器人:
靈犀X2-W。
這是一款收納起來占地不到0.5㎡的輪足式人形機器人,具備高自由度雙臂及仿生手腕以及靈巧三指手,目前尚處原型階段。
在現場播放的靈犀X2-W展示視頻中,它彎曲“膝蓋”,用手打開了掃地機器人的開關,掃地機器人麻溜工作去了。
能理解,為了展示它各個方面的能力嘛!
但一瞬間幻視迪士尼IP某經典畫面:
大家都是狗,但高飛是“人”,得牽狗繩出門遛布魯托(頂鍋蓋跑開)。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.