經(jīng)典機(jī)器人設(shè)計(jì)通常依賴機(jī)器人專家和機(jī)械工程師的經(jīng)驗(yàn)進(jìn)行正向設(shè)計(jì),并針對空間可達(dá)性、結(jié)構(gòu)強(qiáng)度、重量分布、重復(fù)精度等特性進(jìn)行有選擇性的優(yōu)化。這個過程非常依賴設(shè)計(jì)師的經(jīng)驗(yàn),并且迭代周期較長,需要開發(fā)出數(shù)個版本的實(shí)體硬件進(jìn)行測試、迭代,導(dǎo)致研發(fā)成本較高。而且在應(yīng)用場景及任務(wù)更加復(fù)雜時,經(jīng)典設(shè)計(jì)的本體及末端執(zhí)行器構(gòu)型等在機(jī)器人任務(wù)執(zhí)行成功率、執(zhí)行效率、硬件成本等方面不能達(dá)到最優(yōu)。
依賴AI技術(shù),尤其是基于Sim2Real具身智能引擎,跨維智能開始嘗試是否能夠比經(jīng)典方法更高效地探索廣泛的設(shè)計(jì)空間,最大化強(qiáng)度同時最小化材料使用的創(chuàng)新結(jié)構(gòu),能夠像AlphoGo之于人類經(jīng)典棋譜一樣,突破思維定式,實(shí)現(xiàn)機(jī)器人本體的更優(yōu)的設(shè)計(jì)。
在“AI定義本體”的機(jī)器人研發(fā)發(fā)展趨勢下,跨維在這方面進(jìn)行了首次嘗試。近日,跨維智能首款A(yù)I定義的具身智能機(jī)器人W1即將全球發(fā)布。該機(jī)器人由跨維智能從電機(jī)開始全棧自研,包含基于AI的機(jī)械結(jié)構(gòu)設(shè)計(jì)優(yōu)化、控制系統(tǒng)開發(fā)、感知系統(tǒng)搭建以及具身智能大模型等各個模塊,機(jī)器人本體在技術(shù)協(xié)同性、整體穩(wěn)定性等方面更具優(yōu)勢,能更好、更精準(zhǔn)、更快速地展現(xiàn)具身智能大腦的能力,賦予大腦一個“指哪打哪”的軀體,展現(xiàn)出更強(qiáng)勁的性能表現(xiàn)。
▍具身智能機(jī)器人最高效演化與訓(xùn)練場
技術(shù)實(shí)現(xiàn)上,具身智能機(jī)器人W1首先得益于跨維自研DexVerse?引擎,這是全球少有的空間與具身智能模型訓(xùn)練引擎,具備“三維數(shù)字資產(chǎn)生成-物理仿真-數(shù)據(jù)合成與標(biāo)注計(jì)算-模型訓(xùn)練-模型驗(yàn)證”全鏈條自動化能力,是空間智能、具身智能、生成式AI的核心底座。
機(jī)器人想要實(shí)現(xiàn)靈巧操作,預(yù)先訓(xùn)練具身智能模型是一條捷徑。DexVerse?引擎作為人形機(jī)器人及不同形態(tài)具身智能機(jī)器人的最佳設(shè)計(jì)與演化場,能以落地場景和靈巧操作技能為目標(biāo),通過設(shè)計(jì)強(qiáng)化學(xué)習(xí)獎懲函數(shù),以可微仿真的方式優(yōu)化機(jī)器人構(gòu)型、運(yùn)動學(xué)、動力學(xué)等參數(shù),實(shí)現(xiàn)針對作業(yè)場景及技能的最佳機(jī)器人形態(tài)。
基于Sim2Real具身智能引擎,W1具身智能機(jī)器人就在本體設(shè)計(jì)上輕松實(shí)現(xiàn)了包含機(jī)器人任務(wù)執(zhí)行目標(biāo)、機(jī)器人構(gòu)型及運(yùn)動學(xué)和動力學(xué)參數(shù)空間、可微物理仿真引擎等幾個關(guān)鍵模塊。通過強(qiáng)化學(xué)習(xí)等方式,跨維智能還針對目標(biāo)場景和機(jī)器人任務(wù)技能,在參數(shù)空間中進(jìn)行離散加局部連續(xù)優(yōu)化的方式,實(shí)現(xiàn)本體的更優(yōu)設(shè)計(jì);而且這種方式也能實(shí)現(xiàn)針對末端執(zhí)行器以及機(jī)器人外觀形態(tài)等方面的更優(yōu)設(shè)計(jì)。
在機(jī)器人優(yōu)化方式上,基于Sim2Real具身智能引擎也可以采用模塊化設(shè)計(jì)加樹狀搜索的方式,降低學(xué)習(xí)成本,提升優(yōu)化效率。這種方式能夠在Sim2Real具身智能訓(xùn)練場中,跟機(jī)器人技能訓(xùn)練統(tǒng)一目標(biāo),在一個框架體系下完成,實(shí)現(xiàn)本體設(shè)計(jì)與任務(wù)技能學(xué)習(xí)的統(tǒng)一。
目前,跨維基于DexVerse?引擎,形成了包括具身智能感知套件、RoPilot新一代機(jī)器人控制器、移動操作式復(fù)合機(jī)器人等一系列軟硬件產(chǎn)品,以AnyPick, AnyPlace, AnyInsert, AnySort, AnyScrew等通用技能,賦能智能制造、商業(yè)服務(wù)、家庭助理等業(yè)務(wù)板塊。
▍“大腦+小腦+感知”擦出最閃亮“本體”火花
具身智能機(jī)器人要想大批量落地,大腦、小腦和感知缺一不可。
在一個完整的具身智能機(jī)器人中,往往需要“大腦”負(fù)責(zé)智能規(guī)劃與決策、自然認(rèn)知與人機(jī)交互、多模態(tài)感知與精確定位;“小腦”負(fù)責(zé)高精度自適應(yīng)運(yùn)動控制與身體感知與反饋;傳感器作為機(jī)器人“感知”物理世界的窗口,才能更好實(shí)現(xiàn)任務(wù)執(zhí)行和落地。
跨維智能憑借強(qiáng)力的研發(fā)團(tuán)隊(duì),在具身智能機(jī)器人W1就做到了“大腦+小腦+感知”的融合,最完整大小腦團(tuán)隊(duì)在W1機(jī)器人這個整體上迸發(fā)出創(chuàng)新的火花。
- 港中文(深圳)賈奎教授帶隊(duì)組成“最強(qiáng)大腦”
“大腦”是具身智能機(jī)器人的核心,由“認(rèn)知-感知-規(guī)劃-控制”的具身智能分層模型中的前三個模塊組成。針對一個機(jī)器人靈巧操作任務(wù),首先機(jī)器人“認(rèn)知”模塊需要基于專用于具身任務(wù)的大語言模型/多模態(tài)大模型,(在認(rèn)知層面)理解任務(wù)目標(biāo)并拆解成機(jī)器人能夠執(zhí)行的基礎(chǔ)技能與原動作。隨后“感知”模塊負(fù)責(zé)在三維物理世界中進(jìn)行目標(biāo)物識別、定位、姿態(tài)估計(jì)、操作點(diǎn)/姿態(tài)估計(jì)等;“規(guī)劃”模塊則在空間感知的基礎(chǔ)上,規(guī)劃出機(jī)器人用以完成目標(biāo)任務(wù)的動作軌跡。
“認(rèn)知-感知-規(guī)劃”作為一個有機(jī)的整體形成“大腦”,算法方式上既可以通過分層模型實(shí)現(xiàn),在足量高質(zhì)量數(shù)據(jù)下也可以端到端實(shí)現(xiàn)。
跨維擁有全球頂尖的“大腦”研發(fā)團(tuán)隊(duì),由具身智能、多模態(tài)大模型、3D生成式AI 、強(qiáng)化學(xué)習(xí)等方向權(quán)威專家組成。其中帶頭人賈奎教授是跨維智能創(chuàng)始人,香港中文大學(xué)(深圳)教授,全球Top2%頂尖科學(xué)家,廣東省“珠江人才計(jì)劃”創(chuàng)新創(chuàng)業(yè)團(tuán)隊(duì)帶頭人,人工智能、具身智能、計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)等領(lǐng)域權(quán)威專家,發(fā)表頂級論文百余篇,獲CVPR19最佳論文候選,ICDP最佳論文獎,廣東省自然科學(xué)一等獎。
賈奎教授首創(chuàng)Fantasia3D, Grasp Proposal Networks, PCANet, DehazeNet等深度模型,曾研發(fā)出業(yè)界領(lǐng)先的深度三維物體檢測與姿態(tài)估計(jì)算法、深度三維物體表面重建算法、深度遷移與域適應(yīng)學(xué)習(xí)算法,帶領(lǐng)團(tuán)隊(duì)多次獲得物體抓取與姿態(tài)估計(jì)等領(lǐng)域權(quán)威競賽冠軍;擔(dān)任TIP, TMLR等頂刊副主編,ICCV/ICML/NeurIPS等AI頂會領(lǐng)域主席。目前帶隊(duì)跨維智能組成了具身智能機(jī)器人W1的“最強(qiáng)大腦”。
- 機(jī)器人專家、原三星首席工程師金毅博士帶隊(duì)“最靈小腦”
除了大腦,具身智能機(jī)器人還需要對周邊環(huán)境和本體狀態(tài)有全面的感知,并能夠根據(jù)反饋信息及時調(diào)整運(yùn)動。由于周邊環(huán)境及任務(wù)的復(fù)雜性,具身智能機(jī)器人的運(yùn)動需要高度的魯棒性、協(xié)調(diào)性和精確性。在這個過程中,機(jī)器人“小腦”就負(fù)責(zé)環(huán)境與本體的感知和自適應(yīng)運(yùn)動控制,能夠?qū)h(huán)境及本體的各種傳感器信息和本體的狀態(tài)信息作為“小腦”的輸入,預(yù)測即將發(fā)生的狀況,并計(jì)算出當(dāng)下機(jī)器人應(yīng)該做出的反應(yīng)。“小腦”隨即調(diào)整運(yùn)動控制策略并控制機(jī)器人的各個關(guān)節(jié)做出合適的應(yīng)對。
機(jī)器人領(lǐng)域資深專家、前三星電子首席工程師金毅博士作為CTO帶領(lǐng)跨維研發(fā)團(tuán)隊(duì),進(jìn)一步加強(qiáng)跨維在機(jī)器人本體控制的協(xié)調(diào)性和靈活性,為跨維具身智能大腦在各個場景落地提供支撐。
金毅博士本科畢業(yè)于浙江大學(xué),博士畢業(yè)于韓國科學(xué)技術(shù)院(KAIST),主要研究方向?yàn)闄C(jī)器人控制、運(yùn)動規(guī)劃及機(jī)器人本體設(shè)計(jì)。后于三星電子生產(chǎn)技術(shù)研究所擔(dān)任首席工程師,帶領(lǐng)百人團(tuán)隊(duì),主導(dǎo)了多款機(jī)械臂、移動機(jī)器人和復(fù)合機(jī)器人的研發(fā)及量產(chǎn),攻克了一系列世界級難題,在工業(yè)及服務(wù)機(jī)器人領(lǐng)域擁有二十年的豐富的研發(fā)、量產(chǎn)及管理經(jīng)驗(yàn)。目前支撐起了跨維智能W1的“最靈小腦”打造。
- 傳感器專家吳迪帶隊(duì)研發(fā)“慧雙眼”
傳感器是機(jī)器人感知物理世界的窗口,也是機(jī)器人邁向智能化的基礎(chǔ)。在機(jī)器人在智能化發(fā)展過程中,不斷對感知、交互、運(yùn)動和控制等多個模塊提出更高要求,而傳感器在這些模塊中發(fā)揮著重要作用。
而視覺傳感器是機(jī)器人的“雙眼”,擁有視覺能使機(jī)器人更敏銳地獲取外界環(huán)境信息。為了讓機(jī)器人的感知能力接近人類的水平,關(guān)鍵在于充分發(fā)揮傳感器的感知潛力??缇S智能自研的全系列空間與具身智能傳感器,尤其是純視覺雙目結(jié)構(gòu)的Kingfisher系列,能有效適配各類工作環(huán)境,無論是室外強(qiáng)光、高反光物品、透明/黑色物品等,均能獲取到精確的空間位置信息,交由機(jī)器人“大腦”進(jìn)行與環(huán)境的交互。
這背后是資深傳感器專家吳迪帶隊(duì)研發(fā)的“最慧雙眼”。吳迪曾任騰訊高級算法工程師,研發(fā)機(jī)器人及視覺產(chǎn)品;作為華為高級算法工程師負(fù)責(zé)華為首款雙攝手機(jī)三維重建算法,并曾在霍尼韋爾等世界500強(qiáng)企業(yè)擔(dān)任高級工程師職位,具備豐富的視覺傳感器產(chǎn)品、三維重建算法等領(lǐng)域的實(shí)戰(zhàn)經(jīng)驗(yàn),獲授權(quán)發(fā)明專利16件。
▍結(jié)語與未來
具身智能機(jī)器人的落地應(yīng)用,是從研發(fā)到工程落地的系統(tǒng)性問題,從底層運(yùn)動控制,到上層AI技術(shù),到相互協(xié)調(diào)配合,都非常具有挑戰(zhàn)性,也是賈奎教授、金毅博士、吳迪等一直在探索的事業(yè)。
目前,跨維智能擁有全球頂尖的大腦團(tuán)隊(duì),在具身智能引擎、具身智能大模型上取得的成就有目共睹,結(jié)合小腦控制、本體研發(fā)、傳感器研發(fā)等方面的專長,尤其是基于“AI定義本體”的新理念,跨維通過自研的DexVerse?引擎,正以最高效、最低成本的方式打通具身智能機(jī)器人全鏈路,加快跨維具身智能機(jī)器人的整體研發(fā)與落地進(jìn)程,并穩(wěn)步邁向Physical AGI的實(shí)現(xiàn)。
基于Sim2Real具身智能引擎推出W1具身智能機(jī)器人是跨維探索和落地Physical AGI的又一步。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.