夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AlphaGo作者領(lǐng)銜,DeepMind新作登Science子刊

0
分享至

henry 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

一群機(jī)械臂手忙腳亂地自己干活,彼此配合、互不碰撞。

科幻大片場(chǎng)景真的走入現(xiàn)實(shí)了。優(yōu)雅,實(shí)在是優(yōu)雅。



△視頻中為4個(gè)機(jī)械臂,在仿真環(huán)境下4個(gè)安裝在桌子上,另外4個(gè)安裝在天花板上。

這就是發(fā)表在Science子刊Science Robotics上,由DeepMind、Intrinsic AI和UCL等研究機(jī)構(gòu)共同提出的最新成果——RoboBallet(機(jī)器芭蕾)。



RoboBallet創(chuàng)新性地將圖神經(jīng)網(wǎng)絡(luò)(GNN)用于強(qiáng)化學(xué)習(xí),作為其策略網(wǎng)絡(luò)和狀態(tài)-動(dòng)作價(jià)值估計(jì),以解決多機(jī)器人(機(jī)械臂)協(xié)作運(yùn)動(dòng)規(guī)劃中的復(fù)雜問題。

這一方法最多可以同時(shí)控制8個(gè)機(jī)械臂,協(xié)調(diào)多達(dá)56個(gè)自由度的配置空間,并處理多達(dá)40個(gè)共享任務(wù), 每一步規(guī)劃僅需0.3毫秒,且任務(wù)分配和調(diào)度完全不受約束。

值得一提的是,這篇論文的通訊作者——Matthew Lai,可謂是谷歌DeepMind的資深研究員。自2016年加入谷歌DeepMind以來,他曾參與過AlphaGoAlphaZero等明星項(xiàng)目。



利用圖神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)

總的來說,RoboBallet的核心是把圖神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)結(jié)合起來,采用圖神經(jīng)網(wǎng)絡(luò)(GNN)作為策略網(wǎng)絡(luò)和狀態(tài)-動(dòng)作價(jià)值估計(jì),解決了大規(guī)模多機(jī)器人任務(wù)分配、調(diào)度和運(yùn)動(dòng)規(guī)劃的聯(lián)合問題,實(shí)現(xiàn)了在計(jì)算上高效、可擴(kuò)展且能零樣本泛化的高質(zhì)量軌跡規(guī)劃

具體來說,在現(xiàn)代自動(dòng)化制造中,核心挑戰(zhàn)在于如何讓多個(gè)機(jī)器人在共享的、充滿障礙物的空間中無碰撞地高效協(xié)作,以完成大量任務(wù)(如焊接、裝配等)。

這涉及到三個(gè)高度復(fù)雜的子問題:

  • 任務(wù)分配(Task Allocation):決定哪個(gè)機(jī)器人執(zhí)行哪個(gè)任務(wù),以最小化總執(zhí)行時(shí)間。
  • 任務(wù)調(diào)度(Task Scheduling):決定任務(wù)的執(zhí)行順序。
  • 運(yùn)動(dòng)規(guī)劃(Motion Planning):在關(guān)節(jié)空間中尋找一條無碰撞路徑,使機(jī)器人末端執(zhí)行器移動(dòng)到目標(biāo)姿態(tài)。

這三個(gè)子問題一組合,復(fù)雜度急劇增加,傳統(tǒng)算法在真實(shí)場(chǎng)景中往往難以計(jì)算可行解,工業(yè)界目前主要依賴耗時(shí)且勞動(dòng)密集的人工規(guī)劃。

因此,為了應(yīng)對(duì)這種高維復(fù)雜性,RoboBallet就被用來在隨機(jī)生成的環(huán)境中進(jìn)行任務(wù)和運(yùn)動(dòng)規(guī)劃,其能夠?yàn)榕c訓(xùn)練期間所見環(huán)境不同的環(huán)境(具有任意障礙物幾何形狀、任務(wù)姿態(tài)和機(jī)器人位置)規(guī)劃多臂抓取軌跡。

為了實(shí)現(xiàn)這一點(diǎn),RoboBallet在數(shù)據(jù)表示層面,創(chuàng)新性地將整個(gè)場(chǎng)景建模為圖結(jié)構(gòu)



其中,圖中的節(jié)點(diǎn)代表場(chǎng)景中的核心實(shí)體,包括機(jī)器人、任務(wù)和障礙物,而邊(Edge)則表示這些實(shí)體之間的關(guān)系(例如,相對(duì)姿態(tài))。

機(jī)器人節(jié)點(diǎn)之間存在雙向邊,以支持相互協(xié)調(diào)和避碰。而任務(wù)節(jié)點(diǎn)和障礙物節(jié)點(diǎn)到機(jī)器人節(jié)點(diǎn)則存在單向邊,用于向機(jī)器人傳遞規(guī)劃所需的環(huán)境信息(如圖c)

接下來,RoboBallet使用圖神經(jīng)網(wǎng)絡(luò)(GNN)作為策略網(wǎng)絡(luò),通過權(quán)重共享來處理不斷變化的圖大小。其以觀測(cè)圖作為輸入,并在每個(gè)時(shí)間步為所有機(jī)器人生成指令關(guān)節(jié)速度。這使得機(jī)械臂能夠在只接收原始狀態(tài)作為輸入的情況下,進(jìn)行關(guān)系和組合推理。

而在具體的策略學(xué)習(xí)和評(píng)估階段,RoboBallet通過微調(diào)TD3(Twin-Delayed Deep Deterministic Policy Gradient)算法來訓(xùn)練策略網(wǎng)絡(luò),使模型能夠生成多機(jī)械臂軌跡,同時(shí)解決任務(wù)分配、調(diào)度和運(yùn)動(dòng)規(guī)劃等子問題,使得昂貴的在線計(jì)算轉(zhuǎn)移到了離線訓(xùn)練階段。

(注:在此任務(wù)中,機(jī)械臂因成功解決任務(wù)和避免碰撞而獲得獎(jiǎng)勵(lì))

同時(shí),為了解決稀疏獎(jiǎng)勵(lì)的問題,RoboBallet還采用了Hindsight Experience Replay方法,使模型能夠在沒有人工設(shè)計(jì)的獎(jiǎng)勵(lì)函數(shù)的情況下高效學(xué)習(xí)。

在具體的部署方面,RoboBallet使用Franka Panda七自由度機(jī)械臂、在隨機(jī)障礙物和任務(wù)的模擬環(huán)境進(jìn)行訓(xùn)練。



為了驗(yàn)證性能,研究團(tuán)隊(duì)在一個(gè)包含4(8)個(gè)機(jī)器人、40個(gè)任務(wù)和30個(gè)障礙物的模擬工作單元中進(jìn)行測(cè)試,并與RRT-Connect方法進(jìn)行比較。值得一提的是,這一切都只需在一塊 GPU(圖形處理單元)上完成,無論是真實(shí)的還是模擬的多臂工作單元。

實(shí)驗(yàn)表明,RoboBallet在多個(gè)關(guān)鍵指標(biāo)上表現(xiàn)出色:

在訓(xùn)練時(shí)間的擴(kuò)展性方面,即使任務(wù)數(shù)量增加四倍,RoboBallet收斂所需的訓(xùn)練步數(shù)也只是略有增加。



在規(guī)劃速度方面。實(shí)驗(yàn)表明,在推理階段,即便是包含8個(gè)機(jī)器人和40個(gè)任務(wù)的最大場(chǎng)景,每個(gè)規(guī)劃步在NVIDIA A100上只需約0.3毫秒,能夠?qū)崿F(xiàn)10 Hz時(shí)間步下超過300倍的實(shí)時(shí)規(guī)劃速度

在單個(gè)Intel Cascade Lake CPU核心上,每個(gè)步長大約需要30毫秒,在10Hz時(shí)間步下仍比實(shí)時(shí)快約3倍。每個(gè)規(guī)劃步驟包括對(duì)整個(gè)場(chǎng)景進(jìn)行一次推理和一次碰撞檢測(cè)。

在多智能體協(xié)同方面,隨著機(jī)器人數(shù)量從4個(gè)增加到8個(gè) ,平均執(zhí)行時(shí)間減少了約60%



而在泛化性方面,模型在隨機(jī)生成的環(huán)境中訓(xùn)練后,無需額外訓(xùn)練即可零樣本遷移(zero-shot)到具有不同機(jī)器人位置、障礙物幾何形狀和任務(wù)姿態(tài)的新環(huán)境中。

最后,RoboBallet 的高速和可擴(kuò)展性使其能夠應(yīng)用于工作單元布局優(yōu)化(將任務(wù)執(zhí)行時(shí)間縮短了33%)、容錯(cuò)規(guī)劃和基于在線感知的重新規(guī)劃等新能力。



[1]https://x.com/GoogleDeepMind/status/1965040645103407572

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“吃飯八分飽”錯(cuò)了?醫(yī)生建議:過了60歲,吃飯要盡量做到這7點(diǎn)

“吃飯八分飽”錯(cuò)了?醫(yī)生建議:過了60歲,吃飯要盡量做到這7點(diǎn)

說歷史的老牢
2025-08-30 11:17:31
加比亞:阿萊格里改善了米蘭防守;恩昆庫給人留下了深刻印象

加比亞:阿萊格里改善了米蘭防守;恩昆庫給人留下了深刻印象

懂球帝
2025-09-11 03:55:31
中國工程界最大烏龍!研究沙漠種小麥技術(shù),卻意外解開1世界難題

中國工程界最大烏龍!研究沙漠種小麥技術(shù),卻意外解開1世界難題

紅豆講堂
2024-09-07 09:56:30
以色列隊(duì)長嘲諷意大利:好像他們?cè)谔呤澜缱顝?qiáng)球隊(duì),替補(bǔ)席快瘋了

以色列隊(duì)長嘲諷意大利:好像他們?cè)谔呤澜缱顝?qiáng)球隊(duì),替補(bǔ)席快瘋了

直播吧
2025-09-10 23:59:17
任上被查的北京博士副市長,騙取學(xué)歷玩忽職守一審獲刑12年

任上被查的北京博士副市長,騙取學(xué)歷玩忽職守一審獲刑12年

南方都市報(bào)
2025-09-10 18:17:44
房產(chǎn)稅真要來?國家動(dòng)真格,專家提出免征面積,超出每年交12000

房產(chǎn)稅真要來?國家動(dòng)真格,專家提出免征面積,超出每年交12000

山丘樓評(píng)
2025-09-09 18:01:36
為什么748萬公職人員越來越沉默,現(xiàn)在的公務(wù)員怎么了?

為什么748萬公職人員越來越沉默,現(xiàn)在的公務(wù)員怎么了?

詩意世界
2025-09-10 09:54:23
號(hào)稱15分鐘見效!全球首款“速效偉哥”亮相,真能改變ED困境嗎?

號(hào)稱15分鐘見效!全球首款“速效偉哥”亮相,真能改變ED困境嗎?

獨(dú)角獸早知道
2025-09-10 10:14:21
大事件!以軍大批戰(zhàn)機(jī)奔襲千里轟炸美國盟友,驚醒了整個(gè)中東

大事件!以軍大批戰(zhàn)機(jī)奔襲千里轟炸美國盟友,驚醒了整個(gè)中東

兵國大事
2025-09-10 16:21:54
京東外賣:為全職騎手免費(fèi)配置紅斗篷雨衣,防水指數(shù)超20000mmH2O,在騎行時(shí)形成隱形風(fēng)道,持續(xù)保持體感干爽

京東外賣:為全職騎手免費(fèi)配置紅斗篷雨衣,防水指數(shù)超20000mmH2O,在騎行時(shí)形成隱形風(fēng)道,持續(xù)保持體感干爽

臺(tái)州交通廣播
2025-09-10 21:42:49
27歲小伙傍上55歲富婆大媽,第一晚還很害羞,之后小伙就放開了

27歲小伙傍上55歲富婆大媽,第一晚還很害羞,之后小伙就放開了

濤哥講堂
2025-09-05 09:50:23
9月10日A股猛料:工信部重磅宣布!3板塊迎大利好!是避險(xiǎn)首選?

9月10日A股猛料:工信部重磅宣布!3板塊迎大利好!是避險(xiǎn)首選?

小舟談歷史
2025-09-10 08:57:06
青年學(xué)者、四川大學(xué)化學(xué)工程學(xué)院副院長鈕大文已加盟北京大學(xué)

青年學(xué)者、四川大學(xué)化學(xué)工程學(xué)院副院長鈕大文已加盟北京大學(xué)

澎湃新聞
2025-09-09 15:04:27
敲詐中國10億美元、拒絕中國飛機(jī)借道,如今這個(gè)國家又找上中國?

敲詐中國10億美元、拒絕中國飛機(jī)借道,如今這個(gè)國家又找上中國?

阿柒的訊
2025-09-09 23:51:08
朱婷歸隊(duì)引發(fā)多國球迷熱議 已參加全隊(duì)合練與隊(duì)友英語無障礙交流

朱婷歸隊(duì)引發(fā)多國球迷熱議 已參加全隊(duì)合練與隊(duì)友英語無障礙交流

科學(xué)發(fā)掘
2025-09-10 10:37:44
血虧400多萬!南京一樓盤房?jī)r(jià)暴跌,網(wǎng)友:江景房也不保值了…

血虧400多萬!南京一樓盤房?jī)r(jià)暴跌,網(wǎng)友:江景房也不保值了…

火山詩話
2025-09-09 13:42:49
人民日?qǐng)?bào)點(diǎn)贊辛芷蕾獲獎(jiǎng)感言,句句不提劉亦菲,卻字字提醒劉亦菲

人民日?qǐng)?bào)點(diǎn)贊辛芷蕾獲獎(jiǎng)感言,句句不提劉亦菲,卻字字提醒劉亦菲

白面書誏
2025-09-09 13:46:19
看了這些數(shù)據(jù),你就不會(huì)覺得尼泊爾是一個(gè)小國了!

看了這些數(shù)據(jù),你就不會(huì)覺得尼泊爾是一個(gè)小國了!

戶外釣魚哥阿勇
2025-09-10 07:18:59
這天,那英老公把第三者帶回家,崩潰的那英給所有女人提了一個(gè)醒

這天,那英老公把第三者帶回家,崩潰的那英給所有女人提了一個(gè)醒

溫讀史
2025-09-10 12:18:53
快船傳聞:倫納德事件因涉嫌“極端”的Aspiration交易而“惡臭”

快船傳聞:倫納德事件因涉嫌“極端”的Aspiration交易而“惡臭”

好火子
2025-09-11 02:05:31
2025-09-11 04:27:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11278文章數(shù) 176267關(guān)注度
往期回顧 全部

科技要聞

蘋果良心了!iPhone17全系高刷加量不加價(jià)

頭條要聞

羅永浩吐槽西貝"幾乎全是預(yù)制菜太惡心" 最新回應(yīng)來了

頭條要聞

羅永浩吐槽西貝"幾乎全是預(yù)制菜太惡心" 最新回應(yīng)來了

體育要聞

帕楚里亞的徒弟,嘲諷文班亞馬

娛樂要聞

曝那英老公出軌后續(xù)!本人發(fā)聲否認(rèn)

財(cái)經(jīng)要聞

發(fā)改委:綜合整治無序非理性競(jìng)爭(zhēng)

汽車要聞

5門7座/Hi4四驅(qū)電混 魏牌高山7預(yù)售價(jià)28.98萬起

態(tài)度原創(chuàng)

教育
房產(chǎn)
親子
健康
藝術(shù)

教育要聞

好成績(jī)的底氣,來自溫暖的陪伴

房產(chǎn)要聞

炸裂!70+高校落地海南,自貿(mào)港教育紅利要來了!

親子要聞

幼兒園大班免費(fèi),只是開始

內(nèi)分泌科專家破解身高八大謠言

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進(jìn)入關(guān)懷版 亚洲熟女久久精品| 国产乱码AV一区二区三区| 最新AV免费地址| 超薄肉色丝袜激情啪啪| 丰满人妻av一区二区三区| 精品麻豆丝袜高跟鞋av| www,中文字幕,com| 欧美日韩国产一区二区三区不卡| 性免费开放网站| 被三个男人绑着躁我好爽| 又深又粗又爽又猛的视频| 欧美淫乱一区二区三区| 九九99精品| 欧美性XXXXX极品中国| 国产精品多p对白交换绿帽| 欧美熟妇揷揷揷| 日韩高清国产中文字幕| 韵味人妻!极品大| 久久人人做人人爽人人av| 色婷婷综合缴情免费观看| 中文字幕亚洲无线码在线| 欧美自慰在线| 国精品午夜福利视频不卡| 国产熟人精品一区二区| 精品久久久久久| 国产欧美不卡视频| 国产日韩欧美成人| 亚洲伊人久久综合影院| 欧美综合影院在线影院| 成人区视频去| 蜜桃狠狠婷婷| 国产人妻一区二区三区久| 恨恨干免费视频观看| 最新国产网站| 一区二区三区涩涩涩| 人人插人人提| 亚州一区二区| 亚洲精品无码视频| 日本一区二区三区免费播放视频站| 欧美人成视频在线视频| 五十路亲子中出在线观看|