夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

“神經(jīng)-符號”融合規(guī)劃器性能顯著超越o1:借鑒人類運動學(xué)習(xí)機制

0
分享至

中國科學(xué)院磐石研發(fā)團隊 投稿
量子位 | 公眾號 QbitAI

科研er看過來!還在反復(fù)嘗試材料組合方案,耗時又耗力?

新型“神經(jīng)-符號”融合規(guī)劃器直接幫你一鍵鎖定高效又精準的科研智能規(guī)劃。

不同于當前效率低下、盲目性高的傳統(tǒng)智能規(guī)劃方法,中國科學(xué)院磐石研發(fā)團隊此次提出的混合規(guī)劃器,同時融合了神經(jīng)規(guī)劃系統(tǒng)和符號規(guī)劃系統(tǒng)的優(yōu)勢。



借鑒人類的閉環(huán)反饋機制,構(gòu)建雙向規(guī)劃機制,在表達能力、適應(yīng)能力、泛化能力以及可解釋性上都實現(xiàn)了顯著提升。

還能只在正向規(guī)劃器需要時,自動激活反饋接收,在規(guī)劃覆蓋率和規(guī)劃效率上均顯著優(yōu)于OpenAI o1

目前該智能規(guī)劃器已加入“磐石·科學(xué)基礎(chǔ)大模型”,該項目已面向科學(xué)領(lǐng)域集成了一系列專用模型。

借鑒人類運動學(xué)習(xí)的“反饋閉環(huán)理念”

基于Knowledge of Result(KR)的閉環(huán)系統(tǒng)是人類運動學(xué)習(xí)的關(guān)鍵部分,可以幫助學(xué)習(xí)者糾正錯誤,向著目標方向?qū)崿F(xiàn)有效學(xué)習(xí)。

在運動學(xué)習(xí)中KR是執(zhí)行運動后的增強信息,表明既定目標是否成功,而閉環(huán)系統(tǒng)是以反饋、錯誤檢測和錯誤糾正為核心的過程。

規(guī)劃任務(wù)中的問題、規(guī)劃器和動作序列可近似對應(yīng)于人類運動學(xué)習(xí)中的試驗、學(xué)習(xí)者和行動序列,規(guī)劃任務(wù)與運動學(xué)習(xí)有較強的相似性。


反饋閉環(huán)與對應(yīng)的規(guī)劃問題

因此,“神經(jīng)-符號”融合規(guī)劃器通過借鑒人類運動學(xué)習(xí)中的反饋閉環(huán)理念,構(gòu)建了一種閉環(huán)反饋的雙向規(guī)劃機制——KRCL(Knowledge-of-Results based Closed-Loop),正向神經(jīng)規(guī)劃器生成問題的動作序列與反向KR反饋機制構(gòu)成動態(tài)的錯誤檢測-糾正閉環(huán)。

通過有效利用信息的雙向傳遞和反饋來評估和調(diào)整動作,在規(guī)劃中研究以KR信息為中心的閉環(huán)規(guī)劃結(jié)構(gòu),實現(xiàn)準確的反饋以加強錯誤檢測和錯誤糾正,持續(xù)評估和調(diào)整規(guī)劃器的動作,從而促進規(guī)劃器的有效學(xué)習(xí)。

神經(jīng)規(guī)劃器與符號規(guī)劃識別器融合

“磐石”研發(fā)團隊構(gòu)建了一種神經(jīng)規(guī)劃器與符號規(guī)劃識別器的新型融合模式,實現(xiàn)了神經(jīng)系統(tǒng)與符號系統(tǒng)之間的雙向連接,通過利用兩種范式的互補優(yōu)勢,在規(guī)劃中同時實現(xiàn)的有效學(xué)習(xí)和推理。

其中,正向的神經(jīng)規(guī)劃器反向的符號規(guī)劃識別器構(gòu)成KR閉環(huán)結(jié)構(gòu)。


“神經(jīng)-符號”融合新型規(guī)劃器架構(gòu)

在正方向,神經(jīng)規(guī)劃器利用其強大的表示和學(xué)習(xí)能力生成規(guī)劃問題的動作序列,可提高規(guī)劃效率和靈活性。

在反方向,動作序列則被輸入到符號規(guī)劃識別器中,推理出最可能的規(guī)劃目標。

符號規(guī)劃識別器具備準確、可靠和可解釋性等優(yōu)勢,可幫助神經(jīng)網(wǎng)絡(luò)訓(xùn)練、學(xué)習(xí)和推理,進而提高模型的可解釋性。

實現(xiàn)正反向閉環(huán)的KR增強信息則利用文本相似度方法來量化,通過比較推理目標和真實目標來計算它們的相似度。

KR強信息賦予規(guī)劃器思考能力并對結(jié)果進行校正。閉環(huán)反饋過程兼顧有效學(xué)習(xí)與推理能力,促進規(guī)劃器糾正錯誤并能夠更精準地指導(dǎo)規(guī)劃器尋找正確的解決方案。

只在“需要”的時候接收反饋

人類運動學(xué)習(xí)中,傳統(tǒng)的固定KR機制由指導(dǎo)者控制KR信息,限制了學(xué)習(xí)者的學(xué)習(xí)動機和獲取的反饋信息。

為了解決該問題,提出了自我控制機制,允許學(xué)習(xí)者決定何時獲得KR,這種方式不僅可以增強學(xué)習(xí)動機,還可以增強信息處理能力,特別是可以提高閉環(huán)系統(tǒng)的錯誤檢測和錯誤糾正能力。


面向規(guī)劃問題的自我控制機制

此外,過多的KR增強反饋會使正向規(guī)劃器依賴于KR,導(dǎo)致短期表現(xiàn)提升,但會影響模型的長遠表現(xiàn)和遷移能力。

因此,“磐石”研發(fā)團隊提出了面向規(guī)劃問題的自我控制機制,從規(guī)劃問題的難度和模型表現(xiàn)兩方面展開研究。

一方面,評估規(guī)劃問題的難度,基于規(guī)劃問題的對象、狀態(tài)、動作三個重要元素來計算每個問題的難度,當難度超過預(yù)定義的閾值時激活反向規(guī)劃識別器。

另一方面,當正向規(guī)劃器表現(xiàn)不佳時,反向規(guī)劃識別器也會被觸發(fā)。

自我控制機制使得反向規(guī)劃識別器只在正向規(guī)劃器“需要”的時候被激活,以優(yōu)化正向規(guī)劃器接收反饋的頻率,減少規(guī)劃器對反饋的依賴,進而提高模型的自主性,另外也為規(guī)劃器提供了更高的學(xué)習(xí)效率。

它在適當時機選擇性地引入KR反饋,避免了固定KR策略中的反饋冗余問題,從而在規(guī)劃器的學(xué)習(xí)過程中實現(xiàn)了更快的收斂和更高的覆蓋率。

規(guī)劃覆蓋率和規(guī)劃效率顯著領(lǐng)先

研發(fā)團隊在國際IPC(International Planning Competition)競賽的8個代表性規(guī)劃任務(wù)上系統(tǒng)性地評估了KRCL的性能。


8個代表性規(guī)劃任務(wù)上的系統(tǒng)評估

結(jié)果顯示KRCL的平均覆蓋率顯著優(yōu)于其他對比規(guī)劃器,證明了所提出的基于神經(jīng)-符號融合的雙向規(guī)劃器可以指導(dǎo)規(guī)劃器尋找正確的解決方案,精準有效地解決規(guī)劃任務(wù)。

此外,團隊還在PlanBench(用于評估大語言模型規(guī)劃性能的基準數(shù)據(jù)集)上對KRCL與大型語言模型OpenAI o1在規(guī)劃任務(wù)中的性能進行了對比。


PlanBench上的性能對比

實驗結(jié)果表明, KRCL在規(guī)劃覆蓋率和規(guī)劃效率方面均顯著優(yōu)于OpenAI o1,進一步驗證了該方法在規(guī)劃任務(wù)中的優(yōu)勢。

KRCL通過神經(jīng)和符號系統(tǒng)優(yōu)勢互補,能夠有效提升規(guī)劃性能,并利用其強大的閉環(huán)反饋機制、精準的推理校正能力以及高效的自主規(guī)劃特性,可為各類科學(xué)研究任務(wù)提供更可靠、更智能的規(guī)劃工具。

論文鏈接:
https://www.sciencedirect.com/science/article/abs/pii/S095070512501086X?via%3Dihub

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
理想能否撞贏乘龍不清楚,但現(xiàn)實中,卻和東風(fēng)重卡撞了車

理想能否撞贏乘龍不清楚,但現(xiàn)實中,卻和東風(fēng)重卡撞了車

全金貓眼
2025-08-10 12:30:28
男子不信社保,35年堅持不繳納,每月存2000進銀行,退休后傻眼了

男子不信社保,35年堅持不繳納,每月存2000進銀行,退休后傻眼了

紅豆講堂
2025-08-09 14:07:36
永興島一年三熟產(chǎn)出大量西瓜,如果覆蓋南沙島礁,可出口到東南亞

永興島一年三熟產(chǎn)出大量西瓜,如果覆蓋南沙島礁,可出口到東南亞

七月夏安
2025-07-31 23:30:40
WTT 冠軍賽橫濱站 1/4 決賽,向鵬 VS 張本智和,贏球需做好三點

WTT 冠軍賽橫濱站 1/4 決賽,向鵬 VS 張本智和,贏球需做好三點

小蘭看體育
2025-08-10 09:59:10
中國首例雇外國殺手復(fù)仇案:中國妻子雇俄籍殺手,為日本丈夫報仇

中國首例雇外國殺手復(fù)仇案:中國妻子雇俄籍殺手,為日本丈夫報仇

禾所思
2023-09-07 22:27:35
你認同嗎?林園說:本輪牛市,或許是這輩子最后一次大機會

你認同嗎?林園說:本輪牛市,或許是這輩子最后一次大機會

郭小凡財經(jīng)
2025-08-10 11:18:03
愛來自曼徹斯特!德布勞內(nèi)8分鐘兩球,那不勒斯3-2赫羅納

愛來自曼徹斯特!德布勞內(nèi)8分鐘兩球,那不勒斯3-2赫羅納

雷速體育
2025-08-10 04:00:40
西安文旅淪陷!游客被打成腦震蕩,商家囂張堪比黑社會,警方介入

西安文旅淪陷!游客被打成腦震蕩,商家囂張堪比黑社會,警方介入

涵豆說娛
2025-08-08 11:32:14
6歲女童殞命戲水池:家屬稱左腿被回水管吸住,官方正調(diào)查死因

6歲女童殞命戲水池:家屬稱左腿被回水管吸住,官方正調(diào)查死因

澎湃新聞
2025-08-10 15:30:37
楊蘭蘭到底是誰?《每日郵報》下場扒了她,結(jié)果令人意外……

楊蘭蘭到底是誰?《每日郵報》下場扒了她,結(jié)果令人意外……

麥杰遜
2025-08-09 12:21:46
瑞幸咖啡幕后大佬:父親是原蘭州軍區(qū)副司令,妻子是知名主持人

瑞幸咖啡幕后大佬:父親是原蘭州軍區(qū)副司令,妻子是知名主持人

禾寒敘
2025-08-09 22:18:05
德比賽后武磊在場地里拿出手機,笑著拍下辱罵他的申花球迷

德比賽后武磊在場地里拿出手機,笑著拍下辱罵他的申花球迷

懂球帝
2025-08-10 11:26:45
越南至今無力翻身,79年撤軍前許世友發(fā)布的3個命令,太高明

越南至今無力翻身,79年撤軍前許世友發(fā)布的3個命令,太高明

歷史有些冷
2025-08-09 10:15:06
多名游客還原“風(fēng)雨少林”:僧人主動邀請進殿躲雨

多名游客還原“風(fēng)雨少林”:僧人主動邀請進殿躲雨

大象新聞
2025-08-10 09:30:04
交警后續(xù)曝光:小伙再發(fā)聲明,已報警,逆行女正臉照被扒出。

交警后續(xù)曝光:小伙再發(fā)聲明,已報警,逆行女正臉照被扒出。

振華觀史
2025-08-10 08:51:22
林詩棟爆冷輸給邱黨后被王皓在場邊怒斥,內(nèi)疚的林詩棟一直低著頭

林詩棟爆冷輸給邱黨后被王皓在場邊怒斥,內(nèi)疚的林詩棟一直低著頭

鳳幻洋
2025-08-09 15:54:42
莫斯科果然說到做到,俄軍攻入紅軍城,澤連斯基想求饒已經(jīng)晚了

莫斯科果然說到做到,俄軍攻入紅軍城,澤連斯基想求饒已經(jīng)晚了

boss外傳
2025-08-08 13:00:03
40°高溫,將汽車的科技撕了個稀爛,創(chuàng)新需要符合實際!

40°高溫,將汽車的科技撕了個稀爛,創(chuàng)新需要符合實際!

柏銘銳談
2025-08-09 21:59:34
2025 年 7 月抖音主播收入榜出爐,頭部與普通差距居然這么大

2025 年 7 月抖音主播收入榜出爐,頭部與普通差距居然這么大

陳意小可愛
2025-08-09 08:46:21
威海乳山市委原書記周兵,被開除黨籍

威海乳山市委原書記周兵,被開除黨籍

中國山東網(wǎng)
2025-08-10 10:12:02
2025-08-10 16:07:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11067文章數(shù) 176225關(guān)注度
往期回顧 全部

科技要聞

機器人大會:展臺水泄不通 觀眾眼里放光!

頭條要聞

7歲男童參加夏令營在大理蒼山失蹤1天1夜 疑來自北京

頭條要聞

7歲男童參加夏令營在大理蒼山失蹤1天1夜 疑來自北京

體育要聞

時隔10年全勝出線,中國男籃收獲了什么?

娛樂要聞

方媛才是人生贏家,38歲“懷男胎”

財經(jīng)要聞

機器人企業(yè)老總要200萬月薪 被怒懟

汽車要聞

長安啟源全新Q05:10萬級配激光雷達和小藍燈

態(tài)度原創(chuàng)

藝術(shù)
健康
數(shù)碼
親子
公開課

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

呼吸科專家破解呼吸道九大謠言!

數(shù)碼要聞

蘋果 macOS Tahoe 悄悄引入 15 款全新航拍風(fēng)景屏保

親子要聞

如何讓孩子養(yǎng)成刷牙的好習(xí)慣

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 成人爽a毛片在线视频| av天堂免费| 日韩一区二区三区北条麻妃| 99国产精品99久久久久久| 日韩一区二区三区2023| 国产美女无套 ,| av最新网址| 无码久久精品| 亚洲的天堂av无码| 熟女av九九| 色综合久久久久久久| 日夜啪啪一区二区三区| 欧美A级在线播放| 色欲传媒AV原创作品免费在线观看 | 女教师的毛片一级| 成年女人片免费视频播放A| 国产成人午夜在线视频极速观看| 国产精品视频一区二区三区四| 久久综合亚洲色hezyo社区| 亚洲另类无码专区丝袜| 人人操人人宝| 日本一道一区二区视频| www.91在线播放| 久久猫咪伊人有精品| 日韩AV无码久久一区二区商场| 国产羞羞的视频一区二区| 无码精品毛片一区二区三区亚洲| 色色色999韩| 欧美色99| 被插动态视频| 午夜福利在线观看6080 | 午夜蜜桃模特| 久久久久久久久久久久AV| 亚洲人成色777777精品不卡| 日韩在线观看精品亚洲| 国产AV片精东影业| 爱看av在线| 色欲老女人人妻综合网| 强奸乱伦中文字幕av| 国产乱码一二三区别免费公司| 少妇呻吟亚洲精品|