夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

哈佛揭示外部反饋對Agent記憶管理重要性,構(gòu)建自我演化型Agent

0
分享至

近年來,大模型的迅速發(fā)展賦能了大量交互式的智能代理(大模型 Agent),使后者在類似代碼生成、自動駕駛、個人助理等領(lǐng)域展現(xiàn)出令人矚目的潛力。

這些 Agent 通常需要類似人類的記憶能力,以便持續(xù)學(xué)習(xí)并逐漸提升自身表現(xiàn)。具體而言,Agent 需要記錄并回憶曾經(jīng)遇到的任務(wù)輸入以及對應(yīng)的輸出結(jié)果,從而幫助其在新的任務(wù)中取得良好表現(xiàn)。

然而,目前各種 Agent 所使用的記憶模塊往往是為特定任務(wù)專門設(shè)計的。例如,自動駕駛 Agent 存儲的是車輛的軌跡與狀態(tài)數(shù)據(jù),代碼生成 Agent 保存的是代碼片段,而個人助理型 Agent 則可能傾向于總結(jié)對話信息。這種碎片化的、任務(wù)導(dǎo)向的設(shè)計方式,使得研究記憶管理的通用規(guī)律與共性變得極其困難。因此,美國伊利諾伊大學(xué)香檳分校本科校友、美國哈佛大學(xué)博士生熊梓迪和所在團隊決定回歸到最基本的記憶管理操作——添加操作與刪除操作,以便解決這樣一個通用而核心的問題:到底該如何管理記憶,才能長期提升大模型 Agent 的表現(xiàn)?


圖 | 熊梓迪(來源:熊梓迪)

研究團隊的目標(biāo)是提供系統(tǒng)性的實驗證據(jù)和具有普適性的原則,避免開發(fā)者因為缺乏通用準(zhǔn)則而只能憑經(jīng)驗制定策略,從而導(dǎo)致性能的不穩(wěn)定甚至退化。

如前所述,與以往關(guān)注復(fù)雜記憶機制設(shè)計的研究不同,研究團隊的研究重點回歸到記憶管理最基礎(chǔ)的兩個操作上:

  • 添加:判斷一個新任務(wù)的執(zhí)行結(jié)果是否值得被記憶。
  • 刪除:決定何時以及按照什么標(biāo)準(zhǔn)刪除過去的記憶。

通過研究不同精度的外部反饋作為這兩項操作的執(zhí)行標(biāo)準(zhǔn),研究團隊發(fā)現(xiàn)了以下三個核心規(guī)律:

  • 第一個規(guī)律是經(jīng)驗跟隨現(xiàn)象(Experience-Following):Agent 在處理當(dāng)前任務(wù)時,傾向于復(fù)制檢索到的相似歷史任務(wù)的輸出,而這種現(xiàn)象不區(qū)分記憶質(zhì)量的好壞,具有高度一致性。
  • 第二個規(guī)律是錯誤傳播效應(yīng)(Error Propagation):當(dāng)記憶添加的外部反饋精度和評估標(biāo)準(zhǔn)不嚴(yán),錯誤或低質(zhì)量的任務(wù)執(zhí)行結(jié)果被存入記憶后,會不斷被后續(xù)任務(wù)所模仿,從而導(dǎo)致一連串的決策失誤,甚至使 Agent 長期表現(xiàn)退化。
  • 第三個規(guī)律是經(jīng)驗回放失配(Misaligned Memory Replay):即使某些記憶本身正確,但如果它們與當(dāng)前任務(wù)的上下文不匹配或已過時,仍然會拖累 Agent 的表現(xiàn)。因此,需要通過精準(zhǔn)的外部反饋進行持續(xù)維護或刪除。

整體而言,研究團隊揭示了一個長期被忽視的重要問題,即精準(zhǔn)可靠的外部反饋對于記憶管理設(shè)計的重要性。在絕大多數(shù)實際場景中,由于缺乏這種高質(zhì)量反饋,Agent 的記憶系統(tǒng)反而可能阻礙而非促進其長期的表現(xiàn)。

研究團隊希望本研究能夠激發(fā)更多關(guān)于大模型 Agent 各模塊通用機制的系統(tǒng)性研究,并期待本工作中的發(fā)現(xiàn)能夠為未來記憶模塊的設(shè)計提供實證參考,從而推動構(gòu)建更智能、具備自我演化能力的大模型 Agent。


(來源:https://arxiv.org/pdf/2505.16067)

談及研究過程,熊梓迪對 DeepTech 表示,他與本次相關(guān)論文的共同通訊作者 Zhen Xiang 師兄(現(xiàn)為美國佐治亞大學(xué)助理教授)希望找到一種普遍適用于各種 Agent 的記憶管理方案。研究早期,他們嘗試了許多復(fù)雜的方法,但發(fā)現(xiàn)由于 Agent 任務(wù)差異巨大,很難提煉出真正通用的解決方案,也難以清晰界定研究問題。

反思之后,研究團隊決定回歸最基礎(chǔ)的記憶操作,聚焦于記憶的添加和刪除。之所以選擇這兩個操作,是因為它們不僅是記憶系統(tǒng)中最基本的部分,同時在不同 Agent 中都有明確可能的實現(xiàn)方式。

研究團隊隨后建立了一個統(tǒng)一的實驗框架,選擇了具有代表性的多個不同領(lǐng)域的 Agent,包括醫(yī)療數(shù)據(jù)、自動駕駛、物聯(lián)網(wǎng)安全等,以充分驗證普適性。經(jīng)過大量的實驗和分析,研究團隊發(fā)現(xiàn)了 Agent 記憶管理中三個重要的共性問題:經(jīng)驗跟隨、錯誤傳播和經(jīng)驗回放失配。這些發(fā)現(xiàn)幫助研究團隊明確了準(zhǔn)確可靠的外部反饋在記憶管理中不可或缺的角色,也為后續(xù)的研究和應(yīng)用提供了明確的方向。

不過,熊梓迪坦言:“實驗中應(yīng)用程序編程接口(API,Application Programming Interface)的花銷非常昂貴,比如像 GPT-4o 作為 backbone 讓 Agent 在幾千條任務(wù)上跑的花銷真的很驚人?!边@也更加凸顯了本次研究的不易。

日前,相關(guān)論文以《內(nèi)存管理如何影響大模型代理:經(jīng)驗跟隨行為的實證研究》(How Memory Management Impacts LLM Agents: An Empirical Study of Experience-Following Behavior)為題發(fā)在arXiv[1],熊梓迪是第一作者。


圖 | 相關(guān)論文(來源:https://arxiv.org/pdf/2505.16067)

未來,研究團隊希望進一步探索如何在缺乏高質(zhì)量外部反饋的情況下,盡可能減少記憶模塊可能帶來的負面影響,并提升其長期表現(xiàn)。他們相信,這對于現(xiàn)實的大模型 Agent 應(yīng)用具有重要的價值。

參考資料:

1.https://arxiv.org/pdf/2505.16067

排版:劉雅坤

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
甘肅女子稱扶老人反被誣陷,維權(quán)近3月等到道歉,“對方又報警稱泄露隱私”,社區(qū)回應(yīng)

甘肅女子稱扶老人反被誣陷,維權(quán)近3月等到道歉,“對方又報警稱泄露隱私”,社區(qū)回應(yīng)

瀟湘晨報
2025-08-06 16:06:05
奔馳石頭姐“社會性死亡”:車是按揭的,正臉曝光,家庭情況被扒

奔馳石頭姐“社會性死亡”:車是按揭的,正臉曝光,家庭情況被扒

秋姐居
2025-08-05 19:20:14
剛剛,基礎(chǔ)物理又有重大突破!日本科學(xué)家發(fā)現(xiàn)量子世界最深層奧秘

剛剛,基礎(chǔ)物理又有重大突破!日本科學(xué)家發(fā)現(xiàn)量子世界最深層奧秘

徐德文科學(xué)頻道
2025-08-06 14:46:26
大事件要來了!休賽期最震撼交易有可能即將發(fā)生!

大事件要來了!休賽期最震撼交易有可能即將發(fā)生!

田先生籃球
2025-08-06 09:02:45
破“6”!深圳房價,失守了!

破“6”!深圳房價,失守了!

城市財經(jīng)
2025-08-06 12:16:36
局面突變?釋永信被帶走僅10天,四大名人挺身而出,愿為其養(yǎng)老

局面突變?釋永信被帶走僅10天,四大名人挺身而出,愿為其養(yǎng)老

書雁飛史oh
2025-08-05 14:00:31
美記:楊瀚森團隊知道其不是球隊的首選 球員的未來尚不穩(wěn)固

美記:楊瀚森團隊知道其不是球隊的首選 球員的未來尚不穩(wěn)固

直播吧
2025-08-06 16:50:10
上海一小區(qū)被外賣員集體“拉黑”!加價都沒人送,平臺介入

上海一小區(qū)被外賣員集體“拉黑”!加價都沒人送,平臺介入

環(huán)球網(wǎng)資訊
2025-08-06 15:49:53
亮證姐被拘留5日后續(xù):網(wǎng)友再提質(zhì)疑,本人私下判若兩人,大V發(fā)聲

亮證姐被拘留5日后續(xù):網(wǎng)友再提質(zhì)疑,本人私下判若兩人,大V發(fā)聲

古希臘掌管松餅的神
2025-08-06 13:58:23
受賄超2億的秦如培一審被判死緩 曾被通報違規(guī)舉債,瞞報債務(wù),搞“七個有之”

受賄超2億的秦如培一審被判死緩 曾被通報違規(guī)舉債,瞞報債務(wù),搞“七個有之”

紅星新聞
2025-08-06 19:02:30
理想i8碰撞測試相關(guān)方發(fā)布聯(lián)合聲明

理想i8碰撞測試相關(guān)方發(fā)布聯(lián)合聲明

界面新聞
2025-08-06 19:27:46
暴跌69%!BBA集體大崩盤

暴跌69%!BBA集體大崩盤

蔣東文
2025-08-06 10:14:43
難怪趙露思要解約,公司早就找好替代品了,嘴巴鼻子簡直一模一樣

難怪趙露思要解約,公司早就找好替代品了,嘴巴鼻子簡直一模一樣

說說史事
2025-08-04 20:49:51
平頭哥回應(yīng)全名被警方“公開”:轉(zhuǎn)發(fā)時請給個人信息打碼

平頭哥回應(yīng)全名被警方“公開”:轉(zhuǎn)發(fā)時請給個人信息打碼

大象新聞
2025-08-06 17:26:26
一家人包下“高鐵包間”,傷了普通人的心:有些東西出生就追不上

一家人包下“高鐵包間”,傷了普通人的心:有些東西出生就追不上

熙熙說教
2025-08-06 20:09:57
少林寺被調(diào)查僅九天!靈隱寺就上熱搜,方丈生活被曝,收費引爭議

少林寺被調(diào)查僅九天!靈隱寺就上熱搜,方丈生活被曝,收費引爭議

寒士之言本尊
2025-08-06 18:14:00
5萬聯(lián)軍集結(jié)俄羅斯邊境,又一批阿塞拜疆雇傭兵加入烏軍

5萬聯(lián)軍集結(jié)俄羅斯邊境,又一批阿塞拜疆雇傭兵加入烏軍

史政先鋒
2025-08-06 21:11:33
北京協(xié)和醫(yī)院專家答紅星新聞:“坐沒坐相、站沒站相”可能不是孩子故意的,而是脊柱側(cè)彎

北京協(xié)和醫(yī)院專家答紅星新聞:“坐沒坐相、站沒站相”可能不是孩子故意的,而是脊柱側(cè)彎

紅星新聞
2025-08-06 18:09:16
湖南岳陽警方通報“一車輛撞進茶顏門店”:車輛意外失控,致2死2傷

湖南岳陽警方通報“一車輛撞進茶顏門店”:車輛意外失控,致2死2傷

界面新聞
2025-08-06 23:23:10
羅家英自曝曾花光積蓄抗癌,妻子汪明荃從未提供幫助:如果她愿意幫我,我也很樂意

羅家英自曝曾花光積蓄抗癌,妻子汪明荃從未提供幫助:如果她愿意幫我,我也很樂意

極目新聞
2025-08-06 13:30:37
2025-08-07 03:31:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15494文章數(shù) 513965關(guān)注度
往期回顧 全部

科技要聞

周鴻祎定義AI下半場:大模型只是“玩具”

頭條要聞

特朗普稱對印度加征25%的額外關(guān)稅 印度回擊

頭條要聞

特朗普稱對印度加征25%的額外關(guān)稅 印度回擊

體育要聞

狂攬四金成MVP,18歲天才少女領(lǐng)獎臺"冷臉"

娛樂要聞

趙露思直播 被關(guān)酒店驅(qū)魔只是冰山一角

財經(jīng)要聞

復(fù)旦孫金云:內(nèi)卷破局關(guān)鍵在于兩條路徑

汽車要聞

GTS回歸GT不熄:凌渡L憑何成年輕人第一臺燃油轎跑?

態(tài)度原創(chuàng)

教育
時尚
游戲
手機
藝術(shù)

教育要聞

學(xué)前教育開始免費了,你會因此生孩子嗎

推廣中獎名單-更新至2025年7月24日推廣

AL又輸了!狀態(tài)低迷,慘遭IG橫掃!粉絲怒斥Tabe:毀了隊員的信任

手機要聞

谷歌調(diào)侃蘋果AI,新品分批發(fā)售

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進入關(guān)懷版 h动漫无遮挡成本人h视频| 一区二区三区色欲AⅤ| 久久中文字幕亚洲| 久久精品aⅴ无码中文字字幕| 综合久久126| 精品乱码一区二区三区四区| 88精品视频| 蜜桃AⅤ无码在线| 亚洲综合色88综合天堂| 亚洲人成人无码www| 曰本无码不卡高清AV一二| 久久国产精品夜色| 久久亚洲AV成人电影| 国产成人免费观看久久久| 国产精品久久久久久久久久久久人四虎| 国产强奸一区二区| 拔插拔插海外华人永久免费| 色熟妇人妻久久中文字幕| 欧美第一次开笣破瓜| 国产精品狼人久久久久影院| 亚洲国产精品无码久久| 四房播播网址| 久久婷婷视频亚洲| 人妻人人揉人人躁人人| 日韩精品一区二区三区日韩| 99re视频热这里只有精品7| 亚洲国产高清国产精品| 久久精品国产99精品最新| 亚洲欧美精品一中文字幕| 国产精品美女久久久M| 亚洲综合国产精品第一页| 99精品毛片| 少妇疯狂高潮| 国产精品va在线观看无码不卡| 日本三级香港三级人妇久久| 亚洲精品无码久久不卡| 一区二区在线欧美日韩中文| 337P人体粉嫩| 人妻123区| 国产成人精品一区二区三区在线观看| 成人又黄又爽又色的视频|