歡迎關(guān)注中國科學院自動化研究所 & 北京中關(guān)村學院 & 芝加哥大學 & 西湖大學 & 騰訊帶來的科研智能體方面的最新綜述調(diào)研。
當前基于大語言模型(LLM)的智能體構(gòu)建通過推動自主科學研究推動 AI4S 迅猛發(fā)展,催生一系列科研智能體的構(gòu)建與應用。然而人工智能與自然科學研究之間認知論與方法論的偏差,對科研智能體系統(tǒng)的設計、訓練以及驗證產(chǎn)生著較大阻礙。
與傳統(tǒng)綜述不同,本篇綜述為大家呈現(xiàn)了科研智能體的「漫游指南」,旨在提供構(gòu)建科研智能體的「說明指南」:從科學研究的全周期出發(fā),概述了科研智能體的分級策略,并詳細闡述了對應等級的構(gòu)建策略與能力邊界;同時該「漫游指南」詳細闡明了如何從頭構(gòu)建科研智能體,以及如何對科研智能體的定向能力進行增強。同時「指南」中詳細涵蓋了科研智能體的概念闡述、構(gòu)建方案、基線評估以及未來方向。
希望本「漫游指南」能啟發(fā) AI 研究者與具體自然科學研究者,促進 AI 與自然科學之間的深度融合。
- 論文地址:https://doi.org/10.36227/techrxiv.175459840.02185500/v1
- 倉庫地址:https://github.com/gudehhh666/Awesome_Scientific_Agent.git
綜述的核心貢獻如下:
- 在系統(tǒng)性探索科研智能體領(lǐng)域的過程中,本綜述尤其注重對自然科學領(lǐng)域的科研智能體的深入而嚴謹?shù)慕鈽?gòu)分析,尤其就其構(gòu)建策略與能力范圍而提出了針對科研智能體的三級分級系統(tǒng)。
- 該綜述提供了一套全面而細致的實踐指南,涵蓋從零構(gòu)建科研智能體的基礎(chǔ)流程,到針對特定能力對現(xiàn)有智能體進行定向能力增強,進一步提升現(xiàn)有科研智能體系統(tǒng)的能力與性能。
- 通過結(jié)合科學研究全生命周期與科研智能體構(gòu)建策略,本綜述深入剖析了構(gòu)建策略與科研流程之間相互促進與協(xié)同的過程,揭示了科研智能體設計與應用之間的獨特聯(lián)系。
圖 1|科研智能體對于科研過程全生命周期的介入
科研智能體分級策略
圖 2|科研智能體分級示意
根據(jù)構(gòu)建策略與其能力邊界的等級劃分,科研智能體被我們分為三個等級:
- Agent as Assistant:該等級的智能體通常局限于特定領(lǐng)域的較單一任務,而無法進行跨多個科研流程的綜合性操作。其構(gòu)建策略往往使用小模型經(jīng)過后訓練(Post-training)或微調(diào)(Fine-tuning)而完成。其能力往往局限于被專門訓練過的領(lǐng)域任務。其能夠在一個專門任務上達到很高的水準,但是無法承擔起全面統(tǒng)籌各個科研過程的能力。
- Agent as Partner:該等級的智能體較 Assistant 最大的飛躍便是充分集成各類工具以實現(xiàn)自身能力的躍遷。其構(gòu)建策略上逐步轉(zhuǎn)向更加系統(tǒng)化的架構(gòu)設計,采用閉源大型模型,并結(jié)合豐富的上下文信息進行優(yōu)化。它們的設計不僅僅是優(yōu)化單個任務的性能,而是將多個任務拆解并進行模塊化設計。其能力范圍主要在于在特定領(lǐng)域內(nèi)獨立完成文獻咨詢、假設生成和實驗設計等任務,然而,許多這類智能體仍然局限于知識獲取工具的集成,在復雜任務的自我驗證和可靠性方面存在局限。
- Agent as Avatar:該等級智能體側(cè)重于多個維度的能力增強,其具備了強大的推理能力、深度記憶和強協(xié)作能力,能夠在科學研究的各個階段提供全面支持。其構(gòu)建策略轉(zhuǎn)向?qū)υ兄悄荏w能力的定向增強:通過深度協(xié)作和增強的記憶能力進行設計,能夠處理復雜的科學問題,并協(xié)調(diào)不同工具進行任務執(zhí)行。其能力也不簡單傾向于單一領(lǐng)域,它們能夠跨學科地應用并協(xié)作解決科研難題。
圖 3|不同等級科研智能體匯總
從頭構(gòu)建科研智能體
本綜述凝練了科研智能體的構(gòu)建過程,從頭構(gòu)建科研智能體的工作流主要為知識組織、知識注入以及工具集成三個部分構(gòu)成。
知識組織:知識組織定義了科學信息如何被結(jié)構(gòu)化,以便使智能體能夠有效地理解和推理。它涵蓋非結(jié)構(gòu)化序列(例如研究論文和書籍)、結(jié)構(gòu)化數(shù)據(jù)(例如基因表達數(shù)據(jù)集)、指令(例如問答對)以及知識圖譜,每種方式都提供了獨特的方式來表示和檢索領(lǐng)域知識。這些組織策略作為智能體推理、歸納和決策的基礎(chǔ),對于科學發(fā)現(xiàn)至關(guān)重要。
知識注入:知識注入涉及將特定領(lǐng)域的專業(yè)知識嵌入科學智能體中,這可以通過顯式或隱式方法實現(xiàn)。顯式注入直接將知識整合到提示中或針對特定任務優(yōu)化提示,而隱式注入通常涉及微調(diào)模型或使用強化學習來使智能體的響應適應特定領(lǐng)域。這兩種方法都旨在通過注入相關(guān)專業(yè)知識來增強智能體解決特定領(lǐng)域科學挑戰(zhàn)的能力。
工具集成:工具集成通過將外部工具用于專業(yè)任務(如專業(yè)知識獲取、執(zhí)行和模擬、分析以及可視化)來擴展智能體的功能。通過選擇和集成特定領(lǐng)域的工具,科研智能體可以更高效地執(zhí)行復雜任務。這些工具的有效集成使科研智能體能夠自主運行,協(xié)調(diào)各種資源以協(xié)助科學研究與發(fā)現(xiàn)。
科研智能體能力增強
- 記憶增強:記憶增強對于科學智能體實現(xiàn)類人智能和長期高效運作至關(guān)重要。它使智能體能夠保持上下文、執(zhí)行多步推理并積累經(jīng)驗知識。記憶結(jié)構(gòu),如塊、知識三元組、原子事實、摘要和例程,服務于不同的記憶功能,從存儲上下文信息到細粒度的事實知識。記憶系統(tǒng)分為以上下文為中心和以行動為中心兩種方法,前者側(cè)重于在長時間內(nèi)保持可靠的上下文,后者則增強動態(tài)任務適應和技能泛化能力。這些記憶改進使智能體能夠執(zhí)行更復雜的任務,并保留相關(guān)知識以供未來使用。
- 推理增強:推理增強旨在解決 LLMs 的局限性,例如幻覺和不一致性,特別是在科學任務中。通過結(jié)構(gòu)化推理鏈(例如 CoT 和多輪推理)以及自洽性驗證等機制,科學場景中的通用推理能力得到提升,從而提高智能體輸出的可靠性和透明度。領(lǐng)域特定推理優(yōu)化通過引入領(lǐng)域偏好指導(確保在特定領(lǐng)域內(nèi)進行邏輯推理)和符號演繹(將符號推理與概率模型相結(jié)合),進一步提升了智能體的推理能力,使其在復雜的科學探究中能夠做出更精確和一致的推論。
- 協(xié)作增強:協(xié)作增強著重于改善多智能體系統(tǒng)之間以及智能體與人類在科學研究中的交互。在多智能體協(xié)作中,智能體專注于特定角色,參與結(jié)構(gòu)化對話和辯論,并高效共享知識。角色專業(yè)化和結(jié)構(gòu)化協(xié)議等方法有助于解決角色重疊和信息流等挑戰(zhàn)。人機協(xié)作得益于明確的目標設定和反饋機制,使人類研究人員能夠提供戰(zhàn)略指導并監(jiān)督智能體任務。自然語言界面促進無縫溝通,減少人類與 AI 之間的技術(shù)障礙。這些增強確保智能體和人類能夠有效協(xié)作,優(yōu)化研究成果,并促進更具活力的科學發(fā)現(xiàn)過程。
基準與評估
根據(jù)現(xiàn)有基準的側(cè)重不同,基準主要分為知識密集型任務以及實驗驅(qū)動型任務,兩者對于整體科學研究過程中各有側(cè)重。
知識密集型:科研智能體主要設計用于處理需要深厚專業(yè)知識的復雜、特定領(lǐng)域的任務。這些任務通常圍繞知識傳播展開,包括文獻挖掘、研究假設生成、實驗設計、結(jié)果分析和評估。這類任務要求智能體在專業(yè)領(lǐng)域具備認知能力,而非簡單的一般知識。
實驗驅(qū)動型:面向科研智能體的實驗驅(qū)動任務評估代理在科學探究中使用工具的能力,強調(diào)自主實驗設計、驗證以及在科學環(huán)境中的多過程探索。
圖 4|基準測試匯總
未來研究方向
- 事實性與合理性:確保科學實驗設計的實證準確性和理性仍然是一個主要挑戰(zhàn),需要更好地整合驗證工具和反饋機制;
- 復雜任務適配框架設計:科學智能體需要靈活、連貫的框架,以適應特定的研究領(lǐng)域,從而克服現(xiàn)有復雜、特定領(lǐng)域系統(tǒng)的局限性;
- 自我迭代進化:為了持續(xù)進步,科學智能體需要融入自我反思和持續(xù)迭代機制,重點在于平衡情景記憶和參數(shù)記憶,以防止知識丟失并支持長期發(fā)展;
- 面向科學探索的交互優(yōu)化:優(yōu)化智能體與人類研究人員的交互對于推動科學發(fā)現(xiàn)至關(guān)重要。未來的系統(tǒng)應當整合通用和專用模型,以促進跨學科的動態(tài)有效合作;
- 多學科智能體:科學智能體可以通過促進跨學科知識轉(zhuǎn)移來增強其專業(yè)知識,從而加強其在相關(guān)研究領(lǐng)域的執(zhí)行能力,并提高整體性能;
- 科學評估與驗證:評估人工智能驅(qū)動的科學研究仍然是一項復雜的挑戰(zhàn),需要創(chuàng)新的方法來構(gòu)思開放式研究任務,并確保智能體遵循可證偽性和可重復性等核心科學原則。
在此,我們誠摯邀請 SCI 領(lǐng)域的同學和教師與我們聯(lián)系與合作,共同推動科學代理在自主科學研究中的應用與發(fā)展。我們相信,通過多學科的跨界合作和經(jīng)驗交流,能夠為科學研究的創(chuàng)新和效率提升提供強有力的支持。
如果您對我們的工作或研究方向感興趣,歡迎隨時與我們建立聯(lián)系。期待與各界科研人員攜手合作,共同探索科技前沿,實現(xiàn)更廣泛的學術(shù)價值和應用潛力。
聯(lián)系方式:
中國科學院自動化研究所 & 北京中關(guān)村學院 2024 級直博生王新茗
wangxinming2024@ia.ac.cn
中國科學院自動化研究所副研究員 & 北京中關(guān)村學院共建導師徐健
jian.xu@ia.ac.cn
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.