來源:ScienceAI
作者:論文團隊
編輯:ScienceAI
科學史的每一次飛躍,往往伴隨著工具的革新。隨著近期大模型和智能體的飛速發(fā)展,這條路徑正在通向一種全新的階段:“AI 科學家”。 在 AI 賦能科研的前沿,我們正見證一個重要的里程碑:從證明 AI 智能體 “能否” 解決特定科學問題,轉向思考如何讓它 “高效、可靠、規(guī)模化” 地參與整個研究過程。
Nature 在近期發(fā)布的新聞解析《How AI agents will change research: a scientist’s guide》中, 報道了由哈佛大學 Marinka Zitnik 和高尚華團隊與 MIT 發(fā)布的首款大規(guī)模工具開源框架 - ToolUniverse, 這一開放的在線環(huán)境讓研究人員能夠用自然語言將各類大模型和智能體連接到不同科學領域常用的工具,為打造 AI 科學家奠定了基礎。
ToolUniverse 網(wǎng)站:https://aiscientist.tools/
論文詳解:https://arxiv.org/abs/2509.23426
代碼開源:https://github.com/mims-harvard/ToolUniverse
1. 當 AI 生成模型不再足夠:AI 科學家為何而來?
傳統(tǒng) LLM(大語言模型)的核心能力是 “文本生成”,但科學研究需要的遠不止于此:它需要分解復雜問題(如 “如何優(yōu)化降膽固醇藥物”)、規(guī)劃實驗步驟、調(diào)用專業(yè)工具(如分子模擬軟件)、驗證數(shù)據(jù)合理性,甚至在結果偏離預期時自我修正。這種 “推理 + 行動” 的閉環(huán),正是 AI 從 “模型” 升級為 “科學家” 的關鍵。
AI 智能體的突破在于將 LLM 與三大機制深度耦合:
1. 規(guī)劃能力:將 “發(fā)現(xiàn)新藥物” 拆解為 “靶點識別→化合物篩選→性質(zhì)優(yōu)化→專利驗證” 等可執(zhí)行步驟;
2. 記憶系統(tǒng):追蹤中間結果(如 “某化合物對肝組織的滲透率”),避免重復計算或邏輯斷裂;
3. 工具調(diào)用:連接外部數(shù)據(jù)庫、模擬器、分析軟件,彌補 LLM 自身在專業(yè)計算(如分子結合能預測)上的短板。
但科學研究的特殊性給 AI 智能體 其提出了更高要求:不同學科(生物、化學、物理)的工具格式不統(tǒng)一、數(shù)據(jù)需可復現(xiàn)、實驗流程需嚴謹驗證。若僅依賴通用的工具調(diào)用協(xié)議(如 MCP,模型上下文協(xié)議),無法解決 “如何讓 AI 理解質(zhì)譜數(shù)據(jù)格式”“如何協(xié)調(diào)分子模擬與臨床數(shù)據(jù)庫的輸出” 等專業(yè)問題。而這,正是 ToolUniverse 解決的核心問題之一。
2. ToolUniverse:科學 AI Agent 的生態(tài)基石
ToolUniverse 并非單一工具,而是一套 “連接 LLM 與科學工具” 的標準化生態(tài)(圖 1)。它的核心目標是:讓任何 LLM 都能通過統(tǒng)一接口,調(diào)用 600 + 科學工具,完成從 “提出假設” 到 “驗證結論” 的全流程研究。
圖 1:ToolUniverse 是一個用于打造 AI 科學家的生態(tài)系統(tǒng)。通用型大語言模型(LLM)、推理模型與智能體可連接 ToolUniverse 提供的 600 余種科學工具,實現(xiàn)科研工作流自動化。
3. 統(tǒng)一科學工具的 “HTTP”:解決三大痛點
就像 HTTP 協(xié)議統(tǒng)一了互聯(lián)網(wǎng)通信,ToolUniverse 為 AI 科學家定義了專屬的 “科學工具交互標準”(圖 2),既能夠無縫集成本地部署的開源工具,也能安全、規(guī)范地連接強大的閉源模型與 API 服務,解決了 MCP 協(xié)議在科研場景中的三大痛點:
圖 2: ToolUniverse 通過統(tǒng)一協(xié)議連接機器學習模型、智能體、科學軟件工具、數(shù)據(jù)庫與 API。它引入了標準化的工具規(guī)范框架,使語言模型能夠一致地發(fā)現(xiàn)、調(diào)用并解析各類工具。類似于 HTTP 在互聯(lián)網(wǎng)通信中確立標準的方式,ToolUniverse 協(xié)議通過兩項核心操作:Find Tool(查找工具) 與 Call Tool(調(diào)用工具), 定義了 AI 科學家如何請求工具并接收結果。
1. 工具發(fā)現(xiàn)難:通過 “Tool Finder” 組件,AI 可結合關鍵詞搜索、向量嵌入檢索、LLM 推理,從 600 + 工具中精準匹配需求(如 “需要預測化合物肝毒性” 時,自動定位 ADMET-AI 工具);
2. 調(diào)用不規(guī)范:“Tool Caller” 組件會先驗證輸入(如分子結構格式是否符合 SMILES 標準),再執(zhí)行工具,最后將輸出轉化為結構化數(shù)據(jù)(如 “結合能 - 8.2 kcal/mol” 而非雜亂文本);
3. 推理難閉環(huán):新增 “推理控制層”,讓 AI 能理解工具輸出的科學意義(如 “該化合物腦滲透率高→可能引發(fā)中樞副作用”),而非僅機械調(diào)用。
這種標準化設計,讓 AI 從 “會用工具” 升級為 “會用科學工具解決問題”。
4. 四大核心組件:支撐 AI 科學家的完整生命周期
ToolUniverse 通過四大組件(圖 3),覆蓋了 AI 科學家從 “工具獲取” 到 “ workflow 優(yōu)化” 的全流程需求,真正實現(xiàn) “可編程的科學協(xié)作”:
(1)Tool Manager:工具的 “注冊與管理中心”
它解決了 “如何將新工具接入生態(tài)” 的問題:
1. 本地工具(如實驗室自研的數(shù)據(jù)分析腳本)只需提交 “功能描述 + 參數(shù)格式 + 輸出示例”,即可被自動納入統(tǒng)一 schema;
2. 遠程工具(如云端分子模擬平臺)通過 MCP 協(xié)議接入,無需暴露內(nèi)部代碼,兼顧安全性與兼容性;
3. 自動驗證工具有效性(如 “輸入錯誤分子結構時是否返回提示”),確保 AI 調(diào)用時的可靠性。
(2)Tool Composer:科學 workflow 的 “搭建者”
科學研究很少依賴單一工具,比如 “藥物篩選” 需要串聯(lián) “靶點數(shù)據(jù)庫→化合物庫→分子對接工具→毒性預測工具”。Tool Composer 的作用就是:
1. 定義工具間的數(shù)據(jù)流(如 “分子對接工具的輸出結構,直接作為毒性預測工具的輸入”);
2. 支持條件邏輯(如 “若毒性預測超標,則返回上一步重新篩選化合物”);
3. 生成可復現(xiàn)的 workflow 腳本,方便人類科學家追溯或修改。
4. 通過智能體系統(tǒng),實現(xiàn)工具間調(diào)用關系的自動構建與優(yōu)化。
(3)Tool Discover:工具的 “自動生成器”
當現(xiàn)有工具無法滿足需求(如 “需要一種新的基因表達數(shù)據(jù)可視化工具”),AI 可通過自然語言描述需求,Tool Discover 會:
1. 將文本描述轉化為結構化工具規(guī)格(如 “輸入:CSV 格式表達矩陣;輸出:熱圖 + 火山圖”);
2. 自動生成代碼、測試用例,通過 “預期行為 vs 實際輸出” 的反饋循環(huán)迭代優(yōu)化;
3. 無需人工編碼,讓工具庫隨科研需求動態(tài)擴展。
(4)Tool Optimizer:工具的 “質(zhì)量守護者”
科學研究強調(diào)可復現(xiàn)性,Tool Optimizer 通過三大動作保障工具穩(wěn)定性:
1. 定期生成測試用例(如 “用已知活性的化合物驗證分子對接工具的準確性”);
2. 分析工具輸出與規(guī)格的偏差(如 “某工具預測的結合能與實驗值誤差突然增大”);
3. 自動更新工具文檔或參數(shù)設置,確保 AI 調(diào)用時的一致性。
圖 3: ToolUniverse 提供了六項關鍵能力,支持 AI 科學家完整的生命周期:查找工具、調(diào)用工具、添加新工具、將工具串聯(lián)為工作流、從自然語言生成新工具,以及優(yōu)化工具規(guī)范以提升可用性。
5. 跨模型兼容:讓每類 LLM 都能成為科學助手
不同科研場景對 LLM 的需求差異極大:實驗室本地分析可能需要輕量開源模型(如 Llama 3),而復雜 hypothesis 推理可能依賴云端大模型(如 Claude 3),生物醫(yī)藥研究還需專業(yè)模型(如 TxAgent)。
ToolUniverse 的兼容性設計打破了 “模型綁定” 局限(圖 4):它將工具調(diào)用轉化為 “標準化函數(shù)調(diào)用”,無需修改 LLM 的權重或 Tokenizer—— 只需通過輕量級包裝器,向模型傳遞 “工具列表 + 參數(shù)格式”,模型輸出即可被解析為工具調(diào)用指令。
這種設計的價值在于:
科研團隊可根據(jù)成本、隱私需求選擇模型,無需擔心 “換模型就要重寫工具調(diào)用邏輯”;
能在相同實驗條件下對比不同模型的性能(如 “用 Gemini-CLI vs Claude 3 做藥物篩選,哪個準確率更高”);
支持專業(yè)模型與通用工具的結合(如 “讓 TxAgent 調(diào)用 ChEMBL 數(shù)據(jù)庫,分析藥物 - 靶點相互作用”)。
圖 4: ToolUniverse 為構建不同類型的 AI 科學家提供了簡潔而高效的協(xié)議:既可用于基于通用大語言模型(如左圖的 Claude),也可用于具備更強推理與控制能力的智能體系統(tǒng)(如右圖的 Gemini-CLI),以及專注于生物醫(yī)學研究的 AI 智能體(如 TxAgent)。
6. 案例實證:AI 科學家如何優(yōu)化降膽固醇藥物
理論架構需要實踐驗證。我們以 “尋找更安全的降膽固醇藥物” 為例,看看 ToolUniverse 構建的 AI 科學家(基于 Gemini-CLI agent)如何完成全流程研究(圖 5)。
步驟 1:靶點識別 —— 鎖定 “關鍵蛋白”
AI 首先調(diào)用 “文獻挖掘工具” 和 “藥物 - 靶點數(shù)據(jù)庫”,通過分析 thousands of 研究論文與臨床數(shù)據(jù),得出結論:HMG-CoA 還原酶是膽固醇合成的關鍵酶,且該酶在肝臟外的過度抑制會引發(fā)肌肉疼痛等副作用。這一步完全復刻了人類科學家的 “靶點發(fā)現(xiàn)” 邏輯,但效率提升 10 倍以上。
步驟 2:起始化合物篩選 —— 從現(xiàn)有藥物入手
AI 通過 ToolUniverse 查詢 “已上市降膽固醇藥物庫”,篩選出以 HMG-CoA 還原酶為靶點的藥物,最終選擇 “洛伐他?。╨ovastatin)” 作為起始化合物 —— 理由是 “臨床驗證充分,但肝外組織滲透率高,存在副作用風險”。
步驟 3:化合物優(yōu)化 —— 提升安全性與有效性
AI 調(diào)用三大工具協(xié)作:
ChEMBL 數(shù)據(jù)庫:獲取洛伐他汀的 100 + 結構類似物;
Boltz-2 工具:預測每個類似物與 HMG-CoA 還原酶的結合能(數(shù)值越低,結合越強);
ADMET-AI 工具:預測類似物的肝滲透率、腦滲透率、代謝穩(wěn)定性。
通過綜合排序,AI 篩選出兩個候選:
普伐他?。╬ravastatin):已知藥物,肝外滲透率低,副作用更少(驗證了 AI 的可靠性);
CHEMBL2347006/CHEMBL3970138:新化合物,結合能比洛伐他汀高 30%,腦滲透率降低 50%,生物利用度提升 25%。
步驟 4:專利與驗證 —— 規(guī)避法律風險
最后,AI 調(diào)用 “專利檢索工具”,發(fā)現(xiàn)新化合物已被注冊用于心血管疾病治療,雖無法直接開發(fā),但為后續(xù)結構修飾提供了方向。
整個過程中,AI 不僅完成了 “調(diào)用工具” 的動作,更體現(xiàn)了科學推理能力:它能解釋 “為何選擇該靶點”“為何淘汰某化合物”,甚至能根據(jù)副作用風險調(diào)整優(yōu)化方向 —— 這正是 “AI 科學家” 與普通工具調(diào)用的本質(zhì)區(qū)別。
圖 5:展示了一個基于 ToolUniverse 構建并應用于藥物發(fā)現(xiàn)的 AI 科學家實例。該系統(tǒng)與 Gemini-CLI 智能體相連,能夠識別生物學靶點、篩選并優(yōu)化候選藥物、評估分子性質(zhì),并利用計算工具驗證結果。整個工作流程展示了 AI 科學家如何在藥物研發(fā)的各個階段進行推理、整合多源證據(jù),并在必要時融入人類反饋。
7. 從用到建:當 “使用者” 成為 “共創(chuàng)者”
一個健康的生態(tài)系統(tǒng),其生命力不僅來源于使用,更來源于創(chuàng)造與貢獻。
ToolUniverse 內(nèi)置了 Tool Discover 和 Tool Optimizer 等核心組件。前者允許用戶通過自然語言描述,自動化生成新工具的規(guī)范與代碼框架;后者能通過多輪測試與反饋,持續(xù)優(yōu)化現(xiàn)有工具的說明與易用性。這一機制巧妙地將用戶從純粹的 “消費者” 轉變?yōu)闈撛诘?“共建者”,激勵社區(qū)智慧反哺生態(tài),形成一個自我完善、持續(xù)生長的良性循環(huán)。
ToolUniverse 的終極愿景,是賦能各個科學領域的專家,而不僅僅是 AI 專家。當生物學家、化學家、藥物研發(fā)人員能夠基于一個穩(wěn)定、豐富的工具生態(tài),輕松定制符合其獨特研究需求的 “AI 科研伙伴” 時,或許將迎來一個真正 AI 輔助科研的全新時代。AI 科學家不僅能調(diào)用數(shù)據(jù)庫、模擬器,還能通過標準化協(xié)議控制實驗室自動化設備(如液體處理機器人、質(zhì)譜儀),實現(xiàn) “提出假設→設計實驗→自動執(zhí)行→分析結果” 的全流程閉環(huán)。
當 AI 能真正理解科學問題、自主協(xié)調(diào)工具、與人類共同推進認知邊界時,我們或許正站在 “科學發(fā)現(xiàn)新范式” 的起點。
閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”
https://wx.zsxq.com/group/454854145828
未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯(lián)網(wǎng)、超級智能,數(shù)智大腦、能源、軍事、經(jīng)濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.