首個能夠從零開始自動化設計和生成虛擬細胞模型的多智能體系統(tǒng)來了!
近日,美國耶魯大學馬克·格斯坦(Mark Gerstein)教授、斯米塔·克里希納斯瓦米(Smita Krishnaswamy)教授、唐相儒,賓夕法尼亞大學黃治教授、崔巖,斯坦福大學吳方,哈佛大學林希虹教授,以及德國慕尼黑亥姆霍茲中心法比安·泰斯(Fabian Theis)教授、汪偉旭等組成的聯(lián)合團隊,在預印本平臺arXiv上傳了題為《CellForge:虛擬細胞模型的智能體化設計》(CellForge: Agentic Design of Virtual Cell Models)[1] 的研究論文。
圖丨相關論文(來源:arXiv)
該多智能體系統(tǒng)不僅可用于虛擬細胞建模,還可以被廣泛地用于 AI for Science 的各類模型設計。這項成果在 AI for Science 的方法論上邁出了關鍵一步,也為單細胞組學、藥物研發(fā)和合成生物學提供了一條新的自動化科研路徑。
圖丨馬克·格斯坦(Mark Gerstein)教授(來源:資料圖)
CellForge 可直接輸出用于虛擬細胞建模等 AI for Science 任務的網(wǎng)絡模型架構。具體而言,研究人員只需輸入原始單細胞多組學數(shù)據(jù)及任務描述(如指定對照與擾動條件,或提出構建新擾動模型的指令),CellForge 便能自動生成優(yōu)化后的模型,并輸出包含訓練與預測的可執(zhí)行代碼。
與傳統(tǒng)人工設計模型的方法不同,CellForge 的獨特之處在于其“多智能體架構”。CellForge 由多個專家型 Agent 共同協(xié)作,每個 Agent 扮演不同角色,例如數(shù)據(jù)專家、模型設計師、生物學家和模型訓練專家。它們通過多輪辯論批判性討論,逐步收斂到最優(yōu)的設計方案。
這一過程高度模擬了現(xiàn)實科研中的跨學科團隊合作:研究人員往往需要通過查閱文獻、交流實驗思路、比較優(yōu)缺點,最終凝聚出一個合理的研究計劃。CellForge 將這一過程轉化為內部的 Agent 協(xié)作,從而實現(xiàn)了完全自動化的模型構建流程。
在定量實驗中,CellForge 生成的模型在多個數(shù)據(jù)集和場景下顯著超越了此前發(fā)表在Nature Methods、Nature Biotechnology等期刊的先進單細胞擾動預測模型。
這一流程不僅降低了復雜生物建模的操作門檻,同時也確保了計算模型的科學嚴謹性,為單細胞組學分析及合成生物學研究提供了一種高效、精準的解決方案。
人體由具有不同功能、不同類型的細胞構成,而細胞的核心特性由其基因表達模式?jīng)Q定。例如,免疫細胞可以對抗炎癥或感染,干細胞能夠分化成組織,而癌細胞則通過調控基因表達逃逸細胞分裂的控制。細胞的基因表達由 RNA 分子介導,后者是 DNA 轉錄的直接產(chǎn)物?;虮磉_不僅決定了細胞的類型,還動態(tài)反映了細胞的狀態(tài)變化。
虛擬細胞建模是當前生物學與人工智能交叉領域的前沿方向,旨在預測細胞對各種擾動(基因編輯、藥物處理、細胞因子刺激等)的定量響應。通過研究細胞基因表達的變化,可以揭示細胞如何從健康狀態(tài)轉變?yōu)檠装Y狀態(tài)甚至癌變狀態(tài)。然而,構建此類模型面臨多重技術挑戰(zhàn)。
該研究中,一個重要的突破在于 CellForge 的跨模態(tài)能力。單細胞組學數(shù)據(jù)包括 RNA 測序(scRNA-seq)、染色質可及性數(shù)據(jù)(scATAC-seq)、蛋白質標記數(shù)據(jù)(CITE-seq)等多種模態(tài)。以往的研究通常針對特定模態(tài)開發(fā)模型,很難推廣到新的數(shù)據(jù)類型。而 CellForge 通過其任務分析模塊自動識別模態(tài)特征,并在方法設計階段生成合適的網(wǎng)絡架構,從而展現(xiàn)出跨模態(tài)的泛化能力。
在驗證測試中,它不僅在 RNA-seq 任務上超過了scGPT、Geneformer、ChemCPA 等領域代表性模型,還在 ATAC-seq 和 CITE-seq 任務上實現(xiàn)了突破性提升。這種能力對于推動新型實驗模態(tài)的研究至關重要,因為生物學數(shù)據(jù)的異質性極高,而 CellForge 的靈活性意味著它能夠快速適配不同的研究場景。
研究團隊的目標是開發(fā)一種基于強大的自進化的多智能體框架的方法,讓模型能夠根據(jù)當前細胞狀態(tài)和任務,預測之前未遇到過的干擾,并自主設計出之前不存在的且最適合的模型架構。
(來源:arXiv)
CellForge 的工作流程分為三個核心環(huán)節(jié):
·首先是任務分析。系統(tǒng)在接收到原始單細胞多組學數(shù)據(jù)以及研究者提出的自然語言任務描述后,會自動對數(shù)據(jù)進行表征分析,并檢索相關文獻,以理解該任務在科學背景中的位置。這一步類似于科研人員做綜述和查找先前工作,為后續(xù)設計提供知識支撐。
·第二步是方法設計。在這一階段,多個智能體會像專家團隊一樣提出各自的建模思路,包括可能的神經(jīng)網(wǎng)絡架構、訓練方法和優(yōu)化方案。隨后,它們通過多輪批判性對話不斷迭代,直到達成一致意見,生成最優(yōu)的研究計劃。
·最后是實驗執(zhí)行。系統(tǒng)會將最終設計轉化為可運行的代碼,自動完成數(shù)據(jù)預處理、模型訓練、驗證和推理,并輸出最終結果。這意味著研究人員只需輸入數(shù)據(jù)和研究目標,CellForge 便能從頭到尾產(chǎn)出完整的科研工作流。
圖丨 CellForge 架構與工作流程(來源:arXiv)
與以往的 AI 系統(tǒng)相比,CellForge 系統(tǒng)不僅能夠提出假設或研究方案,還能讓每個智能體根據(jù)文獻搜索結果提出想法。這些智能體會互相審視對方的方案,并進行多輪(可能多達 10 輪)的批判性討論,直至方案收斂到最優(yōu)解。
更值得一提的是,CellForge 具備自動生成可執(zhí)行代碼的能力。這一點在現(xiàn)有 AI for Science 框架中尚不多見。大多數(shù)系統(tǒng)往往停留在提出研究思路或提供部分分析,而 CellForge 可以將討論結果直接轉化為高質量的 Python 代碼,涵蓋數(shù)據(jù)預處理、模型訓練、超參數(shù)優(yōu)化和結果可視化等完整流程。
這意味著研究人員無需再手動編寫復雜的代碼,而是可以讓 CellForge 直接自己運行生成的程序,迅速獲得實驗結果。研究團隊指出,這種“端到端”的自動化能力顯著降低了科研門檻,讓沒有深厚計算背景的生物學研究者也能夠使用先進的建模方法。
圖丨 CellForge 三個模塊的示例輸出(來源:arXiv)
為驗證 AI 自主設計的網(wǎng)絡架構是否能夠超越人類的設計,研究團隊選擇了六個數(shù)據(jù)集,涵蓋基因敲除、藥物處理和細胞因子刺激等多種擾動類型,涉及多種模態(tài)。研究團隊在每個數(shù)據(jù)集上都進行了三次實驗。
在 CellForge 系統(tǒng)中,輸入是一個數(shù)據(jù)集和一個研究問題,系統(tǒng)會根據(jù)這個數(shù)據(jù)集和研究問題輸出針對性的模型。雖然任務可能相似,但由于數(shù)據(jù)集不同,系統(tǒng)會為每個數(shù)據(jù)集設計一個量身定制的方案。
在系統(tǒng)的內部機制上,CellForge 的關鍵創(chuàng)新是多智能體的協(xié)作優(yōu)化。每個智能體基于文獻檢索和數(shù)據(jù)分析提出方案,其他智能體會對這些方案進行批判和質疑。這個過程可能會反復進行上千輪,直到各方收斂到最優(yōu)解。
研究人員還為其設計了類似深度優(yōu)先和廣度優(yōu)先的搜索機制,使智能體在提出方案之前能先進行充分的知識探索,從而提高設計的合理性。這種“批判性共識”機制不僅提升了模型性能,也讓生成的方案更具可解釋性,避免了單一大模型容易出現(xiàn)的幻覺和偏差問題。
圖丨 CellForge 的多 Agent 討論過程(來源:arXiv)
在性能評估中,CellForge 不僅在單細胞建模任務中顯著超越了 scGPT、Geneformer、ChemCPA 等領域代表性方法,還與近期提出的通用科研自動化框架 Biomni 和 DeepResearch 進行了對比。
結果顯示,CellForge 在任務特異性和模型生成能力上更具優(yōu)勢,能夠輸出更高質量、更可執(zhí)行的研究方案,尤其在人類專家打分和跨模態(tài)預測中領先明顯。這一差異凸顯了 CellForge 針對虛擬細胞建模的深度優(yōu)化,相較通用框架更貼合生物學實際應用需求。
圖丨CellForge 生成結果的專家評估對比(來源:arXiv)
使用過 CellForge 的研究人員對 DeepTech 表示,可基于該系統(tǒng)實現(xiàn)高效的科學突破,無論輸入什么樣的數(shù)據(jù)集、任務或研究問題,都能基于此設計出比人類設計的神經(jīng)網(wǎng)絡架構更好的模型,助力科學發(fā)現(xiàn)進入規(guī)?;瘯r代。
這一突破意味著,AI 可大幅縮短科學發(fā)現(xiàn)的周期。過去,設計模型需要花費多達五六年的時間,但現(xiàn)在,AI 系統(tǒng)可以基于之前的工作基礎,快速進行科學發(fā)現(xiàn)和模型設計。
從應用角度來看,CellForge 的潛力遠不止于學術研究。虛擬細胞建模本身是一個關鍵的前沿方向,其核心目標是預測細胞在基因編輯、藥物處理或環(huán)境刺激下的響應。傳統(tǒng)藥物研發(fā)流程往往依賴動物實驗和臨床試驗,成本極高且失敗率居高不下。CellForge 通過虛擬建模,可以在計算機中提前預測細胞對藥物的反應,從而篩選出最有前景的候選藥物,減少不必要的試錯過程。這種能力有望顯著縮短藥物研發(fā)周期,降低臨床試驗的失敗風險。因此,CellForge 在癌癥研究、免疫治療和干細胞分化等領域都可能成為重要的工具。
研究團隊還強調,這一系統(tǒng)不僅僅是科研輔助工具,更是邁向“AI 科學家”的一步。與解決標準化測試題目或優(yōu)化固定模型不同,CellForge 能夠根據(jù)數(shù)據(jù)和任務自主構思全新的網(wǎng)絡架構。這種從零設計的能力意味著 AI 不再只是人類的助手,而是具備了獨立進行科學探索的潛質。
未來,團隊計劃將 CellForge 與自動化實驗平臺結合,使其能夠直接控制實驗設備,完成從模型設計到實際實驗的閉環(huán)驗證。這一方向一旦實現(xiàn),將進一步加速科學研究的工業(yè)化和規(guī)?;M程。
馬克·格斯坦教授和唐相儒博士此前的工作為本次開發(fā) CellForge 系統(tǒng)提供了底層技術支持。例如通過開發(fā)Medagents系統(tǒng) [2],首次將 AI 多智能體應用于疾病診斷。此外,他們之前還有一項關于ChemAgent的研究 [3],探討了如何利用可自主進化的智能體系統(tǒng)更好地回答量子力學或量子化學等領域的專家級別的復雜化學推理問題。
從長遠來看,CellForge 的出現(xiàn)可能改變科研范式。過去,科學發(fā)現(xiàn)往往依賴于專家的創(chuàng)造性思維和長期積累,一個新的建模方法可能需要五六年的時間才能從概念走到應用。而 CellForge 這樣的系統(tǒng)可以在幾天甚至幾小時內完成從文獻調研到模型設計、代碼生成和實驗驗證的全過程。這意味著科學發(fā)現(xiàn)可能進入一種“可擴展”的新模式,即通過算力和智能體協(xié)作實現(xiàn)科研的加速與量產(chǎn)。這不僅會提高研究效率,也可能帶來前所未有的科學突破。
目前,CellForge 的論文和代碼均已公開(https://github.com/gersteinlab/CellForge),研究團隊希望全球科研人員能夠使用和改進這一系統(tǒng),共同推動 AI for Science 的發(fā)展。正如論文所言,CellForge 的目標不是取代科學家,而是為他們提供一個強大的智能協(xié)作平臺,讓人類與 AI 共同探索未知的生命奧秘。
參考資料:
1.https://arxiv.org/abs/2508.02276
2.https://arxiv.org/abs/2311.10537
3.https://openreview.net/forum?id=kuhIqeVg0e
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.