來源:DeepTech深科技
運(yùn)營(yíng)/排版:何晨龍、劉雅坤
當(dāng) Meta 創(chuàng)始人扎克伯格的“AI 挖人大戰(zhàn)”正在進(jìn)行之時(shí),其妻子普莉希拉·陳(Priscilla Chan)也在 AI 大模型領(lǐng)域做出了新成績(jī)。
圖丨扎克伯格與其妻子普莉希拉·陳(Priscilla Chan)(來源:資料圖)
十年前,扎克伯格和美國(guó)哈佛大學(xué)生物學(xué)專業(yè)畢業(yè)的妻子共同創(chuàng)立了名為陳?扎克伯格倡議(CZI,Chan Zuckerberg Initiative)的慈善組織,該組織是一個(gè)致力于通過科技手段、戰(zhàn)略性投資以及跨領(lǐng)域合作,推動(dòng)人類健康、教育公平和社會(huì)正義的長(zhǎng)期項(xiàng)目。當(dāng)時(shí),扎克伯格還承諾捐出其在臉書 99% 的股份來支持這一組織[1]。在 CZI 的日常運(yùn)營(yíng)管理中,普莉希拉·陳擔(dān)任主要負(fù)責(zé)人。
近日,該組織發(fā)布一款名為rBio 的推理模型,這是一個(gè)基于預(yù)訓(xùn)練大模型的、通過強(qiáng)化學(xué)習(xí)后訓(xùn)練的生物學(xué)推理模型。這也是一款基于虛擬細(xì)胞(Virtual Cell)模型模擬結(jié)果訓(xùn)練的模型,能從虛擬細(xì)胞模型中學(xué)習(xí)推理能力,相關(guān)論文也已發(fā)表在
bioRxiv。需要說明的是,虛擬細(xì)胞是一種通過計(jì)算模型和數(shù)學(xué)模擬來模擬真實(shí)細(xì)胞結(jié)構(gòu)、功能和行為的研究工具。
圖 | rBio 架起了 AI 推理與細(xì)胞生物學(xué)之間的橋梁,讓科學(xué)家能夠用通俗的語(yǔ)言提出關(guān)于基因相互作用的復(fù)雜問題(來源:資料圖)
在訓(xùn)練過程中,rBio 將從虛擬細(xì)胞模型中提取的信息,蒸餾為統(tǒng)一的自然語(yǔ)言模型,使用戶能夠輕松地針對(duì)復(fù)雜生物學(xué)問題展開縝密的逐步推理。這一過程將虛擬細(xì)胞模型轉(zhuǎn)變?yōu)橥评砟P偷摹吧飳W(xué)老師”,避開了僅依賴實(shí)驗(yàn)數(shù)據(jù)作為訓(xùn)練依據(jù)的局限。將一個(gè)或多個(gè)虛擬細(xì)胞模型的能力與大模型的對(duì)話式界面相結(jié)合,有望讓人們基于豐富的生物學(xué)基礎(chǔ)模型開展生物學(xué)問題研究,同時(shí)還能在熟悉的交互界面中進(jìn)行操作。
與此同時(shí),rBio 無需依賴非對(duì)即錯(cuò)的硬性標(biāo)簽,而是將與模型輸出的一致性作為反饋,在生物學(xué)的不確定性中學(xué)習(xí)推理。它能夠整合多個(gè)生物學(xué)模型的知識(shí),實(shí)現(xiàn)對(duì)于復(fù)雜、多尺度系統(tǒng)的推理,從而幫助科研人員預(yù)測(cè)、解釋和設(shè)計(jì)生物學(xué)研究,并且無需依賴直接的實(shí)驗(yàn)數(shù)據(jù)。
在訓(xùn)練過程中,該模型利用生物學(xué)習(xí)模型獲取生物學(xué)知識(shí)進(jìn)行驗(yàn)證。研究人員表示,其所采用的軟驗(yàn)證的方式能夠?qū)⑸飳W(xué)世界模型蒸餾至 rBio 中。以擾動(dòng)預(yù)測(cè)為例,相比現(xiàn)有的最先進(jìn)模型,rBio 在 PerturbQA 基準(zhǔn)測(cè)試中表現(xiàn)出領(lǐng)先性能。與此同時(shí),他們還驗(yàn)證了組合式驗(yàn)證器對(duì)于構(gòu)建更通用 rBio 模型的優(yōu)勢(shì)。其認(rèn)為,rBio 提供了一個(gè)很好的概念驗(yàn)證。它表明利用生物模型的預(yù)測(cè)結(jié)果,在無需使用實(shí)驗(yàn)數(shù)據(jù)的前提之下,通過模擬的方式就能訓(xùn)練出性能強(qiáng)大的推理模型,而這無疑代表了一種全新的訓(xùn)練范式。
總的來說,rBio 顛覆了傳統(tǒng)模式——它將生物學(xué)世界模型的模擬結(jié)果用作“軟驗(yàn)證器”,把虛擬細(xì)胞模型轉(zhuǎn)化為強(qiáng)化學(xué)習(xí)式推理的訓(xùn)練環(huán)境,從而能夠吸收上述模型的核心知識(shí)。
就 rBio 的功能來說:
首先,在 PerturbQA 基準(zhǔn)測(cè)試上,rBio 能夠通過語(yǔ)言提示來預(yù)測(cè)基因擾動(dòng)效應(yīng)。
其次,在跨任務(wù)泛化能力上,即便在不相關(guān)的模擬數(shù)據(jù)上訓(xùn)練,它也能提升對(duì)未見過的擾動(dòng)任務(wù)的性能。例如,研究人員基于 Transcriptformer(陳·扎克伯格倡議旗下的虛擬細(xì)胞模型之一)的基因表達(dá)共現(xiàn)模擬數(shù)據(jù)進(jìn)行訓(xùn)練。
再次,實(shí)現(xiàn)了具有競(jìng)爭(zhēng)力的結(jié)果:通過思維鏈(COT,chain of thought)方法,僅使用模型生成的數(shù)據(jù)(測(cè)試時(shí)不依賴工具或檢索),rBio 在 PerturbQA 上的性能便達(dá)到了最先進(jìn)水平(該水平由研究人員基于硬性實(shí)驗(yàn)數(shù)據(jù)訓(xùn)練的消融模型定義)。
https://www.biorxiv.org/content/10.1101/2025.08.18.670981v2.full.pdf)
值得注意的是,北京大學(xué)本碩校友、英國(guó)劍橋大學(xué)博士畢業(yè)生 Donghui Li 是相關(guān)論文的共同作者之一。領(lǐng)英資料顯示,他在陳?扎克伯格倡議工作已有八年之久。
圖 | Donghui Li 是相關(guān)論文的共同作者之一(來源:資料圖)
rBio 的核心構(gòu)成
一般來說,推理模型在代碼或符號(hào)數(shù)學(xué)等形式化系統(tǒng)中針對(duì)驗(yàn)證機(jī)制進(jìn)行訓(xùn)練。然而,在生物學(xué)等領(lǐng)域,人們通常無法獲得能夠支持大規(guī)模形式化驗(yàn)證的精確規(guī)則,以至于往往需要通過在實(shí)驗(yàn)室中檢驗(yàn)假設(shè)來評(píng)估預(yù)測(cè)的有效性。通過真實(shí)實(shí)驗(yàn)進(jìn)行驗(yàn)證不僅速度慢、成本高,而且無法隨計(jì)算規(guī)模進(jìn)行擴(kuò)展。rBio 的成功問世證明了這一事實(shí),即人們可以利用生物學(xué)世界模型或其他先驗(yàn)知識(shí)作為生物知識(shí)的近似驗(yàn)證機(jī)制,通過軟驗(yàn)證的方式來訓(xùn)練推理系統(tǒng),全程完全無需額外的實(shí)驗(yàn)數(shù)據(jù)。
圖 | rBio 是一種基于虛擬細(xì)胞模擬訓(xùn)練的推理模型,旨在加速生物學(xué)領(lǐng)域的研究進(jìn)度(來源:資料圖)
在設(shè)計(jì) rBio 的過程中,研究人員攻克了向大模型傳授生物學(xué)知識(shí)的一項(xiàng)根本性難題。對(duì)于此前的大模型來說,它們的設(shè)計(jì)初衷是從結(jié)果明確的問題中學(xué)習(xí),例如“2+2=?”或“水是否由氫和氧組成”。但生物學(xué)問題必須納入不同程度的不確定性,比如一種新藥是否可能治愈某種特定癌癥。
以 TranscriptFormer 為基礎(chǔ),研究人員針對(duì)大模型的訓(xùn)練方法進(jìn)行了創(chuàng)新。他們以一款現(xiàn)成的語(yǔ)言模型為框架,通過強(qiáng)化學(xué)習(xí)對(duì) rBio 進(jìn)行訓(xùn)練。事實(shí)上,這也是一種 AI 領(lǐng)域的常見技術(shù),模型會(huì)因給出正確答案而獲得獎(jiǎng)勵(lì)。但是,本次研究人員并未采用“是非題”的形式,而是根據(jù)模型答案的正確概率來調(diào)整獎(jiǎng)勵(lì)比例。這種新穎的方法讓 rBio 能夠?qū)W會(huì)提出與生物學(xué)現(xiàn)實(shí)相符的假設(shè),從而提高了準(zhǔn)確性、連貫性和科學(xué)價(jià)值。
一款借助虛擬細(xì)胞之力的大模型
據(jù)了解,TranscriptFormer 接收指令后返回的結(jié)果是復(fù)雜數(shù)據(jù),而 rBio 則允許用戶使用通俗語(yǔ)言進(jìn)行交互。例如,在訓(xùn)練過程中,研究人員向 rBio 提出的問題結(jié)構(gòu)如下:“基因 A 和基因 B 是否可能共表達(dá)??jī)H給出‘是/否’的二元答案。”而作為一款推理模型,rBio 能夠回答那些表述不同但本質(zhì)相同的問題。
但是,假如采用“軟性”評(píng)估指標(biāo)來訓(xùn)練大模型,可能導(dǎo)致模型輸出失準(zhǔn)。為了確保 rBio 不被誤導(dǎo),研究團(tuán)隊(duì)將其性能與多個(gè)基準(zhǔn)大模型進(jìn)行了對(duì)比。在各類細(xì)胞標(biāo)記和擾動(dòng)預(yù)測(cè)任務(wù)中,rBio 的表現(xiàn)均優(yōu)于基準(zhǔn)模型,這表明虛擬細(xì)胞模型能夠訓(xùn)練出來“能對(duì)生物學(xué)問題進(jìn)行推理”的可靠大模型。具體而言,rBio 的首個(gè)版本在 PerturbQA 基準(zhǔn)測(cè)試中,性能超過了一些同類模型和 QWEN2.5 這樣的基準(zhǔn)大模型。在使用思維鏈的時(shí)候,其性能與直接基于實(shí)驗(yàn)數(shù)據(jù)訓(xùn)練的高性能 rBio 消融模型相當(dāng)。與此同時(shí),rBio 通過從與擾動(dòng)任務(wù)無關(guān)的 TranscriptFormer 模型進(jìn)行零樣本學(xué)習(xí),能夠顯著提升對(duì)于基因激活/抑制等擾動(dòng)任務(wù)的理解能力。這一結(jié)果表明,虛擬細(xì)胞模型中蘊(yùn)含的可遷移知識(shí)具有重要的后續(xù)研究?jī)r(jià)值。
盡管 rBio 有潛力從多種細(xì)胞生物學(xué)研究方法中學(xué)習(xí),但是該模型首先是基于擾動(dòng)模型、基因共表達(dá)模式以及從 TranscriptFormer 中提取的基因調(diào)控通路信息進(jìn)行訓(xùn)練的。這種多功能模型能夠針對(duì)不同物種和發(fā)育階段的多種細(xì)胞類型及狀態(tài)進(jìn)行分類。用戶在使用時(shí)可以向 rBio 提出諸如“抑制基因 A 的作用是否會(huì)導(dǎo)致基因 B 的活性增強(qiáng)?”之類的問題。作為回應(yīng),模型會(huì)提供有關(guān)細(xì)胞后續(xù)變化的信息,例如從健康狀態(tài)向疾病狀態(tài)的轉(zhuǎn)變。
當(dāng)面對(duì)全新的數(shù)據(jù)和假設(shè)時(shí), rBio 能通過預(yù)測(cè)研究結(jié)果 , 從而能 為 研究人員 節(jié)省時(shí)間,避免他們?cè)诔杀靖甙旱膶?shí)驗(yàn)室研究中投入時(shí)間和資源去測(cè)試和排除多個(gè)假設(shè)。而針對(duì)這些問題的答案將深化我們對(duì)于阿爾茨海默病等神經(jīng)退行性疾病相關(guān)基因互作機(jī)制的理解,進(jìn)而有望推動(dòng)早期干預(yù)手段的發(fā)展,甚至有朝一日實(shí)現(xiàn)這些疾病的徹底阻斷。
“讓 AI 像科學(xué)家一樣思考”
據(jù)了解,rBio 是陳·扎克伯格倡議在構(gòu)建“能像科學(xué)家一樣思考”的 AI 系統(tǒng)愿景中的又一重要進(jìn)步,類似于 rBio 這樣的 AI 系統(tǒng)旨在通過從虛擬細(xì)胞模型和數(shù)據(jù)中學(xué)習(xí)來產(chǎn)生新知識(shí)。在開發(fā) rBio 的過程中,陳·扎克伯格倡議還構(gòu)建了一個(gè)更廣泛的框架,以用于整合虛擬細(xì)胞模型的海量知識(shí),這將有助于在未來幾年打造一系列易于獲取的生物學(xué) AI 工具。
如今,rBio 已在陳·扎克伯格倡議的虛擬細(xì)胞平臺(tái)上線,能夠幫助研究基因擾動(dòng)的研究人員加速研究進(jìn)程。機(jī)器學(xué)習(xí)從業(yè)者也可利用 rBio 框架訓(xùn)練自己的大模型,或者直接使用 rBio 對(duì)其模型進(jìn)行基準(zhǔn)測(cè)試。
目前,rBio 的專長(zhǎng)僅限于基因擾動(dòng)領(lǐng)域,但 TranscriptFormer 所涵蓋的所有細(xì)胞生物學(xué)領(lǐng)域知識(shí)都可傳授給 rBio。未來,虛擬細(xì)胞平臺(tái)上的一系列虛擬細(xì)胞模型都可用于訓(xùn)練類似的推理模型,實(shí)現(xiàn)對(duì)細(xì)胞從最小分子到最大系統(tǒng)的全方位理解。
盡管 rBio 已經(jīng)具備科研應(yīng)用條件,但是本次研究人員仍在持續(xù)優(yōu)化用戶體驗(yàn)。因?yàn)檫@種“賦予推理模型對(duì)話能力的問題解決靈活機(jī)制”,也會(huì)帶來一系列挑戰(zhàn)。其中一項(xiàng)關(guān)鍵挑戰(zhàn)在于:必須為模型設(shè)置適當(dāng)?shù)姆雷o(hù)機(jī)制,防止 rBio 對(duì)超出其專業(yè)領(lǐng)域的問題作出應(yīng)答,而這類安全措施也是所有“大模型負(fù)責(zé)任開發(fā)”的通用環(huán)節(jié)之一。
毫無疑問,AI 已在加速生物學(xué)研究的步伐。虛擬細(xì)胞模型能夠讓研究人員避免了徒勞的實(shí)驗(yàn),而大模型則提供了通過對(duì)話積累知識(shí)的便捷方式。rBio 融合了這些優(yōu)勢(shì),展示了一種無需領(lǐng)域?qū)I(yè)知識(shí)即可借助 AI 解答生物學(xué)難題的框架。隨著陳·扎克伯格倡議的虛擬細(xì)胞模型家族不斷壯大,rBio 等推理模型將助力科學(xué)家開展研究、開發(fā)療法,并有望實(shí)現(xiàn)相關(guān)疾病的預(yù)防。
參考資料:
1.https://web.shobserver.com/wx/detail.do?id=8061
https://virtualcellmodels.cziscience.com/model/rBio
https://www.biorxiv.org/content/10.1101/2025.08.18.670981v2
https://github.com/czi-ai/rbio
https://www.linkedin.com/in/donghui-li/details/education/
https://www.linkedin.com/posts/theofanis-karaletsos-57479262_rbio1-training-scientific-reasoning-llms-activity-7364311052425072646-pZ6x/
閱讀最新前沿科技趨勢(shì)報(bào)告,請(qǐng)?jiān)L問歐米伽研究所的“未來知識(shí)庫(kù)”
https://wx.zsxq.com/group/454854145828
未來知識(shí)庫(kù)是“ 歐米伽 未來研究所”建立的在線知識(shí)庫(kù)平臺(tái),收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級(jí)智能,數(shù)智大腦、能源、軍事、經(jīng)濟(jì)、人類風(fēng)險(xiǎn)等等領(lǐng)域的前沿進(jìn)展與未來趨勢(shì)。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進(jìn)入。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.