新智元報道
編輯:元宇
【新智元導讀】近日,谷歌與耶魯大學聯(lián)合發(fā)布的大模型C2S-Scale,首次提出并驗證了一項全新的「抗癌假設」。這一成果表明,大模型不僅能復現(xiàn)已知科學規(guī)律,還具備生成可驗新科學假設的能力。
剛剛,AI科學應用領域又有一件大事發(fā)生!
谷歌與耶魯大學的科學家們聯(lián)合發(fā)布了一個大模型Cell2Sentence-Scale 27B(C2S-Scale)。
該模型提出了一個關于癌細胞行為的全新假設,并在多次體外實驗中得到驗證。
這一發(fā)現(xiàn)引發(fā)廣泛關注,它展示了人工智能模型生成原創(chuàng)科學假設的潛力,有望由此打開一條人類抗癌的新途徑。
網(wǎng)友prinz在x平臺上評價道,「這表明該模型并非簡單重復已知事實,而是生成了新的、可驗證的科學假設?!?/p>
C2S-Scale基于Google的開源Gemma模型構(gòu)建,訓練語料涵蓋超過10億個Token的轉(zhuǎn)錄組數(shù)據(jù)、生物學文獻與元數(shù)據(jù),從而使其具備跨維度解析細胞行為的能力。
目前,耶魯大學的研究團隊正在推進AI在其他免疫學情境中生成更多科學預測,這一機制的出現(xiàn)有望加速抗癌新療法的研發(fā)步伐。
研究人員還在bioRxiv上公開了論文的預印本,目前該論文正在經(jīng)歷「同行評審」階段。
論文地址https://www.biorxiv.org/content/10.1101/2025.04.14.648850v2.full.pdf+html
AI不是只懂復現(xiàn)
還可以提出全新發(fā)現(xiàn)
C2S-Scale是一款擁有270億參數(shù)、旨在理解單個細胞「語言」的基礎模型。
它建立在Gemma模型家族之上,將單細胞分析帶入了一個全新的前沿階段。
C2S-Scale在科學預測方面的成果證明了研究團隊在生物學模型上的一項假設:
生物學模型同樣遵循明確的模型擴展規(guī)律——就像自然語言模型一樣,模型越大,在生物學任務上表現(xiàn)越優(yōu)。
這也引出一個更為關鍵的問題:更大的模型只是提升了已有能力,還是能夠獲得全新的推理能力?
模型擴展的真正潛力,在于催生新思路、揭示未知規(guī)律,而非僅限于性能的線性提升。
癌癥免疫治療的一大挑戰(zhàn)在于許多腫瘤相對于免疫系統(tǒng)而言幾乎都是「隱身」的。
讓腫瘤「現(xiàn)身」的一個關鍵是通過抗原呈遞(antigen presentation)讓它們顯示出能觸發(fā)免疫反應的信號。
抗原呈遞,是把病原體(比如病毒、腫瘤)的「可疑分子片段」(抗原)展示在細胞表面,讓免疫細胞看到并識別,從而決定是否發(fā)動攻擊。
研究人員賦予C2S-Scale這樣的任務:讓它尋找一種「條件性放大劑」,能夠在「免疫環(huán)境陽性」(Immune-Context-Positive)情況下增強免疫信號。
這一任務需要模型具備復雜的條件推理能力,而這種能力正是大模型隨著規(guī)模擴大所涌現(xiàn)的特性——較小模型無法捕捉這種依賴環(huán)境的效應。
為了實現(xiàn)這一點,研究人員設計了一個「雙環(huán)境虛擬篩選」流程,以識別這種特定的協(xié)同效應。
該流程包括:
免疫環(huán)境陽性(Immune-Context-Positive):輸入真實患者樣本,保留腫瘤與免疫系統(tǒng)的交互,并維持低水平干擾素信號;
免疫環(huán)境中性(Immune-Context-Neutral):輸入缺乏免疫背景的細胞系數(shù)據(jù)。
研究人員在以上兩種環(huán)境中對超過4000種藥物進行模擬,并要求模型預測哪些藥物只會在免疫環(huán)境陽性條件下增強抗原呈遞,從而更符合臨床實際。
結(jié)果顯示,約有10%–30%的藥物在文獻中已有報道,這驗證了模型的可信度。
而其余候選則是從未被報道過的新發(fā)現(xiàn),這意味著模型不僅復現(xiàn)了已知生物學現(xiàn)象,還發(fā)現(xiàn)了潛在的新型免疫協(xié)同藥物。
新里程碑
AI「抗癌假說」得到驗證
C2S-Scale模型發(fā)現(xiàn)了激酶CK2抑制劑silmitasertib(CX-4945)具有一種顯著的「環(huán)境分化效應」:
僅在免疫信號活躍的環(huán)境中顯著增強抗原呈遞,而在免疫中性環(huán)境下幾乎無效。
這一發(fā)現(xiàn)表明模型成功生成了具備實驗可驗證性的全新生物假設。
在后續(xù)的實驗階段,研究人員在人體神經(jīng)內(nèi)分泌細胞模型中測試了這一假設,實驗顯示:
單獨使用silmitasertib對抗原呈遞(MHC-I)影響不顯著;
低劑量干擾素單獨使用僅產(chǎn)生輕微效果;
聯(lián)合使用兩者則顯著增強抗原呈遞,使其提升約50%。
這一結(jié)果證實模型預測的可靠性,并揭示出讓腫瘤對免疫系統(tǒng)更易被識別的潛在新途徑。
C2S-Scale模型計算機模擬預測多次在體外實驗中得到驗證。
它成功識別出一種新的干擾素依賴性放大劑,揭示出讓「冷腫瘤」變「熱」的潛在新途徑,為免疫治療帶來新的希望。
盡管該研究仍處于早期階段,這一成果已為新型聯(lián)合療法的開發(fā)提供了實證依據(jù),并開啟了以大模型驅(qū)動的生物學發(fā)現(xiàn)新范式——科學假設的生成、篩選與驗證將日益智能化、系統(tǒng)化。
目前,新的C2S-Scale 27B模型及其相關資源已在Hugging Face全面開放。
地址:https://huggingface.co/vandijklab/C2S-Scale-Gemma-2-27B
也可以在GitHub上訪問其代碼。
地址:https://github.com/vandijklab/cell2sentence
研究人員希望和更多的人共同探索上述工具,進一步拓展該項研究的成果,讓大模型可以解讀更多生命語言的奧秘,從而為醫(yī)療科技帶來全新突破。
參考資料:
https://x.com/sundarpichai/status/1978507110477332582%20
https://blog.google/technology/ai/google-gemma-ai-cancer-therapy-discovery/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.