新智元報道
編輯:桃子
【新智元導(dǎo)讀】AI編寫「生命代碼」成真!今天,斯坦福聯(lián)手Arc Institute放大招,以噬菌體ΦX174為模板,用AI首次生成基因組。其中,16個成功獵殺大腸桿菌,還能KO耐藥菌,堪稱生命學的「ChatGPT時刻」。
人類歷史首次,用AI生成全功能基因組!
1977年,生物化學家Frederick Sanger等人,完成了史上第一個基因組測序——噬菌體ΦX174。
40多年后的今天,斯坦福聯(lián)手Arc Institute團隊,以ΦX174為起點,用AI首次生成了噬菌體基因組。
其中一個,AI設(shè)計的噬菌體基因組,長的是這樣子:
Evo-Φ36
簡單講,噬菌體ΦX174是一種「感染大腸桿菌」的病毒,能精準獵殺細菌,卻對人體無害。
過去,設(shè)計一個基因組絕非易事,需要考慮繁多的因素,限制了合成生物學領(lǐng)域的進展。
為此,斯坦福等團隊拿出了「秘密武器」——
基于數(shù)百萬個基因組訓練,DNA語言模型Evo 1和Evo 2,能以超乎想象的規(guī)模學習基因組的復(fù)雜特征。
其工作原理與ChatGPT類似,專門去處理DNA。
論文地址:https://www.biorxiv.org/content/10.1101/2025.09.12.675911v1
他們以噬菌體ΦX174為模板,合成了285條基因組。
最終顯示,16個基因組可有效抑制宿主生長,不僅能精準干掉特定大腸桿菌,還不會誤傷其他的菌株。
有些AI設(shè)計的噬菌體,比原始版本復(fù)制力更快、競爭力更強,甚至還能對付天然噬菌體難以處理的耐藥菌。
這一實驗的成功,意味著什么?
它標志AI在「合成生物學」領(lǐng)域的一次重大突破——
首次成功驗證了,AI能完整生成具備生物學功能的噬菌體基因組。
這不僅擴展了人類對生命設(shè)計的邊界,還為應(yīng)對「抗生素耐藥性」等健康挑戰(zhàn),提供了全新可替代的療法。
歷史首次!AI生成「完整」基因組
在最新技術(shù)博文中,核心團隊詳細拆解了,成功設(shè)計首批AI生成基因組的秘訣。
不論是設(shè)計單個基因,還是一個完整的基因組,都是一項極具挑戰(zhàn)的難題。
以遺傳信息存儲系統(tǒng)的歷史來算,基因組大概存在了40億年。而DNA基因組的存在,大約有35億年。
今年2月,Arc Institute曾證明了,基因組基礎(chǔ)模型Evo「家族」,可成功生成單個蛋白質(zhì)或復(fù)雜的多組分系統(tǒng),比如CRISPR-Cas復(fù)合體。
但是設(shè)計整個基因組,那又是一個全新的戰(zhàn)場!
因為,基因組設(shè)計,核心難題在于復(fù)雜性:多個基因相互作用,還要維持精妙的平衡,確保復(fù)制、宿主特異性和進化適應(yīng)性。
這些挑戰(zhàn),在單個蛋白質(zhì)設(shè)計中,根本不會存在。
為了攻克這一難題,斯坦福Arc Institute團隊開發(fā)了一系列創(chuàng)新技術(shù),其中包括:
一個為重疊閱讀框定制的基因注釋流程;
用于從基因組語言模型中采樣的系統(tǒng)性微調(diào)與提示詞工程策略;
一套為合成噬菌體基因組設(shè)計的全新篩選方案
ΦX174,跨越半個世紀接力賽
若要生成合成基因組,還得需要一個可靠的起點。
噬菌體ΦX174——一種微小的病毒基因組,只有5386個核苷酸,編碼11個基因。
左:ΦX174噬菌體顯微照;右:單個ΦX174噬菌體3D結(jié)構(gòu)
它的大小,剛好在當前DNA合成成本的可承受范圍內(nèi),卻也足夠復(fù)雜,能考驗基因組設(shè)計的能力。
然而,ΦX174基因重疊結(jié)構(gòu),創(chuàng)造了一個嚴苛的測試用例:
一個突變可能影響多個蛋白質(zhì),必須多重約束下才能正常工作。
此外,ΦX174編碼了多種調(diào)控元件和識別序列,它們精密協(xié)同,確保噬菌體在宿主細胞內(nèi)能被正確包裝和復(fù)制。
ΦX174基因組,是一場跨越半個世紀的接力賽。
1977年,F(xiàn)red Sanger及其團隊的研究,讓其成為人類首個完整測序的基因組。
2003年,Craig Venter及其團隊首次通過化學方法將其完整合成,證明了基因組可以從零開始構(gòu)建。
如今,2025年,團隊利用ΦX174作為模板,創(chuàng)造出首批由AI生成的基因組。
這一演進歷程,正標志著定義現(xiàn)代基因組學的核心能力:先學會了讀?。y序),接著是寫入(合成),而現(xiàn)在是設(shè)計(AI生成)。
ΦX174基因組
AI「基因組工廠」,破解重疊謎題
如上所述,ΦX174重疊基因,讓標準工具束手無策。因為它只能識別11個基因中的7個。
為此,研究人員打造了專屬注釋流程:
結(jié)合開放閱讀框(ORF)搜索和噬菌體蛋白數(shù)據(jù)庫的同源性比對,最終成功識別全部基因,甚至預(yù)測了部分A*基因。
這一工具,在評估數(shù)千個AI生成的序列時,大顯身手。
研究人員設(shè)定了底線——生成的基因組必須預(yù)測出,至少7個匹配天然ΦX174蛋白質(zhì),確保保留噬菌體「生存工具包」。
微調(diào)Evo,讓AI更懂噬菌體
原有的Evo模型,基于海量噬菌體數(shù)據(jù)訓練后,雖能生成序列,但缺乏針對ΦX174精準控制。
為此,監(jiān)督微調(diào),成為了不二選擇。
團隊又讓Evo,在14,466精選的微小噬菌體序列上,繼續(xù)訓練在減少冗余后,模型專攻ΦX174相關(guān)變異。
微調(diào)后,通過精心設(shè)計的提示詞和采樣參數(shù),Evo能生成與ΦX174進化相似卻又創(chuàng)新的序列。
這就像給AI一個靈感模板,讓它在熟悉中注入新意。
評估與篩選
生成序列后,作者又開發(fā)了多維度評估體系,可以檢查基因排列、宿主特異性和進化多樣性。
關(guān)鍵是,確保AI噬菌體能感染,實驗用的非致病菌株——C型大腸桿菌。
于是,他們要求序列中包含與ΦX174相似的刺突蛋白,因為該蛋白決定了ΦX174的宿主范圍。
實驗證明,所有16個功能性噬菌體,都對C型大腸桿菌,以及W型大腸桿菌,具有嚴格的靶向性。
而且,其對其他六種測試菌株無效。
這恰恰證明了,宿主特異性可以在基因組中,其他區(qū)域顯著進化的同時得以維持。
2小時「團滅」細菌
全新噬菌體誕生
傳統(tǒng)噬菌體研究慢而繁瑣,研究人員又創(chuàng)新了篩選流程。
他們用Gibson組裝合成基因組,轉(zhuǎn)化至感受態(tài)C型大腸桿菌中,然后在96孔板中監(jiān)測其生長抑制情況。
成功感染,會讓細菌密度(OD???)在2-3小時內(nèi)暴跌。
這個方案,讓團隊能快速測試285個設(shè)計,最終驗證了16個功能性噬菌體,并表征它們的適應(yīng)性和宿主范圍。
評估AI設(shè)計噬菌體的實驗檢測
這些AI基因組攜帶了67-392個,相較于其最近似天然基因組的新突變。
其中,Evo-Φ2147攜帶了392個突變,與噬菌體NC51的平均核苷酸同一性為93.0%。
根據(jù)某些分類學標準,它足以被認定為一個新物種。
另外,13個基因組包含自然界未見的突變,證明Evo能夠利用自然進化從未涉足過的序列空間。
一個非常有趣的發(fā)現(xiàn)是,合成噬菌體之一Evo-Φ36整合了,遠親噬菌體G4的DNA包裝蛋白——J蛋白(25 vs 38個氨基酸)。
這在以往,是一個未能攻克的工程性難題。
研究人員通過冷凍電鏡看到,它以獨特方式嵌入衣殼結(jié)構(gòu),AI巧妙地協(xié)調(diào)補償突變,讓全新蛋白質(zhì)組合得以正常運作。
跨代追殺「耐藥菌」,5次逆轉(zhuǎn)
細菌的抗生素耐藥性,是現(xiàn)代醫(yī)學面臨的最緊迫挑戰(zhàn)之一,每年有數(shù)十萬,甚至更多人因此喪生。
細菌能夠迅速進化出對傳統(tǒng)抗生素的耐藥性,卻極大地限制了治療效果。
而噬菌體療法有望逆轉(zhuǎn),但自然噬菌體往往跟不上細菌進化。
在研究中,研究團隊誘導(dǎo)了,三種對ΦX174具有耐藥性的C型大腸桿菌菌株,這些菌株的waa操縱子(負責修飾細菌表面受體)發(fā)生了突變。
結(jié)果顯示,AI生成的噬菌體「雞尾酒」(cocktails),在1-5次傳代內(nèi)攻克了三種耐藥菌株。
然而,單獨使用ΦX174,則完全無效。
值得一提的是,這些實現(xiàn)突破的噬菌體,是「嵌合基因組」。它們?nèi)诤隙鄠€AI片段,突變集中在受體交互區(qū)。
序列分析表明,成功的噬菌體,結(jié)合了2-3種不同AI設(shè)計的遺傳元件。
這樣一來,人類無需依賴自然界稀有的噬菌體,而讓AI直接生成多樣群體,形成「多重打擊」,讓細菌難以發(fā)展出全面的耐藥性。
總而言之,AI能快速篩選出有效的基因序列,這就讓噬菌體療法不再是碰運氣的「試錯」,而是精準的「設(shè)計」。
未來,人類能主動設(shè)計出領(lǐng)先一步的療法,永遠跑在細菌變異的前面。
基因革命2.0,編寫生命代碼
如今,噬菌體療法,正日益成為對抗多重耐藥菌的有效武器。
近期,醫(yī)學上的治療靶點,主要針對植物病原體,或是大型DNA噬菌體。
最新研究證明,AI模型已能捕捉進化約束,通過訓練、質(zhì)控和高質(zhì)量驗證,橋接AI生成序列與生物學現(xiàn)實。
隨著模型迭代和合成成本下降,全基因組設(shè)計將開啟未探索的進化空間,為生物技術(shù)和基礎(chǔ)研究開辟全新的疆域。
從讀取到寫入,再到設(shè)計,這一轉(zhuǎn)變,標志著人類在最基礎(chǔ)的層面上改造生物學的能力,翻開了新的篇章。
核心作者
Brian Hie
我是斯坦福大學化學工程系的助理教授,以及Arc Institute創(chuàng)新研究員,致力于生物學與人工智能交叉領(lǐng)域的研究。
他曾獲得了MIT CSAIL博士學位,本科就讀于斯坦福大學。
Samuel King
Samuel King是斯坦福大學博士研究生,目前在Arc Institute從事合成生物學與ML交叉領(lǐng)域的研究工作。
他本科畢業(yè)于哥倫比亞大學(UBC),獲得生物學榮譽學士學位。
參考資料:
https://x.com/samuelhking/status/1968329299364376698 https://www.biorxiv.org/content/10.1101/2025.09.12.675911v1
https://arcinstitute.org/news/hie-king-first-synthetic-phage
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.