夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

訓(xùn)練自2.67億個(gè)單細(xì)胞數(shù)據(jù)的AI虛擬細(xì)胞模型——STATE,無(wú)需實(shí)驗(yàn),預(yù)測(cè)細(xì)胞對(duì)藥物或基因擾動(dòng)的反應(yīng)

0
分享至

撰文丨王聰

編輯丨王多魚

排版丨水成文

人體是由細(xì)胞(Cell)構(gòu)成的馬賽克,其中,免疫細(xì)胞通過(guò)增強(qiáng)炎癥來(lái)對(duì)抗感染;干細(xì)胞可以分化成各種組織;癌細(xì)胞避開調(diào)控信號(hào)而無(wú)節(jié)制地分裂。然而,盡管這些細(xì)胞之間存在顯著差異,但這些看上去截然不同的體細(xì)胞都攜帶著(幾乎)相同的基因組。

細(xì)胞的獨(dú)特性不僅源于 DNA 的不同,更在于每個(gè)細(xì)胞對(duì) DNA 的使用方式。換句話說(shuō),細(xì)胞的特性源自基因表達(dá)的變化,即基因在不同時(shí)刻的“開啟”和“關(guān)閉”。細(xì)胞的基因表達(dá)模式——以 RNA 分子的形式體現(xiàn),而 RNA 分子本身又是從 DNA 轉(zhuǎn)錄而來(lái),基因的表達(dá)不僅決定了細(xì)胞的類型,還決定了細(xì)胞的狀態(tài):細(xì)胞基因表達(dá)的變化可以揭示細(xì)胞如何從健康狀態(tài)轉(zhuǎn)變?yōu)檠装Y狀態(tài),甚至癌變。通過(guò)測(cè)量有或無(wú)化學(xué)或基因干擾的細(xì)胞內(nèi)的 RNA 轉(zhuǎn)錄本,可以訓(xùn)練出能夠預(yù)測(cè)細(xì)胞基因表達(dá)模式(這是細(xì)胞“狀態(tài)”的關(guān)鍵驅(qū)動(dòng)因素)將如何變化的人工智能(AI)模型。這樣的 AI 模型甚至能夠預(yù)測(cè)模型之前未曾遇到的干擾所引發(fā)的反應(yīng)。

大約 90% 的進(jìn)入臨床試驗(yàn)的候選藥物最終會(huì)失敗,原因在于療效不佳或產(chǎn)生了意外的副作用。研究人員在實(shí)驗(yàn)室或患者身上測(cè)試的每種藥物,本質(zhì)上都是為以特定方式干擾細(xì)胞而量身定制的探針。因此,一個(gè)高度預(yù)測(cè)性的虛擬細(xì)胞(Virtual Cell)模型能夠幫助研究人員發(fā)現(xiàn)新藥物,這些藥物能夠使細(xì)胞從“患病狀態(tài)”轉(zhuǎn)換到“健康狀態(tài)”,同時(shí)減少脫靶效應(yīng),從而提高臨床試驗(yàn)的成功率。

近日,Arc 研究所發(fā)布了其第一代虛擬細(xì)胞模型——STATE,該虛擬細(xì)胞模型旨在預(yù)測(cè)各類干細(xì)胞、癌細(xì)胞和免疫細(xì)胞對(duì)藥物、細(xì)胞因子或基因擾動(dòng)的反應(yīng)。STATE 模型基于 1.67 億個(gè)細(xì)胞的觀察數(shù)據(jù)以及超過(guò) 1 億個(gè)細(xì)胞的擾動(dòng)數(shù)據(jù)進(jìn)行訓(xùn)練,這些數(shù)據(jù)涵蓋了 70 種細(xì)胞系。該論文已于近期發(fā)表在了預(yù)印本平臺(tái) bioRxiv 上。



STATE 的使用很簡(jiǎn)單:給定一個(gè)初始轉(zhuǎn)錄組和一個(gè)干擾因素,STATE 就能預(yù)測(cè) RNA 表達(dá)的變化。STATE 由兩個(gè)相互關(guān)聯(lián)的模塊組成——State Embedding(SE)模型和State Transition(ST)模型。SE 模型基于 1.67 億個(gè)細(xì)胞的觀測(cè)數(shù)據(jù)進(jìn)行訓(xùn)練,這些數(shù)據(jù)是細(xì)胞在未受干預(yù)情況下的行為測(cè)量值,而 ST 模型則基于超過(guò) 1 億個(gè)細(xì)胞的擾動(dòng)數(shù)據(jù)進(jìn)行訓(xùn)練,即這些細(xì)胞對(duì)基因變化或小分子的反應(yīng)情況。

SE 模型將轉(zhuǎn)錄組數(shù)據(jù)轉(zhuǎn)換為計(jì)算機(jī)更易于理解的平滑多維向量空間,并且對(duì)技術(shù)噪聲更具不變性。相同類型的細(xì)胞(比如白血病細(xì)胞或神經(jīng)元)在這個(gè)向量空間中會(huì)聚集在一起。ST 模型預(yù)測(cè)細(xì)胞在受到給定干擾時(shí)如何在學(xué)習(xí)到的流形的不同部分之間進(jìn)行轉(zhuǎn)換。該模型基于雙向 Transformer 架構(gòu)構(gòu)建,其獨(dú)特之處在于利用了對(duì)細(xì)胞集的自注意力機(jī)制,從而使 ST 模型能夠靈活地捕捉生物和技術(shù)異質(zhì)性(例如細(xì)胞周期狀態(tài)或 RNA-seq 數(shù)據(jù)中的偏差),而無(wú)需依賴明確的分布假設(shè)。


STATE 是基于超過(guò)1 億個(gè)細(xì)胞的單細(xì)胞擾動(dòng)數(shù)據(jù)(Tahoe-100M、Parse-PMBC、Replogle-Nadig)進(jìn)行訓(xùn)練的,訓(xùn)練數(shù)據(jù)量超過(guò)了迄今為止的任何其他模型。它在預(yù)測(cè)新細(xì)胞環(huán)境中轉(zhuǎn)錄組在受到擾動(dòng)后的變化方面,顯著優(yōu)于現(xiàn)有的最先進(jìn)的計(jì)算方法。在對(duì) Tahoe-100M 進(jìn)行基準(zhǔn)測(cè)試時(shí),STATE 在區(qū)分?jǐn)_動(dòng)效應(yīng)方面表現(xiàn)出了50% 的提升,并且在識(shí)別真正差異表達(dá)基因的準(zhǔn)確性方面是現(xiàn)有模型的2 倍。此外,STATE 也是首個(gè)在所有測(cè)試中都優(yōu)于簡(jiǎn)單線性基線模型的模型。

STATE 最初專注于單細(xì)胞 RNA 測(cè)序數(shù)據(jù)建模,因?yàn)檫@是目前研究人員能夠以合理成本大規(guī)模生成的唯一無(wú)偏倚的單細(xì)胞分辨率數(shù)據(jù)。遺憾的是,測(cè)序數(shù)據(jù)通常是純觀察性的,因此通常不足以推斷細(xì)胞生物學(xué)中的因果關(guān)系。即使有來(lái)自數(shù)百萬(wàn)個(gè)細(xì)胞的觀察數(shù)據(jù),虛擬細(xì)胞模型也無(wú)法確定導(dǎo)致觀察到的相關(guān)性出現(xiàn)的因果效應(yīng)。了解因果關(guān)系對(duì)于構(gòu)建基于生物學(xué)機(jī)制的真正的“虛擬細(xì)胞”模型至關(guān)重要。

Arc 研究所的研究團(tuán)隊(duì)通過(guò)收集大規(guī)模的擾動(dòng)數(shù)據(jù)來(lái)彌補(bǔ)單細(xì)胞 RNA 測(cè)序數(shù)據(jù)數(shù)據(jù)不足:即通過(guò)實(shí)驗(yàn)(例如使用 CRISPR 基因編輯工具)生成的數(shù)據(jù),在實(shí)驗(yàn)中特意改變特定基因以觀察其對(duì)細(xì)胞的影響。與觀察性數(shù)據(jù)不同,擾動(dòng)數(shù)據(jù)捕捉了基因之間的因果關(guān)系,直接反映了潛在的生物學(xué)機(jī)制??赡苄枰獢?shù)萬(wàn)次觀察才能推斷出兩個(gè)基因之間的直接相互作用關(guān)系,而擾動(dòng)數(shù)據(jù)僅通過(guò)一次測(cè)量就能捕捉到相同的相互作用關(guān)系。研究團(tuán)隊(duì)以獨(dú)特的方式將技術(shù)開發(fā)與機(jī)器學(xué)習(xí)相結(jié)合,從而能夠迅速擴(kuò)大數(shù)據(jù)收集規(guī)模,并在建模方法上進(jìn)行創(chuàng)新。

迄今為止,大多數(shù)單細(xì)胞數(shù)據(jù)來(lái)自規(guī)模較小的研究,其中技術(shù)和來(lái)源批次的差異降低了跨多個(gè)項(xiàng)目無(wú)縫整合數(shù)據(jù)的能力。研究團(tuán)隊(duì)開發(fā)并推出了scBaseCount,這是該領(lǐng)域首個(gè)AI 智能體,旨在統(tǒng)一收集和分析單細(xì)胞數(shù)據(jù),以最大程度減少分析誤差。scBaseCount 也是目前最大的單細(xì)胞數(shù)據(jù)開源庫(kù)。STATE 本身也能夠直接建模這些“混雜”因素,這使其能夠整合來(lái)自世界各地不同實(shí)驗(yàn)室的大量不同數(shù)據(jù)集。

研究團(tuán)隊(duì)表,盡管 STATE 只是未來(lái)將不斷改進(jìn)的虛擬細(xì)胞模型中的第一個(gè)版本,但隨著虛擬細(xì)胞訓(xùn)練數(shù)據(jù)的增長(zhǎng),其預(yù)測(cè)準(zhǔn)確性也在提高。這似乎是一個(gè)顯而易見的結(jié)果——Scaling Laws(標(biāo)度律),模型性能隨規(guī)模(例如參數(shù)、數(shù)據(jù)量、計(jì)算量)增長(zhǎng)而遵循冪律關(guān)系。但實(shí)際上,Scaling Laws 在生物學(xué)領(lǐng)域直到最近才得以確立,Arc 研究所的研究團(tuán)隊(duì)去年發(fā)布了 DNA 大語(yǔ)言模型Evo,首次揭示了 DNA 語(yǔ)言建模中的 Scaling Laws。

STATE 的使用案例可能遵循與蛋白質(zhì)折疊模型類似的模式——AlphaFold不僅因?yàn)槟軌驕?zhǔn)確預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)而變得有用,還因?yàn)檠芯咳藛T找到了將其預(yù)測(cè)結(jié)果整合到工作流程中的方法。例如,通過(guò)快速預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),研究人員能夠更快地發(fā)現(xiàn)可能與這些蛋白質(zhì)結(jié)合的小分子。

同樣,研究人員不僅可以利用STATE 以及未來(lái)的其他模型來(lái)模擬細(xì)胞對(duì)干擾的反應(yīng),還可以利用這些預(yù)測(cè)來(lái)提名并實(shí)驗(yàn)性地發(fā)現(xiàn)新藥。


STATE:一種基于 Transfomer 的用于預(yù)測(cè)細(xì)胞集合中的擾動(dòng)效應(yīng)的虛擬細(xì)胞模型

構(gòu)建虛擬細(xì)胞模型的最終愿景,是幫助科學(xué)家探索更廣闊的組合可能性空間。任何活細(xì)胞都可以通過(guò)無(wú)數(shù)種方式進(jìn)行改變,而要測(cè)試每一種可能的基因突變或藥物治療(比如針對(duì)癌細(xì)胞的治療)是不可能的。一個(gè)高度預(yù)測(cè)性的虛擬細(xì)胞模型將解決這個(gè)問(wèn)題。STATE 正是朝著這個(gè)方向邁出的第一步,其目標(biāo)是通過(guò)未來(lái)的迭代的虛擬細(xì)胞模型最終達(dá)到實(shí)驗(yàn)級(jí)精度。這將使科學(xué)家能夠進(jìn)行數(shù)百萬(wàn)次的計(jì)算機(jī)模擬干預(yù),從而在進(jìn)行原創(chuàng)性發(fā)現(xiàn)的過(guò)程中“縮小”他們的假設(shè)范圍。

為了助力這一愿景,研究團(tuán)隊(duì)還推出了Cell_Eval,這是一個(gè)用于虛擬細(xì)胞建模的全面評(píng)估框架,它超越了該領(lǐng)域傳統(tǒng)的基于表達(dá)計(jì)數(shù)等指標(biāo)的評(píng)估方法,納入了一系列具有生物學(xué)相關(guān)性和可解釋性的指標(biāo),重點(diǎn)關(guān)注差異表達(dá)預(yù)測(cè)和干擾強(qiáng)度估計(jì)。希望 Cell_Eval 能夠幫助透明地評(píng)估當(dāng)前及未來(lái)各代虛擬細(xì)胞模型。此外,Arc 研究所還推出了一個(gè)虛擬細(xì)胞挑戰(zhàn)賽。詳情:


總的來(lái)說(shuō),Arc 研究所公布的這個(gè)虛擬細(xì)胞模型——STATE,希望生物學(xué)家們能夠使用它,并開始探索將其融入自身工作的途徑。

論文鏈接

https://www.biorxiv.org/content/10.1101/2025.06.26.661135v1

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
游資章建平(章盟主):從5萬(wàn)到百億,冷門賽道的突擊高手

游資章建平(章盟主):從5萬(wàn)到百億,冷門賽道的突擊高手

復(fù)利種韭菜
2025-11-01 19:04:09
荷蘭最終改口,稱可以不再接管安世半導(dǎo)體,只要中方滿足一個(gè)條件

荷蘭最終改口,稱可以不再接管安世半導(dǎo)體,只要中方滿足一個(gè)條件

小影的娛樂(lè)
2025-11-09 00:08:25
湖南一老人摔倒,33分鐘內(nèi)49人路過(guò)無(wú)一人攙扶!老人去世后,家屬調(diào)監(jiān)控起訴路人每人索賠14萬(wàn),法院判了!

湖南一老人摔倒,33分鐘內(nèi)49人路過(guò)無(wú)一人攙扶!老人去世后,家屬調(diào)監(jiān)控起訴路人每人索賠14萬(wàn),法院判了!

二胡的歲月如歌
2025-11-08 18:01:58
林志玲老太多了,看著比張鈞甯大20歲!臉部浮腫,簡(jiǎn)直慘不忍睹!

林志玲老太多了,看著比張鈞甯大20歲!臉部浮腫,簡(jiǎn)直慘不忍睹!

樂(lè)悠悠娛樂(lè)
2025-11-08 09:38:15
陪玩陪睡根本不夠!集體開嫖、目無(wú)王法、舔手指,陰暗面藏不住了

陪玩陪睡根本不夠!集體開嫖、目無(wú)王法、舔手指,陰暗面藏不住了

叨嘮
2025-11-09 05:07:59
竟然不是爭(zhēng)冠?孫銘徽談四川男籃全運(yùn)會(huì)目標(biāo):定了前三

竟然不是爭(zhēng)冠?孫銘徽談四川男籃全運(yùn)會(huì)目標(biāo):定了前三

狼叔評(píng)論
2025-11-09 09:14:08
火箭出最大短板,杜蘭特把話挑明!申京沒(méi)借口,烏度卡該重用一人

火箭出最大短板,杜蘭特把話挑明!申京沒(méi)借口,烏度卡該重用一人

魚崖大話籃球
2025-11-08 15:48:46
街頭無(wú)規(guī)則限制,散打高手打得過(guò)身經(jīng)百戰(zhàn)的地痞流氓嗎?網(wǎng)友解密

街頭無(wú)規(guī)則限制,散打高手打得過(guò)身經(jīng)百戰(zhàn)的地痞流氓嗎?網(wǎng)友解密

帶你感受人間冷暖
2025-08-30 00:20:05
河南28歲離異女看上寧波35歲拆遷大哥主動(dòng)要留宿 更多細(xì)節(jié)曝光

河南28歲離異女看上寧波35歲拆遷大哥主動(dòng)要留宿 更多細(xì)節(jié)曝光

阿SIR觀察
2025-11-08 11:03:09
朱俊龍被交易?廣廈官宣,名單公布,已無(wú)頂薪名額,朱俊龍發(fā)聲

朱俊龍被交易?廣廈官宣,名單公布,已無(wú)頂薪名額,朱俊龍發(fā)聲

樂(lè)聊球
2025-11-08 09:40:04
出場(chǎng)時(shí)間少得可憐!火箭用一份不低的簽下他是一個(gè)巨大的錯(cuò)誤?

出場(chǎng)時(shí)間少得可憐!火箭用一份不低的簽下他是一個(gè)巨大的錯(cuò)誤?

稻谷與小麥
2025-11-09 00:54:35
形勢(shì)逆轉(zhuǎn)!3名大法官倒戈,貝森特向美高院攤牌:整個(gè)國(guó)家將陪葬

形勢(shì)逆轉(zhuǎn)!3名大法官倒戈,貝森特向美高院攤牌:整個(gè)國(guó)家將陪葬

原來(lái)仙女不講理
2025-11-09 09:45:32
中國(guó)籃協(xié)終于開竅了!女籃3大賽事公開選帥:宮魯鳴這下壓力大了

中國(guó)籃協(xié)終于開竅了!女籃3大賽事公開選帥:宮魯鳴這下壓力大了

籃球快餐車
2025-11-08 05:54:52
霸氣,威斯布魯克在連續(xù)造成雷霆隊(duì)亞歷山大犯規(guī)后說(shuō):他不會(huì)防守

霸氣,威斯布魯克在連續(xù)造成雷霆隊(duì)亞歷山大犯規(guī)后說(shuō):他不會(huì)防守

好火子
2025-11-09 04:42:22
擁有最強(qiáng)話語(yǔ)權(quán)的三個(gè)星座女

擁有最強(qiáng)話語(yǔ)權(quán)的三個(gè)星座女

星座葉大仙
2025-11-09 10:26:08
老師發(fā)的三年級(jí)數(shù)學(xué)期中復(fù)習(xí)試卷,很多我也不會(huì),難怪孩子不愿學(xué)

老師發(fā)的三年級(jí)數(shù)學(xué)期中復(fù)習(xí)試卷,很多我也不會(huì),難怪孩子不愿學(xué)

特特農(nóng)村生活
2025-11-09 00:00:24
廣州地鐵這回捅大簍子了!人民網(wǎng)痛批:要認(rèn)清自己的身份!

廣州地鐵這回捅大簍子了!人民網(wǎng)痛批:要認(rèn)清自己的身份!

王二哥老搞笑
2025-11-08 10:38:52
浙江28分完敗廣東!丁偉無(wú)奈苦笑:他們是拿前兩場(chǎng)比賽來(lái)熱身了

浙江28分完敗廣東!丁偉無(wú)奈苦笑:他們是拿前兩場(chǎng)比賽來(lái)熱身了

狼叔評(píng)論
2025-11-08 22:18:04
為何說(shuō)兩岸統(tǒng)一迫在眉睫?再晚了臺(tái)灣就“新加坡化”,等不及了!

為何說(shuō)兩岸統(tǒng)一迫在眉睫?再晚了臺(tái)灣就“新加坡化”,等不及了!

顧史
2025-11-06 21:21:48
突發(fā)!終止重大資產(chǎn)重組,山東這家上市公司“蛇吞象”并購(gòu)告吹

突發(fā)!終止重大資產(chǎn)重組,山東這家上市公司“蛇吞象”并購(gòu)告吹

山東財(cái)經(jīng)報(bào)道
2025-11-09 08:55:01
2025-11-09 11:16:49
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科學(xué)研究
8348文章數(shù) 144894關(guān)注度
往期回顧 全部

科技要聞

黃仁勛親赴臺(tái)積電“討要更多芯片”

頭條要聞

"賞金獵人"用無(wú)人機(jī)獵殺200頭野豬:一次只能帶一支箭

頭條要聞

"賞金獵人"用無(wú)人機(jī)獵殺200頭野豬:一次只能帶一支箭

體育要聞

馬刺絞贏火箭,不靠文班亞馬?

娛樂(lè)要聞

《繁花》劇組又回應(yīng)了?

財(cái)經(jīng)要聞

10月CPI同比上漲0.2% CPI同比下降2.1%

汽車要聞

鈦7月銷破2萬(wàn) 霜霧灰與青巒翠配色正式開啟交付

態(tài)度原創(chuàng)

游戲
本地
時(shí)尚
家居
公開課

下一部《質(zhì)量效應(yīng)》新概念原畫 將有克洛根人內(nèi)戰(zhàn)

本地新聞

這屆干飯人,已經(jīng)把博物館吃成了食堂

五十多歲的女性秋季別瞎打扮,這3個(gè)技巧實(shí)用還時(shí)髦,快收藏

家居要聞

現(xiàn)代自由 功能美學(xué)居所

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 美女搞黄色视频| 中文字幕 欧美精品 第1页| 夜鲁夜鲁很鲁在线视频 视频| 美女BBBB免费观看| 日日夜夜操888| 国产小姐被操逼| 午夜精品欧美| 国产极品美女到高潮| 日本熟妇浓毛| ass新版毛耸耸的pics| 亚洲午夜久久久久久久久久久| 精品国产成人国产在线观看| 沈阳老熟女高潮| 狠狠色噜噜狠狠狠狠888奇米| 中文字幕乱码一区av久久不卡| 黑人精品一区二区三区不| 激情图片小说网站| 蜜桃av色欲a片精品一区| www国产亚洲精品久久麻豆| 胸大美女又黄的网站| 美国操逼视频网站| 亚洲免费视频播放| 亚洲制服丝袜自拍中文字幕| 国产 中文 亚洲 日韩 欧美| 美女禁区a级全片免费观看| 在线成人一区二区| freeXXX少妇性饥渴难耐| 亚洲一二三区影视| 中字无码av电影在线观看网站| 26uuu另类亚洲欧美日本| 国产成人无码A区在线观| 少妇大战二十8厘米黑人| 日本人妻一区二区| 国产人久久人人人人爽| 四虎影视av| 人妻熟女αⅴ一区二区三区| porny蝌蚪九色| 金瓶狂野欧美性猛交XXXX | 后入丰满熟妇一区二区| 欧亚欧洲码国产| 最新亚洲人成无码www|