虛擬細(xì)胞(AIVC),被譽(yù)為生物學(xué)的圣杯之一。
設(shè)想一下,如果能在臨床前階段使用AI較為準(zhǔn)確的模擬新藥在細(xì)胞內(nèi)的反應(yīng),臨床階段所面臨的問題將會顯著減少。
而數(shù)據(jù)缺乏是困擾該行業(yè)發(fā)展的難題之一,不僅要涵蓋基因組、轉(zhuǎn)錄組、蛋白質(zhì)組、代謝組等多層次信息,還需要面對細(xì)胞變化的復(fù)雜性。
這樣的情況下,全球首個(gè)十億級擾動(dòng)單細(xì)胞數(shù)據(jù)集——Tahoe-100M,在今年2月一經(jīng)開源發(fā)布便轟動(dòng)了業(yè)界。
短短的六個(gè)月中,該模型已被下載近10萬次,受眾從人工智能實(shí)驗(yàn)室到重點(diǎn)研究機(jī)構(gòu),已成為構(gòu)建虛擬細(xì)胞模型團(tuán)隊(duì)的基礎(chǔ)選擇之一。
踩上虛擬細(xì)胞風(fēng)口,該模型的幕后公司Tahoe Therapeutics近日宣布獲得 3000萬美元(約合人民幣2.1億元)融資 ,用于構(gòu)建訓(xùn)練虛擬細(xì)胞模型的權(quán)威基礎(chǔ)數(shù)據(jù)集。
本輪融資由Amplify Partners 領(lǐng)投,Databricks Ventures、Wing Venture Capital、General Catalyst、Civilization Ventures、Conviction、中東主權(quán)基金Mubadala Capital Ventures 和 AIX Ventures 等也參與其中。
經(jīng)過本輪投資后,該公司的總?cè)谫Y達(dá)到4200萬美元,估值突破1.2億美元(約合人民幣8.6億元)。
Tahoe首席執(zhí)行官Nima Alidoust說:“我們將利用這些海量數(shù)據(jù)集為人體細(xì)胞的人工智能模型帶來 GPT 時(shí)刻,將見解轉(zhuǎn)化為臨床讀數(shù),大幅降低藥物開發(fā)的臨床失敗率。”
開源下載破十萬 踩上虛擬細(xì)胞風(fēng)口
Tahoe成立于2022年,原名Vevo Therapeutics,總部位于美國加州,團(tuán)隊(duì)由生物學(xué)家和機(jī)器學(xué)習(xí)工程師組成。
該團(tuán)隊(duì)建立在加州大學(xué)舊金山分校的科學(xué)突破上,除CEO Nima Alidoust畢業(yè)于普林斯頓大學(xué)外,其他聯(lián)合創(chuàng)始人均來自該校,包括CSO Johnny Yu以及聯(lián)合創(chuàng)始人Hani Goodarzi、Kevin Shokat。
該公司在成立后不到三年就能夠推出Tahoe-100M這樣的重磅數(shù)據(jù)集,主要?dú)w功于其背后的Mosaic平臺。
傳統(tǒng)的藥物篩選一次只能針對一種癌癥模型,效率低下,而該平臺能將來自不同患者(例如肺癌、胰腺癌等)的癌細(xì)胞匯集到一個(gè)可重復(fù)培養(yǎng)的“馬賽克腫瘤”中。
利用該技術(shù)能在同一個(gè)實(shí)驗(yàn)里,一次性測試數(shù)百種藥物對數(shù)十種不同遺傳背景的癌細(xì)胞的影響,實(shí)現(xiàn)了數(shù)據(jù)生成效率的指數(shù)級提升。
最開始企業(yè)定位在AI制藥領(lǐng)域,但該數(shù)據(jù)集的潛力與虛擬細(xì)胞領(lǐng)域?qū)Χ鄻忧腋哔|(zhì)量生物數(shù)據(jù)的需求不謀而合。
這些數(shù)據(jù)涵蓋了基因組、轉(zhuǎn)錄組、蛋白質(zhì)組、代謝組等多層次信息,并且過去生物學(xué)數(shù)據(jù)多為觀測性(如單細(xì)胞圖譜),缺乏藥物擾動(dòng)下的因果響應(yīng)數(shù)據(jù),導(dǎo)致無法預(yù)測細(xì)胞對干預(yù)的動(dòng)態(tài)反應(yīng),這也是Tahoe的優(yōu)勢領(lǐng)域。
這樣的能力讓該數(shù)據(jù)集從其他競品中脫穎而出,今年六月Arc Institute剛發(fā)布的開源虛擬細(xì)胞模型State,就使用了Tahoe-100M 作為訓(xùn)練數(shù)據(jù)的一部分。
在進(jìn)行基準(zhǔn)測試時(shí),Arc發(fā)現(xiàn)它的準(zhǔn)確性是其他 AI 模型的兩倍,并且還擊敗了之前擊敗其他基礎(chǔ)模型的更簡單的機(jī)器學(xué)習(xí)程序。
劍指百億級 布局AI制藥領(lǐng)域
獲得融資后,該團(tuán)隊(duì)計(jì)劃生成10億個(gè)單細(xì)胞數(shù)據(jù)點(diǎn),繪制100萬個(gè)藥物分子與患者的相互作用,這是以前不可能實(shí)現(xiàn)的規(guī)模。
在之前的媒體訪談中,聯(lián)合創(chuàng)始人Johnny Yu曾表示:Tahoe-100M作為十億級數(shù)據(jù)集包含了1億個(gè)單細(xì)胞數(shù)據(jù)點(diǎn)。
而新計(jì)劃的集合數(shù)據(jù)點(diǎn)達(dá)到10億個(gè),為之前的十倍,這代表著Tahoe最終完成的數(shù)據(jù)集有望達(dá)到百億規(guī)模。
這個(gè)新數(shù)據(jù)集將擴(kuò)展生物基礎(chǔ)模型的邊界,旨在降低臨床試驗(yàn)失敗率,加速精準(zhǔn)藥物的開發(fā),無論哪個(gè)模型最終摘得“虛擬細(xì)胞”的桂冠,該公司都能提供背后有力的“訓(xùn)練燃料”。
商業(yè)模式方面,該公司打算在保留其數(shù)據(jù)集專有性的同時(shí),選擇一家大型制藥公司或人工智能公司來共享數(shù)據(jù)并加速轉(zhuǎn)化為臨床結(jié)果。
目前該合作伙伴尚未被選中,但Tahoe正在與不同的公司合作開展較小的項(xiàng)目。并有一種針對“主要癌癥亞型”的候選藥物處于研發(fā)階段。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.