夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

蛋白質(zhì)基座的GPT時代來了?!

0
分享至

聞樂 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

蛋白質(zhì)模型的GPT時刻來了!

清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)周浩副教授課題組聯(lián)合上海人工智能實驗室發(fā)布了AMix-1

首次以Scaling Law、Emergent Ability、In-Context Learning和Test-time Scaling的系統(tǒng)化方法論來構(gòu)建蛋白質(zhì)基座模型。



這為通往蛋白質(zhì)的通用智能構(gòu)建起了新的技術(shù)范式。讓停留在BERT時代、缺乏可擴展性和通用性的蛋白質(zhì)基座領(lǐng)域?qū)崿F(xiàn)了向GPT時代的跨越。

就像NLP領(lǐng)域的ChatGPT一樣,AMix-1不再局限于某一種蛋白質(zhì)任務(wù),而是能舉一反三、自主學(xué)習(xí)。

這個“蛋白質(zhì)GPT”能自己摸索規(guī)律,看幾個例子就會設(shè)計新蛋白,甚至越研究越厲害。

由AMix-1設(shè)計的蛋白質(zhì)已經(jīng)通過濕實驗的硬核考驗,最優(yōu)變體蛋白質(zhì)活性提升了50倍

并且,它的模型權(quán)重、代碼和技術(shù)細(xì)節(jié)已全部公開,下面來看看具體細(xì)節(jié)。

四大“超能力”

  • 當(dāng)語言模型涌現(xiàn)出通用智能時,蛋白質(zhì)模型的通用智能還有多遠(yuǎn)?

在NLP領(lǐng)域,語言模型基座經(jīng)歷了從BERT到GPT的跨時代變化,涌現(xiàn)出了各種超出預(yù)期的通用智能,BERT時代的模型關(guān)心具體任務(wù)的提升,缺乏對可擴展性、通用性和涌現(xiàn)能力的系統(tǒng)化討論。

而在GPT時代,系統(tǒng)化的討論逐漸顯現(xiàn),通用智能的爆發(fā)也因此開始。

然而,在蛋白質(zhì)基座領(lǐng)域,幾乎沒有貫徹這條智能涌現(xiàn)的路徑,一系列工作同樣停留在BERT時代,在“預(yù)訓(xùn)練+任務(wù)微調(diào)”這一范式下前行,缺乏對可擴展性、通用性和涌現(xiàn)能力的系統(tǒng)化討論。



AMix-1是基于貝葉斯流網(wǎng)絡(luò)(Bayesian Flow Networks, BFNs)的蛋白質(zhì)基座新范式,為蛋白質(zhì)基座模型實現(xiàn)Test-time Scaling提供了一整套系統(tǒng)性的技術(shù)方案:

  • Pretraining Scaling Law明確了參數(shù)、樣本數(shù)和計算量如何權(quán)衡,才能最大化模型的能力。
  • Emergent Ability顯示隨著訓(xùn)練的推進,模型會涌現(xiàn)出對蛋白結(jié)構(gòu)的“感知理解”。
  • In-Context Learning解決了功能優(yōu)化中的對齊難題,讓模型學(xué)會在進化語境中推理與設(shè)計。
  • Test-time Scaling讓AMix-1在驗證預(yù)算增加時,“越花時間越有回報”,開啟基于演化的設(shè)計新方式。

實際上我們可以將其概括為AMix-1的四大“超能力”。

成長有規(guī)律,進步看得見

就像學(xué)生刷題越多、成績提升越穩(wěn)定,AMix-1有個“可預(yù)測的成長曲線”。

研究者設(shè)計了從800萬到17億參數(shù)的多尺度模型組合,利用訓(xùn)練FLOPs(浮點操作數(shù))作為統(tǒng)一衡量指標(biāo),精確擬合、預(yù)測了模型交叉熵?fù)p失與計算量的冪律關(guān)系。



他們發(fā)現(xiàn),只要增加模型參數(shù)、訓(xùn)練數(shù)據(jù)或計算量,AMix-1的性能(比如預(yù)測蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確度)就會按規(guī)律提升。

這意味著科學(xué)家能精準(zhǔn)規(guī)劃資源,不用擔(dān)心花了錢卻沒效果,為更大規(guī)模的蛋白質(zhì)研究鋪平了路。

突然開竅,看懂蛋白質(zhì)的隱藏規(guī)律

AMix-1最神奇的一點是會“頓悟”。

剛開始訓(xùn)練時,它只懂識別蛋白質(zhì)的基本序列,但隨著訓(xùn)練深入,當(dāng)loss降到某個閾值時,它會自動具備“結(jié)構(gòu)感知能力”——

不用任何人教,就能自動理解蛋白質(zhì)的折疊方式、空間結(jié)構(gòu)。



這種能力不是漸進,而是跳變。就像從只會認(rèn)字母,突然學(xué)會了讀懂整篇文章的意思,這種“質(zhì)變”讓它能更好地把握蛋白質(zhì)結(jié)構(gòu)和功能的關(guān)系。

不需要微調(diào),看例子就能“仿寫”

這實際上是其In-Context Learning機制在蛋白質(zhì)設(shè)計過程中的體現(xiàn)。

以前設(shè)計蛋白質(zhì),要針對不同任務(wù)改算法,就像做一道新題要重新學(xué)公式。

但AMix-1 會上下文學(xué)習(xí):給它幾個同類蛋白質(zhì)的例子(比如一組能在高溫下工作的酶),它能自動總結(jié)規(guī)律,直接設(shè)計出符合這些規(guī)律的新蛋白,不用任何額外訓(xùn)練。



具體來說,這種方法把一組蛋白質(zhì)MSA(多序列比對)壓縮成一個位置級的概率分布,作為提示輸入給模型。

而模型不需要任何微調(diào),就能根據(jù)這些例子自動推理出結(jié)構(gòu)和功能規(guī)律,并生成符合意圖的新蛋白。



在結(jié)構(gòu)任務(wù)上(上圖a-b),以常規(guī)同源蛋白甚至在近乎無同源的“孤兒蛋白”為提示,AMix-1生成在預(yù)測結(jié)構(gòu)上高度一致的新蛋白;

在功能任務(wù)中(上圖c-d),AMix-1在輸入蛋白的酶學(xué)功能和化學(xué)反應(yīng)引導(dǎo)的酶設(shè)計上,AMix-1能生成出功能高度一致的蛋白酶。

越琢磨越厲害,進化能力無上限

AMix-1設(shè)計了獨特的測試時擴展方法EvoAMix-1,能夠利用其特有的上下文學(xué)習(xí)范式,在簡單可插拔的驗證(包括計算模擬與濕實驗評估)加持下,實現(xiàn)模型能力隨驗證預(yù)算提升的可持續(xù)擴展。

同時,AMix-1也是第一個具備了測試時擴展能力的蛋白質(zhì)基礎(chǔ)模型。

實驗結(jié)果顯示,EvoAMix-1在所有任務(wù)上展示出強勁的擴展能力,同時也體現(xiàn)其跨任務(wù)、跨目標(biāo)的強大通用性。

下圖展示了EvoAMix-1在六個定向進化基準(zhǔn)中的Test-time Scaling性能。



這也就是說,給它更多驗證時間和資源,它能不斷優(yōu)化設(shè)計結(jié)果。

比如設(shè)計酶的時候,第一次生成10個候選蛋白,測試后挑出最好的2個,再讓它基于這2個繼續(xù)改進,重復(fù)幾次,就能得到性能遠(yuǎn)超初始版本的蛋白質(zhì)。

下圖展示了AMix-1在推理階段進行進化擴展算法的工作流程。



AMix-1已經(jīng)通過了濕實驗的硬核考驗。

研究者想優(yōu)化一種叫AmeR的轉(zhuǎn)錄調(diào)控因子(常用于合成生物學(xué)的基因開關(guān)),讓它更擅長結(jié)合DNA。

用AMix-1生成40個變體后,實驗發(fā)現(xiàn)最優(yōu)的變體蛋白質(zhì)活性提升了50倍,比目前最先進的方法還提升了77%。



更關(guān)鍵的是,整個過程全自動化,不用科學(xué)家手動調(diào)整,完美實現(xiàn)了「從模型到實驗」的閉環(huán)。

清華大學(xué)智能產(chǎn)業(yè)研究院還聯(lián)合上海人工智能實驗室研發(fā)了一個虛擬生物實驗室



AMix-1支撐了該虛擬生物實驗室的蛋白質(zhì)生成與進化工作。



以前需要反復(fù)試錯、耗錢耗時的蛋白質(zhì)改造,現(xiàn)在可能像和ChatGPT聊天一樣簡單~

技術(shù)報告:https://arxiv.org/pdf/2507.08920
項目主頁:https://gensi-thuair.github.io/AMix-1/
模型權(quán)重:https://huggingface.co/GenSI/AMix-1-1.7B
代碼倉庫:https://github.com/GenSI-THUAIR/AMix-1

虛擬生物實驗室:https://virtualbiolab.intern-ai.org.cn/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
臺球第4金+中國隊第25金!世運會斯諾克:肖國棟2-1奪冠

臺球第4金+中國隊第25金!世運會斯諾克:肖國棟2-1奪冠

全景體育V
2025-08-14 19:30:39
胖東來公布對刑釋人員的面試題

胖東來公布對刑釋人員的面試題

界面新聞
2025-08-14 21:08:45
官方變相認(rèn)可!王俊杰賽后接受尿檢 自曝腿抽筋+感謝郭士強信任

官方變相認(rèn)可!王俊杰賽后接受尿檢 自曝腿抽筋+感謝郭士強信任

醉臥浮生
2025-08-14 22:24:06
爆雷!知名巨頭突然宣布:可能撐不下去了......

爆雷!知名巨頭突然宣布:可能撐不下去了......

中國基金報
2025-08-14 17:28:28
恒大前總裁夏海鈞找到了!藏匿資產(chǎn)曝光

恒大前總裁夏海鈞找到了!藏匿資產(chǎn)曝光

攸克地產(chǎn)pro
2025-08-14 08:27:08
網(wǎng)友稱廣州東站內(nèi)的商店已停售泡面,車站工作人員:確已全部下架

網(wǎng)友稱廣州東站內(nèi)的商店已停售泡面,車站工作人員:確已全部下架

極目新聞
2025-08-13 21:37:51
胡金秋23+11成頭號功臣:連3場兩雙太穩(wěn)定 拼到眼角被打出血

胡金秋23+11成頭號功臣:連3場兩雙太穩(wěn)定 拼到眼角被打出血

醉臥浮生
2025-08-14 20:58:11
曝普京住所部署12套防空系統(tǒng)!是整個莫斯科的20%

曝普京住所部署12套防空系統(tǒng)!是整個莫斯科的20%

項鵬飛
2025-08-14 18:10:01
8歲自閉癥王一凱遇難!志愿者曝孩子沒穿衣服,書包變行李箱

8歲自閉癥王一凱遇難!志愿者曝孩子沒穿衣服,書包變行李箱

恪守原則和底線
2025-08-14 14:16:52
菲律賓連續(xù)撞擊中國船只,中方不再留有余地,052D驅(qū)逐艦首次開撞

菲律賓連續(xù)撞擊中國船只,中方不再留有余地,052D驅(qū)逐艦首次開撞

來科點譜
2025-08-12 09:14:25
會晤不足24小時之際,特朗普突然發(fā)出威脅,普京有去無回?

會晤不足24小時之際,特朗普突然發(fā)出威脅,普京有去無回?

南宮一二
2025-08-14 08:11:37
馬丁路德金的FBI檔案被解密,被曝在巡回演講時巡回嫖娼,當(dāng)?shù)孛襟w卻三緘其口

馬丁路德金的FBI檔案被解密,被曝在巡回演講時巡回嫖娼,當(dāng)?shù)孛襟w卻三緘其口

風(fēng)向觀察
2025-08-11 12:57:32
難以置信!一超市發(fā)工資時,備注欄多了“含1500元社保費”幾個字

難以置信!一超市發(fā)工資時,備注欄多了“含1500元社保費”幾個字

火山詩話
2025-08-14 18:02:48
中國駐韓大使館被砸,韓國警察冷眼旁觀,李在明為何選擇“沉默”

中國駐韓大使館被砸,韓國警察冷眼旁觀,李在明為何選擇“沉默”

boss外傳
2025-08-14 00:00:05
王俊杰:韓國隊的1號和22號都是我的師兄 對他們來說很遺憾

王俊杰:韓國隊的1號和22號都是我的師兄 對他們來說很遺憾

直播吧
2025-08-14 21:25:30
香港公務(wù)員為身體健康拒喝內(nèi)地飲用水:李家超發(fā)聲,涉及品牌曝光

香港公務(wù)員為身體健康拒喝內(nèi)地飲用水:李家超發(fā)聲,涉及品牌曝光

博士觀察
2025-08-14 18:08:51
房東稅下月實施!房東慘了:以前靠收租躺平,現(xiàn)在躺平也要交稅了

房東稅下月實施!房東慘了:以前靠收租躺平,現(xiàn)在躺平也要交稅了

烏娛子醬
2025-08-14 16:40:51
菲總統(tǒng)候選人莫雷諾:如果當(dāng)選,我會讓菲律賓成為下一個新加坡!

菲總統(tǒng)候選人莫雷諾:如果當(dāng)選,我會讓菲律賓成為下一個新加坡!

現(xiàn)代春秋
2025-08-14 17:24:27
A股跳水原因找到了!超過4600家下跌,一上頭就虧錢,4000億寒武紀(jì)

A股跳水原因找到了!超過4600家下跌,一上頭就虧錢,4000億寒武紀(jì)

看財經(jīng)show
2025-08-14 16:49:32
從月銷20.9萬輛到4.5萬輛,某車企無奈承認(rèn):已站在生死存亡邊緣

從月銷20.9萬輛到4.5萬輛,某車企無奈承認(rèn):已站在生死存亡邊緣

小李車評李建紅
2025-08-14 06:50:47
2025-08-15 01:12:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11107文章數(shù) 176226關(guān)注度
往期回顧 全部

科技要聞

暴雨之下1萬多人,500個機器人燃爆全場

頭條要聞

3名女子和4個孩子點1碗面 多次免費續(xù)面被拒給2個差評

頭條要聞

3名女子和4個孩子點1碗面 多次免費續(xù)面被拒給2個差評

體育要聞

在菲律賓,一支中國人創(chuàng)建的球隊踢上了亞冠

娛樂要聞

趙露思發(fā)文告別!扯下她最后的顏面

財經(jīng)要聞

“許家印同伙”夏海鈞的資產(chǎn)藏匿游戲

汽車要聞

大六座SUV還能這么玩 吉利銀河M9動態(tài)內(nèi)測

態(tài)度原創(chuàng)

本地
家居
數(shù)碼
健康
軍事航空

本地新聞

云游中國 | 地心探秘!一天穿越池州六大溶洞

家居要聞

現(xiàn)代奶油 網(wǎng)紅又實用

數(shù)碼要聞

據(jù)傳下一代入門級iPad將搭載A18芯片 并支持Apple Intelligence

急診科專家解答動物抓咬傷八大問題

軍事要聞

倒計時一天 "普特會"的五大看點梳理

無障礙瀏覽 進入關(guān)懷版 久久AV无码精品人妻糸列| 欧美又大粗又爽又黄大片图片| 97香蕉超级碰碰碰久久兔费| 国产精品天堂| 国产精品无码不卡视频| 噜噜噜精品无码成人一区日韩| 高清破外女出血AV毛片| 综合成人色图亚洲| 欧美性精品不卡在线观看| 久久成人影视| 久久大香国产成人av| 西西4444www大胆无码| 亚洲国产成人无码影院| av网站的免费观看| 国产成人一区二区精品非洲| 国产一区二区三区在线2021| 欲色欲色天天天www| 亚洲av成人中文无码专区| 久久综合伊人77777麻豆| 久久国产精品国产色婷婷| 3级国产操逼片| 疯狂孕妇孕交毛片| 无码人妻的获取方式| 国产精品黑丝高跟鞋| 少妇丰满电影| 国产国产国产国产系列| 久久月本道色综合久久| 少妇做爰免费视频网站| 麻豆国产巨作AV剧情老师| 亚洲AⅤ优女AV综合久久久| 亚洲AV成人一二三区观看| 亚洲国产精品人人做人人爱| 日韩大屁股无码| 男人天堂理论片| 中国国产av不卡| 一本色道久久88加勒比—综合| 欧美熟妇人妻| 亚洲精品国精品久久99热一| 亚洲免费无码一区二区| 欧美国产日韩在线三区| 无码av高潮喷水无码专区线|