夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Nature子刊多篇文章速覽: 大模型賦能的科學(xué)發(fā)現(xiàn)

0
分享至


導(dǎo)語(yǔ)

在科學(xué)研究邁向智能化的當(dāng)下,大語(yǔ)言模型正逐步打破傳統(tǒng)AI僅擅長(zhǎng)文本和圖像生成的固有邊界,深入滲透到材料科學(xué)、生物醫(yī)藥與復(fù)雜系統(tǒng)預(yù)測(cè)的核心領(lǐng)域。本期圖智決策精選的Nature系列前沿研究,這些工作展現(xiàn)了“語(yǔ)言即物質(zhì)結(jié)構(gòu)”、“文本即生物功能”的跨模態(tài)生成范式:CrystaLLM將晶體結(jié)構(gòu)建模轉(zhuǎn)化為自回歸文本生成問(wèn)題,成功合成出多種未見(jiàn)于訓(xùn)練集的穩(wěn)定新材料;ProteinDT引入多模態(tài)預(yù)訓(xùn)練框架,首次實(shí)現(xiàn)由自然語(yǔ)言引導(dǎo)的蛋白質(zhì)設(shè)計(jì);Token-Mol打通分子3D構(gòu)象生成與屬性預(yù)測(cè),用token統(tǒng)一編碼結(jié)構(gòu)與性質(zhì),在速度與性能上全面超越擴(kuò)散模型;TrinityLLM借助物理合成數(shù)據(jù),實(shí)現(xiàn)對(duì)數(shù)據(jù)稀缺下聚合物性能的精確預(yù)測(cè)。

與此同時(shí),科學(xué)大語(yǔ)言模型也在向“可解釋科學(xué)發(fā)現(xiàn)”邁進(jìn):LLM4SD挖掘文獻(xiàn)與分子數(shù)據(jù)的符號(hào)邏輯,用規(guī)則驅(qū)動(dòng)分子性質(zhì)建模;PandemicLLM則將疫情預(yù)測(cè)重構(gòu)為文本推理任務(wù),融合政策、行為、基因等非結(jié)構(gòu)信息實(shí)現(xiàn)高精度預(yù)測(cè);SciToolAgent則基于知識(shí)圖譜自動(dòng)編排數(shù)百種科學(xué)工具,重塑多工具科學(xué)工作流的交互范式。這些研究共同揭示了一個(gè)趨勢(shì):大語(yǔ)言模型不僅能“說(shuō)出科學(xué)”,更正在“生成科學(xué)”與“發(fā)現(xiàn)科學(xué)”,AI for Science 正迎來(lái)從“跨模態(tài)表征”到“跨學(xué)科推理”的系統(tǒng)躍遷。

本文聚焦于大語(yǔ)言模型賦能的科學(xué)發(fā)現(xiàn),遴選了7篇來(lái)自Nature系期刊中關(guān)于這一話題的文章。

研究領(lǐng)域:大語(yǔ)言模型,分子網(wǎng)絡(luò),蛋白質(zhì)合成,多智能體,疫情預(yù)測(cè)

曾利丨編輯

Frank丨審校

圖智決策丨來(lái)源

論文一:基于自回歸大模型的晶體結(jié)構(gòu)生成

論文題目:Crystal structure generation with autoregressive large language modeling

基于自回歸大模型的晶體結(jié)構(gòu)生成

論文來(lái)源:Nature Communications

論文鏈接:https://www.nature.com/articles/s41467-024-54639-7

代碼鏈接:https://github.com/lantunes/CrystaLLM

一作單位:University of Reading,UK


摘要:產(chǎn)生合理的晶體結(jié)構(gòu)通常是根據(jù)材料的化學(xué)成分預(yù)測(cè)材料結(jié)構(gòu)和性能的第一步。然而,目前大多數(shù)晶體結(jié)構(gòu)預(yù)測(cè)方法的計(jì)算成本很高,減緩了創(chuàng)新的步伐。使用高質(zhì)量生成的候選者進(jìn)行種子結(jié)構(gòu)預(yù)測(cè)算法可以克服主要瓶頸。在這里,我們介紹了 CrystaLLM,這是一種基于晶體學(xué)信息文件 (CIF) 格式的自回歸大語(yǔ)言建模 (LLM) 的晶體結(jié)構(gòu)的多功能生成方法。CrystaLLM 經(jīng)過(guò)數(shù)百萬(wàn)個(gè) CIF 文件的訓(xùn)練,專(zhuān)注于通過(guò)文本對(duì)晶體結(jié)構(gòu)進(jìn)行建模。CrystaLLM 可以為訓(xùn)練中看不到的各種無(wú)機(jī)化合物產(chǎn)生合理的晶體結(jié)構(gòu),正如從頭開(kāi)始模擬所證明的那樣。我們的方法挑戰(zhàn)了傳統(tǒng)的晶體表示,并展示了大語(yǔ)言模型在學(xué)習(xí)有效晶體化學(xué)模型方面的潛力,這將加速材料科學(xué)的發(fā)現(xiàn)和創(chuàng)新。


核心圖:基于自回歸大模型的晶體生成流程。a訓(xùn)練模型的核心概念:通過(guò)標(biāo)記化將 CIF 文件(左)轉(zhuǎn)換為一系列符號(hào)。該序列由模型處理,該模型為輸入中的每個(gè)相應(yīng)符號(hào)生成詞匯表上的概率分布列表。使用交叉熵?fù)p失指標(biāo)根據(jù)目標(biāo)分布(包含正確后續(xù)標(biāo)記上的整個(gè)概率質(zhì)量)評(píng)估生成的預(yù)測(cè)概率分布。目標(biāo)標(biāo)記是向左移動(dòng)一個(gè)位置的輸入標(biāo)記,因?yàn)槟繕?biāo)是在給定一系列前面標(biāo)記的情況下預(yù)測(cè)下一個(gè)標(biāo)記。標(biāo)記分為CIF標(biāo)記(藍(lán)色)、原子(綠色)、數(shù)字(金色)和標(biāo)點(diǎn)符號(hào)(紅色)。輸出標(biāo)記(在訓(xùn)練期間未實(shí)際采樣)表示模型分配最高概率的標(biāo)記。帶下劃線的標(biāo)記表示預(yù)測(cè)的分布,為正確的下一個(gè)標(biāo)記分配相對(duì)較低的概率。b生成CIF文件:首先,通過(guò)將符號(hào)data_與所需的單元格組成連接起來(lái)來(lái)構(gòu)造提示,然后由模型對(duì)其進(jìn)行標(biāo)記和處理。接下來(lái),從序列中即將到來(lái)的Token的預(yù)測(cè)分布中采樣一個(gè)Token。最后,采樣的Token將添加到 CIF 文件的累積內(nèi)容中。此過(guò)程繼續(xù)迭代,直到滿足預(yù)定義的終止條件(例如,對(duì)兩個(gè)連續(xù)的換行符進(jìn)行采樣)。

論文二:基于文本數(shù)據(jù)進(jìn)行蛋白質(zhì)設(shè)計(jì)的多模態(tài)框架

論文題目:A text-guided protein design framework

基于文本數(shù)據(jù)進(jìn)行蛋白質(zhì)設(shè)計(jì)的多模態(tài)框架

論文來(lái)源:Nature Machine Intelligence

論文鏈接:https://www.nature.com/articles/s42256-025-01011-z

代碼鏈接:https://github.com/chao1224/ProteinDT

一作單位:University of California Berkeley, USA


摘要:目前的人工智能輔助蛋白質(zhì)設(shè)計(jì)主要利用蛋白質(zhì)順序和結(jié)構(gòu)信息。同時(shí),人類(lèi)以文本格式收集了大量描述蛋白質(zhì)高級(jí)功能的知識(shí),但尚未探索這些文本數(shù)據(jù)的結(jié)合是否有助于蛋白質(zhì)設(shè)計(jì)任務(wù)。為了彌合這一差距,我們提出了 ProteinDT,這是一個(gè)利用文本描述進(jìn)行蛋白質(zhì)設(shè)計(jì)的多模態(tài)框架。ProteinDT 由三個(gè)連續(xù)的步驟組成:ProteinCLAP,它對(duì)齊兩種模態(tài)的表示,一個(gè)從文本模態(tài)生成蛋白質(zhì)表示的促進(jìn)器,以及一個(gè)從表示創(chuàng)建蛋白質(zhì)序列的解碼器。為了訓(xùn)練 ProteinDT,我們構(gòu)建了一個(gè)大型數(shù)據(jù)集 SwissProtCLAP,其中包含 441,000 個(gè)文本和蛋白質(zhì)對(duì)。我們定量驗(yàn)證了 ProteinDT 在三項(xiàng)具有挑戰(zhàn)性的任務(wù)中的有效性:(1) 文本引導(dǎo)蛋白質(zhì)生成的準(zhǔn)確率超過(guò) 90%;(2)12個(gè)零樣本文本引導(dǎo)蛋白質(zhì)編輯任務(wù)的最佳命中率;(3) 在六分之四的蛋白質(zhì)特性預(yù)測(cè)基準(zhǔn)上表現(xiàn)出色。


核心圖:ProteinDT 預(yù)訓(xùn)練框架與下游任務(wù)的流程(a–c 為預(yù)訓(xùn)練,d–f 為下游任務(wù))。(a)ProteinCLAP:一種對(duì)比學(xué)習(xí)范式,用于對(duì)齊文本模態(tài)與蛋白質(zhì)序列模態(tài)的表示空間。(b)ProteinFacilitator 模型:增強(qiáng)從文本序列表示到蛋白質(zhì)序列表示的映射能力。(c)蛋白質(zhì)序列解碼器:基于前一步生成的表示來(lái)生成蛋白質(zhì)序列。(d)下游任務(wù):文本到蛋白質(zhì)的生成。(e)下游任務(wù):文本引導(dǎo)的蛋白質(zhì)編輯。(f)下游任務(wù):蛋白質(zhì)性質(zhì)預(yù)測(cè)

論文三:用于分子性質(zhì)預(yù)測(cè)的科學(xué)發(fā)現(xiàn)大模型

論文題目:Large language models for scientific discovery in molecular property prediction

用于分子性質(zhì)預(yù)測(cè)的科學(xué)發(fā)現(xiàn)大模型

論文來(lái)源:Nature Machine Intelligence

論文鏈接:https://www.nature.com/articles/s42256-025-00994-z

代碼鏈接:https://github.com/zyzisastudyreallyhardguy/LLM4SD

一作單位:Monash University,Australia


摘要:大語(yǔ)言模型(LLM)是一種人工智能系統(tǒng),以自然語(yǔ)言的形式封裝了大量知識(shí)。這些系統(tǒng)擅長(zhǎng)許多復(fù)雜的任務(wù),包括創(chuàng)意寫(xiě)作、講故事、翻譯、問(wèn)答、摘要和計(jì)算機(jī)代碼生成。盡管大語(yǔ)言模型在自然科學(xué)中已經(jīng)得到了初步應(yīng)用,但它們?cè)谕苿?dòng)科學(xué)發(fā)現(xiàn)方面的潛力在很大程度上仍未被探索。在這項(xiàng)工作中,我們介紹了LLM4SD,這是一個(gè)旨在利用LLM通過(guò)綜合文獻(xiàn)知識(shí)和從科學(xué)數(shù)據(jù)中推斷知識(shí)來(lái)推動(dòng)分子性質(zhì)預(yù)測(cè)的科學(xué)發(fā)現(xiàn)的框架。大語(yǔ)言模型通過(guò)從科學(xué)文獻(xiàn)中提取既定信息來(lái)綜合知識(shí),例如分子量是預(yù)測(cè)溶解度的關(guān)鍵。對(duì)于推理,LLM 可以識(shí)別分子數(shù)據(jù)中的模式,特別是在簡(jiǎn)化的分子輸入線輸入系統(tǒng)編碼的結(jié)構(gòu)中,例如含鹵素分子更有可能穿過(guò)血腦屏障。這些信息以可解釋的知識(shí)的形式呈現(xiàn),使分子能夠轉(zhuǎn)化為特征向量。通過(guò)將這些功能與隨機(jī)森林等可解釋模型一起使用,LLM4SD 可以在一系列預(yù)測(cè)分子特性的基準(zhǔn)任務(wù)中超越當(dāng)前最先進(jìn)的技術(shù)。我們預(yù)計(jì)它將提供可解釋的和潛在的新見(jiàn)解,有助于分子性質(zhì)預(yù)測(cè)的科學(xué)發(fā)現(xiàn)。


核心圖:用于分子性質(zhì)預(yù)測(cè)的LLM4SD大模型的工作流。從文獻(xiàn)中綜合知識(shí)。在此階段,大語(yǔ)言模型根據(jù)預(yù)訓(xùn)練的文獻(xiàn)綜合知識(shí),以執(zhí)行預(yù)測(cè) BBBP 等任務(wù)。例如,分子量低于 500 Da 的分子更有可能通過(guò)血腦屏障。b,從數(shù)據(jù)中推斷知識(shí)。在這里,大語(yǔ)言模型分析數(shù)據(jù),例如帶有標(biāo)簽的 SMILES 字符串(1 表示 BBB 滲透性,0 表示非 BBB 滲透性),以識(shí)別模式。例如,他們可能會(huì)觀察到含有鹵素的分子有更高的機(jī)會(huì)穿過(guò)血腦屏障。c、模型訓(xùn)練。通過(guò)合成和推斷規(guī)則,分子可以根據(jù)其相應(yīng)的規(guī)則值轉(zhuǎn)換為載體表示。然后,矢量化表示可用于訓(xùn)練可解釋模型。d,可解釋的見(jiàn)解。模型經(jīng)過(guò)訓(xùn)練后,它會(huì)提供解釋其如何進(jìn)行預(yù)測(cè)的見(jiàn)解。例如,在 BBBP 預(yù)測(cè)的背景下,模型可以揭示每個(gè)規(guī)則的重要性,顯示哪些規(guī)則對(duì)最終預(yù)測(cè)很重要。

論文四:知識(shí)圖譜驅(qū)動(dòng)的多工具集成科學(xué)智能體

論文題目:SciToolAgent: a knowledge-graph-driven scientific agent for multitool integration

知識(shí)圖譜驅(qū)動(dòng)的多工具集成科學(xué)智能體

論文來(lái)源:Nature Computational Science

論文鏈接:https://www.nature.com/articles/s43588-025-00849-y

代碼鏈接:https://github.com/hicai-zju/scitoolagent

一作單位:Zhejiang University, China


摘要:科學(xué)研究越來(lái)越依賴專(zhuān)門(mén)的計(jì)算工具,但有效利用這些工具需要大量的領(lǐng)域?qū)I(yè)知識(shí)。雖然大語(yǔ)言模型在工具自動(dòng)化方面顯示出前景,但它們難以無(wú)縫集成和編排多種工具以實(shí)現(xiàn)復(fù)雜的科學(xué)工作流程。在這里,我們介紹SciToolAgent,這是一種由大語(yǔ)言模型驅(qū)動(dòng)的代理,可自動(dòng)執(zhí)行生物學(xué)、化學(xué)和材料科學(xué)領(lǐng)域的數(shù)百種科學(xué)工具。SciToolAgent 的核心是利用科學(xué)的工具知識(shí)圖譜,通過(guò)基于圖的檢索增強(qiáng)生成實(shí)現(xiàn)智能工具選擇和執(zhí)行。該代理還包含一個(gè)全面的安全檢查模塊,以確保負(fù)責(zé)任和合乎道德的工具使用。對(duì)精選基準(zhǔn)的廣泛評(píng)估表明,SciToolAgent 優(yōu)于現(xiàn)有方法。蛋白質(zhì)工程、化學(xué)反應(yīng)性預(yù)測(cè)、化學(xué)合成和金屬有機(jī)框架篩選方面的案例研究進(jìn)一步證明了 SciToolAgent 自動(dòng)化復(fù)雜科學(xué)工作流程的能力,使專(zhuān)家和非專(zhuān)家都可以使用先進(jìn)的研究工具。


核心圖:SciToolAgent 概覽。(a)研究中使用的工具集,其中包括通用工具以及常用的生物學(xué)、化學(xué)和材料相關(guān)工具。(b)SciToolKG 的模式架構(gòu),涵蓋了每個(gè)工具的多樣信息,如輸入/輸出格式、特定功能、安全等級(jí)等。(c)SciToolAgent 的整體工作流程:在接收到用戶查詢后,基于 LLM 的Planner(規(guī)劃器)會(huì)利用基于 SciToolKG 的檢索增強(qiáng)生成(RAG)來(lái)生成工具鏈,隨后由基于 LLM 的Executor(執(zhí)行器)順序執(zhí)行。接著通過(guò)安全檢查模塊調(diào)用安全數(shù)據(jù)庫(kù),以確保生成的解決方案符合倫理與安全要求。最后,基于 LLM 的Summarizer(總結(jié)器)對(duì)執(zhí)行結(jié)果進(jìn)行總結(jié),評(píng)估問(wèn)題求解過(guò)程,并在必要時(shí)提示 Planner 生成新的工具鏈。最終答案會(huì)被存儲(chǔ)到記憶模塊中,作為下一次查詢的上下文。(arxiv版的圖,對(duì)比了,沒(méi)什么出入)

論文五:基于大語(yǔ)言模型的分子化藥物設(shè)計(jì)

論文題目:Token-Mol 1.0: tokenized drug design with large language models

基于大語(yǔ)言模型的分子化藥物設(shè)計(jì)

論文來(lái)源:Nature Communications

論文鏈接:https://www.nature.com/articles/s41467-025-59628-y

代碼鏈接:https://github.com/hicai-zju/scitoolagent

一作單位:Zhejiang University, China


摘要:將大語(yǔ)言模型 (LLM) 集成到藥物設(shè)計(jì)中的勢(shì)頭正在增強(qiáng);然而,現(xiàn)有方法往往難以有效地結(jié)合三維分子結(jié)構(gòu)。在這里,我們介紹了 Token-Mol,這是一種純Token的 3D 藥物設(shè)計(jì)模型,它將 2D 和 3D 結(jié)構(gòu)信息以及分子特性編碼為離散的標(biāo)記。Token-Mol 基于 Transformer 解碼器構(gòu)建并使用因果掩蔽進(jìn)行訓(xùn)練,引入了專(zhuān)為回歸任務(wù)量身定制的高斯交叉熵?fù)p失函數(shù),從而在多個(gè)下游應(yīng)用程序中實(shí)現(xiàn)卓越的性能。該模型超越了現(xiàn)有方法,在兩個(gè)數(shù)據(jù)集中將分子構(gòu)象生成提高了 10% 和 20% 以上,同時(shí)在屬性預(yù)測(cè)方面比純標(biāo)記模型高出 30%。在基于口袋的分子生成中,它分別將藥物相似性和合成可及性提高了約 11% 和 14%。值得注意的是,Token-Mol 的運(yùn)行速度是專(zhuān)家擴(kuò)散模型的 35 倍。在現(xiàn)實(shí)世界的驗(yàn)證中,它可以提高成功率,并且與強(qiáng)化學(xué)習(xí)相結(jié)合,進(jìn)一步優(yōu)化親和力和藥物相似性,從而推進(jìn)人工智能驅(qū)動(dòng)的藥物發(fā)現(xiàn)。



核心圖:a. 數(shù)據(jù)處理流程。b. Token-Mol 的工作流程。c. GCE 損失函數(shù)中的權(quán)重分配,其中 GT 表示真實(shí)標(biāo)簽 token(ground truth token)。d. 基于結(jié)合口袋的分子生成模型中的口袋編碼器與融合模塊。

論文六:數(shù)據(jù)稀缺條件下基于大模型的聚合物性質(zhì)學(xué)習(xí)

論文題目:Harnessing large language models for data-scarce learning of polymer properties

數(shù)據(jù)稀缺條件下基于大模型的聚合物性質(zhì)學(xué)習(xí)

論文來(lái)源:Nature Computational Science

論文鏈接:https://www.nature.com/articles/s43588-025-00768-y

代碼鏈接:https://github.com/ningliu-iga/TrinityLLM

一作單位:Global Engineering and Materials Inc., USA


摘要:大語(yǔ)言模型 (LLM) 有望成為用于評(píng)估、分析和設(shè)計(jì)的快速、準(zhǔn)確的材料建模范例。它們大量的可訓(xùn)練參數(shù)需要大量數(shù)據(jù)來(lái)實(shí)現(xiàn)準(zhǔn)確性并減少過(guò)度擬合。然而,實(shí)驗(yàn)測(cè)量通常有限且成本高昂,無(wú)法獲得足夠的數(shù)量進(jìn)行微調(diào)。為此,我們?cè)谶@里提出了一個(gè)基于物理的訓(xùn)練框架,用于解決數(shù)據(jù)稀缺的核心問(wèn)題。核心推動(dòng)器是一個(gè)基于物理的建??蚣?,它生成大量合成數(shù)據(jù),以在微調(diào)之前將 LLM 與物理上一致的初始狀態(tài)對(duì)齊。我們的框架采用兩階段訓(xùn)練策略:利用數(shù)量大但準(zhǔn)確度較低的合成數(shù)據(jù)進(jìn)行監(jiān)督預(yù)訓(xùn)練,并使用有限的實(shí)驗(yàn)數(shù)據(jù)微調(diào)第一階段模型。我們通過(guò)學(xué)習(xí)聚合物可燃性指標(biāo)的視角,在錐形量熱儀數(shù)據(jù)稀疏的情況下,通過(guò)學(xué)習(xí)聚合物可燃性指標(biāo)的視角,監(jiān)督預(yù)訓(xùn)練對(duì)于獲得準(zhǔn)確的微調(diào) LLM 至關(guān)重要。


核心圖:數(shù)據(jù)稀缺條件下基于大模型的聚合物性質(zhì)學(xué)習(xí)的核心流程。第 1 至 6 步展示了在數(shù)據(jù)有限的情況下,采用 “三位一體”(trinity)方法訓(xùn)練大型語(yǔ)言模型(LLMs)的流程,與之對(duì)比的是用灰色突出顯示的當(dāng)前常用方法。

論文七:基于大語(yǔ)言模型推動(dòng)傳染病實(shí)時(shí)預(yù)測(cè)研究發(fā)展

論文題目:Advancing real-time infectious disease forecasting using large language models

基于大語(yǔ)言模型推動(dòng)傳染病實(shí)時(shí)預(yù)測(cè)研究發(fā)展

論文來(lái)源:Nature Computational Science

論文鏈接:https://www.nature.com/articles/s43588-025-00798-6

代碼鏈接:https://github.com/miemieyanga/PandemicLLM

一作單位:Johns Hopkins University, USA


摘要:由于影響因素的復(fù)雜性,預(yù)測(cè)正在進(jìn)行的疾病爆發(fā)的短期傳播構(gòu)成了挑戰(zhàn),其中一些因素可以通過(guò)相互關(guān)聯(lián)的多模態(tài)變量以及公共政策和人類(lèi)行為的交叉點(diǎn)來(lái)表征。在這里,我們介紹了 PandemicLLM,這是一個(gè)具有多模態(tài)大語(yǔ)言模型 (LLM) 的框架,它將疾病傳播的實(shí)時(shí)預(yù)測(cè)重新表述為文本推理問(wèn)題,并能夠整合實(shí)時(shí)、復(fù)雜的非數(shù)字信息。這種方法通過(guò)人工智能-人類(lèi)合作提示設(shè)計(jì)和時(shí)間序列表示學(xué)習(xí),為L(zhǎng)LM編碼多模態(tài)數(shù)據(jù)。該模型應(yīng)用于 COVID-19 大流行,并經(jīng)過(guò)訓(xùn)練以利用文本公共衛(wèi)生政策、基因組監(jiān)測(cè)、空間和流行病學(xué)時(shí)間序列數(shù)據(jù),并在美國(guó)所有 50 個(gè)州進(jìn)行了為期 19 個(gè)月的測(cè)試。PandemicLLM 為以異構(gòu)格式合并各種與大流行相關(guān)的數(shù)據(jù)開(kāi)辟了途徑,并顯示出與現(xiàn)有模型相比的性能優(yōu)勢(shì)。


核心圖1:PandemicLLMs 的疫情數(shù)據(jù)流與處理流程概覽。(a) 多模態(tài)數(shù)據(jù)洞察(Multi-modality data insights):我們的多模態(tài)數(shù)據(jù)集整合了四類(lèi)疫情相關(guān)數(shù)據(jù)源:空間數(shù)據(jù)(人口統(tǒng)計(jì)學(xué)與醫(yī)療保健指標(biāo))、流行病學(xué)時(shí)間序列(病例報(bào)告、住院人數(shù)和疫苗接種率)、公共衛(wèi)生政策(以文本形式記錄的政府干預(yù)措施)以及基因組監(jiān)測(cè)數(shù)據(jù)(結(jié)合了變異株的文本描述與其流行情況的周度序列)。整個(gè)數(shù)據(jù)集包含 5200 條記錄,覆蓋美國(guó) 50 個(gè)州,時(shí)間跨度為 104 周。SARS-CoV-2 的系統(tǒng)發(fā)育樹(shù)是使用 Nextstrain 生成的。(b) PandemicLLMs 的構(gòu)建流程:為了預(yù)測(cè)疫情住院趨勢(shì),我們將問(wèn)題形式化為一個(gè)序數(shù)分類(lèi)任務(wù)。根據(jù) CDC 指南,我們定義了五個(gè)類(lèi)別:大幅下降、中度下降、穩(wěn)定、中度上升、大幅上升。通過(guò) AI–人類(lèi)協(xié)作的提示設(shè)計(jì)將多模態(tài)數(shù)據(jù)轉(zhuǎn)換為文本格式,PandemicLLMs 在這些提示與目標(biāo)標(biāo)簽的基礎(chǔ)上進(jìn)行微調(diào),以實(shí)現(xiàn) 1 周和 3 周的預(yù)測(cè)。我們特別強(qiáng)調(diào)對(duì)模型進(jìn)行嚴(yán)格的性能評(píng)估,以驗(yàn)證預(yù)測(cè)的 準(zhǔn)確性與可信度。


核心圖2:AI–人類(lèi)協(xié)作提示設(shè)計(jì)示意圖。美國(guó) 50 個(gè)州的空間數(shù)據(jù)被轉(zhuǎn)化為描述性文本,以反映其排名;政策數(shù)據(jù)包含防控強(qiáng)度及其逐周變化;流行病學(xué)時(shí)間序列數(shù)據(jù)結(jié)合了敘事生成與表征學(xué)習(xí);基因組監(jiān)測(cè)數(shù)據(jù)則將變異株特征的文本摘要與其最新流行情況結(jié)合。藍(lán)色箭頭表示信息文本化,紅色箭頭表示序列表征學(xué)習(xí)。每個(gè)設(shè)計(jì)的提示長(zhǎng)度在 296 至 322 個(gè)詞之間。

大模型與生物醫(yī)學(xué):

AI + Science第二季讀書(shū)會(huì)

生物醫(yī)學(xué)是一個(gè)復(fù)雜且富有挑戰(zhàn)性的領(lǐng)域,涉及到大量的數(shù)據(jù)處理、模式識(shí)別、理論模型建構(gòu)和實(shí)驗(yàn)驗(yàn)證等問(wèn)題。AI基礎(chǔ)模型的引入,使得我們能夠從前所未有的角度去觀察和理解這個(gè)領(lǐng)域的問(wèn)題,加速科學(xué)研究的步伐,提高醫(yī)療服務(wù)的效率和效果。這種交叉領(lǐng)域的合作,標(biāo)志著我們正在向科技與生物醫(yī)學(xué)深度融合的新時(shí)代邁進(jìn),對(duì)于推動(dòng)科學(xué)研究、優(yōu)化醫(yī)療服務(wù)、促進(jìn)人類(lèi)健康有著深遠(yuǎn)的影響。

集智俱樂(lè)部聯(lián)合西湖大學(xué)助理教授吳泰霖、斯坦福大學(xué)計(jì)算機(jī)科學(xué)系博士后研究員王瀚宸、博士研究生黃柯鑫、黃倩,華盛頓大學(xué)博士研究生屠鑫明,共同發(fā)起以“大模型與生物醫(yī)學(xué)”為主題的讀書(shū)會(huì),共學(xué)共研相關(guān)文獻(xiàn), 探討基礎(chǔ)模型在生物醫(yī)學(xué)等科學(xué)領(lǐng)域的應(yīng)用、影響和展望。 讀書(shū)會(huì)已完結(jié),現(xiàn)在報(bào)名可加入社群并解鎖 回放 視頻權(quán)限。

詳情請(qǐng)見(jiàn):

1.

2.

3.

4.

5.

6.

7.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
楊振寧大兒子去年已離世!享年73歲,訃告曝光死因是在家中出意外

楊振寧大兒子去年已離世!享年73歲,訃告曝光死因是在家中出意外

娛樂(lè)圈圈圓
2025-10-25 14:46:57
將中國(guó)列為“四大文明古國(guó)”之一,就是一個(gè)錯(cuò)誤

將中國(guó)列為“四大文明古國(guó)”之一,就是一個(gè)錯(cuò)誤

一天社
2025-10-23 20:03:28
德國(guó)總理:斷供安世芯片不可接受,中方必須明白,我們已忍無(wú)可忍

德國(guó)總理:斷供安世芯片不可接受,中方必須明白,我們已忍無(wú)可忍

知法而形
2025-10-25 16:08:58
北大教授錢(qián)理群,為何寧愿賣(mài)北京房產(chǎn)與妻住養(yǎng)老院,也不生孩子?

北大教授錢(qián)理群,為何寧愿賣(mài)北京房產(chǎn)與妻住養(yǎng)老院,也不生孩子?

君笙的拂兮
2025-10-25 16:51:36
山東女孩趙娜,獲環(huán)球小姐中國(guó)總冠軍!

山東女孩趙娜,獲環(huán)球小姐中國(guó)總冠軍!

魯中晨報(bào)
2025-10-25 13:16:15
大陸設(shè)立臺(tái)灣光復(fù)紀(jì)念日,國(guó)民黨竟然提要求,蔣萬(wàn)安暴露真面目

大陸設(shè)立臺(tái)灣光復(fù)紀(jì)念日,國(guó)民黨竟然提要求,蔣萬(wàn)安暴露真面目

DS北風(fēng)
2025-10-25 21:02:12
預(yù)售5分鐘售罄,開(kāi)售卻遇冷!商家:幾乎“無(wú)人問(wèn)津”,網(wǎng)友們也吵翻了

預(yù)售5分鐘售罄,開(kāi)售卻遇冷!商家:幾乎“無(wú)人問(wèn)津”,網(wǎng)友們也吵翻了

中國(guó)基金報(bào)
2025-10-26 00:11:57
剛剛確認(rèn)!已被當(dāng)場(chǎng)擊斃!

剛剛確認(rèn)!已被當(dāng)場(chǎng)擊斃!

FM93浙江交通之聲
2025-10-25 16:41:05
普京:澤連斯基最好想清楚,如用射程3000公里新武器打擊俄領(lǐng)土,回應(yīng)將非常嚴(yán)厲!

普京:澤連斯基最好想清楚,如用射程3000公里新武器打擊俄領(lǐng)土,回應(yīng)將非常嚴(yán)厲!

每日經(jīng)濟(jì)新聞
2025-10-24 10:36:16
如果在家突發(fā)心梗,黃金5分鐘自救法,快了解,關(guān)鍵時(shí)刻可自救

如果在家突發(fā)心梗,黃金5分鐘自救法,快了解,關(guān)鍵時(shí)刻可自救

風(fēng)信子的花
2025-10-24 23:59:39
44歲歌手落魄,存款不到10塊,相戀16年女友也離開(kāi),網(wǎng)友:活該

44歲歌手落魄,存款不到10塊,相戀16年女友也離開(kāi),網(wǎng)友:活該

查爾菲的筆記
2025-10-25 11:28:35
世界各國(guó)都在凍結(jié)詐騙首腦陳志資產(chǎn),我們要不要凍結(jié)他?

世界各國(guó)都在凍結(jié)詐騙首腦陳志資產(chǎn),我們要不要凍結(jié)他?

小江科普
2025-10-25 17:24:53
等了2天,中方代表才出發(fā),美財(cái)長(zhǎng)破防,中國(guó)表態(tài)發(fā)生質(zhì)變

等了2天,中方代表才出發(fā),美財(cái)長(zhǎng)破防,中國(guó)表態(tài)發(fā)生質(zhì)變

時(shí)時(shí)有聊
2025-10-24 19:41:21
范迪克送點(diǎn)!利物浦2-3小蜜蜂慘遭聯(lián)賽4連敗跌至第六 被曼聯(lián)超越

范迪克送點(diǎn)!利物浦2-3小蜜蜂慘遭聯(lián)賽4連敗跌至第六 被曼聯(lián)超越

狍子歪解體壇
2025-10-26 05:09:36
李提香郁悶一戰(zhàn)!烏龍球+送點(diǎn),不滿判罰怒視裁判,險(xiǎn)染紅離場(chǎng)

李提香郁悶一戰(zhàn)!烏龍球+送點(diǎn),不滿判罰怒視裁判,險(xiǎn)染紅離場(chǎng)

奧拜爾
2025-10-25 20:32:42
22歲“神秘富家女”楊蘭蘭消失,豪宅人去樓空,太神秘的原因在哪

22歲“神秘富家女”楊蘭蘭消失,豪宅人去樓空,太神秘的原因在哪

李昕言溫度空間
2025-10-25 12:54:44
2-1!93分鐘絕殺 英超大冷門(mén):升班馬客場(chǎng)逆轉(zhuǎn)11.4億豪門(mén) 沖進(jìn)前2

2-1!93分鐘絕殺 英超大冷門(mén):升班馬客場(chǎng)逆轉(zhuǎn)11.4億豪門(mén) 沖進(jìn)前2

狍子歪解體壇
2025-10-25 23:59:43
楊振寧的葬禮:身體覆蓋國(guó)旗,翁帆哭腫雙眼,重量級(jí)人物到場(chǎng)送別

楊振寧的葬禮:身體覆蓋國(guó)旗,翁帆哭腫雙眼,重量級(jí)人物到場(chǎng)送別

叨嘮
2025-10-24 21:45:43
CS官方“操盤(pán)”市場(chǎng),賭狗們迎來(lái)最黑暗的一天。

CS官方“操盤(pán)”市場(chǎng),賭狗們迎來(lái)最黑暗的一天。

差評(píng)XPIN
2025-10-25 00:05:34
1死4重傷!十堰通報(bào)一危害公共安全事件,司機(jī)刑拘,當(dāng)?shù)孛襟w發(fā)聲

1死4重傷!十堰通報(bào)一危害公共安全事件,司機(jī)刑拘,當(dāng)?shù)孛襟w發(fā)聲

火山詩(shī)話
2025-10-25 09:51:25
2025-10-26 06:16:49
集智俱樂(lè)部 incentive-icons
集智俱樂(lè)部
科普人工智能相關(guān)知識(shí)技能
5428文章數(shù) 4656關(guān)注度
往期回顧 全部

科技要聞

傳特斯拉人形機(jī)器人再延期,雙手只能用6周

頭條要聞

普京態(tài)度180度大轉(zhuǎn)彎警告特朗普 流露出相當(dāng)強(qiáng)硬的威脅

頭條要聞

普京態(tài)度180度大轉(zhuǎn)彎警告特朗普 流露出相當(dāng)強(qiáng)硬的威脅

體育要聞

從2400人小島打進(jìn)NBA 他才是"上喬下科"?

娛樂(lè)要聞

《水龍吟》《天地劍心》一棄一追

財(cái)經(jīng)要聞

貴州茅臺(tái)換帥!70后陳華接任新掌門(mén)

汽車(chē)要聞

插混皮卡爭(zhēng)霸戰(zhàn),誰(shuí)能笑到最后?

態(tài)度原創(chuàng)

游戲
本地
藝術(shù)
親子
公開(kāi)課

《消光困獸》噩夢(mèng)難度細(xì)節(jié)曝光!敵人更智能、恐怖

本地新聞

這個(gè)秋天,一起來(lái)粉上漓渚!所有風(fēng)景只為等你

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫(xiě)法

親子要聞

我表哥過(guò)生日,晚上一起吃了個(gè)飯,吹蠟燭許了個(gè)愿望

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 h工口全彩里番库18禁无遮挡| 亚洲岛国成人免费av| 久久99精品久久久久久齐齐| 男人和女人高潮免费网站| 亚洲综合婷婷| 老师课后辅导乳揉搓h在线观看| 国产成人精品无码区在线| 香蕉EEWW99国产精选免费| 国产肉丝袜在线观看| 国产成人啪精品视频免费APP| 九一九色国产| 国产精品v欧美精品v日韩精品| 国产精品视频二区不卡| 久久伊人精品青青草原APP| 色AV一区二区三区| 色色色九月综合| 果冻传媒亚洲区二期| 亚洲熟妇女的欲乱系列色欲| 四虎影视库久久久| 蜜桃视频在线观看免费视频网站www| AV免費下載| 欧美成人精品三级网站视频 | 亚洲欧美色图| 久久亚洲AV成人一二三区| 7777米奇影视| 国产黄色精品视频| 日韩国产Av无码一区二区三区| 国产日韩乱码精品一区二区| 丁香美女一区二区| 亚洲综合精品第一页| 狠狠干性爱影院第一页| 中国丰满人妻videoshd| 大香蕉超碰网| 99久久久久无码国产精品免费| 亚洲女久久久噜噜噜熟女| 青春禁区在线观看免费游戏| 无码av波多野结衣久久| 凹凸国产熟女精品视频5| 国产精品538一区二区在线| 久久久久久亚洲| 久久99国产精品成人欧美|