準(zhǔn)確便捷地評估個(gè)體衰老對于識(shí)別健康風(fēng)險(xiǎn)和預(yù)防衰老相關(guān)疾病至關(guān)重要。然而,目前的衰老指標(biāo)往往面臨諸多挑戰(zhàn),例如方法論局限性、與不良后果的關(guān)聯(lián)性較弱以及普適性有限。
2025年7月23日,來自清華大學(xué)等研究團(tuán)隊(duì)在Nature Medicine雜志發(fā)表題為“Large language model-based biological age prediction in large-scale populations”的文章。
該研究提出了一個(gè)框架,利用大型語言模型 (LLM),僅使用健康體檢報(bào)告即可估算個(gè)體整體和器官特異性衰老。
值得一提的是,該模型在六個(gè)人群隊(duì)列中進(jìn)行驗(yàn)證,涵蓋超過 1000 萬參與者,證明了其有效性和可靠性。
為了驗(yàn)證 LLM 是否能夠有效預(yù)測整體年齡和器官特定年齡,研究人員將 LLM 的預(yù)測結(jié)果與其它衰老指標(biāo)進(jìn)行了比較,包括實(shí)際年齡、虛弱指數(shù)、端粒長度、八個(gè)表觀遺傳年齡和四個(gè) ML 預(yù)測年齡。
結(jié)果表明,LLM 預(yù)測的總體年齡與五種表型的關(guān)聯(lián)性顯著高于其他指標(biāo):足跟骨密度、牙齒、步行速度、長期疾病和虛弱指數(shù)。此外,與四種 ML 預(yù)測的總體年齡相比,LLM 預(yù)測的總體年齡與十種表型的相關(guān)性顯著增強(qiáng)。
隨后,研究人員進(jìn)一步比較了8個(gè)老齡化指標(biāo)在預(yù)測36種健康結(jié)果方面的一致性指數(shù)。 發(fā)現(xiàn)LLM 預(yù)測的總體年齡在全因死亡率、冠心病、中風(fēng)、慢性阻塞性肺疾病、腎功能衰竭、關(guān)節(jié)炎和其他22種結(jié)局中顯示出更優(yōu)的C指數(shù)。
緊接著,研究人員比較了LLM和四種ML模型中12種衰老相關(guān)表型的總體年齡差距之間的相關(guān)性。結(jié)果顯示,與ML模型相比,基于LLM的總體年齡差距與大多數(shù)表型的關(guān)聯(lián)明顯更強(qiáng)。
除了能夠更好地預(yù)測不良后果的無監(jiān)督衰老模型外,LLM 在衰老評估方面還具有三大優(yōu)勢,包括強(qiáng)大的通用性、能力演變和動(dòng)態(tài)衰老評估。
為了驗(yàn)證其普適性,研究人員在NCRP、CHARLS、CFPS和CLHLS上重復(fù)了上述分析。在NCRP、CHARLS和CFPS中觀察到了與主要發(fā)現(xiàn)相似的結(jié)果,表明LLM具有很強(qiáng)的普適性。然而,在CLHLS和NCRP的老年參與者中卻發(fā)現(xiàn)了相反的結(jié)果,這意味著目前的LLM可能不太適合評估老年人的衰老情況。
最后,研究人員確定了多個(gè)與衰老相關(guān)的蛋白質(zhì)組生物標(biāo)志物,包括LEP、OXT、ALPP和FGF21等。
總而言之,該研究發(fā)現(xiàn)LLM可以利用常規(guī)健康檢查報(bào)告來預(yù)測總體年齡和器官特異性年齡,并在多個(gè)隊(duì)列中驗(yàn)證其可靠性。通過應(yīng)用LLM預(yù)測的年齡和年齡差距,可以實(shí)現(xiàn)更精確的個(gè)體老齡化和相關(guān)健康風(fēng)險(xiǎn)建模,從而提高人群的健康效益。
參考文獻(xiàn):
https://www.nature.com/articles/s41591-025-03856-8
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.