禽流感病毒(H5N1)甲型病毒(IAV)的頻繁感染病例,構(gòu)成了人禽重配IAV大流行的風(fēng)險(xiǎn)。2025年9月17日,軍事醫(yī)學(xué)科學(xué)院李靖、北京化工大學(xué)童貽剛、軍事醫(yī)學(xué)科學(xué)院姜濤和中國(guó)醫(yī)學(xué)科學(xué)院吳愛平共同通訊在National Science Review在線發(fā)表題為“
Deep learning predicts potential reassortments of avian H5N1 with human influenza viruses”的研究論文。該研究旨在構(gòu)建一個(gè)名為HAIRANGE的注意力深度學(xué)習(xí)模型,用于預(yù)測(cè)H5N1和人IAV可能適應(yīng)人類的重配。
HAIRANGE中一個(gè)與生物相關(guān)的非預(yù)訓(xùn)練嵌入模型Codon2Vec,在基準(zhǔn)測(cè)試中與其他嵌入器(例如ESM2、DNABERT2等)相比表現(xiàn)出色,表明IAV RNA聚合酶相關(guān)基因的基因組背景與病毒宿主或血清型高度相關(guān)。HAIRANGE準(zhǔn)確預(yù)測(cè)了每個(gè)聚合酶相關(guān)基因的適應(yīng)性以及自適應(yīng)聚合酶相關(guān)基因重配,并通過體外報(bào)告分析驗(yàn)證了聚合酶活性。令人擔(dān)憂的是,HAIRANGE 預(yù)測(cè)了禽流感 H5N1 和人流感 H3N2 禽流感病毒 (IAV) 之間的適應(yīng)性重配,并通過聚合酶活性測(cè)定進(jìn)行了驗(yàn)證。總而言之,HAIRANGE 可以根據(jù)嵌入的基因組背景預(yù)測(cè)適應(yīng)性禽流感病毒 (IAV) 重配。目前,禽流感 H5N1 禽流感病毒 (IAV) 可能通過與人流感病毒 (IAV) 發(fā)生重配而構(gòu)成大流行的潛在風(fēng)險(xiǎn)。
禽流感病毒A(IAV)自然棲息于野生水禽和濱鳥體內(nèi),偶爾會(huì)溢出感染哺乳動(dòng)物,并偶爾會(huì)周期性地引發(fā)人類流感大流行。由于基因重配和高突變率,IAV的八段RNA基因組高度多樣化。家禽和野生鳥類的全球分布和密度擴(kuò)大了禽流感病毒溢出到哺乳動(dòng)物的生態(tài)界面。這些鳥類宿主中積累的廣泛遺傳多樣性增加了某些毒株擁有與IAV進(jìn)入哺乳動(dòng)物或復(fù)制相容的分子性狀的可能性。溢出事件發(fā)生后,額外的宿主特異性突變或重配可能會(huì)適應(yīng)哺乳動(dòng)物宿主,進(jìn)一步增強(qiáng)病毒的感染和傳播能力。病毒的適應(yīng)性表現(xiàn)為在單基因或多基因水平上,通過受體結(jié)合、生長(zhǎng)效率和拮抗宿主免疫反應(yīng)等機(jī)制,在感染和傳播方面具有進(jìn)化優(yōu)勢(shì)。1918年、1957年、1968年、1977年和2009年的最近五次流感大流行被認(rèn)定是由重組禽流感病毒(IAV)引起的。因此,識(shí)別禽流感病毒的適應(yīng)性和適應(yīng)性重組至關(guān)重要。
禽流感病毒(IAV)的宿主適應(yīng)性轉(zhuǎn)變主要受血凝素(HA)介導(dǎo)的受體與人或禽類受體(α2,6-或α2,3-連接唾液酸)的結(jié)合、神經(jīng)氨酸酶(NA)介導(dǎo)的病毒釋放以及病毒RNA聚合酶復(fù)合物介導(dǎo)的病毒復(fù)制效率控制。IAV毒株的受體結(jié)合特異性明確且易于區(qū)分。除H3、H2和H1外,H5和其他血清型主要與禽類受體結(jié)合。然而,多種聚合酶相關(guān)基因(PB2、PB1、PA和NP)介導(dǎo)的適應(yīng)性則更為復(fù)雜且難以識(shí)別。迄今為止,已充分證實(shí)H5N1的受體結(jié)合為禽類類型,然而,每個(gè)聚合酶相關(guān)基因的適應(yīng)性以及這些基因與其他禽流感病毒(IAV)介導(dǎo)的潛在人類適應(yīng)性重配仍不清楚。IAV在共感染期間通過交換其片段頻繁發(fā)生基因重配。目前的證據(jù)表明,IAV片段重配受內(nèi)在基因組包裝約束控制,而非隨機(jī)發(fā)生。每個(gè)RNA片段都包含順式作用信號(hào),指導(dǎo)高度有序的“7+1”組裝,從而保持基因組的完整性和顆粒的感染性。這些信號(hào)對(duì)傳入片段的骨架基因組提出了兼容性要求。然而,相互作用網(wǎng)絡(luò)并不嚴(yán)格,允許有限的“容錯(cuò)”片段組合,為偶爾的重配事件和隨后的適應(yīng)性探索提供了基礎(chǔ)。此外,宿主適應(yīng)性對(duì)于評(píng)估可能的禽流感病毒重配株的流行潛力更為重要。只有對(duì)人類適應(yīng)性更高的重配株才有可能在病毒種群中占據(jù)主導(dǎo)地位并發(fā)展成新的毒株,從而構(gòu)成大流行風(fēng)險(xiǎn)。此外,不同片段具有不同的重配率。NS片段在人和禽類病毒中均表現(xiàn)出較高的重配率,而其他五個(gè)內(nèi)部基因片段的重配率同樣較低,但不同血清型之間的重配率存在顯著差異。此外,新形成的重組子代病毒顆粒也受到宿主因素(例如ANP32A、MxA和BTN3A3)通過各種分子機(jī)制的制約。這些發(fā)現(xiàn)強(qiáng)調(diào)了片段兼容性和宿主生物學(xué)特性在驅(qū)動(dòng)禽流感病毒重配方面的相互作用。
自20世紀(jì)90年代末以來,H5N1禽流感病毒(IAV)已被記錄導(dǎo)致人類感染,并在2003年至2014年間持續(xù)出現(xiàn),主要發(fā)生在東亞地區(qū)。致病性更強(qiáng)的H5N1禽流感病毒(2.3.4.4b H5亞型)在世界各地的野生鳥類中出現(xiàn),并迅速適應(yīng)了哺乳動(dòng)物。更令人擔(dān)憂的是,自2022年以來,歐洲、北美以及中美洲和南美洲國(guó)家已廣泛報(bào)道了哺乳動(dòng)物感染H5N1病毒,這意味著該病毒具有很高的哺乳動(dòng)物適應(yīng)風(fēng)險(xiǎn)和哺乳動(dòng)物間傳播風(fēng)險(xiǎn),就像美國(guó)的牛群一樣。因此,我們有理由擔(dān)心H5N1禽流感病毒可能引發(fā)大流行,而大流行最有可能是通過與人類禽流感病毒的重組而引發(fā)的。
人工智能 (AI) 方法在病毒基因型-表型學(xué)習(xí)方面取得了顯著成果,例如預(yù)測(cè)禽流感病毒 (IAV) 的宿主適應(yīng)性、預(yù)測(cè)病毒宿主和節(jié)肢動(dòng)物媒介以及預(yù)測(cè) SARS-CoV-2 或其他冠狀病毒的適應(yīng)性轉(zhuǎn)變。特別是,自然語(yǔ)言處理 (NLP) 的蛋白質(zhì)序列嵌入可以更深入地學(xué)習(xí)蛋白質(zhì)基因型與其表型之間的關(guān)聯(lián),例如蛋白質(zhì)結(jié)構(gòu)和病毒進(jìn)化??紤]到 H5N1 和人類禽流感病毒 (IAV) 之間實(shí)驗(yàn)性重配測(cè)試的生物安全性和倫理問題,迫切需要建立一個(gè) AI 預(yù)測(cè)器來評(píng)估 H5N1 和人類禽流感病毒 (IAV) 之間重配的人類適應(yīng)潛力。并且,這種 AI 嵌入或預(yù)測(cè)器不應(yīng)帶來次要的生物安全性和倫理問題,例如基于大型基因序列數(shù)據(jù)集預(yù)訓(xùn)練嵌入工具,以及訓(xùn)練高危病毒基因組生成器。一些生物信息學(xué)方法已經(jīng)出現(xiàn),它們利用進(jìn)化史和序列衍生的兼容性信號(hào)來分析禽流感病毒(IAV)的重配,例如基于系統(tǒng)發(fā)育的 GiRaF 和 FluReF 流程或無(wú)需比對(duì)的技術(shù) 。為了進(jìn)一步實(shí)現(xiàn)面向表型的預(yù)測(cè),HopPER 的隨機(jī)森林分類器允許對(duì)宿主趨向性進(jìn)行概率推斷,進(jìn)而推斷宿主特異性片段的兼容性 ,盡管其預(yù)測(cè)的重配尚未經(jīng)過實(shí)驗(yàn)驗(yàn)證。因此,更高效、更安全的禽流感病毒基因自然語(yǔ)言處理 (NLP) 嵌入器和更智能的網(wǎng)絡(luò)似乎有望評(píng)估當(dāng)前 H5N1 禽流感病毒中具有高適應(yīng)潛力的重配株,特別是結(jié)合生物學(xué)方法的驗(yàn)證。
本研究提出了一個(gè)智能框架——HAIRANGE(基于基因組嵌入的注意力網(wǎng)絡(luò)進(jìn)行人類自適應(yīng)流感病毒重配),用于預(yù)測(cè)當(dāng)前流行的H5N1禽流感病毒(包括PB2、PB1、PA和NP四個(gè)RNA聚合酶相關(guān)基因)與人類H3N2禽流感病毒(包括H3N2禽流感病毒)的重配株在人類中的高度適應(yīng)潛力。HAIRANGE集成了一個(gè)新型基因組上下文嵌入器Codon2Vec和一個(gè)深度學(xué)習(xí)預(yù)測(cè)器,以評(píng)估禽流感病毒重配株在人類中的高度適應(yīng)潛力。未經(jīng)預(yù)訓(xùn)練的Codon2Vec將病毒基因序列嵌入為一個(gè)上下文矩陣,該矩陣表示每個(gè)密碼子及其編碼的殘基,并依賴于其上游和下游的密碼子和殘基,從而在細(xì)粒度級(jí)別上編碼RNA和蛋白質(zhì)信息。 HAIRANGE 中的 ResNet 分類器用于預(yù)測(cè)聚合酶基因的適應(yīng)性和適應(yīng)性重配,并提供可解釋的消融和聚合酶活性的生物學(xué)驗(yàn)證。智能預(yù)測(cè)和生物學(xué)驗(yàn)證框架可以及時(shí)且可解釋地評(píng)估流行的 H5N1 禽流感病毒造成的高大流行風(fēng)險(xiǎn)。
圖1 HAIRANGE 工作流程用于基因組嵌入、自適應(yīng) IAV 重配預(yù)測(cè)和聚合酶活性驗(yàn)證。(圖源自National Science Review )
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.