撰文丨王聰
編輯丨王多魚
排版丨水成文
酶(Enzyme)是生命的分子機器,其功能的一個關鍵特性是底物特異性——即酶能夠識別并選擇性地作用于特定底物的能力。這種特異性源自酶活性位點的三維(3D)結構以及反應復雜的過渡態(tài)。實際上,許多酶并非傳統(tǒng)認為的那樣“專一”,它們可能具有多功能性,除了作用于其最初進化時涉及的底物,還能作用于其他結構相似的底物,從而催化不同類型的反應。
此外,數(shù)以百萬計的已知的酶仍缺乏可靠的底物特異性信息,這阻礙了它們的實際應用以及我們對自然界生物催化多樣性的全面理解。
2025 年 10 月 8 日, 伊利諾伊大學厄巴納-香檳分校(UIUC)趙惠民教授團隊 (崔海洋、蘇雨峰為共同第一作者 ) 在國際頂尖學術期刊Nature上發(fā)表了 題為: Enzyme specificity prediction using cross attention graph neural networks 的研究論文,論文第一作者崔海洋博士現(xiàn)為 南京師范大學教授。
該研究提出了一種結合跨注意力機制(Cross-Attention)與SE(3)-等變圖神經(jīng)網(wǎng)絡(SE(3)-equivariant GNN)的創(chuàng)新人工智能模型——EZSpecificity,可高精度預測酶的底物特異性,以幫助研究人員找到酶與底物的最佳組合。這項研究為 AI 在酶工程、合成生物學和綠色制造中的深度應用奠定了新的方法學基礎。
論文通訊作者趙惠民教授表示,如果我們想要獲得某種使用酶的產(chǎn)品,我們希望使用最佳的酶和底物組合,EZSpecificity是一種 AI 模型,它可以分析酶的序列,然后預測哪種底物最適合與該酶結合。該模型與團隊兩年前開發(fā)的用于從酶的序列預測其功能的CLEAN AI模型高度互補(該模型于 2023 年 5 月 發(fā)表在了Science期刊),二者共同構成了一個從“功能發(fā)現(xiàn)”到“精準應用”的完整酶研究 AI 工具鏈。
酶(Enzyme)是能夠催化分子反應的大分子蛋白質(核酶除外),它們有口袋狀的結構域,目標分子(稱為底物)可嵌入其中。酶與底物的契合程度被稱為特異性(specificity)。我們通常把酶與底物相互作用類比為“鎖和鑰匙”:只有合適的鑰匙才能打開鎖。但酶的功能并非如此簡單。
要找出酶與底物的最佳組合,頗具挑戰(zhàn)性,因為口袋并非一成不變。酶在與底物相互作用時,其構象會發(fā)生變化,更像是誘導契合。而且有些酶具有多態(tài)性,能夠催化不同類型的反應,這使得預測變得非常困難。因此,研究團隊希望利用機器學習模型和實驗數(shù)據(jù)來真正證明哪種配對效果最佳。
此前,已有研究團隊提出了酶特異性模型,但這些模型在準確性以及能夠預測的酶促反應類型方面都存在局限性。
論文第一作者崔海洋博士(左二),論文通訊作者趙惠民教授(左三)
趙惠民團隊意識到,要提高 AI 預測特異性的能力,還需要改進并擴充機器學習模型所依據(jù)的數(shù)據(jù)庫。于是,他們與伊利諾伊大學Diwakar Shukla展開合作,后者針對不同類別的酶進行了對接研究,創(chuàng)建了一個大型數(shù)據(jù)庫,其中不僅包含酶的序列和結構信息,還涵蓋了不同類別酶在不同類型的底物周圍所呈現(xiàn)的構象信息。
研究團隊表示,捕捉酶與其底物相互作用的實驗通常進展緩慢且復雜,所以團隊進行了大量的對接模擬,以補充和拓展現(xiàn)有的實驗數(shù)據(jù)。研究團隊聚焦于酶與其底物之間的原子級相互作用,數(shù)百萬次的對接計算提供了這一缺失的拼圖,從而構建出一個高度準確的酶特異性預測模型——EZSpecificity。該模型使用SE(3)-等變圖神經(jīng)網(wǎng)絡(SE(3)-equivariant GNN)來表征酶–底物的三維結構關系,并引入跨注意力機制(Cross-Attention)模塊來強化酶的活性口袋與底物分子之間的高維信息交互。
EZSpecificity 模型總體框架
隨后,研究團隊在四個旨在模擬實際應用的場景中,將 EZSpecificity 與當前領先的模型 ESP 進行了并行測試,在所有場景中,EZSpecificity 的表現(xiàn)都優(yōu)于 ESP。最后,研究團隊通過研究 8 種鹵化酶(這一類酶尚未得到充分表征,但其在合成生物活性分子方面的應用日益增多)和 78 種底物,對 EZSpecificity 進行了實驗驗證。結果顯示,EZSpecificity 準確識別唯一反應底物的成功率高達91.7%,而 ESP 的準確率僅為 58.3%。
趙惠民教授表示,現(xiàn)在還不能說 EZSpecificity 對每種酶都能有效預測,但對于某些酶來說,該研究已經(jīng)證明了其效果很好。團隊希望將這個工具提供給其他研究人員使用,因此開發(fā)了一個用戶界面,只需輸入底物和蛋白質序列,就可以使用 EZSpecificity 來預測該底物是否能很好地發(fā)揮作用。
EZSpecificity模型,標志著酶研究從“智能注釋”邁向“智能識別”,為理解生物催化的分子機制、推動 AI 驅動的酶工程、代謝網(wǎng)絡改造及綠色催化劑開發(fā)提供了全新的技術路徑。研究團隊表示,下一步計劃拓展該模型,用于分析酶的選擇性,即酶是否對底物上的特定位點有偏好,以幫助排除具有脫靶效應的酶。此外,還計劃繼續(xù)用更多的實驗數(shù)據(jù)來完善 EZSpecificity。
論文鏈接:
1. https://www.nature.com/articles/s41586-025-09697-2
2. https://www.science.org/doi/10.1126/science.adf2465
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.