當人類基因組計劃完成草圖時,科學家們首次拼湊出約30億個堿基對的“生命天書”;而20年后,借助長讀長測序技術的突破,一場更精細的“基因組考古”正在改寫我們對遺傳變異的認知。近日,兩項發(fā)表于《自然》(Nature)雜志的國際合作研究,利用牛津納米孔(Oxford Nanopore)和太平洋生物科學(PacBio)的長讀長測序技術,對“千人基因組計劃”(1000 Genomes Project)的千余份樣本進行了深度解析,首次繪制出覆蓋全球26個人群的“結構變異(SVs)高清地圖”,揭示了超16萬種此前未被發(fā)現(xiàn)的人類基因組變異細節(jié)。
從“短讀長”到“長讀長”:基因組變異檢測的“分辨率革命”
自2008年啟動以來,“千人基因組計劃”通過短讀長測序(每次讀取約150-300個堿基對)構建了人類基因組變異的“基礎地圖”,但受限于技術,短讀長難以捕捉重復序列、高度相似區(qū)域(如同源染色體)及大段插入/缺失等復雜結構變異(SVs)。這些“隱藏”的變異被認為與癌癥、罕見病、自閉癥等多種疾病密切相關,卻長期處于研究的“盲區(qū)”。
此次突破的核心,正是長讀長測序技術的成熟——其單次讀取長度可達數(shù)十萬甚至數(shù)百萬個堿基對,能跨越復雜區(qū)域“全景式”掃描基因組。正如歐洲分子生物學實驗室(EMBL)的揚·科爾貝爾(Jan Korbel)所言:“新技術讓我們能組裝完整的人類基因組,系統(tǒng)檢查每個區(qū)域的變異,這是短讀長時代無法想象的?!?/strong>
1019份樣本的“變異全景圖”:發(fā)現(xiàn)超16萬種新結構變異
在第一項研究中,由科爾貝爾領銜的國際團隊分析了來自歐洲、東亞、南亞、非洲和美洲26個人群的1019份“千人基因組計劃”樣本,結合長讀長測序與自主研發(fā)的“圖增強結構變異分析(SAGA)”算法,共檢測到每個樣本平均15,301至21,529種結構變異(包括缺失、重復、插入、倒位等),并在967份匹配高覆蓋短讀長數(shù)據(jù)的樣本中,鑒定出近167,300個主要變異位點。
更關鍵的是,約51%的插入變異和14.5%的缺失變異是此前從未被記錄的“新變異”。這些變異廣泛分布于基因組的“復雜區(qū)域”——例如包含大量重復序列的著絲粒、免疫相關的“主要組織相容性復合體(MHC)”區(qū)域,以及與癌癥相關的致癌基因附近。
“原‘千人基因組計劃’標記了基因組的‘變異熱點’,而我們的工作讓這些熱點‘高清化’。”論文合著者、EMBL-EBI研究員薩拉·亨特(Sarah Hunt)解釋,“新圖譜的精度和深度遠超以往,未來有望直接關聯(lián)更多疾病風險?!?/strong>
65個“近完成基因組”:揭開Y染色體與移動元件的“隱秘世界”
第二項研究由“千人基因組計劃”人類基因組結構變異聯(lián)盟(HGSVC)主導,聚焦65個個體的“近乎完整”基因組組裝(覆蓋99%以上序列)。通過整合長讀長測序、光學圖譜(Bionano)、Hi-C染色質(zhì)構象捕獲等技術,團隊首次構建了130個單倍型解析的基因組組裝(即區(qū)分同源染色體的差異),并覆蓋了1,246個人類著絲粒序列——此前這些區(qū)域因高度重復被視為“測序禁區(qū)”。
研究顯示,每個個體平均攜帶26,115種結構變異,其中包括12,919種移動元件插入(如轉(zhuǎn)座子)。更令人振奮的是,團隊首次完成了6個個體的“端粒到端?!盰染色體組裝(覆蓋整個Y染色體),揭示了Yq12區(qū)域(高度異染色質(zhì))的精細結構。“現(xiàn)在,我們可以精確說出一個突變的起點、終點和具體形態(tài)?!闭撐墓餐谝蛔髡?、杰克遜實驗室計算生物學家彼得·奧達諾(Peter Audano)表示,“這對自閉癥、罕見病和癌癥研究而言,是跨越數(shù)十年的進步?!?/strong>
從“數(shù)據(jù)”到“應用”:疾病研究的“新工具箱”
兩項研究的成果不僅是學術突破,更直接指向臨床轉(zhuǎn)化。例如,研究團隊利用長讀長測序分析了4名罕見病患者的全基因組,平均鎖定了386個候選結構變異,并發(fā)現(xiàn)這些變異集中在270個已知致病基因的復雜區(qū)域——這意味著,此前因技術限制被遺漏的“致病變異”將被重新“挖掘”。
“現(xiàn)在,科學家研究癌癥驅(qū)動突變、罕見病致病基因時,終于能‘看清’整個基因組的‘地形’?!眾W達諾比喻道,“過去我們像在霧中摸象,現(xiàn)在至少有了清晰的輪廓?!?/p>
不過,研究者也坦言挑戰(zhàn)猶存:極罕見結構變異的檢測能力仍需提升,長讀長數(shù)據(jù)的“一致性”(不同技術平臺的結果整合)仍需優(yōu)化,且大規(guī)模人群的泛基因組分析(如納入更多非裔、原住民樣本)亟待擴展。正如論文作者指出:“未來的工作需要改進圖算法,將單核苷酸多態(tài)性(SNPs)、插入缺失(indels)和短串聯(lián)重復序列(STRs)納入統(tǒng)一分析框架?!?/p>
人類基因組的“終極拼圖”漸趨完整
從2001年人類基因組草圖的發(fā)布,到2023年人類泛基因組參考項目的推出,再到今日長讀長測序?qū)Y構變異的“高清解碼”,人類對自身遺傳密碼的認知正以指數(shù)級速度躍遷。正如海因里?!ずD髮W杜塞爾多夫分校的托比亞斯·馬沙爾(Tobias Marschall)所言:“這兩項研究不僅構建了一個醫(yī)學相關的資源寶庫,更開啟了‘精準基因組學’的新紀元——未來,每個人都能擁有自己的‘變異地圖’,而疾病治療也將真正進入‘按圖索驥’的時代?!?br/>
【關于投稿】
轉(zhuǎn)化醫(yī)學網(wǎng)(360zhyx.com)是轉(zhuǎn)化醫(yī)學核心門戶,旨在推動基礎研究、臨床診療和產(chǎn)業(yè)的發(fā)展,核心內(nèi)容涵蓋組學、檢驗、免疫、腫瘤、心血管、糖尿病等。如您有最新的研究內(nèi)容發(fā)表,歡迎聯(lián)系我們進行免費報道(公眾號菜單欄-在線客服聯(lián)系),我們的理念:內(nèi)容創(chuàng)造價值,轉(zhuǎn)化鑄就未來!
轉(zhuǎn)化醫(yī)學網(wǎng)(360zhyx.com)發(fā)布的文章旨在介紹前沿醫(yī)學研究進展,不能作為治療方案使用;如需獲得健康指導,請至正規(guī)醫(yī)院就診。
責任聲明:本稿件如有錯誤之處,敬請聯(lián)系轉(zhuǎn)化醫(yī)學網(wǎng)客服進行修改事宜!
微信號:zhuanhuayixue
熱門推薦活動 點擊免費報名
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.