HPV-DeepSeek 是什么?乍一看,你可能覺得這是不是和中國的 DeepSeek 公司有什么關(guān)系?事實(shí)上,這是一群科學(xué)家于近期打造的一款液體活檢檢測(cè)方法,該方法可以在無癥狀個(gè)體出現(xiàn)癥狀的 10 年前就能檢測(cè)出人乳頭瘤病毒(HPV,Human Papillomavirus)相關(guān)的口咽癌,日前相關(guān)論文發(fā)表于《美國國家癌癥研究所期刊》。
我們無法得知研究人員在為這一技術(shù)命名時(shí)是否從國內(nèi)的 DeepSeek 模型汲取了靈感,但對(duì)于熟悉這一模型的國人來說,可能看到 HPV-DeepSeek 這一名稱會(huì)感到多了幾分親切。然而,該技術(shù)確實(shí)是一項(xiàng)國外技術(shù),其由美國哈佛醫(yī)學(xué)院助理教授、博德研究所副研究員、麻省眼耳醫(yī)院頭頸外科腫瘤科主治外科醫(yī)生和麥克托特頭頸癌中心首席研究院丹尼爾·L·法登(Daniel L.Faden)率隊(duì)完成。
(來源:https://oto.hms.harvard.edu/people/daniel-l-faden)
通過針對(duì)這類癌癥進(jìn)行早期診斷,HPV-DeepSeek 不僅可以提高治療成功率,還能減少使用激進(jìn)療法。這一成果首次證明“HPV+口咽癌”的精準(zhǔn)早期檢測(cè)是可行的,通過血液樣本可以更早地檢測(cè)出癌癥,為篩選 HPV 相關(guān)的口咽癌帶來了新機(jī)會(huì)。
(來源:https://youtu.be/y-n_-JuK89M)
據(jù)了解,HPV-DeepSeek 依靠全基因組測(cè)序來識(shí)別從腫瘤中分離并在血液中循環(huán)的 HPV DNA 微小片段。該團(tuán)隊(duì)的早期研究表明,這一檢測(cè)方法在患者初次就診時(shí),其診斷癌癥的特異性和敏感性均可達(dá)到 99%,對(duì)于癌癥早期檢測(cè)的敏感性高達(dá) 79%,優(yōu)于現(xiàn)有的診斷方法。
為了確定 HPV-DeepSeek 能否在患者確診的很久之前就檢測(cè)出 HPV 相關(guān)口咽癌,研究人員針對(duì)來自麻省總醫(yī)院布萊根生物庫的 56 樣本進(jìn)行了測(cè)試,其中 28 個(gè)樣本來自多年后患上 HPV 相關(guān)口咽癌的個(gè)體,另外 28 個(gè)樣本來自健康對(duì)照者。在 28 份后來患上癌癥的患者血液樣本中,研究人員從其中的 22 份中檢測(cè)到了 HPV 腫瘤 DNA,而所有 28 份對(duì)照樣本的檢測(cè)結(jié)果均為陰性,這表明此次檢測(cè)方法具有高度的特異性。對(duì)于距離患者確診時(shí)間較近時(shí)所采集的血液樣本,這一檢測(cè)方法能夠更好地檢測(cè)出其中的 HPV DNA。在一份距離患者確診 7.8 年之前采集的血液樣本中,研究人員也檢測(cè)出了陽性成果。
利用機(jī)器學(xué)習(xí),研究人員進(jìn)一步提高了這一方法的測(cè)試能力,使得其能準(zhǔn)確識(shí)別出 28 例癌癥病例中的 27 例,甚至能從患者確診 10 年之前收集的樣本中識(shí)別出癌癥。
具體來說,研究人員利用 306 例“HPV+口咽癌”病例和對(duì)照組數(shù)據(jù)訓(xùn)練并驗(yàn)證了一個(gè)機(jī)器學(xué)習(xí)模型。結(jié)果顯示,早期檢測(cè)的敏感性提升 96%,最長可以提前 10 年。研究人員表示,這可能是迄今為止基于循環(huán)腫瘤 DNA(ctDNA,Circulating Tumor DNA)的癌癥早期檢測(cè)中最長的檢測(cè)時(shí)間。
期間,他們采用了二元機(jī)器學(xué)習(xí)方法,借此將樣本分類為 HPV 陽性口咽鱗狀細(xì)胞癌和非 HPV 陽性口咽磷狀細(xì)胞癌。在建模之前,研究人員通過采取標(biāo)準(zhǔn)數(shù)據(jù)預(yù)處理技術(shù),針對(duì)數(shù)值特征進(jìn)行了最小-最大歸一化處理。在選擇這些數(shù)值特征時(shí),他們主要基于 HPV-DeepSeek 的五個(gè)輸出指標(biāo):第一個(gè)指標(biāo)是獨(dú)特的 HPV 對(duì)齊讀數(shù),第二個(gè)指標(biāo)是基因組覆蓋率,第三個(gè)指標(biāo)是平均片段長度,第四個(gè)指標(biāo)是片段長度偏度,第五個(gè)指標(biāo)是片段長度峰度。
通過此,研究人員排除了一些其他特征,比如高危 HPV 單核苷酸多態(tài)性、PIK3CA 突變和病毒整合事件,之所以將這些特征排除在外,是因?yàn)樗鼈兊目煽孔⑨屝枰^高的測(cè)序覆蓋率,而這在預(yù)診斷樣本中是不可行的。
在獨(dú)立機(jī)器學(xué)習(xí)訓(xùn)練與測(cè)試列隊(duì)中,研究人員將 80% 的樣本用于訓(xùn)練,將 20% 的樣本用于測(cè)試。借此訓(xùn)練了多種可解釋模型架構(gòu),包括隨機(jī)森林(Random Forest)、AdaBoost 和樸素貝葉斯(Naive Bayes)。模型性能指標(biāo)包括準(zhǔn)確率、精確率、召回率、宏觀 F1 分?jǐn)?shù)、特異性、陰性預(yù)測(cè)值和受試者工作特征曲線下面積(AUC-ROC,Area Under the Receiver Operating Characteristic Curve)。
在適用的情況下,研究人員使用 10 折交叉驗(yàn)證在訓(xùn)練集上進(jìn)行超參數(shù)調(diào)優(yōu)。針對(duì)基于決策樹的模型,研究人員對(duì)其進(jìn)行了可視化,以便能夠識(shí)別關(guān)鍵預(yù)測(cè)因子。在對(duì)模型進(jìn)行調(diào)優(yōu)之后,研究人員對(duì)模型進(jìn)行了最終確定,并針對(duì)保留的測(cè)試集進(jìn)行了 Bootstrap 重采樣,以便生成模型性能指標(biāo)的經(jīng)驗(yàn) 95% 置信區(qū)間。
然后,研究人員使用分層 K 折生成了交叉驗(yàn)證和測(cè)試集的 AUC-ROC 曲線。為了解釋模型,研究人員使用了沙普利加性解釋(SHAP,SHapley Additive Explanations)技術(shù),它能夠估計(jì)每個(gè)輸入特征對(duì)于個(gè)體預(yù)測(cè)的貢獻(xiàn)。
SHAP 值指標(biāo)能夠顯示輸入特征在所有測(cè)試樣本中的影響方向和影響大小,借此得到了每個(gè)特征的平均 SHAP 值和模型之間的總體重要性排名。需要說明的是,機(jī)器學(xué)習(xí)模型具有等效的性能和重疊的置信區(qū)間,同時(shí)研究人員選擇了樸素貝葉斯作為代表模型。
研究人員在論文中指出,機(jī)器學(xué)習(xí)顯著改善了距離時(shí)間較遠(yuǎn)的樣本的分類能力,這種提升主要源于以下兩個(gè)方面。首先,能夠針對(duì)獨(dú)特讀數(shù)數(shù)量和基因組覆蓋百分比這兩個(gè)主要特征進(jìn)行差異化加權(quán),而非采用稀釋試驗(yàn)來確定固定閾值。其次,能夠在特定模型中引入片段組學(xué)特征。
(來源:https://academic.oup.com/jnci/advance-article-abstr)
研究中,研究人員還將 HPV-DeepSeek 與通過 ddPCR(目前用于檢測(cè) ctHPVDNA 的臨床標(biāo)準(zhǔn)護(hù)理)進(jìn)行的 ctHPVDNA 檢測(cè)進(jìn)行了比較,借此發(fā)現(xiàn) HPV-DeepSeek 能夠顯著提高早期檢測(cè)敏感性和最長提前時(shí)間。
除此之外,HPV-DeepSeek 還具備一些其他優(yōu)勢(shì),比如能夠同時(shí)檢測(cè)所有的 HPV 基因型,能夠檢測(cè)和注釋大量預(yù)后和支持性診斷特征。結(jié)合該檢測(cè)的總體高敏感性和特異性,這表明針對(duì)“HPV+口咽鱗狀細(xì)胞癌”的單一或組合的基于血液的早期檢測(cè)方法在技術(shù)上是可行的。
基于循環(huán)腫瘤 DNA 的早期檢測(cè)方法確實(shí)有望顯著改善癌癥早期診斷,并且尤其適用于目前缺乏篩查手段的癌種。當(dāng)前,大多數(shù)癌癥類型由于在確診時(shí)缺乏篩查,導(dǎo)致患者在接受治療時(shí)往往已經(jīng)拖至晚期甚至開始出現(xiàn)臨床癥狀。而患者直到癌癥晚期才得到診斷,就會(huì)導(dǎo)致生存率下降、醫(yī)療成本增加以及病損加重。
HPV 是美國大約 70% 口咽癌患者的病因,口咽癌也是與 HPV 病毒相關(guān)的最常見癌癥類型。目前,這類癌癥的發(fā)病率呈現(xiàn)出逐年上升的趨勢(shì)。其他一些 HPV 相關(guān)癌癥已經(jīng)擁有成熟的篩選方案,但是此前尚未出現(xiàn)檢測(cè) HPV 相關(guān)口咽癌的檢測(cè)方法。
對(duì)于 HPV 相關(guān)口咽癌患者來說,他們往往在腫瘤已經(jīng)擴(kuò)散到數(shù)十億個(gè)細(xì)胞、引發(fā)癥狀并已經(jīng)擴(kuò)散到附近淋巴結(jié)時(shí)才被診斷出來。研究人員表示,當(dāng)患者出現(xiàn)癌癥癥狀才來到醫(yī)院時(shí),這時(shí)所需要接受的治療可能會(huì)帶來嚴(yán)重的終身副作用。因此,開發(fā)能夠更早發(fā)現(xiàn)這類癌癥的篩查工具,能夠讓患者更早地接受治療和改善預(yù)后。
而本次研究還使用了后來發(fā)展為“HPV+口咽鱗狀細(xì)胞癌”的無癥狀個(gè)體和人群對(duì)照的血漿樣本,結(jié)合 HPV-DeepSeek 這一新型超靈敏多特征的液體活檢技術(shù),證明對(duì)于敏感和特異的基于血液的“HPV+口咽鱗狀細(xì)胞癌”早期檢測(cè)來說,HPV-DeepSeek 可以將檢測(cè)時(shí)間提前到患者在臨床上被確認(rèn)患癌的 10 年之前,這為 HPV 相關(guān)口咽癌提供基于血液的早期檢測(cè)測(cè)試帶來了新機(jī)會(huì)。
目前,研究人員正在美國國立衛(wèi)生研究院資助的第二項(xiàng)盲法研究中繼續(xù)驗(yàn)證本次方法,涉及到使用美國國家癌癥研究所的前列腺癌、肺癌、結(jié)直腸癌和卵巢癌的數(shù)百個(gè)樣本,預(yù)計(jì)將能惠及更多患者。
參考資料:
相關(guān)論文https://academic.oup.com/jnci/advance-article-abstract/doi/10.1093/jnci/djaf249/8248381?redirectedFrom=fulltext
https://oto.hms.harvard.edu/people/daniel-l-faden
https://scitechdaily.com/breakthrough-blood-test-detects-head-and-neck-cancer-up-to-10-years-before-symptoms/
https://faden-lab.mgh.harvard.edu/newest-manuscript-findings-featuring-hpv-deepseek-and-early-detection-of-hpvopc-up-to-10-years-before-diagnosis/
https://www.massgeneralbrigham.org/en/about/newsroom/press-releases/blood-test-identifies-hpv-associated-head-and-neck-cancers
https://youtu.be/y-n_-JuK89M
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.