多年來,美國伊利諾伊大學(xué)香檳分校博士畢業(yè)生、Keiji.AI 公司聯(lián)合創(chuàng)始人王子豐一直在研究將 AI 應(yīng)用于臨床試驗(yàn),并已開展多個(gè)相關(guān)項(xiàng)目,包括開發(fā)用于臨床試驗(yàn)系統(tǒng)評價(jià)的輔助工具 TrialMind [1] 和 LEADS [2],提升試驗(yàn)招募效率的 TrialGPT [3],支持生物醫(yī)學(xué)數(shù)據(jù)分析的智能平臺 DSWizard [4,5],以及自動(dòng)生成臨床試驗(yàn)文檔的系統(tǒng) InformGen [6]。
圖 | 王子豐(來源:王子豐)
在推進(jìn)這些研究的過程中,王子豐逐漸意識到,盡管制藥業(yè)內(nèi)對 AI 在臨床試驗(yàn)中的應(yīng)用充滿期待,但仍面臨諸多關(guān)鍵挑戰(zhàn)。
首先,目前缺乏有效的評估手段,使得大模型難以在臨床試驗(yàn)場景中實(shí)現(xiàn)可驗(yàn)證、可落地的應(yīng)用。
其次,真正理解制藥行業(yè)實(shí)踐的專業(yè)人士與 AI 技術(shù)專家之間存在明顯的知識壁壘,跨領(lǐng)域協(xié)同不足,也限制了技術(shù)轉(zhuǎn)化的深度和廣度。
而在構(gòu)建垂直領(lǐng)域模型和 Agent 的過程中,人們又面臨著兩個(gè)根本性的問題:一是缺乏結(jié)構(gòu)清晰、適合 AI 訓(xùn)練的高質(zhì)量數(shù)據(jù)資源,二是缺乏貼近真實(shí)臨床試驗(yàn)任務(wù)、能夠系統(tǒng)評估模型能力的基準(zhǔn)任務(wù)集。
業(yè)界其實(shí)有一些出售臨床試驗(yàn)商業(yè)數(shù)據(jù)的公司比如 Citeline,但是這些數(shù)據(jù)都非常昂貴,一般大型的制藥企業(yè)可能每年向他們支付數(shù)百萬美元以上來獲取這些信息。而公共數(shù)據(jù)比如 ClinicalTrials.gov 只包括了在美國注冊的試驗(yàn)記錄,而很多的多個(gè)國家試驗(yàn)記錄以及發(fā)表的試驗(yàn)都需要被額外收集和標(biāo)準(zhǔn)化處理。
基于上述問題,王子豐等人啟動(dòng)了本項(xiàng)研究,構(gòu)建了臨床試驗(yàn)領(lǐng)域的大規(guī)模結(jié)構(gòu)化數(shù)據(jù)庫 TrialPanorama [7],匯聚了試驗(yàn)設(shè)計(jì)、干預(yù)手段、適應(yīng)癥、生物標(biāo)志物、結(jié)局指標(biāo)等核心要素,并對接權(quán)威醫(yī)學(xué)本體,確保數(shù)據(jù)的一致性與可擴(kuò)展性。在此基礎(chǔ)上,研究團(tuán)隊(duì)進(jìn)一步設(shè)計(jì)了一套配套的評測任務(wù)集,涵蓋從文獻(xiàn)評價(jià)到試驗(yàn)設(shè)計(jì)的多個(gè)關(guān)鍵環(huán)節(jié),以用于系統(tǒng)性地評估 AI 模型在臨床試驗(yàn)相關(guān)任務(wù)中的能力。該工作不僅為模型的訓(xùn)練與測試提供了高質(zhì)量數(shù)據(jù)支撐,也為后續(xù)開發(fā) AI Agent 提供數(shù)據(jù)源。
如前所述,本次研究的主要成果是構(gòu)建了一個(gè)覆蓋廣泛、結(jié)構(gòu)清晰的臨床試驗(yàn)數(shù)據(jù)庫 TrialPanorama,共收錄了來自全球 15 個(gè)來源的 1,657,476 條臨床試驗(yàn)記錄以及匯總這些臨床試驗(yàn)的超過 9,000 篇系統(tǒng)評價(jià)論文。該數(shù)據(jù)庫系統(tǒng)性地整理了臨床試驗(yàn)設(shè)計(jì)與實(shí)施的關(guān)鍵要素,包括研究方案、干預(yù)方式、適應(yīng)癥、生物標(biāo)志物和結(jié)局指標(biāo)等,并與標(biāo)準(zhǔn)醫(yī)學(xué)本體(如 DrugBank 和 MedDRA)進(jìn)行了對齊,具備良好的規(guī)范性與可擴(kuò)展性。
在此基礎(chǔ)上,研究團(tuán)隊(duì)還首次設(shè)計(jì)并發(fā)布了一套面向臨床試驗(yàn)任務(wù)的大模型評測基準(zhǔn),涵蓋系統(tǒng)評價(jià)和試驗(yàn)設(shè)計(jì)累計(jì)兩個(gè)類別和八項(xiàng)任務(wù),這八項(xiàng)任務(wù)包括研究檢索、研究篩選、證據(jù)總結(jié)、試驗(yàn)組設(shè)計(jì)、入排標(biāo)準(zhǔn)制定、終點(diǎn)選擇、樣本量估計(jì)及完成情況評估。通過在五個(gè)當(dāng)前最先進(jìn)的大模型上開展實(shí)驗(yàn),研究團(tuán)隊(duì)發(fā)現(xiàn)通用模型雖然具備一定的零樣本能力,但其表現(xiàn)尚不足以勝任高風(fēng)險(xiǎn)、要求嚴(yán)謹(jǐn)?shù)呐R床試驗(yàn)場景。
而本次工作不僅提供了一個(gè)高質(zhì)量的數(shù)據(jù)基礎(chǔ),還構(gòu)建了可用于訓(xùn)練、評估和推動(dòng)臨床試驗(yàn) AI 研究的系統(tǒng)平臺,有望為開發(fā)更具專業(yè)性和實(shí)用性的智能系統(tǒng)奠定堅(jiān)實(shí)基礎(chǔ)。
(來源:https://arxiv.org/pdf/2505.16097)
本次研究成果具有廣泛的應(yīng)用前景,預(yù)計(jì)能在以下幾個(gè)方面發(fā)揮重要作用:
首先,TrialPanorama 數(shù)據(jù)庫可以作為醫(yī)藥研發(fā)和醫(yī)學(xué)事務(wù)中基于 AI 的知識發(fā)現(xiàn)平臺。例如,人們可以借助該數(shù)據(jù)庫檢索某一適應(yīng)癥下既往的治療手段及其結(jié)果、正在研發(fā)中的同類藥物等關(guān)鍵信息,從而輔助制定更科學(xué)、更具前瞻性的臨床試驗(yàn)方案。
其次,該數(shù)據(jù)庫為訓(xùn)練大模型提供了數(shù)據(jù)基礎(chǔ)。由于其結(jié)構(gòu)清晰、覆蓋全面,非常適合用于生成高質(zhì)量的訓(xùn)練樣本,推動(dòng)更貼近臨床場景的專用語言模型的開發(fā)。同時(shí),研究團(tuán)隊(duì)發(fā)布的 benchmark 也為評估現(xiàn)有及未來的大模型在臨床試驗(yàn)任務(wù)中的表現(xiàn)提供了統(tǒng)一、專業(yè)的測試框架。
最后,對于當(dāng)前越來越多專注于臨床試驗(yàn)領(lǐng)域的 AI Agent 系統(tǒng)來說,TrialPanorama 提供了結(jié)構(gòu)化、標(biāo)準(zhǔn)化的數(shù)據(jù)資源,并可以通過集成模型上下文協(xié)議(MCP,Model Context Protocol)服務(wù)器實(shí)現(xiàn)快速接入與部署,從而助力構(gòu)建高可靠性、高專業(yè)度的垂類 AI Agent,為臨床研發(fā)帶來賦能。
(來源:https://arxiv.org/pdf/2505.16097)
多年前,王子豐就開始研究 AI,同時(shí)做一些 AI for healthcare。一開始進(jìn)入這個(gè)方向時(shí),他覺得有很多的“l(fā)ow-hanging fruit”,他認(rèn)為只要把大模型用上、Agent 搭起來,然后就可以開展很多臨床試驗(yàn)的任務(wù)。但是,當(dāng)他真正在項(xiàng)目中和醫(yī)生、藥廠的研發(fā)人員、銷售等各類角色深度接觸之后,王子豐才意識到很多現(xiàn)實(shí)中的核心需求,其實(shí)并沒有被很好地抽象成 AI 問題然后被做 AI 的人們注意到。
這中間有很多令人反思的時(shí)刻。比如他經(jīng)??吹揭恍┖芸犰诺拇竽P蚫emo,但是藥廠的合作方告訴他,他們可能也會去嘗試一下,然而很多時(shí)候?qū)嶋H效果往往不能達(dá)到可用的程度,或者說由于公司的合規(guī)性要求這些工具還不能夠嵌入他們的工作流。
而作為一名 AI 研究者,王子豐認(rèn)為得學(xué)會放下自嗨的技術(shù)視角,真正去傾聽用戶的痛點(diǎn),理解他們的工作流程、合規(guī)限制和實(shí)際目標(biāo),然后再回過頭來重新定義問題,想辦法用 AI 去解決。
同時(shí),這個(gè)“對話”和“重構(gòu)”的過程,是王子豐在本次研究之中認(rèn)為最有價(jià)值、也是最難忘的部分。這不僅僅凸顯了當(dāng)前的一些技術(shù)挑戰(zhàn),更是對于跨學(xué)科協(xié)作、產(chǎn)品思維、溝通能力的一種錘煉。
至于創(chuàng)業(yè),它對王子豐來說也是一種自然的延伸。王子豐覺得做應(yīng)用研究的人去創(chuàng)業(yè)其實(shí)非常合適。一方面你能從一線看到很多真實(shí)又有挑戰(zhàn)的問題,另一方面你也有機(jī)會把研究成果真正落地,幫助到藥廠、醫(yī)生甚至患者。這種“從問題中來,到應(yīng)用中去”的過程,非常充實(shí),也讓王子豐找到了科研之外的成就感。
正因此,王子豐聯(lián)合創(chuàng)辦了 Keiji.AI,在該公司他主要負(fù)責(zé) AI 算法和應(yīng)用的開發(fā)。該公司由王子豐的博士導(dǎo)師 Jimeng Sun 教授領(lǐng)銜,團(tuán)隊(duì)成員主要來自美國伊利諾伊大學(xué)香檳分校的研究團(tuán)隊(duì)。公司致力于將研究團(tuán)隊(duì)多年來在 AI 醫(yī)療和臨床試驗(yàn)領(lǐng)域的研究成果轉(zhuǎn)化。
基于這一背景,研究團(tuán)隊(duì)開發(fā)了 TrialMind 平臺,集成了多種 AI Agent 和工作流程,并接入研究團(tuán)隊(duì)自建的 TrialPanorama 數(shù)據(jù)庫,支持臨床試驗(yàn)的方案設(shè)計(jì)、隊(duì)列抽取、數(shù)據(jù)分析、患者招募等關(guān)鍵環(huán)節(jié)的智能化加速。
目前,研究團(tuán)隊(duì)的客戶和合作伙伴包括多家制藥公司(如Takeda、Abbvie、Regeneron)、真實(shí)世界數(shù)據(jù)公司(如 Medidata、Guardant Health),以及大型 CRO(如 IQVIA)。公司正處于快速發(fā)展階段,正在積極推進(jìn)融資并擴(kuò)大團(tuán)隊(duì)。而基于上述工作,他們正在基于本次數(shù)據(jù)庫開發(fā)臨床試驗(yàn)的垂類 AI Agent 和模型。
參考資料:
1.https://arxiv.org/abs/2406.17755
2.https://arxiv.org/abs/2501.16255
3.https://www.nature.com/articles/s41467-024-53081-z
4.https://arxiv.org/abs/2410.21591
5.https://arxiv.org/abs/2505.16100
6.https://arxiv.org/abs/2504.00934
7.https://arxiv.org/abs/2505.16097
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.