來源:人民日?qǐng)?bào)海外版
參觀者在北京科博會(huì)上體驗(yàn)AI健康篩查服務(wù)系統(tǒng)。陳曉根攝(人民視覺)
在夸克APP搜索糖尿病該如何治療。受訪者供圖
在江蘇省無錫市濱湖區(qū)一家養(yǎng)老院,一名老人在使用AI健康檢測(cè)儀。新華社記者 柳文惠 攝
江西省宜春市人民醫(yī)院的醫(yī)生在智慧病房利用患者床頭交互系統(tǒng)查房,并與患者交流治療方案。周亮 攝(人民視覺)
在山東省東營市東營區(qū)一家智慧健康驛站,老人在醫(yī)護(hù)人員指導(dǎo)下使用5G智能健康一體機(jī)體檢。劉智峰 攝(人民視覺)
武漢大學(xué)人民醫(yī)院精神衛(wèi)生中心主任、主任醫(yī)師王惠玲講述“醫(yī)療與AI如何結(jié)合”。受訪者供圖
7月23日,夸克健康大模型成功通過12門核心學(xué)科的主任醫(yī)師筆試評(píng)測(cè),成為國內(nèi)首個(gè)完成這一挑戰(zhàn)的大模型。繼5月通過副主任醫(yī)師考試后,該模型實(shí)現(xiàn)能力再躍升,并已全面集成至夸克AI搜索,提供“主任級(jí)AI醫(yī)生”服務(wù),用戶在查詢健康問題時(shí),選擇深度搜索即可調(diào)用。
很多臨床專家對(duì)其表現(xiàn)給予高度評(píng)價(jià),并指出它在輔助診療、患者教育、心理支持等方面展現(xiàn)出巨大潛力。在垂類模型與通用模型對(duì)比中,國產(chǎn)健康大模型呈現(xiàn)出難度越高領(lǐng)先優(yōu)勢(shì)越明顯的性能曲線,展現(xiàn)出在復(fù)雜醫(yī)學(xué)推理任務(wù)中的突破。
“給醫(yī)生提供更多的探索空間”
主任醫(yī)師的考試非常細(xì)致,此次夸克模型選取了12門最核心的學(xué)科作為模擬測(cè)試,如全科醫(yī)學(xué)等。在12門考試?yán)?,夸克健康大模型全部過關(guān)。
主任醫(yī)師考試難度很高。比如,其中的多選題,不僅要判斷各選項(xiàng)的概率,還要理解正確性的邊界,否則很容易漏選或錯(cuò)選。而案例分析題,更是需要直接解決很細(xì)微的、辯證的問題,對(duì)于大模型來說一直都是個(gè)難點(diǎn)。
夸克健康算法負(fù)責(zé)人徐健介紹,理解夸克健康大模型,有三個(gè)關(guān)鍵點(diǎn):一是知識(shí)性,構(gòu)建優(yōu)質(zhì)的大規(guī)模數(shù)據(jù)資源庫;二是正確性,通過技術(shù)系統(tǒng)性解決正確性這個(gè)大問題;三是推理能力,通過醫(yī)療慢思考推理能力解決復(fù)雜問題。
實(shí)現(xiàn)這三個(gè)關(guān)鍵點(diǎn)都不簡(jiǎn)單。比如知識(shí)性,在這一模型中數(shù)據(jù)被分為四大類,資料、病例、知識(shí)以及在此基礎(chǔ)上的合成數(shù)據(jù)。這就要求將大量網(wǎng)頁數(shù)據(jù)、書籍、指南、藥品說明書等專業(yè)類數(shù)據(jù),將臨床上積攢的病例,將醫(yī)學(xué)專家結(jié)構(gòu)化思維的結(jié)晶,統(tǒng)一進(jìn)行合成。
“我們不是在訓(xùn)練AI回答醫(yī)學(xué)問題,而是在訓(xùn)練它學(xué)會(huì)醫(yī)學(xué)思維?!毙旖≌f?!拔覀兊腁I大模型可以做到從表象判斷到深度分析,這樣答題會(huì)更好,解釋性更強(qiáng)?!?/p>
這一成果背后是專業(yè)醫(yī)師團(tuán)隊(duì)的深度參與,讓大模型有高質(zhì)量數(shù)據(jù)支撐。目前,夸克健康大模型擁有千人規(guī)模的專業(yè)醫(yī)師標(biāo)注團(tuán)隊(duì),其中超過400名均為副主任醫(yī)師及以上的高資歷醫(yī)療專家,構(gòu)建了十幾萬條精標(biāo)的樣本數(shù)據(jù)。
前不久,大模型產(chǎn)業(yè)應(yīng)用技術(shù)聯(lián)盟醫(yī)療專業(yè)委員會(huì)發(fā)布報(bào)告,推出了基于大模型的患者醫(yī)療服務(wù)能力分級(jí)框架,并將其分為五級(jí)——L1級(jí)是信息輔助,L2級(jí)是單任務(wù)智能輔助,L3級(jí)是多任務(wù)智能輔助,L4級(jí)是高級(jí)協(xié)同決策輔助,L5級(jí)是智慧協(xié)同創(chuàng)新輔助。
“確實(shí)可以看到在一些疑難病上,AI可以輔助醫(yī)生,給醫(yī)生提供更多的探索空間和建議。”徐健說。
數(shù)據(jù)顯示,在有檢驗(yàn)檢查的疾病上,這一模型的回答準(zhǔn)確率已經(jīng)達(dá)到90.78%,接近??漆t(yī)生水平;在疑難疾病上,其準(zhǔn)確率達(dá)到85.51%。
憑借在醫(yī)學(xué)領(lǐng)域的專業(yè)性,夸克AI搜索已經(jīng)吸引了一大批醫(yī)學(xué)生和醫(yī)生群體。夸克健康運(yùn)營負(fù)責(zé)人趙存忠介紹,目前平臺(tái)在全國醫(yī)學(xué)生中月活用戶已突破200萬,覆蓋率過半。
“醫(yī)生跟AI的結(jié)合是大趨勢(shì)”
對(duì)于這位“主任級(jí)AI醫(yī)生”的水平,多位主任醫(yī)師給出了高度評(píng)價(jià)。
“用完之后,感到確實(shí)會(huì)改變?cè)\療的過程?!北本┐髮W(xué)醫(yī)學(xué)部皮膚與性病學(xué)系主任、北京大學(xué)人民醫(yī)院主任醫(yī)師李厚敏說。
李厚敏分享了她與健康大模型的一次互動(dòng)。某一患者目前既要控制疾病,又需治療瘢痕,而且此前治療對(duì)患者皮膚屏障的破壞已經(jīng)影響到其生活質(zhì)量,在向夸克提供了該患者的年齡、性別、診斷、用藥情況后,夸克給出了讓李厚敏覺得“非常全面”的四方面建議——既包括對(duì)治療方案的調(diào)整,也給出了對(duì)瘢痕、色素的管理建議,最后還提出要對(duì)這位患者進(jìn)行心理疏導(dǎo)?!爸委煼桨负侠恚盟幏桨敢?guī)范,還有疾病的長(zhǎng)期管理和患者的心理疏導(dǎo)?!?/p>
李厚敏認(rèn)為,對(duì)皮膚科來說,與AI的結(jié)合非常容易取得成果?,F(xiàn)有的4000多種皮膚疾病都長(zhǎng)在皮膚表面,甚至可以通過AI進(jìn)行識(shí)別,很多疾病在AI指導(dǎo)下可以獲得很好的處理結(jié)果。她說,全國范圍內(nèi)只有1萬多名皮膚科醫(yī)生,但皮膚科患者很多,而且有疾病種類多、發(fā)病率高的突出特點(diǎn)。她認(rèn)為,在AI幫助下,大量全科醫(yī)生、基層醫(yī)生對(duì)皮膚問題的診療水平會(huì)大大提高,可以做好隨訪管理、慢病管理。
“以后AI可能取代不了醫(yī)生,但醫(yī)生跟AI的結(jié)合是大趨勢(shì)。”武漢大學(xué)人民醫(yī)院精神衛(wèi)生中心主任、主任醫(yī)師王惠玲說。
王惠玲認(rèn)為,對(duì)于抑郁癥患者來說,因?yàn)獒t(yī)生很忙,很難時(shí)刻回答,可以有效借助健康大模型尋找答案。比如,有些患者顧慮是否會(huì)吃藥成癮,有些患者顧慮藥物的副反應(yīng),在應(yīng)對(duì)這些問題的過程中,原本需要醫(yī)生反復(fù)告知,如今AI可以常伴左右。
在李厚敏看來,患者使用健康大模型同樣很重要。比如,面對(duì)皮膚科醫(yī)生經(jīng)常開出的激素藥物,很多患者會(huì)很猶豫,這時(shí)候AI反而可以通過詳細(xì)解釋,緩解大家的激素焦慮?!皩?duì)于患者來講,AI既可以緩解焦慮,也傳遞了更好的慢病管理理念?!?/p>
此外,不少患者對(duì)于心理疾病存在恥感,不好意思告訴醫(yī)生。王惠玲說,這種情況下患者可以去問AI,在其幫助之下正確找到方向,比如哪些問題自己鍛煉可以起效,哪些問題需要去看醫(yī)生,能夠有效幫助患者避免走彎路。
應(yīng)用場(chǎng)景日漸廣泛
夸克健康以阿里巴巴通義千問大模型為基礎(chǔ),走出了一條面向垂直場(chǎng)景的深度工程化路線。
其核心突破之一,是構(gòu)建出“慢思考能力”。該能力融合了鏈?zhǔn)酵评砼c多階段臨床演繹路徑建模,驅(qū)動(dòng)模型在面對(duì)復(fù)雜醫(yī)療問題時(shí),能夠分階段、層層深入地推導(dǎo)出最終回答。
構(gòu)建慢思考能力的前提,是擁有高質(zhì)量推理訓(xùn)練數(shù)據(jù)。據(jù)了解,夸克構(gòu)建了“雙數(shù)據(jù)產(chǎn)線+雙獎(jiǎng)勵(lì)機(jī)制”的工程體系。一方面,將醫(yī)學(xué)數(shù)據(jù)劃分為“可驗(yàn)證”和“不可驗(yàn)證”兩類,分別對(duì)應(yīng)診斷類任務(wù)和健康建議類任務(wù);另一方面,在訓(xùn)練方法上引入“過程獎(jiǎng)勵(lì)模型”和“結(jié)果獎(jiǎng)勵(lì)模型”,分別評(píng)估模型推理鏈的合理性與最終結(jié)論的準(zhǔn)確性,顯著提升模型的臨床可解釋性和推理一致性。
該體系還設(shè)計(jì)了多階段強(qiáng)化學(xué)習(xí)流程,包括冷啟動(dòng)數(shù)據(jù)的嚴(yán)格人工校驗(yàn)、多輪樣本篩選與難度遞進(jìn)訓(xùn)練策略,以及用于防止“高分投機(jī)”的作弊識(shí)別機(jī)制。通過真實(shí)醫(yī)生標(biāo)注、“問—思—答”整組數(shù)據(jù)驅(qū)動(dòng)強(qiáng)化學(xué)習(xí),大大強(qiáng)化了這一健康大模型的能力。
對(duì)于患者來說,通過AI的判斷,可以減少醫(yī)患信息差,讓他們更積極地參與到診療過程中。
趙存忠曾經(jīng)是一名醫(yī)生,如今做健康大模型的運(yùn)營負(fù)責(zé)人,對(duì)于患者的需求有了新的看法。他發(fā)現(xiàn)隨著AI本身的發(fā)展,用戶尤其是年輕人表達(dá)出的需求正在變化。在醫(yī)療大模型出現(xiàn)初期,用戶搜索的都是簡(jiǎn)單問題,但在深度思考技術(shù)發(fā)展之下,用戶表達(dá)越來越精細(xì)。“他們?cè)跊]去醫(yī)院之前已經(jīng)與AI交流過,這樣可以迅速了解醫(yī)生在說什么,降低了溝通成本,有效提高了醫(yī)療資源的可用率和普及性?!?/p>
醫(yī)學(xué)生們也受益于健康大模型。趙存忠介紹,醫(yī)學(xué)生在夸克上面搜索了很多問題,比如專業(yè)的量表、泛知識(shí)的內(nèi)容、臨床指南等。很多醫(yī)學(xué)生在做規(guī)培或者實(shí)習(xí)階段,遇到臨床案例分析時(shí),會(huì)大量用到大模型的搜索功能。
隨著能力不斷提升、應(yīng)用場(chǎng)景日漸廣泛,更多健康大模型正逐步走出“模擬考場(chǎng)”,走入真實(shí)診療場(chǎng)景。(記者 劉少華)
《人民日?qǐng)?bào)海外版》(2025年08月08日第08版)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.