網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

“主任級(jí)AI醫(yī)生”，來了

2025-08-08 06:56:12　來源: 海外網(wǎng)

北京舉報(bào)

分享至

來源:人民日?qǐng)?bào)海外版

參觀者在北京科博會(huì)上體驗(yàn)AI健康篩查服務(wù)系統(tǒng)。陳曉根攝（人民視覺）

在夸克APP搜索糖尿病該如何治療。受訪者供圖

在江蘇省無錫市濱湖區(qū)一家養(yǎng)老院，一名老人在使用AI健康檢測(cè)儀。新華社記者柳文惠攝

江西省宜春市人民醫(yī)院的醫(yī)生在智慧病房利用患者床頭交互系統(tǒng)查房，并與患者交流治療方案。周亮攝（人民視覺）

在山東省東營市東營區(qū)一家智慧健康驛站，老人在醫(yī)護(hù)人員指導(dǎo)下使用5G智能健康一體機(jī)體檢。劉智峰攝（人民視覺）

武漢大學(xué)人民醫(yī)院精神衛(wèi)生中心主任、主任醫(yī)師王惠玲講述“醫(yī)療與AI如何結(jié)合”。受訪者供圖

7月23日，夸克健康大模型成功通過12門核心學(xué)科的主任醫(yī)師筆試評(píng)測(cè)，成為國內(nèi)首個(gè)完成這一挑戰(zhàn)的大模型。繼5月通過副主任醫(yī)師考試后，該模型實(shí)現(xiàn)能力再躍升，并已全面集成至夸克AI搜索，提供“主任級(jí)AI醫(yī)生”服務(wù)，用戶在查詢健康問題時(shí)，選擇深度搜索即可調(diào)用。

很多臨床專家對(duì)其表現(xiàn)給予高度評(píng)價(jià)，并指出它在輔助診療、患者教育、心理支持等方面展現(xiàn)出巨大潛力。在垂類模型與通用模型對(duì)比中，國產(chǎn)健康大模型呈現(xiàn)出難度越高領(lǐng)先優(yōu)勢(shì)越明顯的性能曲線，展現(xiàn)出在復(fù)雜醫(yī)學(xué)推理任務(wù)中的突破。

“給醫(yī)生提供更多的探索空間”

主任醫(yī)師的考試非常細(xì)致，此次夸克模型選取了12門最核心的學(xué)科作為模擬測(cè)試，如全科醫(yī)學(xué)等。在12門考試?yán)?，夸克健康大模型全部過關(guān)。

主任醫(yī)師考試難度很高。比如，其中的多選題，不僅要判斷各選項(xiàng)的概率，還要理解正確性的邊界，否則很容易漏選或錯(cuò)選。而案例分析題，更是需要直接解決很細(xì)微的、辯證的問題，對(duì)于大模型來說一直都是個(gè)難點(diǎn)。

夸克健康算法負(fù)責(zé)人徐健介紹，理解夸克健康大模型，有三個(gè)關(guān)鍵點(diǎn)：一是知識(shí)性，構(gòu)建優(yōu)質(zhì)的大規(guī)模數(shù)據(jù)資源庫；二是正確性，通過技術(shù)系統(tǒng)性解決正確性這個(gè)大問題；三是推理能力，通過醫(yī)療慢思考推理能力解決復(fù)雜問題。

實(shí)現(xiàn)這三個(gè)關(guān)鍵點(diǎn)都不簡(jiǎn)單。比如知識(shí)性，在這一模型中數(shù)據(jù)被分為四大類，資料、病例、知識(shí)以及在此基礎(chǔ)上的合成數(shù)據(jù)。這就要求將大量網(wǎng)頁數(shù)據(jù)、書籍、指南、藥品說明書等專業(yè)類數(shù)據(jù)，將臨床上積攢的病例，將醫(yī)學(xué)專家結(jié)構(gòu)化思維的結(jié)晶，統(tǒng)一進(jìn)行合成。

“我們不是在訓(xùn)練AI回答醫(yī)學(xué)問題，而是在訓(xùn)練它學(xué)會(huì)醫(yī)學(xué)思維?！毙旖≌f?！拔覀兊腁I大模型可以做到從表象判斷到深度分析，這樣答題會(huì)更好，解釋性更強(qiáng)?！?/p>

這一成果背后是專業(yè)醫(yī)師團(tuán)隊(duì)的深度參與，讓大模型有高質(zhì)量數(shù)據(jù)支撐。目前，夸克健康大模型擁有千人規(guī)模的專業(yè)醫(yī)師標(biāo)注團(tuán)隊(duì)，其中超過400名均為副主任醫(yī)師及以上的高資歷醫(yī)療專家，構(gòu)建了十幾萬條精標(biāo)的樣本數(shù)據(jù)。

前不久，大模型產(chǎn)業(yè)應(yīng)用技術(shù)聯(lián)盟醫(yī)療專業(yè)委員會(huì)發(fā)布報(bào)告，推出了基于大模型的患者醫(yī)療服務(wù)能力分級(jí)框架，并將其分為五級(jí)——L1級(jí)是信息輔助，L2級(jí)是單任務(wù)智能輔助，L3級(jí)是多任務(wù)智能輔助，L4級(jí)是高級(jí)協(xié)同決策輔助，L5級(jí)是智慧協(xié)同創(chuàng)新輔助。

“確實(shí)可以看到在一些疑難病上，AI可以輔助醫(yī)生，給醫(yī)生提供更多的探索空間和建議。”徐健說。

數(shù)據(jù)顯示，在有檢驗(yàn)檢查的疾病上，這一模型的回答準(zhǔn)確率已經(jīng)達(dá)到90.78%，接近?？漆t(yī)生水平；在疑難疾病上，其準(zhǔn)確率達(dá)到85.51%。

憑借在醫(yī)學(xué)領(lǐng)域的專業(yè)性，夸克AI搜索已經(jīng)吸引了一大批醫(yī)學(xué)生和醫(yī)生群體。夸克健康運(yùn)營負(fù)責(zé)人趙存忠介紹，目前平臺(tái)在全國醫(yī)學(xué)生中月活用戶已突破200萬，覆蓋率過半。

“醫(yī)生跟AI的結(jié)合是大趨勢(shì)”

對(duì)于這位“主任級(jí)AI醫(yī)生”的水平，多位主任醫(yī)師給出了高度評(píng)價(jià)。

“用完之后，感到確實(shí)會(huì)改變?cè)\療的過程?！北本┐髮W(xué)醫(yī)學(xué)部皮膚與性病學(xué)系主任、北京大學(xué)人民醫(yī)院主任醫(yī)師李厚敏說。

李厚敏分享了她與健康大模型的一次互動(dòng)。某一患者目前既要控制疾病，又需治療瘢痕，而且此前治療對(duì)患者皮膚屏障的破壞已經(jīng)影響到其生活質(zhì)量，在向夸克提供了該患者的年齡、性別、診斷、用藥情況后，夸克給出了讓李厚敏覺得“非常全面”的四方面建議——既包括對(duì)治療方案的調(diào)整，也給出了對(duì)瘢痕、色素的管理建議，最后還提出要對(duì)這位患者進(jìn)行心理疏導(dǎo)?！爸委煼桨负侠恚盟幏桨敢?guī)范，還有疾病的長(zhǎng)期管理和患者的心理疏導(dǎo)?！?/p>

李厚敏認(rèn)為，對(duì)皮膚科來說，與AI的結(jié)合非常容易取得成果?，F(xiàn)有的4000多種皮膚疾病都長(zhǎng)在皮膚表面，甚至可以通過AI進(jìn)行識(shí)別，很多疾病在AI指導(dǎo)下可以獲得很好的處理結(jié)果。她說，全國范圍內(nèi)只有1萬多名皮膚科醫(yī)生，但皮膚科患者很多，而且有疾病種類多、發(fā)病率高的突出特點(diǎn)。她認(rèn)為，在AI幫助下，大量全科醫(yī)生、基層醫(yī)生對(duì)皮膚問題的診療水平會(huì)大大提高，可以做好隨訪管理、慢病管理。

“以后AI可能取代不了醫(yī)生，但醫(yī)生跟AI的結(jié)合是大趨勢(shì)。”武漢大學(xué)人民醫(yī)院精神衛(wèi)生中心主任、主任醫(yī)師王惠玲說。

王惠玲認(rèn)為，對(duì)于抑郁癥患者來說，因?yàn)獒t(yī)生很忙，很難時(shí)刻回答，可以有效借助健康大模型尋找答案。比如，有些患者顧慮是否會(huì)吃藥成癮，有些患者顧慮藥物的副反應(yīng)，在應(yīng)對(duì)這些問題的過程中，原本需要醫(yī)生反復(fù)告知，如今AI可以常伴左右。

在李厚敏看來，患者使用健康大模型同樣很重要。比如，面對(duì)皮膚科醫(yī)生經(jīng)常開出的激素藥物，很多患者會(huì)很猶豫，這時(shí)候AI反而可以通過詳細(xì)解釋，緩解大家的激素焦慮?！皩?duì)于患者來講，AI既可以緩解焦慮，也傳遞了更好的慢病管理理念?！?/p>

此外，不少患者對(duì)于心理疾病存在恥感，不好意思告訴醫(yī)生。王惠玲說，這種情況下患者可以去問AI，在其幫助之下正確找到方向，比如哪些問題自己鍛煉可以起效，哪些問題需要去看醫(yī)生，能夠有效幫助患者避免走彎路。

應(yīng)用場(chǎng)景日漸廣泛

夸克健康以阿里巴巴通義千問大模型為基礎(chǔ)，走出了一條面向垂直場(chǎng)景的深度工程化路線。

其核心突破之一，是構(gòu)建出“慢思考能力”。該能力融合了鏈?zhǔn)酵评砼c多階段臨床演繹路徑建模，驅(qū)動(dòng)模型在面對(duì)復(fù)雜醫(yī)療問題時(shí)，能夠分階段、層層深入地推導(dǎo)出最終回答。

構(gòu)建慢思考能力的前提，是擁有高質(zhì)量推理訓(xùn)練數(shù)據(jù)。據(jù)了解，夸克構(gòu)建了“雙數(shù)據(jù)產(chǎn)線+雙獎(jiǎng)勵(lì)機(jī)制”的工程體系。一方面，將醫(yī)學(xué)數(shù)據(jù)劃分為“可驗(yàn)證”和“不可驗(yàn)證”兩類，分別對(duì)應(yīng)診斷類任務(wù)和健康建議類任務(wù)；另一方面，在訓(xùn)練方法上引入“過程獎(jiǎng)勵(lì)模型”和“結(jié)果獎(jiǎng)勵(lì)模型”，分別評(píng)估模型推理鏈的合理性與最終結(jié)論的準(zhǔn)確性，顯著提升模型的臨床可解釋性和推理一致性。

該體系還設(shè)計(jì)了多階段強(qiáng)化學(xué)習(xí)流程，包括冷啟動(dòng)數(shù)據(jù)的嚴(yán)格人工校驗(yàn)、多輪樣本篩選與難度遞進(jìn)訓(xùn)練策略，以及用于防止“高分投機(jī)”的作弊識(shí)別機(jī)制。通過真實(shí)醫(yī)生標(biāo)注、“問—思—答”整組數(shù)據(jù)驅(qū)動(dòng)強(qiáng)化學(xué)習(xí)，大大強(qiáng)化了這一健康大模型的能力。

對(duì)于患者來說，通過AI的判斷，可以減少醫(yī)患信息差，讓他們更積極地參與到診療過程中。

趙存忠曾經(jīng)是一名醫(yī)生，如今做健康大模型的運(yùn)營負(fù)責(zé)人，對(duì)于患者的需求有了新的看法。他發(fā)現(xiàn)隨著AI本身的發(fā)展，用戶尤其是年輕人表達(dá)出的需求正在變化。在醫(yī)療大模型出現(xiàn)初期，用戶搜索的都是簡(jiǎn)單問題，但在深度思考技術(shù)發(fā)展之下，用戶表達(dá)越來越精細(xì)。“他們?cè)跊]去醫(yī)院之前已經(jīng)與AI交流過，這樣可以迅速了解醫(yī)生在說什么，降低了溝通成本，有效提高了醫(yī)療資源的可用率和普及性?！?/p>

醫(yī)學(xué)生們也受益于健康大模型。趙存忠介紹，醫(yī)學(xué)生在夸克上面搜索了很多問題，比如專業(yè)的量表、泛知識(shí)的內(nèi)容、臨床指南等。很多醫(yī)學(xué)生在做規(guī)培或者實(shí)習(xí)階段，遇到臨床案例分析時(shí)，會(huì)大量用到大模型的搜索功能。

隨著能力不斷提升、應(yīng)用場(chǎng)景日漸廣泛，更多健康大模型正逐步走出“模擬考場(chǎng)”，走入真實(shí)診療場(chǎng)景。（記者劉少華）

《人民日?qǐng)?bào)海外版》（2025年08月08日第08版）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.