國內(nèi)首次AI醫(yī)生與真人醫(yī)生一致性評測結(jié)果正式揭曉!6月30日,醫(yī)聯(lián)于成都舉行了國內(nèi)首次AI醫(yī)生與真人醫(yī)生一致性評測,并進(jìn)行了全天候?qū)崟r(shí)直播。現(xiàn)場有120多位真實(shí)患者及10位來自四川大學(xué)華西醫(yī)院的主治醫(yī)師共同參與了這場評測研究。最終,經(jīng)過來自北大人民醫(yī)院、中日友好醫(yī)院、阜外醫(yī)院和友誼醫(yī)院的7位專家教授針對評測形成的91份有效病例進(jìn)行審核,并且針對AI醫(yī)生的問診準(zhǔn)確性、診斷準(zhǔn)確性、治療建議準(zhǔn)確性、輔助檢查方案準(zhǔn)確性、數(shù)據(jù)分析準(zhǔn)確性、提供可解釋信息、自然語言問診與交互這7個(gè)評價(jià)維度的打分之后,最終,真人醫(yī)生綜合得分為 7.5分,AI醫(yī)生綜合得分為7.2分。AI醫(yī)生與三甲主治醫(yī)生在比分結(jié)果上的一致性達(dá)到了96%。
(最終評審結(jié)果)
國內(nèi)首次AI醫(yī)生一致性評測 評審專家稱“超出預(yù)期”
(資料圖)
在歷經(jīng)8個(gè)小時(shí)的問診過程中,MedGPT與來自四川大學(xué)華西醫(yī)院的心內(nèi)科、消化內(nèi)科、呼吸內(nèi)科、內(nèi)分泌科、腎臟內(nèi)科、骨科、泌尿外科的10位主治及以上醫(yī)師共同對100余名患者進(jìn)行問診,經(jīng)過專家評審團(tuán),從準(zhǔn)確性、客觀數(shù)據(jù)分析、可信度、人機(jī)交互性展開。最終,經(jīng)過長達(dá)3個(gè)小時(shí)的對比分析及判斷,綜合專家團(tuán)所有評審的判定及評分,AI醫(yī)生與三甲主治醫(yī)生在比分結(jié)果上的一致性達(dá)到了96%。
(評審流程)
為了保證評測的合理性和科學(xué)性,此次測試的問診環(huán)節(jié)進(jìn)行了特殊的設(shè)計(jì):患者進(jìn)入診室后,將與醫(yī)助溝通自身病情,醫(yī)助通過線上文字輸入的方式將患者主訴傳達(dá)給真人醫(yī)生與AI醫(yī)生并協(xié)助醫(yī)患完成多輪溝通,在收集足夠的決策因子后,真人醫(yī)生與AI醫(yī)生為患者開具檢查單或診斷,患者直接在成都高新海爾森醫(yī)院完成檢查;在獲得檢查結(jié)果后,患者進(jìn)行復(fù)診,并由AI醫(yī)生及真人醫(yī)生提供臨床診斷及治療方案。通過以上流程,可以在條件基本一致的情況下,讓真人醫(yī)生與AI醫(yī)生進(jìn)行互不干涉的獨(dú)立診斷。
在當(dāng)晚的評審環(huán)節(jié),現(xiàn)場專家對于AI醫(yī)生的表現(xiàn)給予高度肯定,在場評審團(tuán)專家普遍認(rèn)為,MedGPT而是通過多輪詢問收集足夠信息,以確保醫(yī)療準(zhǔn)確性為前提推進(jìn)問診流程,所以出現(xiàn)誤診、漏診的概率就比較小。令人驚喜的一點(diǎn)是,不同于專科醫(yī)生,MedGPT診斷出了不屬于就診科室的疾病,給出其他具備可能性的判斷,這在常規(guī)的??茊栐\中是很難做到的。專家評審團(tuán)認(rèn)為,它的知識覆蓋面是超過一些經(jīng)驗(yàn)并不是很充足的真人醫(yī)生的。
北大人民醫(yī)院主任醫(yī)師薛峰在評審過程中發(fā)現(xiàn)了一個(gè)“驚喜”:MedGPT根據(jù)患者腳底板疼痛診斷出有患者有可能出現(xiàn)神經(jīng)壓迫,真人醫(yī)生卻沒有想到這一點(diǎn)。薛峰認(rèn)為,MedGPT應(yīng)該是一個(gè)非常有發(fā)展前景的一項(xiàng)技術(shù),在病人遇到一些癥狀,有困擾的時(shí)候,跟他去聊一聊,讓它給一個(gè)初步的診斷,還是非常有幫助的,具備非常好的前景。
中日友好醫(yī)院心內(nèi)科主任醫(yī)師任景怡表示:我覺得最好的一點(diǎn),當(dāng)診斷尚不明確時(shí),MedGPT并不會輕易給出結(jié)論,而是要堅(jiān)持要通過繼續(xù)問診或檢查收集更多信息。盡管MedGPT還存在一些問題,但邁出了重要的一步,這是里程碑式的結(jié)果。
云化能力結(jié)合 AI醫(yī)生“手段”更加豐富
值得一提的是,MedGPT不僅在一致性上達(dá)到了一定水準(zhǔn),還可以提供疾病治療環(huán)節(jié)中的其他“手段”,例如此次診斷過程中的“云檢驗(yàn)”:在完成初步問診后,MedGPT會給患者開具必要的醫(yī)學(xué)檢查項(xiàng)目,以進(jìn)一步明確病情?;颊邉t可以通過醫(yī)聯(lián)云檢驗(yàn)等多模態(tài)能力進(jìn)行檢查?;谟行栐\以及醫(yī)學(xué)檢查數(shù)據(jù),MedGPT得以進(jìn)行準(zhǔn)確的疾病診斷,并為患者設(shè)計(jì)后續(xù)疾病治療方案。對于真人醫(yī)生來說,開具檢驗(yàn)并根據(jù)結(jié)果對病情進(jìn)行判斷是疾病診斷過程中的常規(guī)操作,但對于AI醫(yī)生來說,這是一則突破。
在此次問診現(xiàn)場,MedGPT就為患者開具了多種檢驗(yàn)檢測,患者在憑借單據(jù)直接在成都高新海爾森醫(yī)院完成相關(guān)檢測。醫(yī)聯(lián)MedGPT項(xiàng)目負(fù)責(zé)人王磊表示:MedGPT開單檢查只是多模態(tài)能力的其中一環(huán),MedGPT后續(xù)將配合醫(yī)聯(lián)多種云化能力,覆蓋預(yù)防、診斷、治療、康復(fù)的疾病管理全流程,讓患者輕松接觸到優(yōu)質(zhì)醫(yī)療資源。未來,MedGPT會擁有更大的想象空間。
事實(shí)上,醫(yī)聯(lián)在今年5月已經(jīng)公布了MedGPT多種醫(yī)學(xué)檢驗(yàn)檢測模態(tài)能力。除了配合云化能力進(jìn)行檢驗(yàn)檢測外,MedGPT會在患者收到藥品后主動為患者進(jìn)行用藥指導(dǎo)與管理、智能隨訪復(fù)診、康復(fù)指導(dǎo)等智能化疾病診療動作。醫(yī)聯(lián)MedGPT plugin應(yīng)用平臺整合超過 1000+醫(yī)療多模態(tài)能力,整合多樣化的醫(yī)療多模態(tài)能力,豐富和完善全流程智能化診療體驗(yàn)。
一次階段性探索 一次AI應(yīng)用發(fā)展的推進(jìn)
現(xiàn)階段,醫(yī)療行業(yè)還存在著資源分配不均,邊緣地區(qū)患者難以接觸到優(yōu)質(zhì)醫(yī)療資源等痛點(diǎn),而AI醫(yī)療可以有效補(bǔ)充醫(yī)療資源,助力全民健康生活水平的提升,有利于補(bǔ)全基層診療服務(wù)短板,強(qiáng)化公共衛(wèi)生服務(wù)效率,幫助解決優(yōu)質(zhì)醫(yī)療資源相對匱乏和基層醫(yī)療服務(wù)能力不足的結(jié)構(gòu)性難題。
(評測現(xiàn)場)
此次測試是國內(nèi)首次公開的、規(guī)模化的、基于真實(shí)患者的AI醫(yī)生與真人醫(yī)生的一致性研究評測,也是對于AI醫(yī)療的一次階段性探索。經(jīng)過此次評測,以MedGPT為首的AI醫(yī)療已經(jīng)現(xiàn)階段進(jìn)入到了真實(shí)患者測試階段,這也意味著通用型人工智能技術(shù)的研究與應(yīng)用發(fā)展水平得到了進(jìn)一步推進(jìn)。王磊表示:“此次測評,本質(zhì)是為了持續(xù)驗(yàn)證與提升AI模型的醫(yī)學(xué)有效性。醫(yī)聯(lián)希望通過MedGPT在疾病管理全流程上的能力,讓智能化的醫(yī)療手段幫助更多患者,令各地醫(yī)療資源的不均等逐漸消弭。”
推動AI在醫(yī)療行業(yè)的研究與應(yīng)用,以嚴(yán)肅醫(yī)療為根本,讓優(yōu)勢的醫(yī)療資源與技術(shù)惠及更多人,是醫(yī)聯(lián)不斷向前的動力。醫(yī)聯(lián)也將在AI醫(yī)療領(lǐng)域持續(xù)耕耘,加速AI在醫(yī)療行業(yè)內(nèi)的落地應(yīng)用,力爭貫徹讓全人類健康壽命延長一年的使命。
關(guān)鍵詞:
責(zé)任編輯:Rex_03