AI尚不具備獨立臨床診療的能力

2026-04-14 來源：科技日報

255

　　盡管人工智能（AI）在醫療領域的應用日益增多，但其“像醫生一樣思考”的能力仍存在明顯短板。由美國麻省總醫院MESH孵化器團隊開展的一項最新研究發現，生成式AI在臨床推理關鍵環節仍顯不足，尚不具備獨立承擔臨床診療任務的能力。相關成果發表在最新一期《JAMA Network Open》上。

　　團隊選取包括ChatGPT、DeepSeek、Claude、Gemini和Grok在內的21種大語言模型，在29個已發表的臨床病例中進行測試，并通過逐步提供患者信息（從基本癥狀到實驗室和影像結果）來模擬真實診療過程。結果顯示，當獲得完整信息時，所有模型在超過90%的案例中能給出正確的最終診斷。

　　然而，在關鍵的早期診斷階段，這些模型普遍表現欠佳。研究發現，超過80%的情況下，模型未能提出合理的“鑒別診斷”，即對多種可能疾病進行系統性分析與篩選。這一能力被認為是臨床推理的核心，也是醫生決策的重要基礎。

　　為更全面評估模型能力，團隊提出了一種名為PrIME-LLM的新指標，從提出潛在診斷、選擇檢查手段、給出最終診斷到制定治療方案等多個環節對模型進行綜合評價。結果顯示，各模型整體評分在64%至78%之間，表現存在明顯差異。

　　團隊指出，大語言模型更擅長在信息完備的情況下“給出答案”，但在信息不充分、需要開放性推理的情境中表現較弱。隨著實驗室數據和影像資料的加入，模型表現有所提升，且新一代模型整體優于舊版本，表明相關技術正在持續改進。

　　團隊表示，當前大語言模型尚不適合在缺乏監督的情況下直接用于臨床實踐，其價值更在于輔助醫生決策，而非取而代之。（記者張佳欣）

【責任編輯:朱家齊】

行業動態

2026年一季度工業和信息化發展情況：工業對經濟增長貢獻率近四成，工業機器人產量增長33.2%

力源信息旗下武漢芯源半導體官宣全系產品調價，晶圓封測成本上漲與產能緊張成主因

AMD將與格方羅德合作開發CPO解決方案

熱讀文章

電子產業運行動態觀察（2022年7月）

薩科微slkor宋仕強：解讀電子信息產業“國產替代”

電子產業運行動態觀察（2022.06.08）