大語言模型仍無法可靠區分信念與事實為高風險領域應用敲響警鐘

2025-12-30 來源：中國日報網

342

在最新一期《自然·機器智能》發表的一篇論文中，美國斯坦福大學研究提醒：大語言模型（LLM）在識別用戶錯誤信念方面存在明顯局限性，仍無法可靠區分信念還是事實。研究表明，當用戶的個人信念與客觀事實發生沖突時，LLM往往難以可靠地作出準確判斷。

這一發現為其在高風險領域（如醫學、法律和科學決策）的應用敲響警鐘，強調需要審慎對待模型輸出結果，特別是在處理涉及主觀認知與事實偏差的復雜場景時，否則LLM有可能會支持錯誤決策、加劇虛假信息的傳播。

團隊分析了24種LLM（包括DeepSeek和GPT-4o）在13000個問題中如何回應事實和個人信念。當要求它們驗證事實性數據的真或假時，較新的LLM平均準確率分別為91.1%或91.5%，較老的模型平均準確率分別為84.8%或71.5%。當要求模型回應第一人稱信念（“我相信……”）時，團隊觀察到LLM相較于真實信念，更難識別虛假信念。具體而言，較新的模型（2024年5月GPT-4o發布及其后）平均識別第一人稱虛假信念的概率比識別第一人稱真實信念低34.3%。相較第一人稱真實信念，較老的模型（GPT-4o發布前）識別第一人稱虛假信念的概率平均低38.6%。

團隊指出，LLM往往選擇在事實上糾正用戶而非識別出信念。在識別第三人稱信念（“Mary相信……”）時，較新的LLM準確性降低4.6%，而較老的模型降低15.5%。

研究總結說，LLM必須能成功區分事實與信念的細微差別及其真假，從而對用戶查詢作出有效回應并防止錯誤信息傳播。

總編輯圈點

當前大語言模型雖在表面語言任務上表現優異，但缺乏人類的基礎社交智能，在事實與信念識別上的誤差，不僅反映出技術瓶頸，更暴露出AI在復雜社會語境中應用的潛在風險。如文中指出的醫療咨詢、法律判斷等場景，模型若無法辨析當事人主觀認知與客觀事實，會出現離譜的錯位，造成嚴重后果。該研究揭示出模型在認知層面的關鍵缺陷，對AI的發展方向具有重要警示意義。這也提醒我們，下一代AI需要融入對人類認知模式的理解，只有當模型能真正理解信念的復雜性時，才能成為值得信賴的智能伙伴。

機構：2032年全球電子傳感器市場將達412億美元，亞太地區以48%份額領先11-14

行業動態

臺積電Q4營收激增20.45% 遠超市場預期

小鵬：希望轉型成物理AI公司，而不僅僅是一家汽車制造商

天晟新材籌劃控制權變更，股票自1月9日起停牌

熱讀文章

電子產業運行動態觀察（2022年7月）

薩科微slkor宋仕強：解讀電子信息產業“國產替代”

電子產業運行動態觀察（2022.06.08）

大語言模型仍無法可靠區分信念與事實 為高風險領域應用敲響警鐘

大語言模型仍無法可靠區分信念與事實為高風險領域應用敲響警鐘