研究发现AI对80%以上的早期医疗案例误诊AI misdiagnoses over 80% of early medical cases, study finds

环球医讯 / AI与医疗健康来源:www.thecooldown.com美国 - 英语2026-05-17 01:50:21 - 阅读时长2分钟 - 792字
一项发表在《美国医学会杂志·网络开放》上的研究测试了21款AI聊天机器人在临床诊断中的表现,结果显示这些先进模型在早期医疗案例中的误诊率超过80%,尤其在症状可能对应多种疾病的鉴别诊断环节失败率更高;尽管在后期诊断阶段表现有所改善,误诊率降至40%以下且最强大模型最终诊断准确率可达90%以上,但研究凸显了当前AI医疗诊断技术的局限性,同时文章指出公众对AI技术的信心已因就业市场动荡和数据中心争议等问题而显著下降,多位评论者强调"人类洞察力仍然是黄金标准",这一发现对AI在医疗领域的应用前景提出了重要警示。
AI聊天机器人医疗误诊早期医疗案例临床诊断鉴别诊断医疗诊断准确率
研究发现AI对80%以上的早期医疗案例误诊

一项新研究测试了AI聊天机器人在临床环境中诊断患者的能力,发现该技术尚不足以胜任这一任务,《金融时报》报道称。

《金融时报》(FT)在一条推文中表示,在研究评估的"80%以上的早期医疗案例"中出现了误诊情况。

这项于4月13日发表在《美国医学会杂志·网络开放》(JAMA Network Open)上的研究,使用"29个标准化临床案例"测试了21个聊天机器人,其摘要解释道。

被测试的聊天机器人中包括前沿模型,如OpenAI的GPT-5、Anthropic的Claude 4.5 Opus、Google的Gemini 3.0(Flash和Pro版本)以及Grok 4。

尽管上传图片提高了模型的准确性,但作者发现AI聊天机器人在从所提供信息中逐步识别疾病的过程中存在困难。

特别是,研究人员观察到,在鉴别诊断方面,AI聊天机器人的失败率超过80%。鉴别诊断是指诊断过程因症状与多种潜在疾病、伤害或状况相匹配而变得复杂的情况。

最终,作者报告称,聊天机器人在后期诊断阶段的表现有所改善,误诊率降至40%以下。最强大的模型在最终诊断中的准确率超过90%。

除了研究结果外,在发表时,公众对AI及相关技术的信心已显著下降,原因包括就业市场动荡以及对数据中心日益增长的争议等。

最初,数据中心被视为区域性问题,但到2025年底,它们对公用事业账单的影响已成为全国性关键问题。正如PBS所报道的,电费飙升,在某些地区,月度成本甚至超过了住房付款。

在X平台上,评论者对研究结果并不感到惊讶。

"下次当某些AI首席执行官大放厥词说AI将取代所有人时,请记住这一点,"一人回复道。

"经过美化的自动补全应用不应诊断医疗案例,"另一人表示。

"人类洞察力仍然是黄金标准,"第三人写道。

【全文结束】

猜你喜欢
  • 超级智能、媒体、健康与长寿领域知名人士畅谈人工智能与内卷文化超级智能、媒体、健康与长寿领域知名人士畅谈人工智能与内卷文化
  • 尼日利亚药品监管委员会推出电子药房法规以保障在线药物服务尼日利亚药品监管委员会推出电子药房法规以保障在线药物服务
  • 探究既往医疗不当对待与寻求现场人工流产的美国人群对非处方药物流产的兴趣和支持度之间的关联探究既往医疗不当对待与寻求现场人工流产的美国人群对非处方药物流产的兴趣和支持度之间的关联
  • 研究发现AI在80%以上早期医疗病例中误诊研究发现AI在80%以上早期医疗病例中误诊
  • 数据将使人们远离医院——这是正确的事情——Ng Kheng Yean数据将使人们远离医院——这是正确的事情——Ng Kheng Yean
  • 腺热是否会增加脑淋巴瘤风险?顶尖医生揭示不可忽视的症状腺热是否会增加脑淋巴瘤风险?顶尖医生揭示不可忽视的症状
  • 研究发现女性在心脏搭桥手术中面临更高风险研究发现女性在心脏搭桥手术中面临更高风险
  • 新肥胖药物指南直指污名化问题新肥胖药物指南直指污名化问题
  • '这不是你故事的终点':名厨Heny Sison如何与心力衰竭共处'这不是你故事的终点':名厨Heny Sison如何与心力衰竭共处
  • 研究显示阿尔茨海默病筛查工具在女性与男性身上效果可能不同研究显示阿尔茨海默病筛查工具在女性与男性身上效果可能不同
热点资讯
全站热点
全站热文