医生使用AI助手后癌症筛查能力下降Doctors Got Worse at Cancer Screening After Using AI Helpers

环球医讯 / AI与医疗健康来源:www.eweek.com美国 - 英语2025-08-27 02:01:46 - 阅读时长2分钟 - 892字
波兰研究显示,19名经验丰富的医生在使用AI辅助系统后,独立进行结肠镜检查的癌前病变检出率下降6个百分点。与此同时,GPT-5在医学考试中以29%优势超越人类专家,但最新研究揭示当前医学AI评估体系存在严重缺陷,约92%基准测试数据存在污染,96%未评估模型表达不确定性的能力,这引发关于人类医生技能退化与AI评估标准失真的医疗AI悖论。
癌症筛查医疗AI去技能化GPT-5临床诊断测评体系医疗水平医生技能真实医疗场景可靠性
医生使用AI助手后癌症筛查能力下降

![Envato/monkeybusiness]

一项发表于《柳叶刀》的新研究显示,经验丰富的医生在使用人工智能辅助系统进行结直肠癌筛查后,当AI系统撤除时,他们的筛查能力反而下降。就在揭示人类能力局限性的同时,另一项突破性研究宣称OpenAI最新模型GPT-5在复杂医学推理任务中展现出"超人类"表现,远超专业医疗人员。

这两项发现提出了关键问题:AI究竟是提升医疗水平的革命性工具,还是正在使临床医生变得过度依赖并丧失专业技能?答案比想象中复杂。

研究细节

波兰研究人员跟踪了19名已完成2000+例结肠镜检查的医生,研究期间覆盖1443例无AI辅助操作:

  • 使用AI前:医生癌前病变检出率为28.4%
  • 使用AI后:独立操作时检出率降至22.4%
  • 启用AI时:检出率为25.3%

这项研究首次实证了医疗AI导致的"去技能化"现象,研究人员将其归因为"自动化偏差"——医生在缺乏数字助手时表现出降低的工作积极性。就像长期依赖GPS导航导致城市路线认知能力下降。

AI医疗能力突破

埃默里大学医学院研究显示,GPT-5在医学考试中取得突破:

  • 标准化考试:在MedQA和USMLE考试中取得95.2%-95.8%正确率
  • 多模态推理:相比GPT-4o,在MedXpertQA测试中推理能力提升29%
  • 临床诊断:准确诊断Boerhaave综合征(食管破裂)并制定诊疗方案

但最新研究揭示重大隐患:53项医学基准测试中,92%存在数据污染风险,94%未测试模型处理噪声数据的能力,96%未评估模型表达不确定性的能力。

矛盾再审视

三项研究共同揭示医疗AI悖论:

  1. 人类医生独立诊断能力下降
  2. AI系统宣称具备超人类表现
  3. 测评体系存在系统性缺陷

解决方案包括:

  • 设立"无AI训练日"保持临床技能
  • 建立动态临床工作流基准测试
  • 重新定义AI时代医生角色

研究警示,当前测评体系可能创造"进步假象",在放弃传统医疗技能前,必须确保AI系统真正具备应对真实医疗场景的可靠性。

【全文结束】

大健康

猜你喜欢

  • 使用AI辅助的医生在独立操作时发现异常的能力下降20%,研究发现过度依赖引发担忧使用AI辅助的医生在独立操作时发现异常的能力下降20%,研究发现过度依赖引发担忧
  • 极端高温正加剧佛罗里达州孕妇的健康风险极端高温正加剧佛罗里达州孕妇的健康风险
  • 南非医疗AI公众信任调查结果南非医疗AI公众信任调查结果
  • 睡眠传感与AI结合 bitsensing与Ontact Health合作睡眠传感与AI结合 bitsensing与Ontact Health合作
  • 赫尔辛基大学安装新型Orbitrap Astral质谱仪 加强国家蛋白质组学研究赫尔辛基大学安装新型Orbitrap Astral质谱仪 加强国家蛋白质组学研究
  • FDA发布医疗设备人工智能应用指南FDA发布医疗设备人工智能应用指南
  • AI疾病预测研究论文AI疾病预测研究论文
  • 2025年医药创新重塑医疗保健:一场生物技术革命2025年医药创新重塑医疗保健:一场生物技术革命
  • EMVision启动加州大学洛杉矶分校医疗中心作为emu脑扫描仪关键试验最后一个站点EMVision启动加州大学洛杉矶分校医疗中心作为emu脑扫描仪关键试验最后一个站点
  • Firefly股价飙升 英伟达合作推动AI脑电图技术革新神经疾病诊疗Firefly股价飙升 英伟达合作推动AI脑电图技术革新神经疾病诊疗
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康