AI在医学扫描中难以区分左右AI Struggles to Tell Left From Right in Medical Scans

环球医讯 / AI与医疗健康来源:www.unite.ai德国 - 英语2025-08-05 01:39:52 - 阅读时长3分钟 - 1031字
最新研究发现ChatGPT等视觉-语言模型在医学扫描中频繁出现空间认知错误,其依赖先验解剖知识而非实际图像分析的行为可能导致临床误诊。该研究通过创新性MIRP数据集揭示:当医学影像被旋转翻转时,主流模型准确率仅约50%;去除解剖术语并使用视觉标记后,GPT-4o等模型准确率可提升至85%以上,但Llama3.2等模型仍存在显著缺陷。该成果对医疗AI开发具有重要警示意义。
AI医学扫描空间认知缺陷临床诊断误诊MIRP数据集技术局限性医疗AI风险异常检测动态学习能力
AI在医学扫描中难以区分左右

AI在医学扫描中的空间认知缺陷

一项新研究发现,ChatGPT等AI图像模型在处理医学影像时存在严重空间认知障碍,表现为无法正确识别器官位置的颠倒或旋转。这种缺陷可能导致临床诊断中出现危险错误。实验显示,当前主流视觉-语言模型(VLMs)在医学扫描的空间推理测试中表现接近随机猜测,其根本原因在于模型更倾向于依赖训练获得的解剖先验知识,而非实际分析图像内容。

临床应用风险

德国乌尔姆大学与美国Axiom Bio研究人员指出:"当要求AI判断肝脏是否位于胃部右侧时,模型可能直接调用解剖常识得出肯定答案,而不会仔细检查图像。这种机制在存在内脏反位、术后改变或肿瘤位移等异常情况时,将导致致命误诊。"

研究团队开发的MIRP(医学影像相对定位)数据集显示:

  • 使用标准问诊格式时,GPT-4o等四大主流模型准确率均约50%
  • 添加字母/数字标记后,GPT-4o和Pixtral准确率提升至75%
  • 完全去除解剖术语后,GPT-4o使用字母标记准确率达85%以上

技术局限性分析

实验揭示关键现象:

  1. 先验知识依赖:当处理翻转影像时,GPT-4o基于解剖常识的判断准确率达75%,但直接分析图像时准确率骤降
  2. 模型代际差异:开源模型Llama3.2在所有测试中表现最差,即使在纯视觉标记测试中准确率也不足60%
  3. 泛化能力不足:在去除医学语境的白底标记测试中,JanusPro和Llama3.2仍表现出基础空间判断缺陷

数据集创新

MIRP数据集采用多维度测试方案:

  • 包含CT/MRI腹部切片数据
  • 设置红蓝圆点、黑白字母、黑白数字三种标记系统
  • 对影像进行随机旋转/翻转处理以打破解剖先验
  • 平衡Yes/No答案分布

该数据集已整合自BTCV、AMOS和TotalSegmentator等公开医学影像数据库。

临床转化启示

研究团队强调,当前医疗AI存在两大根本性风险:

  1. 认知黑箱化:模型可能完全忽略上传的医学影像,直接根据文本提示生成"诊断结果"
  2. 异常检测失效:对偏离标准解剖结构的病理改变缺乏识别能力,这正是诊断医学的核心需求

虽然通过优化提示工程(如使用视觉标记)可提升准确率,但这一发现凸显出医疗AI开发的深层矛盾——当前模型本质上更擅长"医学知识问答"而非"医学影像分析"。研究团队建议,下一代医疗AI应重点开发异常检测机制和动态学习能力,以突破现有技术框架。

【全文结束】

大健康

猜你喜欢

  • 基于细胞的检测市场预计2032年达到255亿美元,受益于药物研发与个性化医疗基于细胞的检测市场预计2032年达到255亿美元,受益于药物研发与个性化医疗
  • 如何在不借助风投的情况下创立一家人工智能公司?Pentavere首席执行官的经验分享如何在不借助风投的情况下创立一家人工智能公司?Pentavere首席执行官的经验分享
  • 生命智能:人工智能、传感器与生物技术如何塑造认知系统未来生命智能:人工智能、传感器与生物技术如何塑造认知系统未来
  • 多家科技公司进军医疗健康 三星电子称其方法独具优势多家科技公司进军医疗健康 三星电子称其方法独具优势
  • 医疗领域的AI:算法何时能取代医生?医疗领域的AI:算法何时能取代医生?
  • 新AI模型仅需少量数据即可完成医疗图像分割新AI模型仅需少量数据即可完成医疗图像分割
  • 利用基础模型实现快速临床响应:急诊环境下的脑出血分割利用基础模型实现快速临床响应:急诊环境下的脑出血分割
  • 白宫与CMS启动健康科技生态系统倡议 推动以消费者为中心的数字健康应用白宫与CMS启动健康科技生态系统倡议 推动以消费者为中心的数字健康应用
  • PurpleAI通过韩国深度科技TIPS计划获得115万美元政府研发资金PurpleAI通过韩国深度科技TIPS计划获得115万美元政府研发资金
  • 利用联邦数据平台增强精准医学中的AI利用联邦数据平台增强精准医学中的AI
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康