微软AI在复杂NEJM诊断案例中表现超越医生Microsoft's AI now outperforms doctors in complex NEJM diagnostic cases

环球医讯 / AI与医疗健康来源:windowsreport.com美国 - 英文2025-07-07 14:47:34 - 阅读时长2分钟 - 635字
微软开发的AI诊断工具MAI-DxO在处理《新英格兰医学杂志》复杂病例时准确率达到85.5%,远超经验丰富的医生团队,展示了AI在医疗领域的巨大潜力,但其实际应用仍需临床验证和监管支持。
微软AI医疗保健医学诊断NEJM病例诊断准确率临床医生辅助患者常规护理监管机制
微软AI在复杂NEJM诊断案例中表现超越医生

微软的AI工具可能正在改变医疗保健行业,至少从它应对一些最棘手医学挑战的表现来看是如此。

在一项新的实验中,微软的AI诊断协调器(Microsoft AI Diagnostic Orchestrator,简称MAI-DxO)成功诊断了来自《新英格兰医学杂志》(New England Journal of Medicine, NEJM)的85.5%复杂病例。该杂志以其极具挑战性的案例研究而闻名。

这款工具通过将大型语言模型转化为一个虚拟的临床医生团队来运作。它能够像医生团队一样,在病例进展过程中提出后续问题、安排测试并发布诊断结果。

当与OpenAI的o3模型结合使用时,MAI-DxO表现出最佳性能,远远超过了来自美国和英国的21名真实医生的结果。尽管这些医生拥有5到20年的经验,但在相同基准测试中的平均准确率仅为20%。

为了正确评估这一成果,微软创建了一个名为“顺序诊断基准”(Sequential Diagnosis Benchmark,简称SD Bench)的新基准,使用了304个NEJM病例。这种设置允许AI模型像临床医生一样逐步审查症状、请求更多数据,并在每一步缩小诊断范围。

微软表示,其潜在影响是巨大的。这些工具可以帮助临床医生应对复杂的诊断情况,甚至可以帮助患者自行处理常规护理。但公司也承认这只是一个起点。

这项研究需要在真实的临床环境中进行测试,并建立适当的监管框架和监督机制。微软目前正在与医疗机构合作,以实现这一目标。


(全文结束)

猜你喜欢
  • 未来已来:2025年7月1日最大的人工智能与科技突破未来已来:2025年7月1日最大的人工智能与科技突破
  • Thumbay医疗人工智能实验室正式启动Thumbay医疗人工智能实验室正式启动
  • AI初创公司Tandem Health获5000万美元融资,减轻欧洲医生的记录负担AI初创公司Tandem Health获5000万美元融资,减轻欧洲医生的记录负担
  • AI赋能医疗平台减轻职业倦怠并变革加拿大临床文档流程AI赋能医疗平台减轻职业倦怠并变革加拿大临床文档流程
  • AI对决医生:微软AI工具在复杂病例诊断中胜过医生AI对决医生:微软AI工具在复杂病例诊断中胜过医生
  • 人工智能可通过语言、措辞和声音变化检测帕金森病人工智能可通过语言、措辞和声音变化检测帕金森病
  • Tandem Health获得5000万美元以推动医疗领域的人工智能操作系统发展Tandem Health获得5000万美元以推动医疗领域的人工智能操作系统发展
  • 柏林将设立3000万欧元的AI医学创新中心柏林将设立3000万欧元的AI医学创新中心
  • 全球退行性二尖瓣疾病负担持续上升全球退行性二尖瓣疾病负担持续上升
  • AI在绘制肺癌放疗肿瘤图方面与医生水平相当AI在绘制肺癌放疗肿瘤图方面与医生水平相当
热点资讯
全站热点
全站热文