微软AI在复杂NEJM诊断案例中表现超越医生Microsoft's AI now outperforms doctors in complex NEJM diagnostic cases

环球医讯 / AI与医疗健康来源:windowsreport.com美国 - 英文2025-07-07 14:47:34 - 阅读时长2分钟 - 635字
微软开发的AI诊断工具MAI-DxO在处理《新英格兰医学杂志》复杂病例时准确率达到85.5%,远超经验丰富的医生团队,展示了AI在医疗领域的巨大潜力,但其实际应用仍需临床验证和监管支持。
微软AI医疗保健医学诊断NEJM病例诊断准确率临床医生辅助患者常规护理监管机制
微软AI在复杂NEJM诊断案例中表现超越医生

微软的AI工具可能正在改变医疗保健行业,至少从它应对一些最棘手医学挑战的表现来看是如此。

在一项新的实验中,微软的AI诊断协调器(Microsoft AI Diagnostic Orchestrator,简称MAI-DxO)成功诊断了来自《新英格兰医学杂志》(New England Journal of Medicine, NEJM)的85.5%复杂病例。该杂志以其极具挑战性的案例研究而闻名。

这款工具通过将大型语言模型转化为一个虚拟的临床医生团队来运作。它能够像医生团队一样,在病例进展过程中提出后续问题、安排测试并发布诊断结果。

当与OpenAI的o3模型结合使用时,MAI-DxO表现出最佳性能,远远超过了来自美国和英国的21名真实医生的结果。尽管这些医生拥有5到20年的经验,但在相同基准测试中的平均准确率仅为20%。

为了正确评估这一成果,微软创建了一个名为“顺序诊断基准”(Sequential Diagnosis Benchmark,简称SD Bench)的新基准,使用了304个NEJM病例。这种设置允许AI模型像临床医生一样逐步审查症状、请求更多数据,并在每一步缩小诊断范围。

微软表示,其潜在影响是巨大的。这些工具可以帮助临床医生应对复杂的诊断情况,甚至可以帮助患者自行处理常规护理。但公司也承认这只是一个起点。

这项研究需要在真实的临床环境中进行测试,并建立适当的监管框架和监督机制。微软目前正在与医疗机构合作,以实现这一目标。


(全文结束)

大健康

猜你喜欢

  • 丹纳赫任命马丁·斯特姆普为首席技术与人工智能官丹纳赫任命马丁·斯特姆普为首席技术与人工智能官
  • 年轻一代真的如近期研究声称的那样较不容易患上痴呆症吗?年轻一代真的如近期研究声称的那样较不容易患上痴呆症吗?
  • 阿拉斯泰尔·斯图尔特:“孙辈是痴呆症的最佳良药”阿拉斯泰尔·斯图尔特:“孙辈是痴呆症的最佳良药”
  • Tandem Health获得5000万美元以推动医疗领域的人工智能操作系统发展Tandem Health获得5000万美元以推动医疗领域的人工智能操作系统发展
  • 人工智能可通过语言、措辞和声音变化检测帕金森病人工智能可通过语言、措辞和声音变化检测帕金森病
  • Thumbay医疗人工智能实验室正式启动Thumbay医疗人工智能实验室正式启动
  • 全球退行性二尖瓣疾病负担持续上升全球退行性二尖瓣疾病负担持续上升
  • 柏林将设立3000万欧元的AI医学创新中心柏林将设立3000万欧元的AI医学创新中心
  • AI赋能医疗平台减轻职业倦怠并变革加拿大临床文档流程AI赋能医疗平台减轻职业倦怠并变革加拿大临床文档流程
  • 新型人工智能工具加速并提升早期痴呆症诊断新型人工智能工具加速并提升早期痴呆症诊断
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康