微软AI为医疗诊断树立新标杆How Microsoft’s AI Sets New Standards for Medical Diagnosis

环球医讯 / AI与医疗健康来源:aimagazine.com美国 - 英文2025-07-13 18:27:39 - 阅读时长4分钟 - 1545字
微软推出的全新AI诊断系统Microsoft AI Diagnostic Orchestrator(MAI-DxO)在复杂医疗诊断中表现出色,其准确率是医生的四倍,标志着迈向“医疗超级智能”的重要一步。该技术通过独特的“辩论链”方法模拟真实医疗决策流程,展示了AI在医疗领域的巨大潜力。
微软AI医疗诊断MAI-DxO医疗健康诊断准确率顺序诊断辩论链医疗成本AI应用医疗系统挑战
微软AI为医疗诊断树立新标杆

微软表示,其全新AI工具能够超越医生的表现。

微软AI诊断协调器(Microsoft AI Diagnostic Orchestrator,简称MAI-DxO)利用先进的大型语言模型(LLMs)和独特的“辩论链”方法,在诊断复杂医疗条件方面表现优于经验丰富的医生。

AI对社会最重要的贡献之一在于医疗领域,而如今微软正进军这一领域。该公司声称已开发出一种AI系统,其诊断复杂医疗状况的准确率比经验丰富的医生高出四倍。

MAI-DxO在《新英格兰医学杂志》(New England Journal of Medicine)发布的挑战性诊断案例中,正确识别了85%的病例。相比之下,来自美国和英国的21名执业医生在同一案例上的平均准确率仅为20%。

微软AI首席执行官Mustafa Suleyman表示,这项研究是去年由他领导组建的AI健康部门的首个项目,团队成员主要来自谷歌旗下的研究实验室DeepMind,这也是他共同创立的机构。

他在接受《金融时报》采访时将此次试验描述为迈向“医疗超级智能”的一步,认为这有助于解决医护人员短缺和医疗系统过度紧张导致的长时间等待问题。

他表示:“我们正在接近的AI模型不仅稍微好一点,而是显著优于人类表现:更快、更便宜,并且准确率提高了四倍。这将带来真正的变革。”

顺序诊断挑战传统AI基准

微软团队解决了当前AI医疗评估中的局限性,这些评估通常依赖于考试中的多项选择题。这些标准化测试是医生在美国执业的必要条件,但主要衡量的是记忆能力,而非临床推理能力。

相比之下,MAI-DxO通过顺序诊断运行,模拟了现实世界的医疗决策过程。该系统创建了一个由五个AI代理组成的虚拟小组,每个代理扮演不同的角色,例如生成假设或选择诊断测试。这些代理会相互交流和辩论,以选择治疗方案。

该系统采用了一种称为“辩论链”的技术,要求AI推理模型逐步记录其解决问题的过程。这种方法使研究人员能够理解系统如何得出诊断结论。

此外,这些AI模型还被提示注重成本意识,显著减少了准确诊断所需的测试数量,在某些情况下节省了数十万美元。

MAI-DxO整合多个AI模型进行医疗决策

诊断协调器整合了多个大型语言模型(LLM),包括OpenAI的GPT、Meta的模型、Claude、Gemini、Elon Musk的xAI系统以及DeepSeek。

这种方法模仿了不同医疗专家协作处理复杂病例的方式。性能最佳的配置将MAI-DxO与OpenAI的o3模型配对,这是该AI公司专注于推理的系统。微软已在OpenAI投资近140亿美元,并拥有独家使用权和销售权。

尽管OpenAI表现优异,但Mustafa强调微软的技术中立性。他表示:“我们一直认为它们会成为商品。真正起作用的是整体协调器,这才是差异化因素。”

参与测试的医生每人拥有五到二十年的临床经验,他们在没有同事、教科书或AI辅助的情况下工作,以便与系统的性能进行公平比较。

微软AI健康副总裁Dominic King表示:“该程序的表现优于我们之前见过的一切。现在有机会将其作为医疗的新入口。”

医疗成本推动AI应用,尽管存在局限性

这项技术的一个版本可能很快会被部署到微软的Copilot AI聊天机器人和Bing搜索引擎中,后者每天处理5000万次健康查询。

微软的研究表明,AI诊断工具可以减少不必要的医疗支出,同时提高准确性——目前美国医疗支出已接近GDP的20%,其中估计有25%对患者结果的影响微乎其微。

微软研究团队表示:“在生成式AI能够安全且负责任地应用于整个医疗体系之前,仍有许多重要挑战需要克服。我们需要来自真实临床环境的证据,以及适当的治理和监管框架,以确保可靠性、安全性和有效性。”


(全文结束)

大健康

猜你喜欢

  • ALS患者借助AI技术重获声音ALS患者借助AI技术重获声音
  • 2034年重症肌无力药物市场:统计、收入、临床试验、EMA、PDMA、FDA批准、药物、流行病学、疗法、治疗、公司——DelveInsight报告2034年重症肌无力药物市场:统计、收入、临床试验、EMA、PDMA、FDA批准、药物、流行病学、疗法、治疗、公司——DelveInsight报告
  • 新生儿体内阿尔茨海默病生物标志物水平升高新生儿体内阿尔茨海默病生物标志物水平升高
  • 微软称其新型健康AI诊断准确率远超医生微软称其新型健康AI诊断准确率远超医生
  • 医疗系统在人工智能浪潮中所需的关键要素医疗系统在人工智能浪潮中所需的关键要素
  • 一对夫妇尝试18年未能怀孕,人工智能助其成功一对夫妇尝试18年未能怀孕,人工智能助其成功
  • 乔治·拉赞贝前妻谈照顾患痴呆症的007演员乔治·拉赞贝前妻谈照顾患痴呆症的007演员
  • AI正在改变医疗保健服务的惊人方式AI正在改变医疗保健服务的惊人方式
  • 中东和北非地区AI医疗市场即将迎来重大突破中东和北非地区AI医疗市场即将迎来重大突破
  • Seegene推出STAgora平台以支持实时传染病追踪Seegene推出STAgora平台以支持实时传染病追踪
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康