微软宣布在医疗诊断领域取得了重大突破,声称其全新的人工智能系统在诊断复杂病症方面的表现优于经验丰富的医生。
该系统在结合OpenAI的先进o3模型后,达到了超过85%的准确率,显著高于医生在无外部资源辅助下平均仅20%的诊断准确率。
微软将这一创新称为迈向“医疗超级智能”的一步,展示了AI辅助医疗的未来前景。这项技术模拟了一个由专家临床医生组成的团队协作过程,即使面对最具挑战性的病例也能得出精准诊断。
微软AI诊断协调器(MAI-DxO)
这一创新的核心在于微软的AI诊断协调器,也称为MAI-DxO。该协调器使用一组充当虚拟专家的AI代理,包括“假设生成者博士”、“测试选择者博士”和“挑战者博士”等角色。
这些代理共同讨论病例、请求检测、提出具体问题并确定可能的诊断,模拟了真实世界中医疗团队的决策过程。
协调器在《新英格兰医学杂志》中的304个复杂病例上进行了测试,这是一份以其诊断难度高的案例研究而闻名的权威来源。在一个显著的例子中,该AI系统成功诊断出一名29岁女性患有罕见的儿童癌症——胚胎型横纹肌肉瘤。
比人类医生更具成本效益
微软强调了该系统的成本效益。即使在2000美元的测试预算限制下,AI仍保持了70%以上的准确率。相比之下,人类医生平均花费近2963美元,但准确率却低于20%。在不允许进行任何测试的情况下,AI仍然有超过一半的概率给出正确诊断。
微软澄清说,参与研究的医生不能查阅教科书、使用软件或与同事合作,这些条件旨在反映AI独立工作的能力。
尽管表现出色,微软表示并不打算取代医生。相反,这款AI设计初衷是支持和增强临床决策。
“医生的临床职责远不止于做出诊断。他们需要应对不确定性,并以AI无法做到的方式与患者及其家属建立信任。” 公司在一篇博客文章中如是说道。
未来愿景:从辅助到超级智能
微软AI部门负责人兼DeepMind联合创始人Mustafa Suleyman对AI驱动的医疗未来充满信心。他预测,这些系统在未来5到10年内几乎可以达到零错误,从而显著减轻全球医疗系统的压力。
AI的表现预示着患者与医疗服务提供者之间互动方式可能发生改变。从为临床医生提供高级决策支持工具到为日常护理提供自我管理工具,AI在医学领域的应用范围不断扩大。
实际影响与下一步计划
该研究仍在同行评审中。微软表示,在临床应用之前还需要进一步测试,尤其是在常见症状和日常病例方面。
公司透露,通过Bing和Copilot聊天机器人每天收到5000万条与健康相关的查询,显示了AI在公共健康领域扮演的日益重要的角色。
微软的AI系统结合了诊断协调器和OpenAI的o3模型,展现了准确性和效率的巨大提升。虽然不会取代医生,但它能够为医生提供支持,同时帮助降低成本并改善全球医疗质量。
(全文结束)

