微软AI诊断系统准确率远超人类医生,或将改变医疗行业AI doctor four times better at identifying illnesses than humans

环球医讯 / AI与医疗健康来源:www.telegraph.co.uk英国 - 英文2025-07-07 18:24:52 - 阅读时长3分钟 - 1294字
微软开发的AI诊断系统在复杂疾病识别上准确率达86%,远超英美医生平均20%的水平,其低成本、高效的特点可能推动医疗行业的数字化转型并缓解医疗资源压力。
微软AI诊断系统健康医疗行业诊断准确率英国NHSAI辅助医生复杂疾病诊断医疗效率健康查询癌症诊断
微软AI诊断系统准确率远超人类医生,或将改变医疗行业

微软公司近日宣布,已开发出一种人工智能(AI)诊断系统,该系统在诊断复杂疾病方面的表现比医生高出四倍。这家科技巨头表示,其AI诊断系统的准确率高达86%,而英国和美国医生的平均准确率仅为20%。

微软在公布这一研究结果时声称,他们已经为“医学超级智能”奠定了基础。与此同时,英国卫生大臣韦斯·斯特里廷(Wes Streeting)正积极推动将人工智能技术广泛应用于英国国家医疗服务体系(NHS),以提高效率。今年4月,NHS的候诊名单七个月以来首次增加,达到742万人,这给政府削减候诊时间的关键承诺带来了打击。

微软表示,其系统不仅能够比医生更便宜地解决问题,甚至在受限于诊断测试预算的情况下也能胜过医生。这套名为“Microsoft AI Diagnostic Orchestrator”(简称MAI-DxO)的系统,在《新英格兰医学杂志》(New England Journal of Medicine)中选取了304个复杂病例进行测试。这些病例来自麻萨诸塞州综合医院(Massachusetts General Hospital),以其高难度著称。

该系统由五个不同的AI机器人组成虚拟团队,每个机器人承担不同角色,例如“假设医生”(Dr Hypothesiser)、“测试选择医生”(Dr Test-Chooser)和“挑战医生”(Dr Challenger)。这些AI模块会通过内部讨论提出进一步问题、安排测试并最终提供诊断。例如,系统成功诊断出一名29岁女性患有胚胎横纹肌肉瘤(embryonal rhabdomyosarcoma),这是一种通常发生在儿童中的罕见癌症。

当与OpenAI开发的最先进AI模型ChatGPT结合使用,并且没有测试预算限制时,该系统的诊断准确率达到85.5%。即使在必须遵守2000美元(约合1458英镑)测试预算的情况下,它的准确率仍超过70%。相比之下,参与测试的21名人类医生平均花费2963美元进行测试,但诊断准确率仅为19.9%。值得注意的是,这些医生无法使用教科书或软件查阅信息,且均为全科医生而非专科医生。

微软指出,即便无法安排任何测试,其AI工具仍能在超过一半的情况下正确诊断病情。

“辅助”而非取代医生

研究人员强调,《新英格兰医学杂志》提供的病例均设在付费墙之后,许多病例是在AI系统训练完成后才发布的,因此可以确保这些病例未被纳入用于构建AI的数据集中,系统必须独立得出诊断结论。

微软的AI健康部门由英国企业家穆斯塔法·苏莱曼(Mustafa Suleyman)领导。他曾共同创立DeepMind实验室,后该实验室被谷歌收购,去年转投微软。微软表示,其必应搜索引擎和Copilot聊天机器人每天接收5000万条健康相关查询,并补充道:“AI助手正在迅速成为医疗保健的新前线。”

然而,微软也表示,AI将作为医生的补充,而非替代品。“医生需要处理模糊情况,并以AI无法做到的方式与患者及其家属建立信任,”公司指出。

上周,斯特里廷推出了一款NHS应用程序,其中包含一个被称为“口袋医生”的聊天机器人功能。


(全文结束)

大健康

猜你喜欢

  • 专家警告:度假时可能会出现早期痴呆症迹象专家警告:度假时可能会出现早期痴呆症迹象
  • AI健身总结的令人难以忍受的浅显性AI健身总结的令人难以忍受的浅显性
  • 2025年7月《神经外科焦点》期刊:人工智能在改善神经外科患者护理中的应用2025年7月《神经外科焦点》期刊:人工智能在改善神经外科患者护理中的应用
  • 调查发现消费者对人工智能接受度提高,但对全渠道服务不满调查发现消费者对人工智能接受度提高,但对全渠道服务不满
  • 研究显示AI生成的精神病患者治疗方案存在种族偏见研究显示AI生成的精神病患者治疗方案存在种族偏见
  • 基因组中的Transformer:AlphaGenome如何重新构想AI驱动的基因组学基因组中的Transformer:AlphaGenome如何重新构想AI驱动的基因组学
  • 释放生成式人工智能在医疗保健领域的潜力释放生成式人工智能在医疗保健领域的潜力
  • 研究显示:阿尔茨海默病血液生物标志物检测在某些人群中可靠性较低研究显示:阿尔茨海默病血液生物标志物检测在某些人群中可靠性较低
  • 微软称AI工具在复杂医疗病例上胜过医生微软称AI工具在复杂医疗病例上胜过医生
  • 银杏与利伐沙班的药物相互作用银杏与利伐沙班的药物相互作用
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康