微软公司近日宣布,已开发出一种人工智能(AI)诊断系统,该系统在诊断复杂疾病方面的表现比医生高出四倍。这家科技巨头表示,其AI诊断系统的准确率高达86%,而英国和美国医生的平均准确率仅为20%。
微软在公布这一研究结果时声称,他们已经为“医学超级智能”奠定了基础。与此同时,英国卫生大臣韦斯·斯特里廷(Wes Streeting)正积极推动将人工智能技术广泛应用于英国国家医疗服务体系(NHS),以提高效率。今年4月,NHS的候诊名单七个月以来首次增加,达到742万人,这给政府削减候诊时间的关键承诺带来了打击。
微软表示,其系统不仅能够比医生更便宜地解决问题,甚至在受限于诊断测试预算的情况下也能胜过医生。这套名为“Microsoft AI Diagnostic Orchestrator”(简称MAI-DxO)的系统,在《新英格兰医学杂志》(New England Journal of Medicine)中选取了304个复杂病例进行测试。这些病例来自麻萨诸塞州综合医院(Massachusetts General Hospital),以其高难度著称。
该系统由五个不同的AI机器人组成虚拟团队,每个机器人承担不同角色,例如“假设医生”(Dr Hypothesiser)、“测试选择医生”(Dr Test-Chooser)和“挑战医生”(Dr Challenger)。这些AI模块会通过内部讨论提出进一步问题、安排测试并最终提供诊断。例如,系统成功诊断出一名29岁女性患有胚胎横纹肌肉瘤(embryonal rhabdomyosarcoma),这是一种通常发生在儿童中的罕见癌症。
当与OpenAI开发的最先进AI模型ChatGPT结合使用,并且没有测试预算限制时,该系统的诊断准确率达到85.5%。即使在必须遵守2000美元(约合1458英镑)测试预算的情况下,它的准确率仍超过70%。相比之下,参与测试的21名人类医生平均花费2963美元进行测试,但诊断准确率仅为19.9%。值得注意的是,这些医生无法使用教科书或软件查阅信息,且均为全科医生而非专科医生。
微软指出,即便无法安排任何测试,其AI工具仍能在超过一半的情况下正确诊断病情。
“辅助”而非取代医生
研究人员强调,《新英格兰医学杂志》提供的病例均设在付费墙之后,许多病例是在AI系统训练完成后才发布的,因此可以确保这些病例未被纳入用于构建AI的数据集中,系统必须独立得出诊断结论。
微软的AI健康部门由英国企业家穆斯塔法·苏莱曼(Mustafa Suleyman)领导。他曾共同创立DeepMind实验室,后该实验室被谷歌收购,去年转投微软。微软表示,其必应搜索引擎和Copilot聊天机器人每天接收5000万条健康相关查询,并补充道:“AI助手正在迅速成为医疗保健的新前线。”
然而,微软也表示,AI将作为医生的补充,而非替代品。“医生需要处理模糊情况,并以AI无法做到的方式与患者及其家属建立信任,”公司指出。
上周,斯特里廷推出了一款NHS应用程序,其中包含一个被称为“口袋医生”的聊天机器人功能。
(全文结束)

