微软开发了一款新的AI模型,该模型在与人类医生的竞争中以极大的优势胜出。
据称,这款新的AI模型能够提供比人类医生准确四倍的诊断结果。微软正致力于开发高端AI系统,这些系统被设计用于处理复杂的医疗案例,而这一轮AI与人类之间的较量显然以AI的显著胜利告终。微软的新AI模型被称为“AI诊断协调器”(AI Diagnostic Orchestrator),或简称为MAI-DxO。该模型利用《新英格兰医学杂志》发布的案例研究来测试其能力,结果表明其表现远超人类医生所能达到的水平。
我们常听说未来的医疗保健将涉及AI,但这是首次有实际的AI模型在最富经验的医生领域中大幅超越人类医生的表现。
微软的AI医生方案
据报道,这款AI模型在测试中正确诊断率达到85.5%,而来自美国和英国的一组医生的正确率仅为20%。这正是为什么有“AI比人类医生好4倍”的说法。那么,这些测试是如何进行的?又有哪些参数被用来让AI医生与人类医生一较高下呢?微软详细说明了这些测试的过程,其中还涉及了一些竞争对手的AI模型。
微软采用了OpenAI的o3模型、Anthropic的Claude、谷歌的Gemini以及Meta的Llama等模型。MAI-DxO与所有这些AI模型协作,使它们像一个团队的医生那样共享想法并解决这些医疗案例。微软指出,MAI-DxO与o3模型的组合表现最佳。
不仅如此,报道称这一组合不仅在成本上低于参与对比测试的人类医生,还能解决更多的案例。
公平竞争吗?
使用AI模型治疗患者将是开创性的,但这项技术确实依赖于比人类医生更多的资料来源,特别是那些通过多年学习和努力积累专业知识的医生。微软理解AI模型的这些限制,并指出,将该技术应用于常规健康问题可能会成为一个挑战。
AI模型需要输入数据和由人类医生撰写的研究材料。显然,AI可以超越人类,在这种情况下,医生也不例外,但未来不可避免地会同时涉及两者,而不是彼此替代。
(全文结束)

