微软AI于周一(6月30日)表示,微软AI诊断协调器(MAI-DxO)能够正确诊断《新英格兰医学杂志》(NEJM)发布的85%的诊断复杂的病例,而参与研究的执业医生平均准确率仅为20%。
MAI-DxO还在周一的博客文章中提到,该工具比医生更具有成本效益。
“为了让AI产生实际影响,临床医生和患者都必须能够信任其性能,”博客文章指出,“这就是我们新的基准测试和AI协调器的意义所在。”
文章还提到,此前用于评估医学领域AI系统的基准测试基于美国医师执照考试(USMLE),这是一种以选择题为主的考试,偏向于记忆能力,因此夸大了AI系统的表面能力。
为克服该测试的局限性,微软AI开发了一种新测试方法,要求进行顺序诊断,并使用NEJM近期发布的304个案例。此测试要求AI模型和人类医生提出问题、安排检查并最终得出诊断结果。
根据文章内容,微软AI的测试还包括一个反映现实世界医疗支出的虚拟成本。
据报告,作为协调器的MAI-DxO可以访问多个语言模型并整合多样化的数据源。它还可以配置操作,使其在规定的成本限制内运行。
“与我们的合作伙伴一起,我们坚信,未来的医疗将通过增强人类的专业知识和同理心与机器智能的力量来塑造,”博客文章写道,“我们很高兴能迈出下一步,让这一愿景成为现实。”
然而,PYMNTS Intelligence与AI-ID合作的一项研究《生成式AI追踪器®:生成式AI可提升健康水平并彻底改变医疗保健》发现,尽管美国人对AI在医疗保健领域的潜在好处充满热情,但他们仍然对医疗机构依赖AI或用这种技术取代医务人员感到不安。
报告显示,60%的美国人表示他们对医疗机构在其医疗过程中依赖AI感到不适,而57%的人认为使用AI诊断疾病和建议治疗方案会损害医患关系。
(全文结束)

