一项新的科学综述得出结论,人工智能(AI)在疾病诊断方面的表现可能与人类医疗专业人员一样成功,但由于缺乏高质量的研究,该技术的真实潜力尚不明确。
研究人员对健康领域的现有AI研究进行了首次系统性综述,并将研究结果发表在《柳叶刀·数字健康》期刊上。
该综述聚焦于一种名为深度学习的AI技术,该技术利用算法、大数据和计算能力来模拟人类智能。
这使得计算机能够通过检查数千张图像来识别疾病模式,然后将所学知识应用于新的个案以提供诊断。人们对这项技术越来越期待,美国食品药品监督管理局(FDA)已经批准了多项AI算法用于医疗保健。
人工智能被誉为减轻过度劳累的医疗专业人员工作负担并革新医疗保健的方式,但到目前为止,科学研究尚未达到预期的热度。
英国伯明翰大学医院NHS信托基金会的阿拉斯泰尔·丹尼尔斯教授在一份声明中表示,在审查的20,500篇文章中,不到1%被认为足够可靠。
丹尼尔斯说:“在这些为数不多的高质量研究中,我们发现深度学习确实能够像医疗专业人员一样准确地检测从癌症到眼疾等各种疾病。”
“但重要的是要注意,AI并没有显著优于人类诊断。”
研究人员利用14项研究的数据发现,深度学习算法在87%的病例中正确检测出疾病,而医疗专业人员的准确率为86%。
AI在93%的病例中正确识别出无病患者,而医疗专业人员的这一比例为91%。
尽管这些结果很有希望,但研究人员表示,需要更好的研究和报告来提高我们对深度学习在医疗环境中真正能力的认识。
这将涉及改进研究设计,包括在与医疗专业人员工作环境相同的情况下测试AI。
伦敦莫菲尔德眼科医院的利维亚·费斯在一份声明中表示:“关于AI算法如何改变患者预后的证据,需要来自随机对照试验中与替代诊断测试的比较。到目前为止,几乎没有任何试验会依据AI算法的诊断决策来观察对患者真正重要的结果,例如及时治疗、出院时间,甚至生存率。”
专家们称赞了这项综述,同时强调需要进一步研究。
伦敦大学学院的弗朗茨·基拉利表示:“我认为,关键点不是‘AI可能和医疗专业人员一样好’,而是‘评估AI性能的一般标准很糟糕’。”
巴比伦医疗(Babylon Healthcare)的尼尔斯·哈默拉表示,该公司声称使用AI技术来提高医疗保健的可负担性和可及性,在AI发挥全部潜力之前,还需要做更多工作。
他说:“机器学习可以对医疗保健中的大大小小问题产生巨大影响,但除非我们能说服临床医生和公众其安全性和能力,否则它对任何人都不会有太大用处。”
根据投资银行摩根士丹利的数据,全球医疗AI市场正在激增,预计从2019年的13亿美元增长到2024年的100亿美元。
世界各地的医院已经利用这项技术,包括伦敦的莫菲尔德眼科医院。
医生可以使用谷歌旗下的英国AI研究机构DeepMind开发的算法,通过光学相干断层扫描(OCT)在约30秒内返回详细诊断。
根据1月份发表的一项研究,AI技术可以通过患者的面部照片准确识别一些罕见的遗传疾病。
这种名为DeepGestalt的AI技术在三次试验中识别多种综合征的表现优于临床医生,并可能为个性化护理增添重要价值。
【全文结束】

