美国食品药品监督管理局(FDA)批准的近一半人工智能医疗设备并未基于真实患者数据进行训练,一项新研究显示。
发表在《自然医学》杂志上的该研究发现,在FDA授权的521款设备中,有226款缺乏已发表的临床验证数据。
“尽管人工智能设备制造商以获得FDA授权来标榜其技术的可信度,但授权批准并不意味着这些设备已通过真实患者数据对临床有效性进行充分评估,”美国北卡罗来纳大学医学博士候选人、主要作者萨米·丘法尼·埃尔法西(Sammy Chouffani El Fassi)表示。
“基于这些发现,我们希望鼓励FDA和行业通过开展临床验证研究并公开结果,提升设备授权的可信度。”
近年来,人工智能工具在医学领域迅速普及,尤其在诊断和预后方面。研究人员已运用机器学习工具辅助诊断和预测包括子宫内膜异位症、肺癌与前列腺癌、眩晕及罕见疾病在内的多种病症。通常,这些工具是经患者数据集训练的机器学习程序,使其算法能在新问题出现时提供解决方案。
本研究中,美国研究团队审查了FDA官方“人工智能与机器学习(AI/ML)赋能医疗设备”数据库。“通过分析数据库中数百款设备,我们旨在厘清人工智能医疗设备获得FDA授权的真实含义,”北卡罗来纳大学社会医学系研究员盖尔·亨德森(Gail Henderson)教授表示。
在数据库收录的521款设备中,仅22款采用“金标准”——随机对照试验进行验证,而43%(226款)完全没有已发表的临床验证数据。部分设备使用了“模拟图像”——即非来自真实患者的计算机生成图像。其余设备则采用回顾性或前瞻性验证——分别基于历史患者数据或实时患者数据进行测试。
“我们已将研究结果分享给负责医疗器械监管的FDA官员,预计这项工作将为他们的监管决策提供参考,”丘法尼·埃尔法西表示。“我们也希望本研究能激励全球研究人员和大学开展医疗人工智能的临床验证研究,以提升这些技术的安全性和有效性。我们期待该项目将对大规模患者护理产生积极影响。”
在澳大利亚,治疗用品管理局(TGA)要求使用人工智能的软件提供其训练数据信息,并说明“该数据为何适用于预期使用该人工智能的澳大利亚人群及亚群”。人工智能医疗设备还须满足更普遍的临床证据指南。
【全文结束】

