人工智能医疗设备早期召回与临床验证缺口
Ritika Chanda,理学士⁴;Crystal Favorito,理学士²;Olivia Nasef,理学士²;Joseph S. Ross,医学博士,公共卫生硕士⁵’⁶;Joshua Sharfstein,医学博士³;Tinglong Dai,哲学博士⁷’⁸
- ⁴乔治城大学医学院,华盛顿特区
- ⁵耶鲁大学医学院内科,纽黑文,康涅狄格州
- ⁷约翰斯·霍普金斯大学凯瑞商学院,马里兰州巴尔的摩
引言
人工智能医疗设备(AIMD)在美国临床实践中日益普及,其中几乎全部通过FDA 510(k)途径获批。由于510(k)审批不要求前瞻性人体试验,许多AIMD在缺乏充分临床验证的情况下上市;同时召回事件可能削弱临床医生和患者对其性能的信心。本研究探讨临床验证缺失和上市公司属性是否与AIMD召回风险相关。
方法
本横断面研究将所有FDA认证的AIMD¹与2024年11月15日至30日美国设备与放射健康中心数据库中的召回记录进行匹配。每组召回编号-设备配对计为1个事件;单个设备可能贡献多个事件。验证状态根据FDA摘要分为无验证、回顾性数据集验证或前瞻性试验验证。AIMD商业化模式通过标普资本IQ NetAdvantage和PrivCo数据库确定。制造商归因的召回原因分为诊断/测量误差、功能延迟/丧失、物理危害、生化危害和上市后变更。遵循STROBE报告指南。
采用Kaplan-Meier分析估算无召回生存率;组间差异通过对数秩检验评估。多元逻辑回归模型(GraphPad Prism 10;双侧α=0.05)分析任何召回的几率,调整验证状态、制造商类型、获批年份(2020-2024年 vs 早期)及临床专科因素。由于研究使用公开数据,根据《通用规则》(美国45 CFR 46)无需机构审查委员会审查或知情同意。
结果
在950个AIMD中,60个(6.3%)关联182起召回事件(平均每设备3.0±4.3次召回)(图1A)。诊断/测量误差导致109次召回(涉及935,063件产品),其次为功能延迟(44次召回,755,647件)、物理危害(14次召回,8,192件)和生化危害(13次召回,76,257件)。43.4%的召回(79起)发生在设备获批后12个月内,约为所有510(k)设备召回率的两倍⁴。值得注意的是,108次召回(59.3%)至研究截止日仍未解决,其中20次持续超过3年。总体无召回生存率在1年时为96.6%,3年时93.5%,5年时91.8%(图1C)。
无临床验证设备的召回次数显著高于回顾性验证(1.9±1.5次)或前瞻性验证设备(2.0±1.4次)(每设备平均3.4±5.1次召回);且单次召回涉及设备数量更大(12,193±82,405件 vs 6,523±18,690件;P<0.001)。上市公司虽仅占AIMD的53.2%,却导致91.8%的召回和98.7%的召回产品数量(图2A)。私人公司召回设备中40%缺乏临床验证,而成熟上市公司该比例达77.7%,小型上市公司更高达96.9%(图2B)。多元分析显示,缺乏临床验证(优势比[OR]=2.8;95%CI 1.6-4.7)和上市公司属性(OR=5.9;95%CI 2.4-14.6)均独立关联召回风险。
讨论
本研究发现FDA认证的AIMD召回虽罕见,但集中于获批初期,且主要涉及缺乏临床验证的产品及上市公司制造设备,提示510(k)流程可能遗漏AI技术早期性能缺陷。要求前瞻性评估或采用需确认数据支持的限时审批,可能降低此类风险。鉴于召回产品中90%以上由上市公司生产,加强上市前临床测试要求和上市后监测措施或可改进设备错误识别与减少,类似药物警戒的风险分级策略。上市公司与高召回率的关联可能反映投资者驱动的快速上市压力,值得进一步研究。
研究局限包括依赖公开验证报告、未纳入未标记为召回的软件更新,以及2022年后获批设备的随访有限。尽管如此,将上市前证据缺口与制造商类型关联上市后行动,为监管机构、临床医生和医疗系统采用AI工具提供了实用指导。
【全文结束】

