随着AI赋能医疗器械的兴起,FDA正在征求有关AI安全性和有效性考虑的意见和反馈,以应对即将召开的数字健康咨询委员会会议。此次会议将特别关注生成式人工智能(AI)赋能设备在整个产品生命周期中的考虑事项,包括上市前性能评估、风险管理以及上市后性能监测。
当前AI赋能医疗器械的现状
目前,FDA已批准营销和销售约950种AI赋能医疗器械,这一数字还将继续增长。AI赋能医疗器械是指利用AI技术增强患者诊断和治疗的医疗器械,包括通过数据分析和机器学习(ML)算法的应用。
这些AI赋能医疗器械正在改变医学领域,其应用范围从能够解读诊断影像的算法到能够根据持续数据监测自动调整患者治疗的植入式医疗器械。尽管这些设备可以为患者带来显著的好处,但FDA监管机构仍对潜在风险因素表示担忧,如有限的训练数据、偏见、性能指标的差距以及最终用户的错误。
产品生命周期中的透明度和风险演变
早在2021年,FDA与加拿大卫生部和英国药品和保健品监管局(MHRA)合作,制定了良好的机器学习实践(GMLP)指导原则,并强调了透明度的重要性。随着生成式AI的兴起,这些考虑变得更加重要。
例如,AI赋能设备的警告通常涉及诊断和/或开处方的医生,他们不可避免地需要考虑比传统医疗器械更多的不同变量。这不仅仅是提醒物理和/或操作风险的问题,还包括AI算法与用于训练算法的数据集之间的复杂互动。FDA担心最终用户可能不理解AI的局限性及其能力如何受患者情况、设备使用方式以及设备可访问的数据的影响。
一个监管关注点是,AI赋能医疗器械在数据表征方面可能存在某些限制,这意味着某些患者群体可能不适合使用该AI赋能医疗器械。例如,如果AI赋能设备仅使用成人数据开发,则不适用于儿童。然而,制造商在设备开发过程中可能难以识别某些患者群体的代表性不足,如果这种差距未被发现,可能直到商业化后才会显现。
更具有挑战性的是,这些AI系统可以设计为随着时间的推移不断学习,因为设备会吸收新患者的数据。这意味着制造商可能更难预测或测试AI消化更多数据或遇到意外情况时可能出现的风险。鉴于这些潜在风险,FDA可能会要求制造商在整个产品生命周期中不断更新警告。随着FDA即将召开的委员会会议重点关注上市后监测,AI赋能医疗器械制造商应准备应对更严格的FDA上市后监测要求。
平衡AI与临床判断
医疗器械领域的变化还在于制造商进入了一个以前由医疗提供者独自承担的风险区域。在AI赋能医疗器械出现之前,制造商可能会向医疗提供者提供风险标签和说明,有时甚至提供培训,但最终的医疗决策由提供者做出。
现在,AI赋能设备可以提供实时输出,帮助医疗提供者做出决策。最近的一项研究表明,仅ChatGPT-4在诊断多个病例方面的表现就超过了两个医师组,其中一个组使用ChatGPT-4作为资源。尽管这些输出可能非常有益并且可能比人类更准确,但FDA优先考虑向医疗提供者全面透明地传达这些输出的可靠性。
一种用于风险缓解的GMLP是在此类输出中提供置信区间。例如,AI赋能设备可能会以95%的置信度声明心脏移植手术中存在高感染风险。置信区间可以帮助手术团队了解AI建议的可靠性。风险管理是即将召开的咨询委员会会议的另一个考虑事项,因此FDA可能会考虑这些类型的限定词对降低患者风险的重要性。然而,最终制造商和最终用户之间的责任和法律责任分配仍有待观察。
结论
由于AI的特性,FDA继续考虑AI赋能设备的风险和保护措施。随着这一监管环境的发展,医疗器械制造商应密切关注FDA的指导意见和AI的进步,以确保AI赋能医疗器械能够安全有效地优化患者结果,符合监管要求。
(全文结束)

