医疗器械制造商一直在竞相将人工智能技术添加到其产品中。尽管支持者称这项新技术将彻底改变医学,但监管机构收到的患者受伤索赔报告却在不断增加。
2021年,医疗巨头强生公司(Johnson & Johnson)旗下一个部门宣布"重大突破":已将人工智能添加到用于治疗慢性鼻窦炎(鼻窦炎症)的医疗设备中。Acclarent公司表示,其TruDi导航系统(TruDi Navigation System)的软件现在将使用机器学习算法,协助耳鼻喉专科医生进行手术。
该设备已在市场上销售约三年。在此前,美国食品药品监督管理局(FDA)收到未经证实的报告称,该设备出现七次故障及一起患者受伤事件。自该设备添加AI功能后,FDA已收到至少100起故障和不良事件的未证实报告。
根据报告,2021年底至2025年11月期间,至少有10人受伤。大多数据称涉及TruDi导航系统在手术过程中向外科医生错误报告其器械位置的错误,当时医生正在患者头部内操作。据报告,一名患者的脑脊液从鼻腔泄漏。在另一起报告案例中,一名外科医生误穿了患者颅底。在另外两起案例中,患者在主要动脉意外受伤后据称均出现中风。
FDA的设备报告可能不完整,且不用于确定医疗事故的原因,因此尚不清楚AI在这些事件中可能扮演了什么角色。两名中风受害者分别在德克萨斯州提起诉讼,称TruDi系统的AI导致了他们的伤害。其中一起诉讼称:"在将软件修改以整合人工智能之前,该产品 arguably(可以说)比修改后更安全。"
路透社无法独立核实这些诉讼的指控。
当被问及TruDi设备的FDA报告时,强生公司让问题转给2024年收购Acclarent和TruDi导航系统的Integra LifeSciences公司。Integra LifeSciences表示,这些报告"仅表明在发生不良事件的手术中使用了TruDi系统",并补充称"没有任何可信证据表明TruDi导航系统、AI技术与任何所谓伤害之间存在因果关系。"
Acclarent在LinkedIn上发布的视频展示了其TruDi导航系统中的一项AI功能。名为TruPath的功能向外科医生显示"两点之间最短的有效路径"。(截图来源:路透社)
这些事件的洞察正值AI开始变革医疗保健领域之际。支持者预测,这项新技术将帮助找到罕见疾病的治疗方法、发现新药物、提高外科医生的技能并赋能患者。但路透社对安全和法律记录的审查,以及对医生、护士、科学家和监管机构的采访,记录了设备制造商、科技巨头和软件开发商竞相推出AI技术时,医学中AI的一些风险。
目前FDA已授权至少1,357种使用AI的医疗设备——是2022年之前授权数量的两倍。TruDi系统并非唯一受到质疑的设备:FDA已收到涉及数十种其他AI增强设备的报告,包括一款据称忽视异常心跳的心脏监测仪和一款据称误认胎儿身体部位的超声设备。
约翰霍普金斯大学、乔治城大学和耶鲁大学的研究人员最近发现,FDA授权的60种使用AI的医疗设备与182起产品召回相关,根据8月发表在《JAMA Health Forum》上的研究信函。他们的审查显示,43%的召回发生在设备获批后不到一年内。审查指出,这大约是根据类似FDA规则授权的所有设备召回率的两倍。
五位现任和前任机构科学家告诉路透社,AI热潮给FDA带来了问题:该机构在流失关键员工后,难以跟上寻求批准的AI增强医疗设备的洪流。包括FDA在内的美国卫生与公众服务部(HHS)发言人表示,该部门正寻求增强在此领域的能力。
人工智能的另一种形式——生成式AI聊天机器人——也正在进入医学领域。许多医生现在使用AI来节省时间,例如转录患者笔记。但医生们也表示,许多患者使用聊天机器人进行自我诊断或质疑专业建议,带来了新的挑战和风险。(参见相关报道)
约三年前ChatGPT发布后,人工智能成为商业和社会热点。ChatGPT和其他流行的聊天机器人,如谷歌的Gemini和Anthropic的Claude,使用所谓的生成式AI来创建内容。它们建立在大型语言模型(LLMs)之上,这些模型通过训练大量文本和其他数据来理解和生成人类语言。这些AI工具现在正被引入消费者医疗应用程序等医疗领域。
然而,AI涵盖的范围远不止LLMs,而且该技术在AI机器人出现之前很久就已进入医学领域。该领域的历史可追溯70多年:一个关键时刻是1950年英国数学家艾伦·图灵(Alan Turing)在一篇论文中提问:"机器能思考吗?"
FDA于1995年授权了首批AI增强医疗设备——两个使用模式匹配软件筛查宫颈癌的系统。如今医疗设备中使用的AI类型通常被称为机器学习,以及称为深度学习的子集,它们通过数据训练来执行特定任务。例如,在放射学中,该技术用于增强和分析医学图像。它可以通过识别医生可能忽略的肿瘤来帮助诊断癌症。
此类系统也用于手术设备。2022年6月,一名外科医生在德克萨斯州沃思堡的一家医院将一个小气球插入埃琳·拉尔夫(Erin Ralph)的鼻窦腔。据拉尔夫提起的诉讼称,Marc Dean医生当时正在使用TruDi导航系统(该系统使用AI)来确认其器械在她头部内的位置。
这种称为球囊扩张术(sinuplasty)的手术是一种治疗慢性鼻窦炎的微创技术。气球膨胀以扩大鼻窦腔开口,从而改善引流并减轻炎症。
但据拉尔夫在达拉斯县地区法院对Acclarent和其他被告提起的诉讼称,TruDi系统"误导并错误引导"了Dean。据称,供应大脑、面部和颈部血液的颈动脉受伤,导致血栓形成。据法庭文件称,拉尔夫的律师告诉法官,Dean自己的记录显示他"根本不知道自己离颈动脉有多近"。路透社无法查阅受司法保护令约束的记录。
拉尔夫离开医院后,显然她已中风。这位四个孩子的母亲返回医院并在重症监护室度过了五天,根据为支持她康复而组织的GoFundMe筹款活动。GoFundMe呼吁称,她的一部分颅骨被移除"以让她的大脑有肿胀的空间。"
"我仍在康复治疗中,"拉尔夫在一年多后在一篇关于中风患者的博客中接受采访时表示。"没有支架很难行走,重新恢复左臂功能也很困难。"
2023年5月,Dean在另一次球囊扩张手术中使用TruDi时,患者Donna Fernihough的颈动脉据称"爆裂"。据Fernihough在沃思堡美国地区法院对Acclarent和几家制造商提起的诉讼称,血液"四处喷溅"——甚至溅到正在观察手术的Acclarent代表身上。Fernihough的一条颈动脉受损。据她的诉讼称,她在手术当天就中风了。
诉讼称,Acclarent"知道或应该知道,所谓的人工智能导致或加剧了集成导航系统产品不一致、不准确和不可靠的倾向。"
根据法庭文件,Acclarent否认了这两起仍在进行中的诉讼中的指控。该公司称,它没有设计或制造TruDi系统,只是分销该系统。Acclarent的所有者Integra LifeSciences告诉路透社,没有证据表明AI技术与任何所谓伤害之间存在联系。
根据联邦数据库Open Payments(该数据库追踪公司与医生之间的财务关系),Dean自2014年开始为Acclarent提供咨询,并通过2024年从该公司获得了超过55万美元的咨询费。其中至少13.5万美元与TruDi系统相关。
Dean的律师表示,由于患者隐私和正在进行的诉讼,医生无法置评。Integra表示,Dean不再是TruDi顾问,且在其收购Acclarent后向他支付的款项是用于餐饮。
Fernihough的诉讼称,2021年,当时Acclarent的总裁Jeff Hopkins正推动将AI添加到TruDi中,"作为一种营销工具",声称该设备"拥有新颖技术"。
根据Acclarent在LinkedIn上的一篇帖子,TruDi软件使用机器学习来识别患者解剖结构的特定部分,并计算"医生指定的两点之间最短的有效路径"。该技术旨在简化手术规划,并在鼻窦手术等手术过程中提供实时反馈。
Fernihough的诉讼称,Acclarent官员曾就添加AI的计划与Dean接洽。诉讼称,这位外科医生警告Hopkins和Acclarent"存在需要解决的问题"。尽管有此警告,诉讼称Acclarent"降低了安全标准,匆忙将新技术推向市场",并设定"在将新技术整合到TruDi导航系统之前,该新技术的准确性目标仅为80%。"
路透社无法确定Dean是否发出了警告。记者无法查阅受司法保护令约束的Fernihough索赔的支持材料。
Hopkins,这位前Acclarent总裁,未回应置评请求。
"错误身体部位"
FDA警告称,不良事件和设备故障报告有限:它们通常缺乏细节,为保护商业秘密而被编辑,且不能单独用于归咎责任。该机构有时也会收到针对单一事件的多份报告。
路透社发现,2021年至2025年10月期间提交给FDA的至少1,401份报告涉及FDA列出的1,357种使用AI的产品清单上的医疗设备。该机构表示该清单并不全面。在这些报告中,至少115份提到了软件、算法或编程问题。
2025年6月的一份FDA报告称,用于产前超声的AI软件误认了胎儿身体部位。名为Sonio Detect的软件使用机器学习技术帮助分析胎儿图像。
"Sonio detect软件AI算法有缺陷,错误标记胎儿结构并将其与错误的身体部位关联,"该报告称,但未说明任何患者受到伤害。Sonio Detect归三星电子(Samsung Electronics)旗下Samsung Medison所有。Samsung Medison表示,关于Sonio Detect的FDA报告"并未表明存在任何安全问题,FDA也未要求Sonio采取任何行动。"
HHS发言人未回应有关Sonio Detect的问题。
Sonio detect软件AI算法有缺陷,错误标记胎儿结构并将其与错误的身体部位关联。
2022年6月提交给FDA的报告
至少16份报告称,医疗设备巨头美敦力(Medtronic)生产的AI辅助心脏监测仪未能识别异常心律或停顿。这些报告均未提及伤害。美敦力告诉FDA,其中一些事件是由"用户混淆"引起的。
美敦力LINQ系列植入式心脏监测仪中的AI算法被描述为"深度学习人工智能"。根据公司网站,它们大大减少了假警报并保留了真实的心脏事件警报。但该公司也在其网站和产品文献中表示,其AI技术AccuRhythm AI可能会将实际异常心律或停顿错误分类。
美敦力告诉路透社,它审查了全部16起事件,得出结论认为其设备仅错过了一次异常心律事件。"这些报告均未导致患者受到伤害,"该公司表示。美敦力称,其中一些事件与数据显示问题有关,而非AI技术。该公司拒绝充分解释每起事件中出了什么问题。
HHS发言人表示,该机构不讨论可能或正在进行的合规事项。
特朗普政府时期的FDA削减
在采访中,五位审查AI驱动医疗设备的现任和前任FDA科学家告诉路透社,联邦监管机构现在更难以应对大量新的此类设备。
大约四年前,FDA扩大了专门研究AI的科学家队伍,特别是用于审查使用该技术的医学影像和放射学设备。许多新员工被安排在影像、诊断和软件可靠性部门(DIDSR)。三位现任和前任FDA员工告诉路透社,该部门成为该机构评估医学中AI安全性的关键资源。去年年初,该部门发展到约40人。
"一些高级监管者根本不知道这些技术如何工作,"一位前员工说。"我们与高级监管者密切合作,向他们解释为什么我们认为这项技术在市场上使用是安全或不安全的。"
吸引顶尖人才加入政府服务并不容易。招聘计算机科学家通常需要说服他们放弃私营部门更高的薪酬。
在工作中,科学家们试图"破坏"设备的AI模型,一位前员工说。他们会测试设备算法在各种临床情况下的表现,并检查AI性能是否会随时间下降。FDA官员在10月发表的一篇论文中写道,他们还试图将"幻觉"(即AI模型有时生成虚假信息)降至最低。
但去年年初,作为埃隆·马斯克(Elon Musk)的成本削减运动——政府效率部(Department of Government Efficiency, DOGE)的一部分,特朗普政府开始解散AI团队。FDA内部人士称,DIDSR部门的40名AI科学家中约有15人被解雇或选择离开。另一个制定使用AI的设备政策的部门——数字健康卓越中心(Digital Health Center of Excellence)——失去了约三分之一的约30名员工。
HHS发言人Andrew Nixon表示,FDA对由机器学习和其他AI辅助的医疗设备应用与对任何产品相同的严格标准。
"患者安全是FDA的最高优先事项,并处于我们保护和促进公共健康的首要位置,"Nixon说。"FDA看到数字健康领域的巨大前景,"包括启用AI和机器学习的设备,"有助于诊断和治疗各种疾病。"他表示,FDA继续招聘和培养在数字健康、人工智能和其他新兴技术方面具有专业知识的人才。
两位前员工表示,自裁员以来,一些设备审查员的工作量几乎翻了一番。"如果你没有资源,事情更可能被遗漏,"去年离职的一位前设备审查员说。
FDA要求对新药进行临床试验,但医疗设备面临不同的筛查。根据FDA规则,大多数上市的AI设备不需要在患者身上进行测试。华盛顿大学圣路易斯医学院讲师、医疗设备监管专家Alexander Everhart博士说,制造商通过引用先前授权的没有AI功能的设备来满足FDA规则。
将新设备定位为现有设备的更新是一种长期做法,但Everhart表示,AI为现状带来了新的不确定性。
"我认为FDA监管医疗设备的传统方法不足以确保AI技术安全有效,"Everhart告诉路透社。"我们依赖制造商做好工作推出产品。我不知道FDA现有的措施是否代表了有意义的保障。"
【全文结束】

