执行摘要
美国食品药品监督管理局(FDA)的人工智能/机器学习医疗器械追踪器(FDA授权的人工智能/机器学习设备的公开清单)反映了此类技术在监管审查下的快速增长。2010年代初仅有少量基于人工智能的设备存在,但近五年来批准数量急剧上升:例如,FDA在2015年批准了6款人工智能/机器学习设备,而2023年则批准了221款。到2025年年中,累计总数已超过1,200款人工智能/机器学习设备(主要由影像和信号分析领域的批准推动)。这些设备中约75-80%集中于放射学领域;心脏病学约占10%,神经学、血液学和其他专业占其余部分。几乎所有获批的人工智能设备都通过510(k)途径进入市场,反映了对"实质等同性"的依赖而非昂贵的临床试验。
尽管设备数量增长,多项分析警示证据缺口仍然存在。例如,2025年一项研究发现,不到2%的FDA获批人工智能/机器学习设备得到随机临床试验支持,且大多数510(k)摘要缺乏研究设计、样本量和人口统计学细节。仅约5%的人工智能设备收到任何上市后不良事件报告,5-6%曾被召回(主要因软件缺陷)。这些发现凸显了加强全生命周期监管(如FDA新的预定变更控制计划用于算法更新)和提高透明度的必要性。
本报告深入探讨了FDA人工智能/机器学习设备追踪器的历史、现状和未来影响:回顾监管框架,分析授权趋势和统计数据(含表格),研究代表性设备,并讨论未来挑战——所有内容均附有详实参考文献。我们既涵盖行业创新的乐观视角,也探讨安全与伦理的批判性观点。FDA的人工智能/机器学习设备清单已成为关键信号资源,帮助制造商、临床医生和患者理解人工智能如何进入医疗实践,同时指明监管需持续演进的领域。
引言与背景
人工智能(AI)——广义上指模拟人类智能的软件系统——在医学中应用已有数十年,但近期机器学习(ML)和数据可用性的进步加速了其在临床设备中的采用。FDA明确鼓励创新人工智能医疗器械的开发,前提是它们保持"安全有效"。为促进创新与透明度,FDA在2019-2021年推出了精选的人工智能医疗器械清单,公开编目整合人工智能/机器学习的授权设备。该追踪器随每次新批准定期更新,旨在帮助利益相关者(制造商、研究人员、临床医生和患者)了解哪些产品使用人工智能,理解监管期望,并确保获批算法已通过安全性和有效性审查。
历史背景:首个FDA批准的人工智能系统是PAPNET(1995年的巴氏涂片复筛工具),但此后多年寥寥无几。截至2015年,仅有约六款FDA设备使用人工智能。快速增长始于2016年左右:2016-2023年人工智能/机器学习设备授权年均增长率约49%,反映了技术成熟度和监管关注度的提升。截至2023年底,FDA追踪器列出了超过690款设备,预测显示2024年中将达到**~950**款。MedTech Dive证实了这一趋势,报道2023年 alone 新增221款人工智能设备(高于2022年的91款)。因此,人工智能/机器学习已不再是小众技术:这些算法现正协助诊断影像、心电图解读、实验室分析等。
人工智能/机器学习设备的定义:FDA采用宽泛定义:清单上的设备必须将人工智能或机器学习用于"临床护理中一个或多个核心功能",无论是独立软件还是嵌入硬件中。实践中,识别依赖关键词。FDA指出该清单并非全面——它仅包含FDA摘要描述(或分类代码)含人工智能相关术语的产品。对于清单上的每款设备,追踪器提供链接至FDA数据库条目,包含可公开的安全性/有效性摘要等信息(然而,这些摘要常省略详细研究数据)。该清单涵盖早期"辅助"应用(向临床医生标记图像或数据以供复核)和更自主的人工智能工具。为促进未来透明度,FDA已表示计划标记基于现代"基础模型"(如大型语言模型)构建的设备,以便用户了解例如图像阅读器是否使用基于LLM的组件。
监管监督:人工智能/机器学习设备通常属于软件即医疗器械(SaMD)范畴。大多数为II类设备,通过510(k)途径获批,意味着制造商证明了与先例(现有)设备的"实质等同性"。与上市前批准(PMA)不同,510(k)无需新临床试验,使数字工具得以更快进入市场。FDA于2017年成立的数字健康卓越中心帮助建立了评估这些申报的专业知识。2022-2023年,FDA发布了针对人工智能/机器学习设备的新指南——例如,2022年12月的预定变更控制计划(PCCPs)最终指南允许预先授权的算法更新协议。2023年初,FDA发布关于人工智能设备申报内容的草案指南,鼓励制造商包含稳健的性能数据并考虑PCCPs。这些举措反映了FDA在加速创新与患者保护之间取得平衡的努力,认识到人工智能工具可能在其生命周期内演变。
监管框架与FDA人工智能/机器学习设备追踪器
FDA在其现有医疗器械框架下监管人工智能/机器学习软件。实践中,许多人工智能算法被认定为II类(中风险) 并通过510(k)获批:事实上,截至2023年底,约97% 的获批人工智能/机器学习设备使用510(k)(对比De Novo或PMA途径的2-3%)。这与医疗软件的总体趋势一致。FDA的明文要求仅为设备"满足适用的上市前要求",包括有针对性的安全性/有效性审查。例如,FDA公开指出,清单上的设备已通过"对设备整体安全性和有效性的针对性审查,包括对设备预期用途研究适当性的评估"。(然而,FDA决策摘要常缺乏患者结局数据。)
申报量激增。行业调查和FDA报告表明申报量创纪录:例如2022年有91项新批准,2023年有221项。截至2025年7月,FDA器械中心自1995年以来已记录超过1,200款人工智能/机器学习设备。这些产品涵盖多个类别,从"人工智能辅助"影像辅助工具到自动分析报告系统。例如,放射学一直占主导地位:超过75%的FDA人工智能批准涉及影像分析(X光、CT、MRI)。心脏病学(心律失常/心电图分析)和神经学紧随其后。追踪器内容证实了这一点:截至2023年10月,FDA清单上的692款设备中有531款(77%)是放射学工具。按专业划分,2023年授权设备包括心脏病学约71款(10%)、神经学20款(3%)、血液学15款(2%),其余分散在其他领域。
| 专业 | 授权人工智能/机器学习设备(2023年) |
|---|---|
| 放射学 | 531(77%) |
| 心脏病学 | 71(10%) |
| 神经学 | 20(3%) |
| 血液学 | 15(2%) |
| 其他(杂项)* | 55(8%) – 各种(包括病理学、眼科) |
*表1:FDA获批人工智能/机器学习医疗器械按医学专业分布(数据来自FDA清单)。"其他"涵盖所有剩余专业。
这种向影像学的倾斜反映了放射学中数据的可获得性和早期数字化采用。相比之下,眼科或牙科等领域的AI设备极少。在公司方面,大型医疗技术公司引领采用:例如,通用电气医疗集团2023年有58款人工智能设备获授权(高于2022年的42款),西门子40款(对比29款),佳能22款(对比17款),飞利浦20款(对比10款)。这种大型公司主导地位与既有的影像产品组合一致。表2总结了主要公司及年同比增长:
| 公司 | 设备(2022年) | 设备(2023年) | 变化 |
|---|---|---|---|
| 通用电气医疗集团 | 42 | 58 | +16 |
| 西门子医疗 | 29 | 40 | +11 |
| 佳能 | 17 | 22 | +5 |
| 飞利浦医疗 | 10 | 20 | +10 |
| Aidoc(初创公司) | 13 | 19 | +6 |
| 联影医疗 | 6 | 12 | +6 |
| Viz.ai(初创公司) | 6 | 9 | +3 |
表2:选定公司2022年与2023年FDA获批人工智能/机器学习设备数量(来源:Kinahan/华盛顿大学)。
数据趋势与分析
FDA追踪器背后的数据揭示了清晰趋势。FDA人工智能设备批准数量自2016年以来大约每2-3年翻一番或更多。事实上,从2015年的仅6款设备,年度数量增长至2022年的91款,预测显示2024年底总数将达到~1100款。2025年5月,MedTech Dive报道称约950款人工智能/机器学习批准,2025年7月则超过1,200款。FDA本身大约每季度更新一次清单。
几乎所有FDA批准的人工智能设备都是决策支持工具,而非完全自主的诊断工具。它们通常标记图像或数据供临床医生复核。因此,追踪器中的安全信号较为微妙。已发表分析表明,上市前证据通常有限:2025年《美国医学会杂志》(JAMA)对691款设备(截至2023年7月)的研究发现,46.7% 的FDA摘要甚至未描述研究设计,53.3% 省略了样本量。惊人的是,仅6款设备(1.6%)引用了随机临床试验,仅3款设备(<1%)报告了实际患者健康结局。大多数决策摘要关注分析性能(如敏感性/特异性)而非临床效益。简言之,尽管设备数量激增,报告证据的质量仍参差不齐。
上市后数据同样稀缺。Lin等人报告称,仅28.2% 的设备摘要提到了任何安全评估,5.2% 提及批准后的不良事件(主要是故障)。在随访期间,40款设备(占所有人工智能设备的5.8%)曾被召回(总计113次召回行动)——通常因软件缺陷或故障。该数据集中甚至报告了一例与人工智能设备相关的患者死亡。因此,官方追踪器——尽管统计了获批产品——凸显了严格的效益-风险评估和上市后监测仍是待发展领域。FDA自身在指南中承认这一点,鼓励"良好机器学习实践"(GMLP),如代表性训练数据、彻底验证和持续监测。
授权途径统计数据反映了这些现实。截至2023年底,约96-97% 的人工智能/机器学习设备为510(k)批准,利用先例避免新试验。仅2-3%通过De Novo(无先例的新型II类)获批,约0.4%通过PMA(高风险试验)获批。值得注意的是,无先例的新型设备开始出现但依然罕见。(例如,Aidoc的肺部CT算法和IDx-DR视网膜系统最初需要De Novo授权。)总之,追踪器数据表明FDA管道中大量涌入人工智能工具——但也强调大多数依赖于与先前设备的等同性,且未带来新的临床试验证据。
代表性案例研究
为说明人工智能/机器学习如何进入FDA框架,我们重点介绍来自不同领域的几款显著设备:
- IDx-DR(糖尿病视网膜病变筛查):2018年4月,FDA授予IDx的人工智能算法(IDx-DR)De Novo授权,作为首款通过视网膜图像检测糖尿病视网膜病变的自主人工智能。批准基于约900名患者的临床研究;该软件正确识别视网膜病变约90%的时间,假阳性率低。正如IDx创始人所言,"作为同类首个系统……该系统为人工智能在医学中的安全负责任使用提供了路线图"。该设备例证了公司如何展示实际影响:通过使初级保健办公室能够筛查眼疾,IDx-DR旨在将专家级诊断扩展至更广泛人群。
- Caption Guidance(AI超声):Bay Labs(现Caption Health)开发了用于心脏超声的人工智能助手。利用深度学习指导图像采集,Caption Guidance系统通过De Novo(DEN190040,2020年2月)获批,关键试验显示非专家用户能像超声技师一样有效获取心脏图像。这说明了人工智能如何嵌入医疗设备而不仅限于软件:它增强了心脏病学的超声硬件。
- 消费可穿戴设备(心电监测):FDA还批准了用于消费设备的人工智能驱动算法。例如,Apple Watch的"AFib History"功能——分析不规则脉搏数据以通知佩戴者潜在心房颤动——于2022年获得FDA批准,与AliveCor的Kardia Mobile等设备一起。这些算法不提供诊断,但向用户(和临床医生)警示心律失常。FDA清单指出Apple的AFib功能和Aidoc的X光肺部分诊工具是2022年获批设备。
- 心脏声音AI:Eko Devices于2020年1月获得510(k)批准,为其AI增强听诊器软件("Eko Analysis Software")分析心脏声音以检测杂音和心房颤动。这代表了AI在床边的应用:Eko设备收集音频数据并使用机器学习标记异常心律,将此技术扩展至听诊而不仅限于影像。
- MRI和CT影像(放射学AI):行业领导者已推出多种此类工具。例如,飞利浦的"MRCAT脑部"——基于人工智能的脑部MRI工具——于2020年1月获得FDA批准。同样,通用电气、佳能和西门子等公司每年例行批准数十款用于CT/MRI机器的AI模块(降噪、病灶检测等),这从它们的高设备数量中可见一斑。
这些案例示例展示了"现实世界"中人工智能医疗工具的光谱。它们从专业影像分析应用到面向患者的监测器不等。在所有案例中,共同点是证明了安全性/有效性(通常对照专家复核)并满足特定临床需求(筛查、分诊、记录)。值得注意的是,迄今为止FDA批准的设备均不依赖现代生成式AI或大型语言模型(LLM)。当前人工智能设备使用在医疗数据上训练的窄域机器学习算法。FDA和行业正关注大型模型的发展:该机构计划标记任何未来嵌入基础模型技术的设备,但目前临床设备尚未触及这一前沿。
讨论:影响与未来方向
FDA人工智能/机器学习追踪器的快速增长既反映了创新机遇也带来了监管挑战。透明度与信任:通过公开人工智能/机器学习设备清单,FDA表明了其对开放的承诺。临床医生和患者可查看产品何时使用人工智能并查找安全性摘要链接。然而,研究表明实际效益-风险信息常报告不佳。例如,近期审计发现支撑获批设备的已发表证据极其有限。重要启示是FDA(和开发者)必须改进标准化报告。呼声要求建立类似于药物使用的上市后监测系统。值得注意的是,Lin等人总结道,鉴于当前证据缺口,"需要专门的监管途径和上市后监测"。FDA正开始应对:新草案指南(2024-2025年)强调自适应人工智能的性能指标和持续监测,而FDA最近的健康IT战略(2023年)提议使用真实世界性能数据和登记系统进行监督。
预定变更控制计划(PCCPs):主要应对措施是PCCPs,FDA引入它来管理人工智能的迭代特性。在此框架下,制造商提前指定人工智能算法将如何更新和监测,可能避免全面重新申报。PCCP试点申报已在进行中。这一转变标志着监管的成熟——从静态上市前审查转向学习算法的全生命周期管理。
全球与伦理背景:FDA的方法处于更广泛的国际环境中。在欧盟,即将出台的人工智能法案(和医疗器械法规)将把许多人AI工具归类为"高风险",要求严格的证据和合规性。在美国,政策重点(如拜登总统的人工智能行政令,后被新政府撤销)凸显了创新与安全之间的紧张关系。伦理学家指出对人工智能自主性和偏见的担忧:例如,Arnold(2021年)认为医疗保健中的人工智能带来"自由意志家长式作风"问题,挑战传统自主性,需要医生积极参与讨论。确实,数据隐私、算法公平性和可解释性现已成为焦点。未来设备追踪可能需要包括元数据(如人口统计学性能)以确保公平性。
市场与报销:从行业角度看,人工智能设备代表一个庞大且不断增长的市场。分析师预测其价值达数十亿美元(一家公司预测2024年为137亿美元,2033年达2550亿美元)。然而,有意义的临床采用取决于报销。目前,针对人工智能诊断的特定保险支付代码极少。国会和医疗保险和医疗补助服务中心(CMS)正在探索算法护理的新支付途径。医院也在组建人工智能监督委员会,正如专家所建议。为取得成功,人工智能设备制造商不仅需通过FDA审批,还必须证明成本效益并与电子健康记录(EHRs)整合。
案例研究——生成式AI前景:另一个未来关注点是生成式AI。ChatGPT风格的工具可解读和生成医疗文本或影像。虽然目前尚无FDA批准用于临床使用的生成式AI设备,但它们已迫在眉睫。FDA认识到这一点:其追踪器页面明确提及计划标记使用基础模型(LLMs,生成式系统)的设备。我们预计未来更新可能显示包含生成式算法的设备条目(例如基于语言的诊断助手)。此类设备将介于医疗器械与通用人工智能之间。FDA将如何评估这些——根据医疗器械法律还是新的人工智能特定规则——仍有待观察。
持续监测与适应:总之,FDA人工智能/机器学习追踪器展示了一个动态格局。其内容(800-1200款设备,视来源而定)突显影像学目前是人工智能设备的"#1领域",但近期数据显示心脏病学、神经学等领域正在增长。追踪器还揭示了缺乏稳健临床证据的设备激增,凸显了加强治理的必要性。未来,FDA可能会通过关于证据和监测的指南、PCCPs和新的基于性能的要求来完善其方法,同时继续更新清单。利益相关者应关注监管机构如何标记新兴技术(如基于LLM的设备)并适应政策变化(如更新的软件指南)。
结论
FDA医疗器械人工智能/机器学习追踪器概括了美国监管下人工智能设备创新的现状。它表明人工智能在医疗技术中已不再是新奇事物,而是主流工具,数百款获批设备现正协助各专业领域的诊断和工作流程。追踪器的透明度很有价值:通过汇总设备名称、批准日期和赞助商,它提供了丰富的数据分析资源。由此分析得出若干经验。首先,人工智能采用正在加速——四分之三的新条目涉及影像学——但临床试验证据的步伐未能跟上。其次,当前监管严重依赖既有途径(510(k)),但正朝着全生命周期监督(PCCPs)演进以匹配人工智能的适应性。第三,伦理和安全专家警告,透明报告和稳健监测仍落后于炒作。
随着医院和患者越来越多地接触人工智能驱动工具,了解FDA的人工智能/机器学习追踪器至关重要。它不仅列出获批产品,还标示更广泛趋势:监管机构在何处施加审查以及何处存在缺口。持续研究——如本报告——必须监测这一演变格局。未来的监管更新(例如针对基于LLM设备的特殊通知、更强有力的性能指南)将反映在追踪器中。利益相关者应将此资源既用作已使用人工智能的快照,也用作指南,指向需要更强证据和治理以确保这些有前景技术真正惠及患者护理的领域。
【全文结束】

