监管机构批准的眼科AI模型在临床表现证据和训练数据透明度方面存在显著差异。伦敦大学学院(UCL)与摩菲尔兹眼科医院主导的研究显示,68%的设备未提供经同行评审的准确性或疗效数据,仅52%研究报告患者年龄信息,51%记录性别数据,21%披露种族信息。
这项发表于《npj数字医学》的研究分析了欧洲、澳大利亚和美国批准的36款"作为医疗设备的人工智能"(AIaMD)工具,发现仅22%设备获得澳大利亚批准,8%获得美国授权,而97%通过欧盟认证,凸显监管标准的全球不均衡。研究特别指出:
- 81%设备依赖档案图像集验证,人口多样性不足且地理分布不均
- 仅22%设备与医生标准诊疗方案进行对照测试
- 81%设备聚焦糖尿病视网膜病变筛查,对其他致盲性眼病关注不足
- 仅8%研究开展真实世界干预实验,缺乏临床疗效直接证据
UCL眼科研究所首席作者Ariel Ong博士强调:"AI有潜力弥补全球眼科医疗资源缺口,但必须建立与药物检测同等标准的证据体系。需提升数据透明度,确保训练数据的可发现性(Findability)、可访问性(Accessibility)、互操作性(Interoperability)和可重用性(Reusability)"。
伯明翰大学资深作者Jeffry Hogg指出:"当前AIaMD有效性评估证据质量参差不齐,训练数据的代表性不足可能导致算法偏见。建议制造商采用标准化报告体系,如分阶段发布'模型卡片',监管机构应建立更统一的证据报告框架"。
研究团队建议采用欧盟AI法案等新监管标准,提升数据多样性和真实世界测试要求。研究通讯作者来自伦敦大学学院、摩菲尔兹眼科医院NHS基金会信托和伯明翰大学,相关成果已发表于《npj数字医学》第8卷第323期(DOI:10.1038/s41746-025-01726-8)。
【全文结束】

