研究人员已开发出一种测试平台,用于确定商业AI算法是否适合在英国国家医疗服务体系中公平检测疾病,首次以糖尿病性眼病作为验证案例。
发表于2025年11月24日《柳叶刀数字健康》的研究表明,该平台消除了企业部署临床AI软件时可能产生的商业偏见,使各公司处于公平竞争环境。该平台通过识别眼底血管损伤迹象,用于比较旨在检测糖尿病性眼病的商业AI算法。
伦敦大学城市圣乔治学院健康与医学科学院的Alicja Rudnicka教授(共同主导该研究)表示:"我们开创性的平台实现了全球首个公平、公正且透明的AI系统评估,用于检测威胁视力的糖尿病性眼病。这种AI审查深度远超人类表现评估标准。我们通过海量数据集证明这些AI系统适用于NHS,最重要的是,它们在不同种族和年龄群体中均表现优异。"
该研究由莫菲尔兹眼科医院NHS基金会信托的Adnan Tufail主导,与金斯顿大学及霍默顿医疗NHS信托合作完成。研究团队建立了独立研究人员的可信研究环境,邀请25家持有CE认证算法的企业参与,其中8家接受评估。八种算法的性能与遵循NHS标准协议的三名人工分析结果进行比对。企业算法无法访问人工分级数据,且公司被排除在图像分析的"安全数据区"之外。
研究共评估202,886次筛查就诊,涵盖120万张图像,其中32%来自白人群体、17%来自黑人群体、39%来自南亚裔群体。AI系统分析每位患者的全部图像耗时240毫秒至45秒,而训练有素的人工需20分钟。AI算法识别需临床干预的糖尿病性眼病准确率达83.7%-98.7%;中重度眼病准确率为96.7%-99.8%;最严重的增殖性威胁视力眼病准确率达95.8%-99.5%。相较之下,人工手动分级的准确率仅为75%-98%,证明AI算法在极短时间内达到甚至超越人类水平。
参与研究的金斯顿大学Sarah Barman教授表示:"这项大规模评估揭示了不同算法在人口亚群中的表现差异,同时提供了可应用于其他医疗领域的清晰方法,确保AI对所有人公平有效。"
与此同时,2024年11月英国国家医疗服务体系宣布计划在社区为糖尿病患者提供高级眼部扫描,预计每年可减少12万个医院预约量。
【全文结束】

