一项新研究表明,视网膜图像可能有助于标记糖尿病、高血压、痛风、骨质疏松症、甲状腺疾病和高胆固醇,但研究人员警告说,更广泛的临床应用将需要更大规模的试验和更有力的患者获益证据。
研究:通过视网膜成像进行多疾病检测的AI框架。图片来源:spaxiax / Shutterstock
在最近发表在《自然医学》杂志上的一项研究中,研究人员开发了一种基于视网膜成像的多疾病检测框架。
视网膜成像和眼组学背景
全球范围内代谢和内分泌疾病的上升对医疗系统构成了重大挑战,凸显了早期检测方法的必要性。目前的筛查方法主要依赖于血液生物标志物,其采集涉及患者不适、高成本和后勤挑战,限制了频繁纵向筛查的可行性。
眼组学(oculomics),即利用眼部成像和人工智能(AI)进行全身健康监测,在识别临床前期心血管、神经退行性和肾脏疾病方面已显示出前景。然而,眼组学研究依赖于高质量图像,并且在很大程度上局限于单一疾病框架,这些限制可能是近期的医学基础模型可以解决的。
Reti-Pioneer框架和研究设计
在本研究中,研究人员引入了Reti-Pioneer,一种基于视网膜成像的多疾病检测多任务框架。首先,研究人员整理了一个彩色眼底照片(CFPs)的多模态数据集,包括来自英国生物银行(UKB)和中国医院登记处的107,730张CFPs,涉及53,000多名个体。开发了一个多模态学习模型,将不同质量的CFPs与结构化临床元数据相结合。
此外,该架构采用了一系列大型预训练视觉基础模型,如RETFound、Swin Transformer和Vision Mamba,以利用它们的能力。在内部数据集中,Reti-Pioneer显示对痛风和2型糖尿病(T2DM)的受试者工作特征曲线下面积(AUROC)为0.83,骨质疏松症为0.79,高脂血症和高血压为0.74,甲状腺疾病为0.7。
Reti-Pioneer在不同队列中的表现
Reti-Pioneer还在代表资源有限和高资源环境的中国数据集上进行了外部测试。在一个来自医疗资源有限地区的数据集中,Reti-Pioneer显示出中等至较强的区分能力,骨质疏松症的AUROC为0.9,甲状腺疾病和T2DM为0.82,高血压为0.81,痛风为0.73,高脂血症为0.63。在结合高低资源环境数据集的分析中,该模型保持了稳健的性能。
此外,Reti-Pioneer在一个多民族新加坡队列中得到验证,对T2DM的AUROC为0.69,高血压为0.75,高脂血症为0.62。按种族分层的分析产生了持续一致的AUROC值;对于高血压,印度人、中国人和马来人的AUROC分别为0.73、0.75和0.77。
T2DM的相应AUROC值分别为0.65、0.67和0.69;这些数据表明该技术在不同种族群体中表现基本一致,尽管作者指出需要进一步工作来提高代表性和泛化能力。
接下来,研究人员在UKB的一个保留子集中评估了Reti-Pioneer,以检查其对六种疾病在五年和十年间隔内的预测性能。
在对15,704名无预先存在疾病的参与者进行的这项分析中,Reti-Pioneer对五年和十年新发T2DM的AUROC分别为0.76和0.74。高血压和高脂血症的相应AUROC分别为0.76和0.72,以及0.75和0.74。
作者指出,长期预测比横断面筛查更具挑战性,未来研究应使用正式的事件发生时间方法。
Reti-Pioneer的临床验证和实际应用
此外,Reti-Pioneer的诊断性能与视网膜专家进行了比较。专家们解释了每种疾病200名患者的CFPs,并在一周或两周后在Reti-Pioneer的辅助下重新评估相同的图像。在Reti-Pioneer辅助下,视网膜专家对T2DM的平均准确率为88%,甲状腺疾病为70%,痛风为79%,而未辅助时分别为71%、63%和51%。
接下来,在初级保健环境中进行了前瞻性静默试验。实时从护理点获取眼底图像,立即用Reti-Pioneer进行测试。这种工作流程显示了更高的吞吐效率,从图像获取到报告生成的时间明显短于体格检查或实验室报告。
最后,在体检和社区健康中心对606名参与者进行了前瞻性真实世界研究。
所有接受体检的参与者都接受了Reti-Pioneer测试。Reti-Pioneer分析了参与者的视网膜图像和临床元数据。对于T2DM,它显示出比芬兰糖尿病风险评分更强的区分能力(AUROC:0.78)。高血压、高脂血症、痛风、骨质疏松症和甲状腺疾病的AUROC分别为0.84、0.7、0.8、0.88和0.65。
临床医生和参与者完成的满意度调查显示Reti-Pioneer具有高可用性和接受度。具体来说,80%的参与者在各个评估领域都非常满意。此外,52%表示愿意付费,而4.9%不愿意。
临床医生评估了部署因素,并确定患者接受度、监管问题和系统集成是最重要的考虑因素,同时在所有决策支持维度上评分都很高。
作者还通过将视网膜潜在特征与疾病相关血浆蛋白质特征相关联来探索生物学可解释性,尽管遗传风险关联有限。显著性图用于突出与模型预测相关的视网膜区域。
视网膜AI筛查的意义
总之,该研究开发了一种基于视网膜成像的框架Reti-Pioneer,用于检测和预测六种代谢和内分泌疾病。
Reti-Pioneer展示了整体中等至较强的区分性能,因疾病和队列而异,在不同数据集、种族和资源环境中表现一致。它还展示了有希望但仍是初步的能力来分层未来疾病风险。然而,作者警告说,其当前的诊断和预测准确性仍低于广泛临床采用所需的阈值,需要更大规模、多中心、随机研究来测试患者层面的获益和真实世界临床影响。
总体而言,Reti-Pioneer可能提供一条从眼组学到可操作临床筛查的低成本、可扩展和可转化的途径。
期刊参考:
Zhang X, Li Q, Liang Y, et al. (2026). AI框架通过视网膜成像进行多疾病检测。《自然医学》。DOI: 10.1038/s41591-026-04359-w
【全文结束】

