机器学习模型在预测结直肠癌(CRC)和晚期息肉方面展现出潜力,但在常规临床实践中的应用仍需进一步验证和标准化。
粪便免疫化学检测(FIT)是一种非侵入性方法,用于识别可能受益于结直肠癌和晚期息肉(ACP)筛查的患者。然而,基于人工智能(AI)的模型可能是另一种识别结直肠癌和晚期息肉高风险患者的方式。
为研究机器学习(ML)模型在结肠镜检查前预测结直肠癌和晚期息肉的潜力,研究人员进行了系统综述和荟萃分析。调查人员搜索了截至2024年4月的相关研究,这些研究开发或验证了基于ML的工具、评分或算法,以预测结直肠癌和/或晚期息肉的风险。
这项分析共纳入14项研究,涉及超过50万名患者的数据。研究设计包括回顾性队列研究(n=6)、横断面研究(n=3)、前瞻性队列研究(n=3)和病例对照研究(n=2),并在英国(n=5)、荷兰(n=3)、西班牙(n=2)、丹麦(n=2)、瑞典(n=1)和澳大利亚(n=1)进行。
“机器学习模型在临床实践中的成功依赖于严格的验证、透明的方法论以及与现有医疗系统的整合。”
这些研究单独使用逻辑回归,或结合向后消除法、分类和回归树、随机森林或人工神经网络,并结合挥发性有机化合物进行建模。
模型结合了内窥镜或放射影像、CT结肠成像、钡灌肠、磁共振成像、组织学发现和/或电子病历数据。
机器学习研究在识别结果的方法和所识别的结果上存在显著差异。
仅针对结直肠癌检测,推导队列和验证队列的合并敏感性为0.832(95%置信区间,0.755-0.889),特异性为0.802(95%置信区间,0.722-0.866),假阳性率为0.198(95%置信区间,0.137-0.278),受试者工作特征曲线下面积(AUROC)为0.883。
对于结直肠癌和晚期结直肠腺瘤,推导队列和验证队列的合并敏感性降低至0.674(95%置信区间,0.509-0.805),特异性为0.692(95%置信区间,0.475-0.847),假阳性率为0.308(95%置信区间,0.153-0.525),AUROC为0.727。
在晚期结直肠腺瘤中,有限的数据限制了合并分析。个别研究报告的AUROC分别为0.69(95%置信区间,0.59-0.79)和0.65(95%置信区间,0.56-0.74)。
总体而言,AUROC结果范围在0.6到1之间。
此分析受到研究间异质性的限制。
研究作者总结道:“机器学习模型在结直肠癌和晚期息肉检测中提供了变革性的机会。然而,它们在临床实践中的成功依赖于严格的验证、透明的方法论以及与现有医疗系统的整合。通过解决这些优先事项,机器学习可以充分发挥其在彻底革新结直肠癌筛查和改善全球患者预后方面的潜力。”
参考文献:
Malik S, Naqvi A, Tenorio BG, Farrukh F, Tariq R, Adler DG. 《机器学习在预测结直肠癌和晚期结直肠息肉中的应用:系统综述与荟萃分析》。J Clin Gastroenterol. 2025年5月29日在线发表。doi:10.1097/MCG.0000000000002172
(全文结束)

