人工智能在诊断乳糜泻活检样本方面已达到甚至超越人类专家水平。弗洛里安·耶克尔博士讨论其团队研究发现,机器学习模型不仅能提升病理学家的诊断准确性,还能对关键组织学特征提供可解释的洞察,为实现更快速、更可靠的诊断奠定基础。
乳糜泻影响全球超过1%的人口,但多数患者尚未被确诊。这种由谷蛋白引发的自身免疫性疾病,会导致免疫系统攻击小肠内壁,引发腹泻、体重减轻、贫血、疲劳、疱疹样皮炎及不孕等症状。
全球乳糜泻患病率约为1%,经活检确诊的患病率在南美和非洲为0.4%-0.5%,欧洲为0.4%-0.8%,北美和亚洲均约为0.6%。若不及时治疗,乳糜泻将显著增加十二指肠腺癌和淋巴瘤等严重并发症风险。目前唯一有效疗法是终身严格遵循无谷蛋白饮食。
及时可靠的乳糜泻诊断
尽管乳糜泻常见且可能危及健康,但诊断往往严重滞后。现行指南虽推荐血清学初筛,但除非抗体水平极高,患者仍需接受被视为金标准的十二指肠活检。
病理学家需评估绒毛萎缩、隐窝增生以及上皮内淋巴细胞(IELs)与肠细胞比例升高等特征,但解读存在显著差异。2024年我们开展大规模研究,分析数字化全切片图像中十二指肠活检的组织学检查一致性。
13位病理学家共同审阅100例十二指肠活检样本。仅凭活检切片时,两两诊断一致率为73%;结合免疫球蛋白A组织转谷氨酰胺酶及血红蛋白的血清学数据后,一致率升至80%。这种变异程度凸显了诊断一致性难题,也表明患者将极大受益于更可靠的诊断工具。
支持诊断的人工智能算法
为解决该挑战,我们开发了可直接从十二指肠活检图像诊断乳糜泻的人工智能算法。在《新英格兰医学杂志AI分刊》发表的多中心研究中,我们在五个医院采集的3000余张苏木精-伊红染色全切片图像上训练验证模型,这些图像来自不同扫描设备且附临床诊断结果。
在来自新数据源的近650张图像独立测试集中,该AI系统表现卓越:准确率超97%,敏感度95%,特异度98%。更重要的是,当专科病理学家复核切片时,他们认同AI评估结论的概率与认同同事结论的概率相当。这证明AI能在多样化环境中持续保持资深专家级诊断水平。
为病理学家构建可解释的人工智能
仅凭准确性不足为据:临床医生需要理解AI的决策逻辑。近期多项研究利用AI提升乳糜泻诊断能力,但多数模型作为"黑箱"运作,缺乏可解释性与透明度。
我们在2025年10月发表于《英国医学杂志数字健康与人工智能分刊》的最新研究中,开发了专门检测乳糜泻诊断四大关键组织学特征的模型:绒毛、隐窝、上皮内淋巴细胞(IELs)及肠细胞。
该工具实现了病理学家当前手动操作的自动化。例如,估算IELs与肠细胞比率通常需在有限视野内计数100个细胞,而AI模型能在数秒内分析整个活检样本中的数千个细胞,提供更可靠的估算值。它还能计算绒毛-隐窝比值——这是评估绒毛萎缩和隐窝增生的替代指标。
在来自独立机构的613张全切片图像测试集上,诊断模型达到96%准确率,阳性预测值86%,阴性预测值98%。通过提供可解释输出并简化繁琐计数工作,该模型降低了诊断变异性,同时释放了病理学家的工作时间。
乳糜泻诊断发展路径
综上所述,我们的研究为AI辅助、可解释且临床可靠的活检评估新标准奠定基础。对患者而言,这意味着更快更准的诊断,将显著缩短乳糜泻确诊前常见的数年不确定期。
随着全球病理学需求持续增长,我们确信人工智能将在保障每位患者及时获得可靠诊疗方面发挥关键作用。
作者简介
弗洛里安·耶克尔博士
剑桥大学病理学系访问研究员、休斯学堂研究学者
参考文献
- Coeliac UK. 乳糜泻诊断 2024.
- Castillejo G等. 乳糜泻病例对照研究:是否该探索高风险患者之外的群体?《营养素》2023;15:1267.
- Singh P等. 乳糜泻全球患病率:系统综述与荟萃分析.《临床胃肠病学与肝病学》2018;16:823–36.
- Silano M等. 乳糜泻延迟诊断增加癌症风险.《BMC胃肠病学》2007;7:8.
- Denholm J等. 乳糜泻数字观察者一致性研究:是或否?《BMJ开放胃肠病学》2024;11:e001252.
- Jaeckle F等. 机器学习实现病理学家水平的乳糜泻诊断.《新英格兰医学杂志AI分刊》2025;2.
- Tabacchi ME等. 基于模糊逻辑的乳糜泻临床决策支持系统.《IEEE访问》2022;10:102223–36.
- Koh JEW等. 采用机器学习方法自动解读活检图像检测乳糜泻.《计算机方法与生物医学程序》2021;203:106010.
- Jaeckle F等. 基于可解释机器学习的乳糜泻检测.《英国医学杂志数字健康与人工智能分刊》2025.
【全文结束】

