一项由Maccabi KSM研究和创新中心及Predicta Med进行的研究表明,通过机器学习模型分析电子病历(EMR)数据,可以提前四年识别出患有乳糜泻的风险患者。该研究发表在《Nature Portfolio》的《Scientific Reports》期刊上,并获得了赫尔辛基委员会的伦理批准。
乳糜泻影响全球约1%的成人和儿童,但许多人在确诊前已经忍受多年症状。研究表明,一些人可能需要超过十年才能得到诊断。目前,乳糜泻主要通过血清学测试和肠活检来诊断,但确定谁应该接受这些测试是一个挑战,尤其是在成年人中,他们可能表现出多种症状或根本没有症状。
在这项研究中,研究人员分析了来自Maccabi Healthcare Services(一家领先的以色列健康维护组织)的匿名EMR数据,这些数据涵盖了超过290万名患者。研究人群包括具有高度升高的组织转谷氨酰胺酶抗体(tTG-IgA)水平的患者(这是乳糜泻的高度预测标志物),以及没有乳糜泻记录的对照患者。
研究人员训练了机器学习模型,仅使用常见的实验室检测和基本的人口统计信息(如性别和年龄),并在以前未见过的病例和对照组中评估了模型区分这两种患者的能力。曲线下面积(AUC)用于评估模型区分病例和对照患者的能力,AUC值范围从0到1,数值越高表示性能越好。模型在距离首次乳糜泻阳性血清学测试前一至四年的不同时间间隔进行了测试,最终导致患者被确诊。
研究中训练和测试了五种算法:逻辑回归、决策树、随机森林、XGBoost和多层感知器。其中,XGBoost表现最佳,在诊断前一年达到0.86的AUC,并在长达四年的更长时间间隔内保持较强的准确性(AUC > 0.8)。乳糜泻自身免疫未被识别的关键预测因素包括低血红蛋白、低铁蛋白、低高密度脂蛋白胆固醇(HDL)和升高的肝功能测试结果。
这项研究提供了一个有希望的框架,利用机器学习来检测乳糜泻风险患者,展示了利用常规临床数据进行早期检测的可行性。这种做法可以在拥有全面EMR系统的医疗机构中集成。
“早期识别乳糜泻可以显著改善患者预后,因为早期诊断的患者通常会经历更好的肠道愈合和减少的症状,而延迟诊断则与即使遵守无麸质饮食仍然存在的持续健康问题相关。”Maccabi KSM研究和创新中心的儿科胃肠病学家和高级临床研究员Amir Ben-Tov博士说。
开发的工具未来可能会演变为一种预筛查方法,标记患者进行进一步评估,包括血清学测试和活检。Predicta Med正在与美国领先的医院进行试点,以证明该工具在前瞻性环境中的有效性。与加州一家主要医院正在进行的一项研究显示,AI指示与医生疾病风险评估之间有很高的吻合度。
(全文结束)

