一项由Maccabi KSM研究和创新中心(以下简称“KSM研究中心”)和Predicta Med进行的新研究表明,通过机器学习模型分析电子病历(EMR),可以提前多达四年诊断乳糜泻。该研究发表在《Nature Portfolio》旗下的《Scientific Reports Journal》上,并已获得赫尔辛基委员会的伦理批准。
乳糜泻影响全球约1%的成人和儿童,但许多人在确诊前已经忍受多年症状。研究表明,有些人可能需要超过十年才能被确诊。目前,乳糜泻主要通过血清学测试和肠活检来诊断,但确定谁需要进行这些测试是一个挑战,尤其是在成人中,他们可能会表现出多种症状或无症状。
在这项研究中,研究人员分析了来自Maccabi Healthcare Services(一家领先的以色列医疗保健组织,HMO)的匿名EMR数据,涵盖了超过290万名患者的数据。研究人群包括抗体组织转谷氨酰胺酶(tTG-IgA)水平极高的患者(这是乳糜泻的高度预测标志物)和未记录任何乳糜泻迹象的对照患者。
研究人员使用常见的实验室测试结果和基本人口统计信息(如性别和年龄)训练了机器学习模型,并评估了这些模型区分病例和对照组的能力。用于评估模型性能的指标是曲线下面积(AUC),其范围从0到1,值越高表示性能越好。模型在初次乳糜泻阳性血清学测试前一年至四年的不同时间间隔进行了测试。
研究中训练和测试了五种算法:逻辑回归、决策树、随机森林、XGBoost和多层感知器。其中,XGBoost表现最佳,在诊断前一年的AUC达到0.86,并且在长达四年的更长时间间隔内仍保持较强的准确性(AUC > 0.8)。关键的未确诊乳糜泻自身免疫预测因子包括低血红蛋白、低铁蛋白、低高密度脂蛋白胆固醇(HDL)和升高的肝功能测试结果。
这项研究为使用机器学习检测乳糜泻高风险患者提供了一个有前景的框架,展示了利用常规临床数据进行早期检测的可行性。这种方法可以在拥有全面EMR系统的医疗机构中集成应用。
KSM研究中心的小儿胃肠病学家兼高级临床研究员Amir Ben-Tov博士表示:“早期识别乳糜泻可以显著改善患者预后,因为较早诊断的患者通常会有更好的肠道愈合和减少的症状,而延迟诊断即使遵守无麸质饮食也与持续的健康问题相关。”
开发的工具未来有可能演变为一种预筛查方法,标记出需要进一步评估(包括血清学测试和活检)的患者。Predicta Med正在与美国领先的医院进行试点,以证明该工具在前瞻性环境中的有效性。一项正在进行的加州大型医院研究显示,AI指示与临床医生的疾病风险评估之间有高度一致性。
(全文结束)

