瑞士研究人员报告称,一种利用常规收集数据的人工智能(AI)模型能够预测随后发展为活动性结核病(TB)。该AI模型在识别高风险的HIV阳性患者方面优于用于检测潜伏性结核病的生物测试。
除了免疫功能和社会人口学变量外,AI模型还保留了几个指示患者健康和代谢状况的生物标志物。
在瑞士和其他具有良好抗逆转录病毒治疗可及性的国家,结核病是HIV感染者中罕见但严重的共感染疾病,通常与晚期HIV诊断相关。为了预防进展为活动性结核病,已知有潜伏性结核感染的人可以接受异烟肼和/或利福平的预防性治疗。
然而,潜伏性结核病的检测具有挑战性,尤其是在HIV感染者中。在之前的一项瑞士分析中,结合使用干扰素-γ释放试验(IGRA)和结核菌素皮肤试验仅识别出后续发展为活动性结核病患者的30%。
“这比抛硬币还糟糕,”瑞士苏黎世大学传染病和医院流行病学系主治医师Johannes Nemeth博士在接受Medscape Medical News采访时说。
问题在于这些测试依赖于免疫反应,而这种反应可能受损。“你询问的是在HIV感染期间功能失调的系统,所以这些测试表现不佳并不令人意外,”他解释道。
这促使他和他的同事寻找其他方法来识别高风险患者。他们利用了瑞士HIV队列研究的数据,该研究包括了该国约70%接受HIV护理的人群。
通过对23年的数据进行机器学习分析,这是一种使计算机能够从数据中学习模式并进行预测的AI子集。他们的机器学习模型采用了随机森林算法——一种结合多个决策树输出的算法。
该模型查看了在HIV诊断时收集的数据,以预测至少6个月后发生的活动性结核病。该模型不仅考虑了研究人员认为是潜在风险因素的变量,还审查了所有有足够的数据支持的变量。
“我真的很喜欢这种机器学习方法,我们把所有收集到的数据扔进机器里,只是问它:你能用这些数据做点什么吗?”Nemeth说。“我认为这真的得到了回报。”
第一个版本的模型包含48个变量,灵敏度为70.1%,特异性为81.0%。简化后的第二个版本保留了20个变量——使其计算上不那么复杂——同时提供了57.1%的灵敏度和77.8%的特异性。
鉴于生物测试的灵敏度为30%,特异性为94%,对于Nemeth来说,这“完全超越了现有的一切”。该模型不需要额外的数据收集,也没有IGRA的成本。
正如预期的那样,保留的20个变量包括免疫参数、血液学标志物和社会人口学因素,但其中一些更为意外:除了与代谢相关的几个变量(胆固醇、高密度脂蛋白、葡萄糖和肌酐)、体重指数和平均动脉压。
研究人员指出,结核病与营养不良有关,并表示这些标志物可能反映了处于结核病风险中的人的代谢紊乱和肌肉质量下降。
该模型首先在一个未用于训练的瑞士队列部分进行了验证,然后在一个奥地利队列中进行了验证。尽管两个队列之间有很多相似之处,但最初该模型在奥地利的表现不佳。
研究人员意识到问题源于两国之间不同的移民模式:瑞士大多数结核病患者来自撒哈拉以南非洲,而在奥地利,大多数来自前苏联共和国。只有在修改了种族和出生地变量后,该模型才开始有效工作。
“这是一个警示故事,”Nemeth说。“你去一个非常相似的环境中,有一些小差异,这一切就停止工作了。对于机器学习模型,我们必须非常小心,在依赖它们之前要进行严格的测试。”
Emily Wong博士是阿拉巴马大学伯明翰分校的副教授,她曾在南非使用AI辅助胸部X光片解读,但并未参与这项新研究。
瑞士的研究“让人们意识到,通过大量包含许多临床变量的数据集,你可以发现有意义且具有预测性的模式,从而预测某人是否会发展成结核病,”她在接受Medscape Medical News采访时说。
Nemeth正在开展一项实施研究,其中从未接受过结核病检测的患者的医生将被随机分配接收提醒进行检测,或者基于机器学习模型的风险评分。一个关键问题是后者是否足以说服医生采取进一步行动,例如提供预防性治疗。
Wong指出,需要权衡预防性治疗的潜在益处和风险(包括肝毒性),但对于每个患者而言。但机器学习模型可以帮助临床医生做出这些决定。
“未来,基于一个人的关键人口统计和临床信息,也许包括他们的胸部X光片或IGRA测试,或者也许不包括,我们将拥有一个运行良好的临床决策工具,指导医护人员为面前的患者做出结核病预防决策,这绝对是一个值得追求的目标,”她说。
(全文结束)

