研究人员已经开发了一种使用人工智能预测自身免疫疾病从临床前期症状到全面疾病进展的遗传进展评分(GPS)。该GPS模型整合了基因数据和电子健康记录,提供个性化的风险评分,比现有模型提高了25%至1000%的预测准确性。这种方法可以更早地识别高风险个体,实现及时干预和更好的疾病管理。该框架还可以适应研究其他未被充分代表的疾病,为个性化医疗和健康公平提供突破。
关键事实包括:
- GPS整合了基因研究和生物银行数据,以改进疾病进展预测。
- 该模型优于其他20种方法,显著提高了预测准确性。
- 提前识别高风险个体可进行主动干预和治疗。
自身免疫疾病是指免疫系统错误地攻击身体自身的健康细胞和组织,通常在诊断前有一个临床前期阶段,表现为轻微的症状或血液中某些抗体的存在。然而,在一些人中,这些症状可能在完全进入疾病阶段之前自行缓解。宾夕法尼亚州立大学医学院的研究团队开发了一种新方法来预测具有临床前期症状的个体的自身免疫疾病进展。该研究团队使用人工智能分析患有自身免疫疾病人群的电子健康记录和大规模基因研究的数据,以得出风险预测评分。
当与现有模型相比,该方法在确定症状是否会发展为晚期疾病方面,准确率提高了25%至1000%。该研究团队于1月2日在《自然通讯》杂志上发表了他们的研究结果。刘大江教授表示:“通过针对有家族史或出现早期症状的相关人群,我们可以利用机器学习识别出最高风险的患者,然后确定可能减缓疾病进展的合适治疗方法。这提供了更有意义和可操作的信息。”
据美国国立卫生研究院统计,约8%的美国人患有自身免疫疾病,其中绝大多数是女性。刘教授指出,越早检测到疾病并进行干预,效果越好,因为一旦自身免疫疾病进展,损害可能是不可逆的。在个体确诊前,往往已经有疾病的迹象。例如,类风湿关节炎患者的血液中可以在症状开始前五年检测到抗体。
预测疾病进展的挑战在于样本量。特定自身免疫疾病的患者群体相对较小,可用数据较少,难以开发出准确的模型和算法。为了提高预测准确性,研究团队开发了一种新的方法,称为遗传进展评分(GPS),以预测从临床前期到疾病阶段的进展。GPS借鉴了迁移学习的理念——一种机器学习技术,即在一个任务或数据集上训练模型,然后微调以应用于不同的但相关任务或数据集。
例如,在医学影像中,人工智能模型可以被训练以判断肿瘤是有害还是无害。创建训练数据集时,医学专家需要逐一标记图像,这可能耗时且受限于可用图像的数量。刘教授解释说,相反,迁移学习使用更多、更容易标注的图像,如猫和狗,创建更大的数据集。任务可以外包。模型学会区分动物,然后可以微调以区分恶性与良性肿瘤。“你不需要从头训练模型”,刘教授说,“模型分割图像元素以判断它是猫还是狗的方式是可以转移的。经过一些调整,你可以精炼模型以分离肿瘤图像和正常组织图像。”
GPS在大型病例对照全基因组关联研究(GWAS)数据上进行训练,这是一种常用的人类基因研究方法,旨在识别患有特定自身免疫疾病的人群与健康人群之间的基因差异,并检测潜在的风险因素。它还结合了基于电子健康记录的生物银行数据,这些数据包含了丰富的患者信息,包括基因变异、实验室测试和临床诊断。这些数据可以帮助识别处于临床前期的个体,并描述从临床前期到疾病阶段的进展过程。来自两个来源的数据随后被整合以优化GPS模型,纳入与实际疾病发展相关的因素。
“整合大型病例对照研究和生物银行数据的优势,提高了预测准确性”,刘教授解释说,高GPS评分的人群有更高的风险从临床前期进展到疾病阶段。该团队使用范德堡大学生物银行的真实世界数据预测了类风湿关节炎和狼疮的进展,并使用国家卫生研究院的“我们所有人”生物银行数据验证了GPS风险评分。GPS比仅依赖生物银行或病例对照样本的其他20个模型,以及通过其他方法结合生物银行和病例对照样本的模型,更好地预测了疾病进展。
准确预测疾病进展可以实现早期干预、有针对性的监测和个性化治疗决策,从而改善患者预后。刘教授说,它还可以通过识别最有可能受益于新疗法的个体来改进临床试验设计和招募。虽然这项研究专注于自身免疫条件,但研究人员表示,类似的框架可以用于研究其他疾病类型。“当我们谈论未被充分代表的人群时,不仅仅是种族。这也可能是一些在医学文献中研究不足的患者群体,因为他们只占典型数据集的一小部分。人工智能和迁移学习可以帮助我们研究这些人群,帮助减少健康差距。”刘教授说。“这项工作反映了宾夕法尼亚州立大学在自身免疫疾病综合研究项目上的实力。”
刘教授和江博士——连同研究合著者Laura Carrel、Galen Foulke、Nancy Olsen——组成了自身免疫工作组,并合作近十年。他们领导创新的临床试验,进行研究以了解自身免疫疾病的生物学机制,并开发人工智能方法以解决与自身免疫疾病相关的各种问题。
陈王和Havell Markus是该研究的共同第一作者,他们在宾夕法尼亚州立大学获得了生物信息学和基因组学博士学位。其他宾夕法尼亚州立大学的作者包括Avantika R. Diwadkar、Chachrit Khunsriraksakul、Xingyan Wang。其他贡献者包括来自范德堡大学医学院的李冰山教授和钟雪助理教授,以及德克萨斯大学西南医学中心的张晓伟副教授。
(全文结束)

