基于结构化电子健康记录数据预测心律失常初发患者的房颤入院情况Prediction of atrial fibrillation admissions in arrhythmia naïve patients from structured electronic health record data | BMC Medical Informatics and Decision Making | Full Text

环球医讯 / 心脑血管来源:bmcmedinformdecismak.biomedcentral.com美国 - 英文2025-10-01 13:45:06 - 阅读时长9分钟 - 4262字
本研究探讨了利用机器学习算法基于结构化电子健康记录预测心律失常初发患者房颤入院的可行性,结果显示加入更多电子健康记录领域可提高预测能力,其中结构化心电图和超声心动图领域贡献最大;尽管机器学习模型表现出良好的区分能力,但由于房颤入院事件发生率低,精确度较差,研究建议未来可考虑纳入所有房颤事件而不仅是导致入院的事件,并整合非结构化电子健康记录数据以提升预测性能,这对早期识别高风险患者并预防不良临床结局具有重要临床意义。
健康心律失常房颤电子健康记录机器学习心电图超声心动图预测入院临床结局
基于结构化电子健康记录数据预测心律失常初发患者的房颤入院情况

摘要

背景

心房颤动(AF)是最常见的持续性心律失常,但其诊断往往难以捉摸。本研究探讨了基于电子健康记录(EHR)的结构化领域,利用机器学习(ML)算法预测心律失常初发患者房颤的作用。

方法

纳入无房颤病史的患者(N = 186,769),这些患者至少接受了1次超声心动图检查,并且随访时间至少为3个月。将电子健康记录中的数据分为多个领域(人口统计学;健康的社会决定因素;既往病史、药物、心电图(EKG)和超声心动图(Echo)),并逐步测试其预测首次房颤入院的能力。

结果

在总体队列中,4,751名(2.5%)患者在中位随访时间为35个月的情况下因房颤入院。所有机器学习分类器随着电子健康记录领域的逐步增加,受试者工作特征曲线下面积(AUROC)也相应提高,梯度提升算法在包含所有领域时达到AUROC为0.85,但在最大尤登指数处F1分数仅为14%。仅使用心电图和超声心动图领域即可达到与包含所有电子健康记录领域相当的性能。这些结果经过了外部验证。

结论

更多结构化电子健康记录领域可提高预测首次房颤入院的能力,但结构化心电图和超声心动图领域带来的收益最大。尽管机器学习模型表现出良好的区分能力,但由于事件发生率低,其精确度较差。

背景

心房颤动(AF)是最常见的持续性心律失常,与心力衰竭等显著发病率相关,以及包括中风在内的血栓栓塞事件,还有死亡率。由于房颤通常具有阵发性和无症状的特性,其诊断往往难以捉摸,但仍约占所有缺血性中风的15%,即使患者在发生脑血管事件时并未被诊断为房颤。鉴于这些考虑因素,预测房颤发生前的风险对于尽早为患者提供充分保护并预防不良临床结局极为重要。

因此,开发预测房颤未来发生的新工具具有重要的即时临床意义,可直接影响患者护理。在本研究中,我们考察了应用于大型多站点医疗系统电子健康记录结构化数据域的几种机器学习(ML)分类器的性能,用于预测无房颤病史患者房颤入院的发生率。

方法

研究设计和数据集

本研究遵循《赫尔辛基宣言》和贝尔蒙报告的伦理原则,并获得匹兹堡大学内部审查委员会的批准,鉴于该研究的观察性质,委员会免除了知情同意的需要。本研究未获得资金支持。

数据来自匹兹堡大学分析数据仓库。本文章所依据的数据将在合理请求下与通讯作者共享。纳入2010-2022年间在本机构接受经胸超声心动图(Echo)检查且超声心动图检查后随访时间≥3个月的连续患者。排除有房颤病史的患者。患者随访至主要终点,即首次以阵发性、持续性或未明确房颤为主要诊断的入院,由《国际疾病分类》代码(427.31, 427.32, I48.-)指示。图1展示了患者队列的CONSORT流程图。简言之,在最初219,667名接受超声心动图检查并在本机构有至少3个月随访的患者中,32,898名(15%)因先前诊断为房颤而被排除。在剩余的186,769名患者中,4,751名(2.5%)患者在中位随访35个月期间因房颤为主要诊断入院。使用来自宾夕法尼亚州哈里斯堡匹兹堡大学Pinnacle医院的58,687名无房颤病史患者的队列进行外部验证,该医院不属于训练或测试队列(图1),中位随访时间为58个月,房颤入院事件发生率为3,195名(5.8%)。遗憾的是,验证数据集中无法获得5个变量(3个心电图变量——P、R和T波的轴向,以及2个超声心动图变量——舒张功能障碍的存在和程度)。此外,验证数据集的随访时间也显著长于开发数据集(中位数=58个月对比中位数=35个月)。为克服这些显著差异,我们在排除两个数据集中的5个缺失变量并设定固定时间范围(=35个月)评估模型区分能力后,重新在开发和外部验证数据集上运行了模型。

统计分析

连续数据以均值±标准差表示,并使用t检验比较房颤入院患者与未入院患者之间的差异。分类数据以频率和百分比报告,并使用卡方检验进行比较。电子健康记录数据分为以下领域,详见表1:人口统计数据、健康的社会决定因素、既往病史、药物、结构化心电图(EKG)和超声心动图参数。缺失数据对连续变量用均值填补,对分类变量用众数填补。使用5种分类器(逻辑回归、决策树、随机森林、梯度提升和神经网络)开发机器学习模型,计算准确性、受试者工作特征曲线下面积(AUROC)、敏感性、特异性、阳性(PPV)和阴性(NPV)预测值以及F1分数(精确度和召回率的调和平均数)[11, 12](F1 = 2×敏感性×PPV/(敏感性 + PPV))。这些参数在最大化尤登指数的阈值处报告,尤登指数等于敏感性 + 特异性 − 1[13]。模型在80%的数据集上训练,在剩余20%上测试。在所有分析中,使用线性回归分析、斯皮尔曼等级相关和肯德尔Tau检验统计测试了从增加电子健康记录领域中获得的增量增益。进一步分析检查了减少电子健康记录领域数量是否能达到与完整领域集相当的性能。此外,我们使用随机生存森林方法将机器学习模型的性能作为生存分析进行检查,以探究生存分析是否能带来更好的模型性能。在3个时间范围(12、24和36个月)评估生存模型的性能。统计显著性在0.05的p值阈值处测试。所有分析均使用开源Python编程(Python软件基金会,特拉华州威明顿)进行。

结果

总共纳入219,667名患者,其中32,898名(15%)有已知的房颤病史。在剩余的186,769名患者中,4,751名(2.5%)在中位随访35个月期间因房颤为主要诊断入院。图2展示了索引超声心动图检查后首次房颤入院时间的直方图。

表1显示了本分析中纳入患者的基线特征,按房颤状态分层。可以看出,与随访期间无房颤入院的患者相比,房颤患者的年龄显著更大,男性和白人的可能性更高,并且心脏和非心脏合并症显著更多。

表2详细说明了随着结构化电子健康记录数据中领域的逐步引入,机器学习模型的性能。使用AUROC指标,表现最佳的机器学习模型是梯度提升,随着电子健康记录数据更多结构化领域的逐步纳入,AUROC从0.71提高到0.85(Kendall Tau的p = 0.017)(图3、4)。在最佳尤登阈值处使用所有电子健康记录领域与仅使用人口统计数据相比,最佳模型(梯度提升)在测试队列中重新分类了37,118个病例中的11,877个,或使用所有电子健康记录领域的重新分类率为32%,将模型准确性从51%提高到73%。

此外,我们研究了仅使用心电图和超声心动图领域而排除所有其他电子健康记录领域时模型的性能。如补充表S1和补充图SF1所示,仅使用这两个领域的模型性能与使用所有电子健康记录领域相当,这对计算负担具有重要意义。

尽管在整合所有可用的人口统计和临床信息时预测模型表现良好,但由于临床事件发生率非常低,梯度提升分类器的F1分数仍较差,约为14%,表明精确度较差。为排除模型过拟合,我们将梯度提升测试应用于包含所有电子健康记录领域的训练集,并记录了与使用测试集时相当的准确性(0.713)和AUROC(0.857)(准确性=0.734,AUROC=0.849)。

此外,使用增量电子健康记录领域将结果建模为生存分析,使用随机生存森林进行。如补充表S2所示,基于时间的模型并未优于其他分类器。

最后,我们使用58,687名无房颤病史的患者队列对预测模型进行了外部验证,该队列中位随访时间为58个月,房颤入院事件发生率为5.8%。鉴于外部验证数据集中的缺失变量和较长的中位随访时间,我们在排除5个缺失变量并设定固定时间范围(=35个月)后,重新在开发和外部验证数据集上运行了模型。开发数据集中的AUROC为0.758,外部验证数据集中的AUROC为0.700。在尤登阈值处,外部验证的准确性为0.804,F1分数为0.243。

讨论

我们的数据表明:(1)向机器学习模型添加更多电子健康记录领域可逐步提高房颤预测能力,但大部分收益是通过使用结构化心电图和超声心动图数据实现的;(2)尽管机器学习模型在预测电子健康记录结构化领域中的房颤时表现出良好的区分能力,但由于我们数据集中房颤入院事件发生率低,精确度较差。因此,仅使用电子健康记录中的结构化数据预测房颤受到限制,可能通过纳入所有房颤事件(而不仅是导致入院的事件)以及整合非结构化电子健康记录数据(主要是数字化心电图轨迹以及超声心动图测试和其他心脏成像方式的图像和/或视频循环)来增强。这将在未来的研究中进行测试,目前仍属推测。

先前曾尝试使用正常窦性心律期间的数字化心电图轨迹以及超声心动图中舒张功能障碍的标志物,利用人工智能预测房颤的发生,并取得了良好效果。在Atia等人的研究中,从正常心律轨迹预测房颤存在的AUROC为0.87,F1分数为39.2%。然而,据我们所知,将机器学习算法应用于结构化电子健康记录数据以预测首次房颤入院并分析各种电子健康记录领域的贡献尚未进行过。此外,预测房颤入院医院会选择病情更严重的患者群体,据我们所知,此前尚未进行过此类研究。

鉴于房颤非常常见,可能在长时间内难以诊断,并且在实际心律失常被诊断前往往是中风或其他严重血栓栓塞事件的原因,预测房颤的发生具有重要的临床意义。最近发表的ARCADIA试验将1,015名隐源性卒中患者随机分配至口服抗凝治疗与阿司匹林,旨在证明口服抗凝在预防复发性中风方面优于阿司匹林。尽管ARCADIA试验中的患者因存在心房心肌病而具有发展为房颤的高风险,但该试验未能证明口服抗凝在降低中风发生率方面优于阿司匹林,可能与房颤风险的选择标准有关。因此,我们研究的前提是检验结构化电子健康记录领域对预测房颤的贡献。

本研究存在局限性。首先,数据来自单一中心,没有外部验证,因此我们的发现可能不适用于其他患者群体。尽管如此,我们的医疗系统包括宾夕法尼亚州及更广泛地理区域的40多家医院,因此我们的研究队列可能很好地代表了普通人群。其次,尽管我们排除了有已知房颤病史的患者,但我们不能确定某些患者是否可能有亚临床心律失常。最后,本研究的临床结局是房颤入院而非任何房颤事件的发生,因为这一终点容易确定。然而,这限制了我们的事件率,并显著影响了整个召回范围内的平均精确度。我们团队未来的工作将重点关注纳入任何房颤事件,这可能会提高我们的模型性能。

结论

总之,我们的机器学习模型在预测电子健康记录结构化领域中的房颤入院方面表现出良好的区分能力,其中心电图和超声心动图领域对模型可预测性贡献最大。然而,由于临床事件发生率低,精确度较差。

【全文结束】

大健康

猜你喜欢

  • 科学家利用人类皮肤细胞成功培育功能性卵子科学家利用人类皮肤细胞成功培育功能性卵子
  • 探究前列腺癌患者与健康对照者的肠道微生物群特征探究前列腺癌患者与健康对照者的肠道微生物群特征
  • 联邦学习提升医疗健康:隐私安全与性能优化联邦学习提升医疗健康:隐私安全与性能优化
  • 第15届中欧制药技术研讨会第15届中欧制药技术研讨会
  • 人工智能在基因组医学中的应用特刊征集启事人工智能在基因组医学中的应用特刊征集启事
  • 一种用于预测老年人创伤性颅内异常的列线图:开发与验证一种用于预测老年人创伤性颅内异常的列线图:开发与验证
  • 研究性新药项目详解研究性新药项目详解
  • 生物药物在临床试验中显著降低严重肺动脉高压诊断后症状与住院风险生物药物在临床试验中显著降低严重肺动脉高压诊断后症状与住院风险
  • 量子计算在人工智能药物发现中的应用:3D蛋白质建模是神话还是现实量子计算在人工智能药物发现中的应用:3D蛋白质建模是神话还是现实
  • 便秘与心血管疾病关联;Lp(a)检测普及率低;超声心动图新指南发布便秘与心血管疾病关联;Lp(a)检测普及率低;超声心动图新指南发布
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康