多模态人工智能预测肥厚型心肌病的心律失常死亡风险Multimodal AI to forecast arrhythmic death in hypertrophic cardiomyopathy

环球医讯 / AI与医疗健康来源:www.nature.com美国 - 英文2025-07-16 02:05:03 - 阅读时长9分钟 - 4018字
美国约翰霍普金斯大学等机构的研究团队开发了一种名为MAARS的多模态AI模型,通过整合电子健康记录、超声心动图和心脏磁共振成像数据,显著提升了对肥厚型心肌病患者心律失常猝死的预测准确性,展现了人工智能在医疗领域中的巨大潜力。
肥厚型心肌病心律失常死亡风险多模态人工智能MAARS模型临床指南风险评估可解释性公平性猝死健康预测
多模态人工智能预测肥厚型心肌病的心律失常死亡风险

心律失常引发的心脏性猝死是全球范围内导致死亡的主要原因之一。在肥厚型心肌病(HCM)患者中,当前临床指南对于心律失常猝死(SCDA)的风险评估准确性较低且表现不一致。本文介绍了一种深度学习方法——MAARS(Multimodal Artificial Intelligence for ventricular Arrhythmia Risk Stratification),用于通过分析多模态医学数据来预测HCM患者的致命心律失常事件。MAARS基于变压器架构的神经网络,能够从电子健康记录、超声心动图和放射学报告以及增强对比的心脏磁共振图像中学习知识,后者是该模型的独特特征。在内部和外部队列中,MAARS分别实现了0.89(95%置信区间(CI)0.79–0.94)和0.81(95% CI 0.69–0.93)的曲线下面积(AUC),并且相较于现有的临床指南,分别高出0.27–0.35(内部)和0.22–0.30(外部)。与临床指南不同,MAARS在各人口统计亚组之间表现出公平性。我们还从多个层面解释了MAARS的预测结果,以提高人工智能的透明度并推导出需要进一步研究的风险因素。

患者队列

JHH-HCM注册中心(内部)包括2005年至2015年间在约翰霍普金斯HCM卓越中心被诊断为HCM的患者。这些患者平均随访时间为2.86年,主要的SCDA终点定义为持续性室性心动过速或心室颤动,导致除颤器电击或抗心动过速起搏。在这项研究中包含的553名患者中,有19名(3%)在随访期间经历了SCDA。

SHVI-HCM注册中心(外部)包括根据标准指南衍生定义确诊的HCM患者,这些患者在2015年至2023年间曾到Atrium Health SHVI HCM卓越中心就诊。主要终点SCDA定义为持续性室性心动过速或心室颤动,导致除颤器电击或抗心动过速起搏,或院外心脏骤停。在这项研究中包含的286名患者中,有25名(9%)在随访期间经历了SCDA。

为了概述这两个队列并描述它们之间的差异,我们在表1中比较了内部和外部队列之间的临床协变量。所选协变量包括由ACC/AHA或ESC指南列出的人口统计学和风险因素,以及在两个队列之间具有统计显著差异的所有其他协变量。在内部队列(JHH-HCM)中收集的67个临床协变量中有14个在外部(SHVI-HCM)队列中缺失,18个在内部和外部队列之间呈现显著差异。我们使用数据插补来填补两个队列中的缺失信息(详见方法部分)。

MAARS:一种多模态AI模型

我们的算法MAARS无缝集成不同的输入模态,并通过端到端的变压器架构设计协同融合知识以进行SCDA风险分层(图1)。MAARS有三个单模态分支网络:LGE-CMR分支、EHR分支和心脏影像报告(CIR)分支。

图1:MAARS的示意图。

MAARS有三个输入分支,分别处理三种类型的输入:LGE-CMR图像(左中,绿色)、来自EHR的临床协变量(左上,蓝色)和来自CIR的测量值,包括CMR和超声心动图报告(左下,橙色)。LGE-CMR图像经过处理以获得左心室作为感兴趣区域,然后用作3D-ViT的输入。EHR和CIR协变量均为结构化的表格数据,用作专用FNN的输入。三个输入分支网络的末端连接到一个多模态融合模块,该模块使用MBT来融合知识并提炼出全面的表示,用于SCDA风险分层的预后(详见方法部分)。Echo,超声心动图;ROI,感兴趣区域;METS,代谢当量;SBP,收缩压。

MAARS相较于临床指南的优越表现

MAARS的表现通过受试者工作特征曲线下的面积(AUROC)、平衡准确率(BA)、精确率-召回率曲线下的面积(AUPRC)、类平衡Brier评分(Bs)、敏感性和特异性进行了全面评估(扩展数据表3)。在内部五折交叉验证中,MAARS的平均AUROC为0.89(95% CI 0.79–0.94),平均BA为0.80(95% CI 0.70–0.89),平均AUPRC为0.22(95% CI 0.10–0.34),平均Bs为0.16(95% CI 0.14–0.20)。在外部队列验证中(扩展数据表4),尽管队列特征存在差异且某些协变量缺失,MAARS仍显示出对SCDA事件的强大预测能力,平均AUROC为0.81(95% CI 0.69–0.93),展示了其跨医疗系统的泛化能力。

对于两个队列,当前临床实践中使用的风险评估工具在预测SCDA方面的准确性有限(图2)。在内部交叉验证中,列举七种主要SCD风险因素的ACC/AHA指南(本研究中包含六种,缺少左心室心尖动脉瘤的标注)的平均AUROC为0.62(95% CI 0.51–0.73)。列举七种主要SCD风险因素的ESC指南(本研究中全部包含)的平均AUROC为0.54(95% CI 0.43–0.65)。HCM Risk-SCD计算器使用七种风险因素(本研究中全部包含)计算5年SCD风险评分,结果平均AUROC为0.54(95% CI 0.42–0.66)。相比之下,MAARS在AUROC方面提供了0.27–0.35的改进。当MAARS与临床工具保持相同灵敏度时,其特异性提高了0.33–0.5。在外部验证中,类似地,临床工具无法预测SCDA事件,AUROC为0.51–0.59。MAARS在AUROC方面提供了0.22–0.30的改进。此外,在内部和外部验证中,MAARS的Brier评分也低于临床风险评估工具(扩展数据表3和4),表明MAARS在预测概率与真实结果之间的校准更好。值得注意的是,所有临床风险评估工具和MAARS在外部队列验证中的性能指标置信区间比内部验证更宽,表明性能估计的不确定性增加,这可能是由于外部患者队列规模较小所致。

不平衡数据集中的判别性预测

由于HCM患者中的SCDA事件较为罕见,本研究中的队列具有高度不平衡的结果,这对开发有效的风险评估工具提出了重大挑战。我们绘制了临床风险评估工具和MAARS预测的风险评分分布图,以突出MAARS在此不平衡数据集上的表现。我们分析了经历和未经历SCDA的患者之间的风险评分分布是否存在统计学显著差异(图2c)。在双样本Kolmogorov–Smirnov检验中,由三种临床风险评估工具预测的风险评分分布对于经历和未经历SCDA的患者之间没有显著差异(P > 0.05)。尽管数据集不平衡,MAARS仍能够对SCDA风险提供判别性预测,经历和未经历SCDA的患者之间的风险评分分布存在显著差异(P < 0.001)。

多模态融合的优势

我们进一步研究了在预测器中单独使用个别数据模态时,MAARS风险评估性能的变化。三个单模态分支网络(EHR、CIR和LGE-CMR)的性能见扩展数据表3。EHR数据反映了患者的基本信息,作为基线预测器的EHR分支网络(FNN)在内部交叉验证中实现了平均AUROC为0.84(95% CI 0.75–0.89)、平均BA为0.77(95% CI 0.68–0.85)、平均AUPRC为0.16(95% CI 0.06–0.26)和平均Bs为0.18(95% CI 0.16–0.21)。依次比较EHR分支网络(FNN)、使用EHR和CIR的MAARS以及使用所有三种模态的MAARS(图3),我们发现所有性能指标均有逐步提升,且置信区间范围无差异,表明在MAARS中整合患者评估的多个方面可以减少偏差而不影响方差。

图3:添加数据模态的效果。

不同亚组间的公平性

为了评估模型在不同亚组中的公平性,我们在交叉验证中评估了MAARS在JHH-HCM队列的不同性别和年龄亚组中的表现(图4)。在每个性别和年龄亚组中,MAARS的表现远远优于临床工具。在性别亚组评估中,MAARS在AUROC方面提高了0.26–0.36,在BA方面提高了0.15–0.29。在年龄亚组评估中,MAARS在中年亚组(40–60岁)中表现最佳,AUROC为0.93,BA为0.81,但在年轻(<40岁,AUROC = 0.85,BA = 0.79)和老年(>60岁,AUROC = 0.86,BA = 0.72)亚组中的表现略有下降。MAARS在年龄亚组中的改进更为显著:AUROC提高0.21–0.46,BA提高0.16–0.36。由于外部队列规模有限,未进行公平性分析。

图4:不同患者亚组中的表现。

MAARS的可解释性

人工智能算法的可解释性对于赢得信任和在临床实践中广泛应用至关重要。我们应用了基于归因和注意力的解释方法来解释EHR和CIR协变量以及LGE-CMR图像如何贡献于SCDA预测。具体而言,Shapley值用于量化EHR和CIR分支中每个协变量对SCDA风险评估的归因。一个协变量的正Shapley值表明该协变量有助于增加患者发生SCDA的可能性,其值量化了影响的程度。通过在群体水平上使用基于Shapley值的解释,我们识别出了最具影响力(通过绝对Shapley值的均值衡量)且与SCDA倾向强相关的协变量(通过协变量值与Shapley值之间的皮尔逊相关系数r衡量)(图5)。在EHR分支中,我们发现非持续性室性心动过速和房颤与SCDA风险增加相关,而压力测试期间测得的较高目标心率(反映运动时的变时反应)和非洲裔美国人种族与SCDA风险降低相关。在CIR分支中,非梗阻性HCM和较高的LGE负担(%)与SCDA风险增加相关;较高的左心室舒张末期容积、二尖瓣收缩前运动、较高的左心室射血分数(LVEF)和压力期间较高的左心室流出道(LVOT)梯度与SCDA风险降低相关。基于Shapley值的个体患者解释描绘了每个协变量对整体风险的增量效应,从而允许决策(扩展数据图1和2)。

图5:模型的可解释性。


(全文结束)

大健康

猜你喜欢

  • 约翰霍普金斯大学开发出预测心脏骤停风险的AI模型约翰霍普金斯大学开发出预测心脏骤停风险的AI模型
  • 新型人工智能工具以高准确度发现隐性心脏病新型人工智能工具以高准确度发现隐性心脏病
  • 大脑衰老速度或将决定未来健康状况大脑衰老速度或将决定未来健康状况
  • 在临床前药物发现中实现人工智能的民主化在临床前药物发现中实现人工智能的民主化
  • 欧洲制药药物市场在研发创新、生物制品增长和监管协调推动下扩张(2025-2032)欧洲制药药物市场在研发创新、生物制品增长和监管协调推动下扩张(2025-2032)
  • 约一半患者在首次心肌梗死前无症状约一半患者在首次心肌梗死前无症状
  • AI心电图模型预测偏头痛患者的血管事件风险AI心电图模型预测偏头痛患者的血管事件风险
  • LG发布新一代精准医疗AILG发布新一代精准医疗AI
  • 人工智能正为南非开启医疗保健新愿景人工智能正为南非开启医疗保健新愿景
  • 简单的血液检测如何预测未来的健康风险简单的血液检测如何预测未来的健康风险
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康