摘要
背景
已有多种风险评分和生物标志物用于预测心房颤动(AF),但它们之间的比较及联合应用效果尚不明确。
目的
评估比较AF事件预测方法
方法
开发人工智能增强心电图(AI-ECG)风险评估器-AF(AIRE-AF),采用卷积神经网络结合离散时间生存损失函数预测AF。该模型在贝斯以色列女执事医疗中心(BIDMC)的189,539名患者(1,163,401份心电图)中训练,并在英国生物样本库(UKB,38,892人)中外部验证。将AIRE-AF与CHARGE-AF临床风险评分等方法比较。
结果
BIDMC队列中,AIRE-AF预测AF的C指数为0.750(0.743-0.758),优于CHARGE-AF、左心房大小和NTproBNP指标。CHARGE-AF和左心房大小的联合使性能提升0.017,但NTproBNP未带来显著增益。在志愿者人群(UKB)中,最佳单一预测因子CHARGE-AF(C指数0.750)与AIRE-AF联合达0.768,再结合多基因风险评分(PRS)提升至0.791。
结论
首次系统评估AF预测方法。AIRE-AF与CHARGE-AF的联合预测性能与更复杂模型相当。
关键词
- 心房颤动
- 风险预测
- 人工智能
- 多基因风险评分
- 心电图
引言
心房颤动(AF)的终生风险达1/3,因其与中风、心力衰竭和死亡的关联构成重大公共卫生挑战。早期干预(如抗凝和节律控制)可降低风险。传统的CHARGE-AF评分依赖临床风险因素,但未能个性化整合个体特异性生物标志物。近期通过多基因风险评分(PRS)整合遗传信息,结合CHARGE-AF和NTproBNP可提升判别性能。左心房(LA)大小作为影像学指标在住院队列中易于获取,但尚不清楚不同AF预测方法(临床、影像、生化、遗传和AI-ECG)是否提供互补信息。人工智能,特别是AI-ECG分析,为非侵入性识别高危人群提供了新可能。
方法
伦理审批
本研究符合相关伦理规范,详见补充材料。
队列研究
研究两个队列:美国波士顿贝斯以色列女执事医疗中心(BIDMC)的二级护理队列和英国生物样本库(UKB)的志愿者队列(40-69岁)。
数据预处理
将数据按50/10/40%划分训练、调参和内部测试集。排除伪迹干扰心电图,采用0.5-100Hz带通滤波和60Hz陷波滤波,重采样至400Hz。采用零填充补足10秒记录,最终输入维度为4096×8。
AIRE-AF模型开发
扩展AIRE平台开发AF预测模型(AIRE-AF)。使用ICD-9/10编码或心电图诊断AF事件,结合先前开发的AI-ECG模型判断心电图AF状态。采用离散时间生存损失函数同时考虑现患和新发AF。
模型架构与训练
在BIDMC验证集定义AIRE-AF评分四分位数,通过Kaplan-Meier曲线和log rank检验评估统计显著性。采用R 4.2.0进行生存分析和Cox模型分析。
可解释性分析
通过变分自编码器(VAE)分析ECG形态与AIRE-AF评分关联,识别三个显著特征并通过-5到5的特征轨迹可视化。计算最低和最高AIRE-AF评分各10,000份心电图的中位波形。
结果
AIRE-AF预测新发AF
BIDMC队列中,189,539名受试者(47.9%男性)随访3.41年,34,938人(18.4%)死亡。在55,619名无基线AF的独立测试集中,AIRE-AF预测AF的C指数为0.750(0.743-0.758),门诊心电图测试性能相似(C指数0.748)。在心电图学家定义的"正常"心电图子集中(5,953人),判别性能小幅下降(C指数0.696)。
外部验证显示,UKB队列(48,827人)的C指数为0.716(0.697-0.735)。Brier评分显示BIDMC(0.089)和UKB队列(0.107)均具有稳健校准性能。
可解释性分析
VAE分析显示AIRE-AF预测与P波形态、PR间期、心率和QRS形态(包括QRS时限和电压)密切相关。中位波形分析验证了这些特征的重要性。
与临床指标比较
在BIDMC子队列(17,471人)中,AIRE-AF单指标性能最佳(C指数0.698),与CHARGE-AF联合最优,联合左心房大小可进一步提升性能(NRI 0.183)。
在NTproBNP测试子队列(4,647人)中,NTproBNP性能(C指数0.614)显著劣于AIRE-AF(0.680,p<0.0001),且与AIRE-AF联合未见显著增益。
志愿者队列验证
在UKB志愿者队列中,CHARGE-AF单指标最佳(C指数0.750),与AIRE-AF联合提升至0.768,再结合PRS提升至0.791(NRI 0.345)。
在心脏MRI子队列(25,780人)中,联合左心房容积可将性能提升至0.795,优于单独联合PRS(0.784 vs 0.779,p<0.0001)。
讨论
本研究开发并验证了AIRE-AF模型,首次系统比较了AI-ECG、临床评分、影像学和遗传信息的预测效能。结果显示:
- 医院队列中,AIRE-AF单指标优于CHARGE-AF
- 志愿者队列中,CHARGE-AF优于AIRE-AF
- AI-ECG与临床指标联合具有显著增益
- PRS在志愿者队列中提供额外价值,但心脏影像更易普及
临床意义
- 医院队列中,AI-ECG是最佳预测指标
- 对栓塞性卒中患者,联合AI-ECG、CHARGE-AF和影像可优化抗凝策略
- 在志愿者队列中,AI-ECG和CHARGE-AF联合具有实用价值
局限性
- 模型在不同人群和临床环境中的表现需进一步验证
- NTproBNP数据仅来自临床指征患者
- UKB缺乏同步NTproBNP数据
- BIDMC未获取PRS数据
结论
本研究首次系统评估了AF预测方法,在不同场景中均具应用价值。AI-ECG与CHARGE-AF联合可达到复杂模型的预测性能,联合影像或PRS可提供小幅增益,而NTproBNP无显著贡献。
【全文结束】

