摘要
背景: 心房颤动(AF)是全球最常见的持续性心律失常,具有显著的遗传成分。全基因组关联研究(GWAS)已鉴定出100多个易感位点;然而,这些位点在不同人群中的复现结果差异较大,表明心房颤动的遗传决定因素可能存在人群特异性差异。迄今为止,尚无基于全基因组测序(WGS)的研究评估波兰人群中心房颤动的易感性。方法: 我们对"波兰千人基因组计划"中招募的233名无关个体进行了全基因组测序(平均覆盖度35×),包括56名非瓣膜性心房颤动患者和177名无心房颤动的对照者。在心血管基因面板内进行质量控制和连锁不平衡修剪后,分析了19,395个变异。使用校正了年龄和性别的逻辑回归进行关联检验,并应用错误发现率和Bonferroni校正阈值。结果: 经多重检验校正后,无任何变异达到与心房颤动关联的统计学显著性。先前报道的易感位点在该队列中未能复现。年龄与心房颤动风险强烈相关,而性别未显示显著影响。鉴于样本量相对较小,本研究主要具有检测中等或较大效应大小变异的能力;大型GWAS中报道的较小遗传效应可能在该队列中无法检测到。结论: 这项基于全基因组测序的初步研究为探索波兰人群中与心房颤动相关的遗传变异提供了初步依据。缺乏显著关联可能反映了在将基因风险分层方法广泛应用于不同人群之前,需要在更大规模且特征明确的中欧-东欧队列中进行进一步研究。
关键词:心房颤动;心血管疾病;遗传变异;GWAS;心律失常风险因素
1. 引言
心房颤动(AF)是成人中最常见的心律失常,主要通过左心房血栓形成导致的血栓栓塞性卒中风险增加,成为心血管发病和死亡的重要因素[1]。2021年,全球心房颤动患者超过5200万人,发病率为每10万人约52例。其患病率随年龄显著增加,从普通成人人口的2-4%上升到80岁以上人群的10-17%[2]。
年龄是心房颤动的首要风险因素,全球人口老龄化预计将大幅增加其负担。在美国,预计到本世纪中叶,心房颤动患者人数将达到600-1200万,而在欧洲,未来几十年的发病人数也预计将显著增加[2]。在波兰,65岁及以上人群中,心房颤动患病率据报道达到约19.2%。高血压、肥胖、冠心病、瓣膜病、睡眠呼吸暂停和肾病等共病已知会增加心房颤动风险[3]。
尽管心房颤动最常与结构性心脏病相关,但在心脏结构正常情况下发生的心房颤动病例常显示家族聚集性,一级亲属风险升高以及同卵双胞胎中的一致性增加支持该疾病的遗传性[4,5,6]。迄今为止,已在许多涉及心脏电生理和结构完整性的基因中鉴定出罕见致病变异,包括离子通道、肌节蛋白、转录因子和缝隙连接蛋白。同时,全基因组关联研究(GWAS)已鉴定出150多个与心房颤动风险相关的常见易感位点,包括染色体4q25上靠近发育调节因子PITX2的已确立区域[7,8,9]。最近涉及100多万人的大型多祖先GWAS继续扩大与心房颤动易感性相关的位点数量[10]。
尽管取得这些进展,但在包括中欧和东欧在内的许多人群中,心房颤动的遗传结构仍未得到充分表征。特别是,基于测序方法获得的人群特异性数据仍然有限。
研究重点
在本研究中,我们分析了"波兰千人基因组计划"中纳入个体的全基因组测序数据,以探索波兰队列中可能与心房颤动相关的遗传变异。通过针对心血管相关基因的靶向分析,我们评估了非瓣膜性心房颤动患者和无心房颤动记录的对照者中的常见变异。该分析旨在评估先前与心房颤动易感性相关的变异是否可在该人群中检测到,并为中欧-东欧队列的未来研究提供初步数据。
2. 结果
本研究纳入了233名在"波兰千人基因组计划"框架下招募的无关个体,该计划是一项旨在定义波兰人群遗传变异的全国性努力。研究人群包括56名诊断为非瓣膜性心房颤动的患者和177名无心律失常的对照者。几种共病在心房颤动组中更为普遍。特别是,高血压、糖尿病、冠心病、心力衰竭、既往卒中/短暂性脑缺血发作(TIA)、高脂血症和吸烟史在心房颤动患者中更常见。两组的详细基线临床特征见表1。
如图1所示,两组间性别分布均衡,在心房颤动组(34名男性,21名女性)和对照组(109名男性,68名女性)中均略以男性为主。排除SNP效应的逻辑回归模型表明,在该特定队列中,性别对心房颤动风险没有产生统计学上显著的独立影响(p > 0.05),这与一些先前报道不同,但与发现不同人群中房颤患病率的性别差异可能由风险因素暴露差异介导的研究结果一致。
相比之下,入院时年龄是一个强大且统计学上显著的预测因子,如图2中的小提琴图所示。心房颤动组年龄明显较大(平均73.1岁,范围51-93岁),而对照组年龄较小(平均57.7岁,范围19-99岁),反映了心房颤动基质进展的年龄依赖性特征。统计模型表明,年龄每增加一岁,心房颤动诊断的几率增加1.085倍,相当于风险每年增加8.5%。
实验室检查结果显示心房颤动患者的红细胞(RBC)计数显著较低,血红蛋白水平略低。这些观察结果不太可能代表原发性遗传性血液疾病;相反,它们与标准抗凝治疗的生理后果一致,抗凝治疗是房颤的标准护理,用于降低血栓栓塞风险。临床上,这些发现突显了老年心房颤动人群中合并症管理与基线实验室特征的交叉[11]。
除年龄和血液学参数外,心房颤动组与对照组相比,几种心血管共病的患病率显著更高,包括高血压、糖尿病、冠心病、心力衰竭、既往卒中/TIA、高脂血症和吸烟史。
基因组分析重点分析了从全基因组测序数据中识别的心血管相关基因。测序在Illumina NovaSeq 6000平台上使用150 bp配对末端读数进行,队列中平均覆盖深度为35.26×。经过质量控制过滤后,应用连锁不平衡(LD)修剪(50 kb窗口,r2 > 0.5)选择区域单倍型块中的代表性变异。经过这些程序后,共保留19,395个单核苷酸多态性(SNPs)和短插入/缺失用于关联分析。
使用逻辑回归评估遗传变异与心房颤动之间的关联。心房颤动的对数几率模型如下:logit(P) = ln(P/(1 − P)) = β0 + β1G + β2Age + β3Sex,其中P表示心房颤动的概率,G表示在加性遗传模型下编码的基因型(0、1或2个效应等位基因拷贝),Age和Sex作为协变量包含在内。参考类别对应于纯合参考等位基因的个体。
曼哈顿图(图3)展示了所分析变异的关联信号分布,并证实该队列中不存在全基因组显著关联。在该数据集中,先前在大型GWAS中报道的变异位点未达到统计学显著水平。然而,鉴于样本量相对较小,本研究主要具有检测中等至大效应大小变异的能力,大型人群研究中报道的较小效应可能在该队列中无法检测到。
位于或靠近NEBL(Nebulette)基因的变异在该队列中未显示与心房颤动的统计学显著关联。尽管NEBL先前已在心脏结构蛋白和心房重构背景下进行过讨论,但当前数据不支持该基因中常见变异与所分析人群中房颤易感性之间的可检测关联。
3. 讨论
据我们所知,本研究代表了首次基于全基因组测序(WGS)分析探索波兰队列中可能与心房颤动相关的遗传变异。使用来自"波兰千人基因组计划"的高覆盖度测序数据,我们评估了心房颤动与心血管相关基因面板内常见遗传变异之间的关联[12]。
尽管基因组覆盖全面且测序深度高,但经过多重检验校正后,无任何变异达到统计学显著性。先前在大型GWAS荟萃分析中报道的易感位点在该数据集中也未得到复现[10,13]。然而,鉴于56名心房颤动病例和177名对照者的相对较小队列规模,应谨慎解释这一发现。大规模人群研究如AFGen联盟或英国生物银行包括数千例病例,因此具有检测小效应大小变异的能力,而这些变异代表了迄今报道的心房颤动大多数遗传关联[10]。相比之下,本研究主要具有检测中等或大效应变异的能力。
如Roselli等人(2020年)的标志性研究所示,大规模荟萃分析已确定了138多个与心房颤动易感性相关的位点,包括PITX2和ZFHX3附近的已确立区域[10]。这些发现突显了心房颤动复杂的多基因结构。然而,由于等位基因频率、连锁不平衡结构、环境修饰因子或统计功效的差异,不同人群间单个位点的复现可能有所不同[14]。因此,本研究中缺乏显著关联不应被解释为先前报道的位点在波兰人群中不存在的证据,而应理解为大型GWAS中报道的小效应变异可能在较小队列中无法检测到。
几项研究已报道了心房颤动遗传结构的人群特异性差异。例如,Low等人(2017年)在日本队列中鉴定出几个位点,包括靠近KCND3、HAND2和NEBL的变异,这些变异表现出祖先依赖性效应,在其他人群中未一致复现[15]。这些观察结果说明了复杂多基因性状中跨人群复现的复杂性,并强调了在不同人群中评估遗传关联的重要性[14]。
在本研究中,经多重检验校正后,分析的19,395个心血管相关变异中无一显示与心房颤动的统计学显著关联[12]。在多变量逻辑回归模型中,年龄仍然是心房颤动风险最强的独立预测因子(每年OR 1.085)。这一观察结果与大量流行病学证据一致,表明衰老是心房颤动发展的主要临床决定因素[16]。尽管在基线分析中,高血压、糖尿病、冠状动脉疾病和心力衰竭等传统心血管风险因素在心房颤动患者中更为普遍,但在多变量模型中调整后,它们的关联减弱。在波兰65岁及以上老年人中,心房颤动患病率激增至19.2%,阵发性心房颤动形式主导了心律异常[16]。
波兰研究结果表明,斯拉夫人群可能代表第三种与西欧人和东亚人显著不同的遗传结构[12,17]。此外,本研究中19,395个心血管相关变异均无显著关联的结果表明,对已确立标记的阴性结果,流行病学信号反而主要由年龄主导[10]。这突显了区域生物样本库的关键需求,因为"一刀切"的基因组风险预测方法可能会通过为未充分代表的人群提供不太准确的风险分层而加剧健康差异[17]。上述研究已总结并比较于表2。
本研究中对波兰队列中NEBL基因的调查提供了对结构基因在心房颤动病因学中潜在作用的见解。然而,我们的数据不支持该人群中常见NEBL变异与心房颤动易感性之间的直接关联[12]。NEBL编码Z盘蛋白nebulette,该蛋白与肌动蛋白和α-辅肌动蛋白相互作用,在维持心肌细胞肌节完整性方面起重要作用[11,12]。该基因的致病性突变先前与扩张型、肥厚型和左心室致密化不全心肌病相关,这些疾病以心肌结构异常和收缩功能受损为特征[19]。
最近研究表明,主要参与心肌病的基因也可能导致心房颤动风险,即使在没有明显心力衰竭的情况下,可能通过与心房结构重构和纤维化相关的机制[20]。在此背景下,NEBL可能代表一种结构修饰因子,有助于心房心肌病的发展,这种基质以心房肥大、纤维化和对折返性心律失常的易感性增加为特征[21]。尽管我们的结果未显示常见NEBL变异与心房颤动之间的显著关联,但该基因中的罕见或功能破坏性变异仍可能在特定个体中贡献于心房颤动易感性。
NEBL基因内变异的分析未显示该人群中与心房颤动易感性的统计学显著关联。尽管参与心肌细胞完整性的结构基因已在心房重构和心肌病背景下进行过讨论,但当前数据不支持常见NEBL变异作为该队列中心房颤动主要易感因素的直接作用。
总体而言,这些发现突显了在不同人群中评估遗传关联的重要性,并强调了在中欧和东欧队列中进行更大规模基于测序研究的必要性。本研究代表了更好地表征未充分代表人群中心房颤动遗传学的探索性步骤,并为纳入更大队列和整合基因组分析的未来多中心研究提供了基础。
最终,年龄与心房颤动风险之间的强关联(每年OR 1.085)仍然是主导的流行病学信号,强化了在当代临床队列中,由衰老驱动的结构和环境重构常常掩盖常见遗传变异的细微信号的观点[12]。在n = 56的设置中,统计功效有利于显著效应,而对需要数千样本才能检测的细微OR < 1.2信号不敏感[22]。Bonferroni校正过于保守,掩盖了名义上的关联,而年龄偏差(p~6 × 10−16)混淆了单独的心房颤动信号[12]。然而,全基因组测序的全面观察,从编码到罕见非编码区域,优于阵列,精确识别阴性结果[10,23]。
最近的多基因风险评分(PRS)审计显示:高评分使心房颤动风险加倍,但种族调整对准确性至关重要[24,25,26]。本研究中复现的缺乏突显了在不同人群中实施PRS的显著挑战,并强调了外部有效性的重要性[17,26]。因果推断的"可迁移性",或将在源人群中获得的效应估计应用于不同目标人群的能力,在遗传祖先、中介物或效应修饰因子的分布在不同群体间存在差异时受到损害。因此,从西欧或东亚队列推导出的因果推断和心房颤动风险分层模型,若无严格的本地验证,可能对中欧-东欧人群不再有效或直接适用。例如,作为大多数心房颤动多基因风险模型基石的PITX2和ZFHX3位点,在该波兰全基因组测序(WGS)队列中未显示显著性[10,12,17]。如果这些主要驱动因素不可迁移,当前PRS对波兰患者的累积预测准确性将显著降低,可能导致次优的筛查和预防策略。
本研究还强化了新兴的"心房优先表型"假说,该假说认为对心房心肌病和结构重构的遗传易感性可能是某些人群中比在广泛GWAS中识别的电触发因素更强大的心房颤动驱动因素[27]。因此,在波兰患者中鉴定TTN或LMNA等基因中的罕见致病变异可能比应用基于常见SNP的风险评分提供更可靠的精准管理途径[5,17]。
结果解释必须考虑关键统计限制,主要集中在严格维护科学客观性[22]。统计功效是最重要的限制;鉴于n = 56心房颤动病例的较小样本量,本研究主要具有检测中等至大效应大小遗传变异的能力。然而,大规模荟萃分析一致表明,迄今为止发现的大多数心房颤动相关变异具有小效应大小(OR < 1.2),需要数千例病例才能可靠检测;因此,我们的缺乏关联并不排除常见小效应位点的存在[22]。Willer等人(2010年)强调,荟萃分析仍然是最大化检测常见性状中此类细微效应能力的金标准[22]。
此外,对多重检验应用Bonferroni校正对初步研究来说极为保守,可能掩盖达到名义显著性但未通过调整阈值的变异[10,12,22]。由于心房颤动组和对照组之间显著的年龄不平衡(p ≈ 6 × 10−16),残留混杂也可能持续存在,这可能会限制对与年龄相互作用的遗传信号的检测,或将结果偏向于在年轻"孤立性心房颤动"患者中表现的因素[12]。
尽管存在这些限制,方法学的优势在于使用高深度全基因组测序(WGS)而非传统基于阵列的基因分型[12]。虽然传统GWAS主要通过插补捕获非编码变异,但WGS提供了编码和非编码变异的综合目录,包括通常缺失于人群范围面板中的罕见突变[10,23]。通过聚焦于WGS数据中的靶向心血管基因面板,本研究最大化了临床相关性,确保阴性结果准确反映了波兰人群中不存在大效应变异[12]。
在我们的队列中,年龄成为心房颤动的主导独立决定因素,强化了进行性心房基质重构经常掩盖常见遗传变异的适度效应大小的概念,特别是在统计功效中等的人群研究中。这些数据凸显了一个基本原理:当疾病表达反映数十年累积的结构重构时,人口统计学和结构决定因素可能超过多基因易感性。
这些发现进一步阐明了NEBL的作用。NEBL在波兰人群中似乎不太可能作为主要易感基因,而是更可能作为结构贡献者,其对心房颤动的影响通过心房心肌病和结构重构过程间接介导。区分启动电不稳定性的基因与塑造结构基质的基因对于机制清晰度至关重要,并防止将关联信号误解为直接因果效应的证据。最重要的是,这项工作强调了精准心脏病学的一个更广泛的要求。在多基因风险评分能够为中欧和东欧数百万个体提供筛查或预防策略之前,验证不同欧洲亚群中的遗传风险位点日益必要。这是负责任的临床转化的先决条件。
本研究代表了一项基础性初步分析。它标志着从被动采用全球发现信号向发展区域基因组证据的转变。通过定义复现和未复现的位点,我们迈出了必要的一步,弥合了国际基因组研究与人群特异性心血管风险评估和护理之间的差距。
4. 结论
本研究提供了在波兰人群中调查心房颤动遗传背景的全基因组测序框架。结果有助于表征中欧和东欧人群中房颤的遗传结构,并为未来人群特异性研究提供参考点。包括归因于NEBL的变异在内的几个先前报道的易感位点复现失败,表明心房颤动的遗传决定因素可能在不同人群间存在差异。这些发现突显了遗传风险结构的潜在人群特异性,并强调了在未充分代表的欧洲人群中进行进一步大规模基因组研究的必要性。
5. 材料与方法
5.1. 样本收集
2020年4月至2021年4月间,在波兰各地收集了232名无关个体的血液样本,这些个体由华沙内政和行政部中央临床医院招募,属于"1000波兰基因组计划"(
5.2. 全面质量管理
该项目按照全面质量管理(TQM)方法进行,确保结果质量和分析风险及可能的困难。TQM要求定义程序的所有关键点:收集生物材料的参考范围、材料制备、分离、DNA浓度和质量、基因组测序以及数据质量控制。整个项目的法律和伦理透明度得到保障,包括数据的保密性、完整性和公正性。
5.3. 全基因组测序(WGS)
本研究对233名无关参与者进行了全基因组测序[更多详细信息见我们先前的报告:[31]]。按照标准化质量管理系统协议,从参与者处收集了4 mL K-EDTA外周血。使用QIAamp DNA Blood Mini Kit、Blood/Cell DNA Mini Kit (Syngen, 弗罗茨瓦夫, 波兰)和Xpure Blood Kit (A&A Biotechnology, 格但斯克, 波兰)按照制造商协议从外周血白细胞中分离基因组DNA。使用NanoDropTM分光光度计测量分离DNA的浓度和纯度,并使用凝胶电泳评估DNA质量。测序文库由Macrogen Europe (阿姆斯特丹, 荷兰)使用TruSeq DNA PCR-free试剂盒(Illumina Inc., 圣地亚哥, CA, 美国)和550 bp插入片段制备。使用2100 Bioanalyzer, Agilent Technologies (圣克拉拉, CA, 美国)测量DNA文库质量。全基因组测序(WGS)在Illumina NovaSeq 6000平台上使用150 bp配对末端读数进行,队列中平均覆盖深度为35.26X。
5.4. 关联研究
全基因组测序鉴定出38,296,203个单核苷酸多态性(SNPs)和短插入/缺失。为集中分析可能具有心血管相关性的变异,我们将关联分析限制在先前与心血管疾病相关的203个基因的预定义面板内。该面板包含274,921个SNPs和短插入/缺失。
为减少连锁不平衡(LD)导致的冗余,我们应用LD修剪选择单倍型块内的代表性变异(标签变异)。LD修剪使用50 kb滑动窗口和r2阈值0.5进行,其中r2表示两个位点等位基因之间的平方相关系数[32]。此程序在保留区域单倍型结构代表性标记的同时去除高度相关的变异。经过质量控制过滤和LD修剪后,共保留19,395个SNPs和短插入/缺失用于关联分析。
使用PLINK v1.9中实现的逻辑回归进行遗传关联测试[33]。将心房颤动状态建模为因变量,年龄和性别作为协变量纳入。基因型按照加性遗传模型编码(0、1或2个效应等位基因拷贝)[34]。
对于每个变异,估计了比值比(ORs)和相应的标准误差。应用两个统计阈值来考虑多重检验:
(1) Benjamini–Hochberg错误发现率(FDR) < 0.1。
(2) 对测试变异总数进行Bonferroni校正。
5.5. 统计分析
使用IBM SPSS Statistics (28 (2021年发布) IBM Corp., 阿蒙克, NY, 美国)进行统计分析。连续变量表示为平均值±标准差(SD),而分类变量表示为计数和百分比。使用学生t检验评估组间差异(连续变量),使用卡方检验评估分类变量。
为识别与心房颤动相关的临床因素,进行了逻辑回归分析。将心房颤动的存在作为因变量。自变量包括年龄、性别、高血压、糖尿病、冠心病、心力衰竭、既往卒中或短暂性脑缺血发作、慢性肾病、高脂血症和吸烟状况。计算了比值比(ORs)及其95%置信区间(CIs)。
双侧p值 < 0.05被认为具有统计学意义。
5.6. 研究局限性
本研究的一个局限是心房颤动病例数量相对较少(n = 56),这限制了检测具有小效应大小的常见变异的统计功效。大规模GWAS荟萃分析表明,大多数心房颤动相关位点导致适度的风险增加(比值比通常在1.05至1.20之间)。本研究主要具有检测中等或大效应大小变异的能力,而较小的效应可能在该队列中无法检测到。因此,先前报道位点的复现失败不应被解释为效应不存在的证据,而可能是初步测序数据集中统计功效有限的结果。
图1. 心房颤动组和对照组中男性和女性的分布。
图2. 心房颤动组和对照组中入院时的年龄分布。年龄的t检验高度显著(p ≈ 6 × 10−16)。
图3. 与心房颤动相关的曼哈顿图。上虚线表示Bonferroni校正的显著性阈值(p = 0.05),下虚线表示提示性显著性阈值。
表1. 研究组的基线特征。
| 变量 | 心房颤动(n = 56) | 对照组(n = 177) | p值 |
|---|---|---|---|
| 年龄,年(平均 ± SD) | 73.8 ± 10.1 | 58.2 ± 17.4 | <0.001 |
| 男性,n(%) | 40(71.4) | 110(62.1) | 0.27 |
| 高血压,n(%) | 40(71.4) | 66(37.3) | <0.001 |
| 糖尿病,n(%) | 17(30.4) | 30(16.9) | 0.047 |
| 冠心病,n(%) | 22(39.3) | 13(7.3) | <0.001 |
| 心力衰竭,n(%) | 17(30.4) | 13(7.3) | <0.001 |
| 既往卒中/TIA,n(%) | 9(16.1) | 5(2.8) | <0.001 |
| 慢性肾病,n(%) | 8(14.3) | 10(5.6) | 0.068 |
| 高脂血症,n(%) | 23(41.1) | 11(6.2) | <0.001 |
| 吸烟,n(%) | 12(21.4) | 13(7.3) | 0.006 |
| 红细胞(RBC)[mln/µL]平均 ± SD | 3.81 ± 0.83 | 4.20 ± 0.74 | 0.0029 |
| 血红蛋白[g/dL]平均 ± SD | 11.62 ± 2.49 | 12.67 ± 2.13 | 0.0064 |
表2. 涉及心房颤动遗传学的最重要研究。
| 研究 | 人群 | 鉴定/靶向位点 | 来源 |
|---|---|---|---|
| Roselli et al. 2020 | 多种族/欧洲 | 138个位点(如PITX2, ZFHX3)[10] | |
| Low et al. 2017 | 日本 | NEBL, KCND3, HAND2[15] | |
| Gudbjartsson 2007 | 冰岛 | 4q25(PITX2)[8] | |
| 波兰千人基因组 | 波兰 | 19,395个心血管变异[12] | |
| Yuan et al. 2025 | 跨人群 | 蛋白质组学增强位点[18] |
【全文结束】

