跨人群全基因组关联分析(GWAS)和蛋白质组学的结合显著提升了对心房颤动(AF,简称房颤)风险的预测能力,同时揭示了其潜在的生物学机制。房颤是一种常见的心律失常疾病,具有强烈的遗传因素,但其分子机制和潜在治疗靶点尚未完全阐明。研究团队进行了一项跨人群的全基因组荟萃分析,涵盖了168,007例房颤病例,发现了525个达到全基因组显著性的遗传位点。其中,_PITX2_和_ZFHX3_两个基因被确定为在不同祖先人群中共享的位点。
研究采用全面的基因优先化策略,强化了肌肉发育和心脏收缩在房颤中的作用,同时还揭示了其他新通路,包括细胞对转化生长因子-β(TGF-β)的反应。群体特异性遗传相关性分析显示,欧洲人和非洲人在循环系统共病方面既有共同点也有差异。孟德尔随机化(MR)分析识别出可改变的风险因素和循环蛋白,为疾病预防和药物开发提供了重要信息。将基因组数据与蛋白质组学数据相结合,显著增强了房颤风险预测的能力。
房颤是全球范围内的流行病,尤其在北美和欧洲地区发病率较高。据《全球疾病负担研究2019》估计,全球约有5970万人患有房颤,这与全球约840万伤残调整生命年(DALYs)的损失有关。因此,迫切需要阐明房颤的病因以改善风险预测、预防和治疗。
尽管环境因素在房颤发展中起一定作用,但其遗传贡献越来越受到重视。此前多项GWAS已发现了超过100个与房颤相关的风险位点,揭示了房颤的遗传结构。然而,这些研究大多基于欧洲人群,更大规模、更多样化的GWAS——尤其是包含多人群的研究——可以增强小效应变异的发现能力,并识别出群体特异性和共享的位点。
本研究进行了跨人群的GWAS荟萃分析,涉及超过200万名个体,并进行了全面的下游分析,揭示了未报告的遗传位点,识别了因果风险因素,并提升了房颤风险预测和治疗机会。
跨人群GWAS荟萃分析发现379个未报告的位点
研究首先在欧洲人群中进行了GWAS荟萃分析,纳入了来自九项研究的153,980例房颤病例,识别出493个达到全基因组显著性的遗传位点。其中五个位点在不同GWAS之间显示出显著的效应异质性。在493个位点中,479个在发现数据集和验证数据集中表现出一致的效应估计值,426个在验证研究中达到了统计显著性。使用连锁不平衡得分回归(LDSC)方法,普通变异解释了假设患病率为2%时,房颤易感性方差的11.2%(95%置信区间:9.2%-13.2%)。
跨人群GWAS荟萃分析纳入了168,007例房颤病例,识别出525个达到全基因组显著性的位点。十三个位点显示出显著的效应异质性。大多数风险等位基因具有较小到中等的效应大小,每个等位基因的优势比(OR)介于1.0到1.3之间。然而,六个主要单核苷酸多态性(SNPs)的OR值超过1.3,位于_SORCS3_、POLD1、AGBL4、AC126283.1、_PITX2_和_FAM241A_基因附近。在525个显著位点中,按人群分布来看,欧洲人群中发现了483个,东亚人群中发现了29个,非洲人群中发现了5个,混血美洲人群中发现了2个。_PITX2_和_ZFHX3_基因的两个位点被确定为跨人群共享。
综合基因优先化细化路径探索
研究团队使用了一种系统化的优先化框架,在504个全基因组显著性位点中提名可能的因果基因。其中,70个基因携带蛋白质改变变异,47%的优先基因在可用方法中一致性超过80%。通过Reactome数据库的通路富集分析,确定了五条显著关联的通路。此外,Gene Ontology(GO)数据库的富集分析进一步确认了肌肉发育和心脏收缩在房颤发病中的核心作用,同时揭示了其他通路,包括TGF-β信号传导、血管重塑、电耦合调节和肌动蛋白丝运动。
群体特异性遗传相关性揭示循环系统共病
经过Bonferroni校正后,房颤与欧洲人群中的95个循环终点和非洲人群中的18个循环终点显著相关。一些表型在欧洲和非洲人群间显示出显著的遗传相关性差异,如一度房室传导阻滞、腹主动脉瘤、下肢静脉曲张、深静脉血栓形成、心动过速、短暂脑缺血发作和异常心音等。
孟德尔随机化揭示可改变的风险因素
孟德尔随机化分析识别出身体质量指数(BMI)、腰臀比、内脏脂肪、儿童期BMI、载脂蛋白A-I水平、载脂蛋白B水平、低密度脂蛋白(LDL)胆固醇水平、2型糖尿病、收缩压和舒张压、促甲状腺激素水平、吸烟、终身吸烟指数、饮酒、休闲屏幕时间和失眠等作为房颤的因果风险因素。这些关联在敏感性分析中仍然稳健。
双向蛋白质组学孟德尔随机化识别因果蛋白
整合deCODE和UKB-PPP的蛋白质定量性状位点(pQTL)数据,正向孟德尔随机化分析(遗传预测的蛋白质水平对房颤的影响)包括2847种独特蛋白质,使用顺式遗传变异作为工具变量。经过筛选,发现95种循环蛋白水平与房颤风险显著相关。其中,21种和16种蛋白质分别通过传统共定位分析和SuSiE共定位分析显示出强共定位证据。总计28种蛋白质被认为与房颤存在潜在因果关系,一个标准差增加带来的房颤优势比从ING1的0.61(95%置信区间:0.49–0.75)到ATXN2L的1.68(95%置信区间:1.35–2.09)。这些蛋白质中的一部分在独立数据集中得到了验证。
多基因风险评分和蛋白质评分提升疾病预测
为了评估多基因风险评分(PGS)在独立数据集中的表现,研究团队在宾夕法尼亚大学医学生物库(PMBB)中进行了测试。由跨人群GWAS荟萃分析得出的PGS显示出房颤患病率的剂量-反应关联,每增加一个标准差的PGS与房颤的OR值为1.82(95%置信区间:1.79–1.85)。相比第一十分位的个体,第十十分位的个体房颤风险增加了六倍(OR = 6.38,95%置信区间:5.30–7.75)。该PGS的表现优于Miyazawa等人研究中的PGS002814,接收者操作特征曲线下面积(AUC)为0.780(95%置信区间:0.778–0.783),Brier评分为0.092(95%置信区间:0.091–0.093),优于PGS002814(AUC = 0.767,95%置信区间:0.764–0.769;Brier评分 = 0.094,95%置信区间:0.093–0.095)。
在一个包含3441例新发房颤和47,437例无房颤个体的队列中,研究团队构建了一个蛋白质评分(ProS)和一个PGS,评估其对房颤风险的预测价值。ProS包括87种蛋白质,表现出与房颤发生率的正相关关系,在测试集中表现出强大的预测性能,AUC为0.792,Brier评分为0.119。同样,PGS也显示出与新发房颤的强烈关联。将ProS加入PGS显著提高了房颤风险预测的性能,综合模型的AUC为0.823,Brier评分为0.059。
讨论
这项大规模跨人群GWAS荟萃分析包含了168,007例房颤病例和1,959,739名对照,识别出许多未报告的遗传位点,细化了房颤的遗传结构,并强调了包容性人群研究的重要性。值得注意的是,欧洲人群中识别出大部分风险位点,而非欧洲人群中则较少,这种不平衡反映了样本量差异,突显了未来遗传研究中增加代表性不足人群的紧迫性。
研究还指出了六个效应较大的SNPs,位于_SORCS3_、POLD1、AGBL4、AC126283.1、_PITX2_和_FAM241A_基因位点,表明这些位点具有更强的遗传贡献。_PITX2_和_ZFHX3_是已知与房颤相关的基因,本次研究再次证实了它们在四个群体中的作用。对于蛋白质分析,遗传预测的NT-proBNP水平与房颤呈负相关,与观察性研究结果相反,提示NT-proBNP升高可能是继发性血液动力学压力和心房牵张的结果,而非房颤本身的直接效应。
结论
本研究通过跨人群GWAS荟萃分析识别出525个房颤遗传位点,细化了其遗传结构和生物学通路。孟德尔随机化揭示了因果风险因素和循环蛋白,为房颤预防和治疗提供了见解。跨人群衍生的多基因评分(PGS)与蛋白质评分(ProS)结合显著提升了风险预测能力。本研究整合了遗传发现、因果推断和多组学数据,推动了房颤风险分层、预防和潜在治疗策略的发展。
(全文结束)

