摘要
背景
明确需要简单有效的测试来识别最可能发展为阿尔茨海默病(AD)的个体,这既是为了临床试验招募,也是为了更好地管理可能经历早期临床前症状或有临床担忧的患者。
目标
使用多基因风险评分算法预测阿尔茨海默病神经影像学倡议(ADNI)中认知功能最可能因阿尔茨海默病而恶化的个体。比较PRS算法与pTau/Aβ1-42比值脑脊液生物标志物在预测认知衰退方面的表现。
设计
对在美国和加拿大50多个站点开展的阿尔茨海默病神经影像学倡议研究数据进行纵向分析。
环境
多中心遗传学研究。
参与者
515名在进入研究时被诊断为认知正常或轻度认知障碍的受试者。
测量
使用基因分型和/或全基因组测序数据计算多基因风险评分,并评估其预测随后4年内认知衰退的能力,通过CDR-SB和ADAS-Cog13量表测量。
结果
对于预测那些在4年内从基线轻度认知障碍下降至少15分ADAS-Cog13分数的个体,总体预测性能为72.8%(CI:67.9-77.7)AUC,当同时包括认知正常参与者时,这一数值增加到79.1%(CI:75.6-82.6)。仅评估轻度认知障碍受试者并使用大于0.6的阈值时,高遗传风险组在4年内平均比低风险组多下降1.4分(CDR-SB)。在预测认知衰退方面,所测试的PRS算法性能与pTau/Aβ1-42比值脑脊液生物标志物相当。
结论
计算多基因风险评分提供了一种简单有效的方法,通过从简单口腔拭子提取的DNA,选择最可能在未来四年内认知衰退的轻度认知障碍患者。
引言
阿尔茨海默病(AD)是最常见的痴呆形式,全球约有5000万人患病,估计经济影响达8180亿美元(1)。
AD不仅具有明显的遗传成分(2),而且遗传复杂。在神经病理学上,该疾病的特点是含有β-淀粉样蛋白(Aβ)的细胞外老年斑和含有过度磷酸化tau蛋白的细胞内神经原纤维缠结。已知相对少量的淀粉样蛋白前体和早老素基因的显性突变会导致早发性阿尔茨海默病。在过去二十年中,全基因组关联研究(GWAS)已经确定了与更常见的晚发性或散发性阿尔茨海默病(LOAD)相关的多个位点和单核苷酸多态性(SNPs)(3-5)。载脂蛋白E(ApoE)是一种主要的胆固醇载体,支持大脑中的脂质运输和损伤修复。ApoE的ε4等位基因(ApoE4)已被发现是AD的主要遗传风险因素,与早发性AD和LOAD的风险增加相关(6,7)。尽管只有20-30%的人类是ApoE4携带者,但这些人占所有阿尔茨海默病病例的60%。此外,ApoE4与发病年龄降低相关(8,9),使这一人群成为发展AD的高风险人群。
开发能够捕捉所有遗传因素对发展AD风险贡献的多基因风险评分(PRS)算法(10)是一种有吸引力的策略,可以为AD预防提供更好的临床试验。当包括APOE、性别和年龄以及PRS时,PRS方法已显示出75%至84%的预测AD发病的准确性(11)。特别是Escott-Price等人(12)开发的PRS方法,是基于10,000多个SNPs的加权贡献之和,其中权重是每个SNP与疾病关联的β系数。与其他PRS算法相比,其他方法使用较少的SNPs(例如仅31个SNPs(13)),这种方法包括在GWAS研究中不被认为具有全基因组显著性的SNPs。然而,包含这些数量大幅增加的单独携带阈下显著性的变异体,可能对整体性能提供实质性贡献,并且在应用于不同队列时也可能减少性能损失的风险。
到目前为止,使用这种方法进行的分析已经用于预测被诊断为AD或MCI(14)与认知正常的个体,尽管Altmann等人(15)已经使用PRS算法研究了各种AD病理和风险。在这里,我们研究PRS在预测最可能认知衰退的个体方面的表现,无论他们在入组时是否有认知障碍。
目前,最常用于丰富临床试验招募的方法是关注识别淀粉样蛋白生物标志物阳性的个体,这些个体更有可能出现进行性认知和功能衰退。此外,测量脑脊液中的tau,通常与淀粉样蛋白水平一起,使用越来越广泛。因此,我们还将PRS预测衰退的能力与使用脑脊液tau和淀粉样蛋白测量的能力进行了比较。
方法
用于准备本文的数据来自阿尔茨海默病神经影像学倡议(ADNI)数据库。ADNI于2003年作为公私合作伙伴关系启动,由首席研究员Michael W. Weiner博士领导。ADNI的主要目标是测试是否可以将系列磁共振成像(MRI)、正电子发射断层扫描(PET)、其他生物标志物以及临床和神经心理学评估结合起来,测量轻度认知障碍(MCI)和早期阿尔茨海默病(AD)的进展。
样本描述
ADNI是一项正在进行的纵向研究,旨在开发早期检测AD和随后监测疾病轨迹的方法,使用临床、成像和遗传数据。本分析的数据来自515名参与者,他们在进入研究时被诊断为轻度认知障碍或认知正常。此外,还使用了47名被诊断为AD的个体来检查算法是否按预期工作,以区分AD病例与认知正常的对照。所有参与者除了拥有合适的遗传数据外,还至少有4年的随访认知测试和成像扫描。进入研究时,199名个体认知正常,316名被诊断为MCI。总群体的平均年龄为73.2岁,CN组平均比被诊断为MCI的个体大约3岁(分别为75.1岁和72.0岁)。进入研究时,认知正常组和MCI组的ADAS-Cog13分数分别为9.0和14.9,在4年评估时,获得的平均分数分别为9.6和19.8,清楚地表明平均而言,MCI组继续下降,而CN组的平均分数变化很小。并非所有参与者都有脑脊液生物标志物数据,因此为了比较PRS与生物标志物(tau和淀粉样蛋白)作为预测随后认知衰退的能力,分析在290名MCI受试者上进行。
基因分型程序和质量控制
ADNI样本使用全基因组测序和/或Illumina Omni 2.5M BeadChip阵列进行基因分型。使用PLINK软件进行质量控制检查。检查包括排除缺失率大于0.02、次要等位基因频率小于0.01以及Hardy-Weinberg平衡p值小于1×10^-6的SNPs。经过这些检查后,剩下8,990,292个SNPs用于分析,其中约114,000个被用作多基因风险评分算法的一部分。
多基因风险评分计算
所有后续PRS计算使用专门构建的专有软件SNPfitR进行。PRS计算基于预先确定的逻辑回归模型,该模型基于大量SNPs中与AD已知关联的变异发生率与大量受试者中疾病存在之间的关联建模。受试者年龄、性别以及APOE4和APOE2蛋白的存在被包括为协变量。该软件计算每个SNP的个体分数与其效应大小加权后的标准化总和,添加协变量的值,并从模型方程中得出预测风险。
效应大小从IGAP研究中确定。对于缺失值的SNP,其评分贡献基于该SNP效应等位基因的人群频率进行估算。
统计分析
生成的多基因风险评分被导出用于呈现的分析。
使用统计分析软件包JMP 14.1.0进行所有数据操作和分析。ROC分析和AUC计算使用附加组件"Model Classification Explorer"进行。数值通过软件中进行的AUC计算进行交叉检查。
结果
AD PRS与阿尔茨海默病发病的关联
为了检查算法是否按预期工作,还为47名阿尔茨海默病病例生成了多基因风险评分,并与为199名认知正常个体生成的评分进行了比较。临床AD病例(n=47)与认知正常对照(n=199)的预测准确率为80% AUC。此外,PRS评分与tau水平明显相关,并且与诊断分类相关。可以看出,被归类为AD、晚期MCI(LMCI)或早期MCI(EMCI)的受试者主要位于PRS为0.6或以上的组中,而认知正常(CN)个体则往往位于PRS评分为0.6或以下的范围内。重要的是,不同APOE基因型亚组之间存在显著重叠。如预期,ApoE4携带者位于PRS范围的高端(0.6及以上),而ApoE2携带者位于低端。然而,代表约60%高加索人口的ApoE3/3纯合子跨越PRS谱的高端和低端,从而证明了风险算法提供的额外遗传风险信息,超过了单独的APOE。
AD PRS与从MCI基线认知衰退的关联
与之前用于分类病例的特定临床诊断不同,我们预测了可能由于AD从MCI或认知正常基线认知衰退的个体。表2显示了识别那些最可能从MCI或CN基线认知下降的个体的预测准确性,无论基线时的认知状态如何。分析将4年随访评估中显著进展定义为5分、10分或15分下降。虽然我们报告了预测从认知正常状态下降的准确性,但在该时间段内显著下降的个体数量相对较少,因此结果不能被视为具有统计学意义。然而,在316名以MCI诊断进入研究的个体中,有相当数量的人在ADAS-Cog13量表上下降了至少5分(107人)、10分(61人)和15分(39人),以允许测量有意义的预测准确性。
除了使用完整的PRS算法(APOE + PRS + Age + Sex)生成风险评分外,还计算了仅基于APOE状态和总遗传风险(APOE + PRS)的预测准确性。当测试那些在4年内下降至少10分的病例与那些保持认知稳定(<5分下降)的病例相比时,观察到最佳预测准确性,AUC为74.8%,而单独APOE为67.4%,APOE + PRS为73.5%。在预测那些有15分下降的个体时,也看到了类似的表现。在这两种分析中,所有那些个体的多基因风险评分都在分布的上半部分。当观察4年内认知表现的较小变化时,将多基因风险评分项添加到APOE并没有带来更大的性能。在所有情况下,在此特定组中添加年龄和性别作为协变量并没有为此特定队列中的CN和MCI组之间特定的年龄和性别分布增加任何额外的预测性能。鉴于下降和保持相对稳定的个体的平均年龄相似,年龄对两组总体风险评分的贡献将大致相当。
为了评估完整的算法是否可以预测由预定阈值定义的认知衰退并与脑脊液生物标志物状态预测的认知衰退进行比较,研究了遗传、脑脊液和CDR-SB评估数据都可用的MCI人群(n=290)。在基线评估后6个月,风险评分大于0.6(n=196)的患者与评分小于0.6(n=94)的组之间在进展(由CDR-SB定义)方面存在显著差异。0.6被选为阈值,基于敏感性和特异性的最佳平衡。高风险患者在24个月内平均进展约1分,在48个月内进展2分,而低风险患者在同一时间点平均下降0.2和0.4分。进行了类似的评估,以使用由pTau/Aβ(1-42)比值确定的脑脊液生物标志物阳性来比较预测性能,使用0.028的截止值,以及使用880pg/mL阈值的脑脊液Aβ(1-42)。同样,在生物标志物阳性和阴性患者之间进展存在显著差异。pTau/Aβ(1-42)比值阳性的患者在24个月和48个月内平均分别进展1.1分和2.9分,而阴性组平均仅下降0.1和0.2分。同样,仅使用Aβ(1-42)脑脊液水平,淀粉样蛋白阳性组在24个月和48个月分别进展1分和2.6分,而阴性组在48个月内平均仅进展0.3分。PRS的性能在识别CDR-SB量表上认知衰退风险最高和最低的受试者方面与任一脑脊液生物标志物测量大致相似。此外,仅对APOE3纯合子个体(n=125)进行了类似的分析。同样,使用0.6的阈值确定高风险组(n=49),两组之间由CDR-SB变化测量的差异在12个月时显现,在36个月时有明显差异。高风险组在36个月时平均下降1.5分,而低风险组平均仅下降0.5分。
讨论
本研究旨在证明特定PRS算法在识别在特定时间内认知显著下降风险最高的个体方面的潜在效用。以前,大多数报告PRS方法使用的研究用于区分具有明显不同临床表型的两个人群(AD与CN),因此不一定证明该方法如何前瞻性地使用。这些分析的结果表明,使用旨在了解未来阿尔茨海默病发病遗传风险的多基因评分算法,可以应用于丰富试验人群,这些人群更可能在特定时间内认知下降。
虽然APOE基因型在此队列中仍然是一个重要的遗传风险因素,但很明显,在评估遗传风险时应考虑额外的遗传成分。这将随后允许在APOE基因型内进行进一步的风险分层,例如识别相对于一些APOE4携带者风险相对较高的APOE3纯合子。这对临床试验设计有影响,在许多试验设计中,拥有至少一个APOE4等位基因被用作预防试验的富集策略。
广泛认为,脑脊液tau/淀粉样蛋白比值是未来认知下降的合理预测指标,尽管尚未进行确定性研究,而通过PET成像或脑脊液单独测试淀粉样蛋白仍然是富集最可能认知下降患者的试验的标准方法。本研究表明,PRS预测在预测MCI诊断患者进一步进展方面能够达到与CDR-SB测量相似的水平。重要的是,这种遗传风险评估可以通过全血或口腔拭子测试更容易地获得(成本和患者负担),而不是通过侵入性腰椎穿刺程序和随后的脑脊液测试;这种侵入性程序对可能相对认知健全的老年人(早期MCI或前驱期)尤其具有挑战性。因此,PRS算法代表了一种有希望的方法,可以促进潜在试验参与者的广泛筛查,以识别认知下降风险最高的个体。随后,可以通过使用更侵入性和昂贵的脑脊液和/或PET成像进行进一步确认性测试,然后集中在显著减少的个体数量上进行最终患者招募决策。此外,PRS和tau水平的组合(潜在遗传风险与通过病理表现的风险)可能为早期症状性或前症状性个体后续AD发病的可能性提供更优化的模型。虽然对于专注于特定针对淀粉样蛋白或tau的治疗方法的临床试验可能有特定原因需要淀粉样蛋白或tau生物标志物,但PRS可能对具有不同治疗目标的疗法具有优势,独立于潜在机制。
进一步的研究将很重要,以确定结合淀粉样蛋白/tau和PRS标志物的附加值,并完全确定PRS在预测认知正常个体认知下降方面的效用。
人们认识到,这项工作在开发预测认知症状进一步发展的模型时,考虑了遗传风险与年龄和性别的结合,因此没有考虑其他已知影响发病和疾病发展的风险因素。结合遗传和生活方式风险因素以识别阿尔茨海默病风险最高的个体,可能会进一步提高预测准确性。
研究局限性
本研究并非没有局限性,样本量是主要缺陷。这在评估仅APOE E3纯合子亚组时尤其相关。此外,对包括从认知正常基线下降的所有诊断类别的更大样本量的研究,对于了解更广泛的效用很重要。与大多数此类研究一样,在替代队列中观察到类似的表现对于理解和确认多基因风险评分评估用于临床试验招募和临床实践至关重要。
【全文结束】

