摘要
水痘-带状疱疹病毒(VZV)是一种嗜神经病毒,可在人体内建立终身潜伏感染。VZV再激活与多种症状相关,包括带状疱疹(HZ,俗称蛇盘疮),并被认为可能参与痴呆的发展,但其确切影响尚不清楚。本研究对美国超过1亿人的健康记录进行了大规模纵向分析,结果表明在控制近400个测量特征(涵盖人口统计学、社会经济因素、合并症、药物使用、医疗寻求行为代理指标、临床指南变化和记录完整性)后,VZV再激活与痴呆之间存在一致的关联。我们发现,与单次带状疱疹发作相比,反复发作带状疱疹与更高的痴呆风险相关。此外,与23价肺炎球菌多糖疫苗(PPSV23)对照组相比,接种带状疱疹疫苗与痴呆风险降低相关。而且,减毒活带状疱疹疫苗对痴呆风险的降低作用随时间推移而减弱,并与疫苗对带状疱疹的保护作用减弱高度相关。接种重组带状疱疹疫苗后3年和5年的痴呆风险降低程度,在接受多次接种而非仅一次接种的个体中更为显著,尤其是在带状疱疹高风险人群中。我们的研究结果强烈表明VZV再激活是痴呆的一个可改变风险因素。
主要内容
痴呆与认知功能下降相关,严重影响日常活动,主要影响老年人群。由于全球平均年龄不断上升且缺乏有效的预防和治疗措施,预计到2050年,痴呆患者人数将达到1.53亿。痴呆的潜在病因复杂且尚未完全了解。遗传、血管和代谢疾病以及多种生活方式因素已被证实会增加痴呆诊断风险。
关于嗜神经人类疱疹病毒在痴呆和阿尔茨海默病中的潜在作用的证据越来越多,特别是单纯疱疹病毒1型(HSV-1)和水痘-带状疱疹病毒(VZV),大多数成年人都携带这些病毒。分子研究表明,VZV可能通过直接(神经毒性淀粉样肽沉积)或间接(通过激活潜伏的HSV-1)方式促进痴呆或阿尔茨海默病样病理。感染VZV的个体脑脊液中淀粉样蛋白和胰淀素水平较对照组升高。在VZV感染(而非假感染或HSV-1感染)的静止人神经周细胞和脊髓星形胶质细胞中,也观察到细胞内胰淀素、β-淀粉样肽和淀粉样蛋白水平增加。其他细胞和动物模型研究表明,HSV-1感染后β-淀粉样蛋白1-40和1-42水平及磷酸化tau蛋白增加。最后,研究表明VZV感染幼稚人神经干细胞导致胶质增生和促炎细胞因子水平升高,但未直接诱导神经毒性表型。然而,VZV感染导致静止感染细胞中HSV-1再激活,从而引起类似痴呆的细胞变化。
与疱疹病毒在痴呆发展中的作用一致,抗疱疹病毒抗病毒治疗和预防临床VZV再激活(即带状疱疹)的疫苗接种已被证明与痴呆和/或阿尔茨海默病风险降低相关。虽然这些发现对公共卫生具有重要意义,但对这些观察结果的机制理解仍然缺乏。我们的研究通过调查并确立持续的VZV再激活是带状疱疹导致痴呆发展的可能机制路径,填补了这一空白。
为验证VZV再激活导致痴呆风险增加的假设,我们研究了几个假设,如果该假设成立,则所有这些假设都必须为真。
第一个假设——VZV再激活负担越重,痴呆风险越高——通过比较多次带状疱疹发作与单次发作的个体进行检验。
第二个假设——再激活负担降低导致痴呆风险降低——通过调查接种带状疱疹疫苗(减毒活带状疱疹疫苗[ZVL; Zostavax, Merck]或重组带状疱疹疫苗[RZV; Shingrix, GSK])的个体未来痴呆风险进行检验。
第三个假设——VZV再激活调控强度与痴呆风险降低成正比——通过评估接受不同类型和剂量带状疱疹疫苗(至少一剂ZVL、一剂RZV或至少两剂RZV)的个体中对带状疱疹的不同保护水平进行检验。
第四个假设——VZV再激活对痴呆风险的影响与随时间推移对VZV再激活的保护成正比——通过利用接种ZVL个体中对带状疱疹的保护在约10年内减弱的现象进行检验。
最后,第五个假设——VZV再激活风险较高的人群从带状疱疹疫苗接种中获益更多——通过评估带状疱疹高风险人群(即女性和老年人)接种ZVL或RZV后痴呆风险进行检验。
在检验上述假设时,我们一致证明VZV再激活减少是带状疱疹疫苗预防痴呆的机制,从而为现有观察结果提供机制支持。
通过利用50岁及以上不同人群的大规模纵向电子健康记录(EHR),这些人群暴露于与VZV再激活相关的各种因素,我们实现了上述目标。为提高研究结果的可信度,我们:(1)通过纳入并调整近400个EHR衍生协变量并使用主动对照,增加对未测量混杂因素的控制程度;(2)量化残余混杂风险(并证明已解决残余混杂);(3)在单一、大型数据集中,使用这一高标准混杂控制,在不同环境中复制先前研究的观察结果。在全面控制混杂因素的情况下,我们的全部发现强烈表明VZV再激活是痴呆进展的一个可改变风险因素。
结果
我们使用多中心Optum EHR数据库,该数据库包含2007年至2023年间在美国7,000多家医院和诊所就诊的1亿多名不同个体的去标识化纵向健康记录。作为常规临床护理的一部分,其中一些个体暴露于各种指示或影响VZV再激活水平的因素,包括反复带状疱疹和不同的VZV疫苗(ZVL和RZV;图1)。我们利用全面的EHR数据构建了近400个暴露前特征的协变量集,包括人口统计学、合并症/生活方式因素(如吸烟状况、心血管疾病和糖尿病)、医疗利用和医疗寻求行为(补充表1-18)。利用这些协变量,我们使用基于机器学习的方法为50岁或以上个体创建了1:1倾向评分匹配队列(方法)。构建匹配队列后,我们使用记录的痴呆诊断和感兴趣的暴露来评估VZV再激活与痴呆进展之间的关系。痴呆诊断和感兴趣的暴露基于Optum EHR中至少一个相关代码的存在来确定(补充表19和20)。带状疱疹,作为临床上表现为疼痛性水疱疹的VZV再激活形式,是本研究中调查的唯一VZV再激活形式。其他感兴趣的暴露是带状疱疹疫苗(RZV和ZVL)以及23价肺炎球菌多糖疫苗(PPSV23)。PPSV23被选为主动对照,因为它是一种针对与带状疱疹疫苗适用人群大致相似人群的可选疫苗,但不提供对带状疱疹的保护。
带状疱疹复发与痴呆风险增加相关
我们发现,与单次带状疱疹发作相比,经历多次带状疱疹发作与指数日期(即第二次带状疱疹发作)后3-9年痴呆风险增加7-9%相关(图2a)。
疫苗介导的带状疱疹预防与痴呆风险降低相关
与暴露于PPSV23的个体相比,接种带状疱疹疫苗与痴呆风险降低相关:ZVL在指数日期后3年降低33%(95%置信区间[CI]=30-35%),至少2剂RZV(RZV[2+剂])降低27%(95% CI=20-34%)(图2b,c)。ZVL和RZV队列与PPSV23队列相比的较低痴呆风险持续到指数日期后5年(图2b,c)。
疫苗介导的带状疱疹保护越高,痴呆风险降低越显著
单独的临床试验报告显示,50岁及以上成年人中两剂RZV的有效性为97.2%(95% CI=94-99%),70岁及以上为91.3%(95% CI=87-95%),而ZVL在50-59岁成年人中的有效性为70%(54-81%),在70岁及以上为38%(25-48%)。在真实世界研究中,两剂RZV对带状疱疹的防护效果优于单剂。在本研究中,当比较RZV(2+剂)与ZVL时,RZV在指数日期后5年的痴呆风险低18%(95% CI=2-31%)(图3a)。此外,在指数日期后3年和5年,接受多次RZV剂量与仅接受一次RZV剂量的个体相比,痴呆风险分别降低24%(95% CI=18-29%)和19%(12-26%)(图3b)。
疫苗介导的带状疱疹抑制减弱与痴呆风险回归基线相关
先前发现ZVL提供的针对临床VZV再激活(即带状疱疹)的保护会随时间减弱,在接种后约10年几乎完全丧失有效性。因此,我们研究了带状疱疹保护减弱与痴呆风险降低之间的关系,随访期长达15年(图4)。ZVL的效果相对于PPSV23对照队列进行评估,在该队列中,带状疱疹和痴呆病例的累积数量预计在15年随访期间增加。在接种ZVL的个体中,该疫苗与痴呆诊断的保护关联与带状疱疹发作的保护关联相关(Pearson's R=0.59;图4)。这一发现表明观察到的ZVL对带状疱疹和痴呆的效果减弱之间存在一致关系。
在图4中,我们观察到带状疱疹的相对风险(RR)保持相对稳定,而痴呆的RR持续向1值回归。我们将这一观察归因于带状疱疹病例被预防,而痴呆病例仅被延迟(即在发展为痴呆的个体中,进展较慢但最终随着ZVL相关保护减弱而恢复)。在VZV再激活得到强力疫苗介导控制期间,VZV再激活对痴呆进展的贡献可能较小(例如,通过最终导致细胞死亡的炎症级联)。然而,随着对VZV再激活的保护减弱,触发痴呆的过程可能恢复,最终导致痴呆诊断时间晚于无保护干预时可能的情况。我们注意到,这一观察也符合我们对神经退行性变作为连续、渐进过程而非单一离散事件的理解。
由于RZV在2017年才进入美国市场,且接种RZV后具有4-5年随访数据的个体数量有限,因此在本出版时无法对RZV进行类似的长期分析。
减少临床VZV再激活对痴呆相关的益处在带状疱疹高风险人群中更为显著
已知某些个体特征,如年龄较大和女性性别,与更高的带状疱疹风险相关。如果VZV再激活减少是带状疱疹疫苗接种后痴呆进展延迟的机制,并假设高风险人群的再激活率/幅度更大,那么与低风险人群相比,高风险人群的ZVL或RZV免疫对痴呆进展的影响应该更大。因此,我们研究了在带状疱疹高风险人群中预防带状疱疹是否也带来了更大的痴呆进展风险降低。通过按性别和年龄分层,我们发现与暴露于带状疱疹疫苗的总体队列相比,在指数日期后3年和5年,高风险和/或女性个体的痴呆风险相对降低更为显著(图5)。暴露于ZVL的50岁及以上女性个体在指数日期后3年和5年的痴呆诊断风险分别降低35%(95% CI=31-38%)和31%(28-34%)(而所有个体分别为33%和27%;图5a)。此外,暴露于多剂RZV的80-89岁女性个体在指数日期后3年和5年的痴呆诊断风险分别降低39%(29-48%)和27%(10-40%)(而所有个体分别为27%和17%;图5b)。
机器学习控制近400个协变量和使用主动暴露对照组有效降低残余混杂风险
为量化残余混杂风险,我们进行了负面对照时间偏移分析,将暴露日期人为提前一年。指数日期被提前到干预对痴呆产生生物学影响之前的时点,只留下队列的固有差异作为唯一可能的解释。使用这些时间偏移分析,我们发现大多数暴露对比较的主动对照与其他可选疫苗相比,残余混杂的证据很少(扩展数据图1)。在重复主要比较时,我们还一致观察到,当使用未暴露于带状疱疹疫苗的对照组而非暴露于PPSV23的对照组时,痴呆进展延迟更为显著(扩展数据图2)。然而,时间偏移分析显示,在比较疫苗暴露与未暴露队列时,混杂风险更高(扩展数据图1)。这一发现突显了广泛混杂控制的重要性,本研究通过考虑近400个协变量和使用可比对照组实现了这一点。比较队列通常较大,包括从56,320(RZV[2+剂]与ZVL)到703,263(ZVL与PPSV23)名个体,在匹配后,这些队列在所考虑的协变量上高度平衡(补充表2-18和21-28以及补充图1-6)。通过不同定义(扩展数据图3和补充表27)和痴呆亚型(扩展数据图4和补充表28)进一步验证了研究结果的稳健性。
讨论
我们的研究表明VZV再激活与痴呆之间存在一致的流行病学联系。这引发了一个问题:嗜神经人类疱疹病毒与痴呆风险之间是否存在潜在的因果联系,以及减少VZV再激活的干预措施是否也可能延迟痴呆进展。我们利用大型多中心Optum EHR数据库证明,VZV再激活负担较低(在RZV/ZVL接种个体或仅有一次带状疱疹发作的个体中)与随访长达9年的痴呆风险显著降低相关。相反,与VZV在痴呆样病理发展中作用相关的研究一致,我们发现临床VZV再激活负担增加的队列(即多次带状疱疹发作的个体)痴呆风险增加。这些观察结果在VZV再激活控制的不同程度下保持一致,例如,接受多剂RZV的个体相比仅接受单剂的个体观察到更大的益处。此外,我们发现VZV再激活风险较高的人群(即50岁及以上和80岁及以上的女性)通过疫苗抑制的VZV再激活,在随访3年和5年时从痴呆风险降低中获益更多。这与先前报道的女性在接受ZVL和RZV后比男性获得更大的风险降低一致。此外,我们利用ZVL自然减弱的有效性证明,对VZV再激活的保护减弱与痴呆延迟益处的丧失同时发生。总之,本研究中观察到的关联表明VZV再激活是50岁及以上成年人进展为痴呆的一个促成因素。
尽管现有数据表明VZV再激活与痴呆之间的关系是研究结果的最佳解释,但目前尚不清楚VZV感染及其随后的(临床和亚临床)VZV再激活如何可能影响痴呆进展。分子研究报道了VZV可能通过直接诱导淀粉样蛋白沉积或通过激活潜伏HSV-1间接促进痴呆或阿尔茨海默病样病理。此外,VZV感染被确定为血管病变的原因,并与类似阿尔茨海默病中观察到的脑血管事件(如梗死、缺血和出血)相关。我们的数据无法确定VZV再激活对痴呆的影响是HSV-1介导的还是VZV介导病理的直接后果。
本研究考察了电子健康记录中记录为带状疱疹发作的临床表现VZV再激活与痴呆的联系,而未调查其他非带状疱疹的VZV再激活临床表现,因为它们比带状疱疹罕见得多。然而,其他VZV再激活的临床形式甚至亚临床VZV再激活可能对痴呆进展有影响。唾液、血液和脑脊液样本数据表明VZV亚临床再激活频繁发生,即使在健康个体中也是如此,并且据报道,暴露于太空飞行相关压力的宇航员中VZV亚临床再激活显著增加。亚临床VZV再激活可能在无带状疱疹症状的情况下影响痴呆风险,而本研究中展示的与带状疱疹的相关性可能反映了带状疱疹作为一般VZV再激活负担更高的代理指标。需要进一步研究评估低水平VZV再激活的分子标志物,以阐明无临床表现或非带状疱疹临床表现的VZV再激活是否也可能与痴呆进展相关。
本研究的主要局限性在于,没有前瞻性随机对照设计,无法最终确立所评估暴露与测量痴呆结果之间的因果关系。然而,跨多种暴露和时间的一致发现合理地将观察结果的解释限制在两个可能机制之一。第一个是观察到的暴露差异是由未知或未控制的残余混杂因素驱动的。另一种解释是与带状疱疹疫苗针对VZV的活性相关的潜在因果机制。
混杂是任何回顾性分析的主要关注点,我们不能排除本研究中存在残余混杂的可能性。然而,与大多数其他关于痴呆与带状疱疹疫苗接种和带状疱疹发作关联的研究相比,这种风险较低,因为任何偏倚或混杂都必须在多种暴露和相似时间框架内一致地影响结果。考虑到本研究中测试的暴露数量众多和评估的多年时间跨度,这种系统性混杂因素的存在不太可能由偶然解释。
为解决未测量混杂的风险,我们利用Optum EHR的广泛数据和非线性机器学习估计器来控制近400个协变量,涵盖人口统计学、合并症、医疗利用和医疗寻求行为。此外,通过使用PPSV23主动对照,我们考虑了匹配人群中与医疗寻求行为相关的潜在未测量混杂因素。在更可能从VZV再激活减少中获益的人群(老年人和女性)中,观察到的效应大小表明,潜在未考虑的混杂因素必须在接种后3年内使对照PPSV23队列的痴呆风险增加2.66倍,才能解释组间观察到的痴呆结果差异(E值=2.66)。在最重要的不可改变痴呆风险因素中,年龄和性别已得到控制。已知遗传变异会增加痴呆风险,但本研究未对其进行控制。尽管如此,对遗传上高风险个体的大规模系统选择偏倚预计会在残余混杂的负面对照时间偏移分析中可见,因为遗传不会随时间变化。尽管已确定几种风险因素是痴呆进展的重要贡献者,但这些风险因素中可能没有一个能提供本研究中报告的与痴呆相关的所需效应幅度。在痴呆的可改变风险因素中,教育程度、认知储备和身体活动未直接控制。然而,这些因素已知与医疗利用和合并症相关,以及与体重指数和肥胖状态相关,而这些因素已得到控制。我们还控制了痴呆的其他显著可改变风险因素,包括糖尿病和吸烟状况。
我们的敏感性分析表明,与PPSV23的主动比较中残余混杂风险最小。其他可能同时影响痴呆和带状疱疹的潜在解释,如反向因果关系(即痴呆导致VZV再激活)或可能同时影响痴呆和带状疱疹的系统性偏倚,可以排除,因为RZV和ZVL对带状疱疹的保护作用已在随机临床研究中得到证实。因此,系统性混杂因素必须特定于痴呆,不应影响暴露对带状疱疹的影响。
此外,本研究关于带状疱疹疫苗的结果与文献中关于ZVL和RZV的讨论一致。通过依赖基于固定截止日期的自然实验,先前研究也显示带状疱疹疫苗接种与女性个体痴呆风险降低之间存在更强的关联,尽管使用了基于回归不连续性的研究设计和来自不同医疗系统的数据集。使用类似的准实验方法,另一项研究显示RZV免疫与暴露后6年内痴呆自由时间增加17%相关,并与流感和破伤风-白喉-百日咳对照疫苗相比,痴呆风险显著降低。
最后,EHR衍生数据固有的局限性,如不完整的药房索赔和暴露及结果的误分类或缺失,可能在一定程度上存在于本分析中。RZV随访时间的限制使我们无法将其对带状疱疹和痴呆进展的影响与ZVL一样进行15年比较。虽然长期数据仍在等待中,但由于RZV免疫后对带状疱疹的高有效性和持久保护,RZV在相同随访期内延迟痴呆的效果可能不同。
总之,我们在一个大型、多样的美国数据库中发现VZV再激活与痴呆进展之间存在一致关系,该数据库允许我们控制近400个协变量。我们观察到对VZV再激活的保护与痴呆之间的相关性,以及临床VZV再激活负担增加与痴呆诊断3-9年风险增加之间的相关性。将VZV再激活确立为痴呆进展的可改变风险因素可能对公共卫生、预防和未来痴呆靶向治疗的潜在开发具有广泛影响。虽然我们已采取广泛措施降低混杂风险,且支持VZV再激活减少与痴呆风险降低之间关系的研究结果在不同环境和时间上保持一致,但无法完全排除未测量混杂作为观察结果潜在解释的可能性。
方法
研究设计与伦理
这是一项回顾性、观察性、匹配队列研究,进行成对比较。由于未收集或分析任何个人可识别数据,因此无需伦理委员会或机构审查委员会的伦理批准。该研究在HMA-EMA真实世界数据源和研究目录(前身为欧盟上市后研究[EUPAS]注册)中注册,编号为EUPAS107206。
人群和随访
本研究使用了Optum EHR数据库中的去标识化个人数据,该数据库包含2007年10月1日至2023年9月30日期间美国2,000多家医院和5,000多家诊所的1亿多名个体的记录。我们排除了以下个体:
- 指数日期时年龄小于50岁
- 没有记录出生年份
- 死亡状态无效(即标记为已故但无记录死亡日期,或标记为活着但有死亡日期)
- 指数日期在出生前或死亡后
- 指数日期在2007年10月1日前
- 对于未暴露和对照队列:记录就诊次数少于25次
- 对于单次和多次带状疱疹发作队列:在暴露日期前接种带状疱疹疫苗(单次带状疱疹队列为第一次带状疱疹发作,多次带状疱疹发作队列为第二次带状疱疹发作)
- 指数日期前已诊断痴呆
- 没有指数日期
如果参与者有记录的相关队列定义事件并满足队列特定纳入标准,则将其纳入队列(扩展数据表1)。我们观察到PPSV23暴露和记录的痴呆诊断在短期内聚集(指数日期后10天内),这可能是因为参与者在诊断痴呆后很快接种了PPSV23。此外,一小部分诊断记录可能延迟,导致一些诊断在PPSV23接种后记录。为避免纳入有延迟诊断的个体,我们从分析中排除了PPSV23接种后10天内有痴呆诊断的所有人。
未有特定队列定义事件的个体被纳入相应未暴露队列。与接种RZV或ZVL个体比较的未暴露队列仅包括未接受这两种带状疱疹疫苗的人,但可接受PPSV23(PPSV23的接受在匹配过程中被考虑)。对于接种个体之间的比较,我们也排除了在指数日期前从一队列接受另一队列疫苗的个体。为确保最低数据可用性,仅将整个观察期内至少有25次记录医疗就诊的个体纳入相应未暴露和对照队列。主要比较的队列流程图见扩展数据图5。每个队列的指数日期定义为单次发作个体的第一次带状疱疹诊断日期,或反复带状疱疹的第二次诊断日期,或RZV、ZVL或PPSV23的首次免疫日期(扩展数据表1和补充表19和20)。对于未暴露队列中的个体,可能的指数日期从所有记录的医疗就诊中随机抽样。在匹配过程中,我们确保每个匹配未暴露个体的指数日期落在匹配暴露个体指数日期前后约3个月内。
将纳入队列的个体随访至发生以下任一审查事件:
- Optum EHR数据集中其记录结束(即最后观察记录)
- 死亡
- 感兴趣的诊断
- 研究结束(2023年9月30日)
- 经历对照队列定义事件(例如,先前接受RZV的个体记录ZVL免疫)
- 对于包括带状疱疹发作的比较:带状疱疹诊断后记录RZV或ZVL接种
- 对于疫苗比较:接受除队列定义疫苗外的任何带状疱疹疫苗,或接受超过队列所需剂量数的队列定义疫苗。
上述事件中最早发生的事件被视为审查日期。为减轻数据错误影响并使审查方法更稳健,我们对某些审查事件应用了安全边际或偏移(扩展数据表2)。安全边际定义了将审查事件视为有效的最短期限。如果指数日期与审查事件之间经过的时间低于此安全边际,则不应用审查,从而控制事件之间的短时间段。在偏移情况下,审查事件日期向前偏移一定时期。这些对审查事件的两种调整使我们能够减少某些数据错误的影响,即RZV接种记录为ZVL、同一疫苗的多次记录以及与PPSV23接种相关的延迟痴呆诊断记录。
此外,在与PPSV23对照的时间偏移负面对照比较中,为减轻对痴呆诊断后PPSV23暴露的影响,未应用队列定义疫苗的审查。相反,我们仅包括那些其他队列定义疫苗不可能影响感兴趣结果的个体(即,仅包括未接受其他队列定义疫苗或在感兴趣结果后接受的个体)。
机器学习匹配方法
我们遵循倾向评分匹配方法为每次成对比较构建可比人群。使用机器学习方法基于关键协变量(人口统计学[指数日期时年龄、性别、民族、种族和地区]、医疗利用[暴露前记录持续月数、每年记录就诊中位数、记录药物处方和免疫接种数量]、指数日期时间框架[暴露月份]、合并症[如抑郁症、糖尿病、中风和高血压]以及生活方式因素[如吸烟])计算倾向评分。总共,我们在匹配中考虑了395个协变量,其中一些被排除用于以下特定比较:
- 对于与接种个体的比较(即RZV、ZVL或PPSV23免疫),排除队列定义疫苗,导致不同疫苗的2个队列比较为394个协变量,RZV(2+剂)与1剂队列比较为395个协变量,接种与未暴露队列比较为395个协变量。
- 对于有带状疱疹诊断的个体的比较,排除两种带状疱疹疫苗(RZV和ZVL),导致393个协变量。
移除这些协变量并未引入任何偏倚,因为根据队列定义方式,纳入的个体均未在暴露前接受移除的疫苗或被诊断为带状疱疹。
选择协变量以最大化EHR数据中包含信息的使用,并彻底解决可能的混杂来源。我们与临床和神经学专家合作,确定相关协变量组(如人口统计学、社会经济因素、痴呆风险因素、合并症、药物和医疗利用),然后导出EHR数据中可用的所有协变量和代理。
为比较两个队列,训练机器学习模型以预测每个个体在相应队列中的分配概率(倾向评分),从而允许构建具有接近队列1纳入概率的层。随后,通过为队列1中的每个个体从队列2中选择一个最近邻(关于预测倾向评分,1:1匹配),在倾向评分周围±0.005的预定义窗口内,形成新的匹配队列。如果不存在这样的队列2个体,则队列1中受影响的个体不包括在匹配人群中。匹配队列2个体从进一步匹配中排除(无替换匹配)。在此匹配步骤后,所创建的队列在标准化均值差异方面几乎无法区分,这意味着它们在指数日期的特征分布几乎相同,从而增加队列间无混杂比较的可能性(有关主要比较的匹配前和匹配后平衡诊断,见扩展数据图6;有关所有比较,见补充图1-6)。我们承认这种比较只能解决测量混杂因素。
上述匹配方法在所有实例中使用。对于暴露队列使用XGBoost,对于未暴露队列使用LightGBM作为倾向评分估计器。
对于RZV与ZVL之间的主要比较,我们通过向指数日期注入高斯噪声来降低指数日期匹配的严格性,以增加可用于匹配的个体池。我们这样做是因为RZV受体数量少得多,这是由于RZV(2017年)在美国的许可日期比ZVL(2006年)更近。
我们还测试了替代分析方法,包括逆概率治疗加权(IPTW)和重叠权重(OW),其中样本不匹配而是根据其倾向评分加权。我们包括IPTW和OW方法以显示结果的一致性。对于OW,治疗队列中的个体权重为w = (1 − ps),对照队列中的个体权重为w = ps,其中ps指通过上述策略获得的倾向评分。对于IPTW,倾向评分被修剪到范围(0.1, 0.9),通过移除倾向评分较小或较大的个体,遵循常见做法。然后将权重计算为\(w=\frac{1}{\mathrm{ps}}\)用于治疗,\(w=\frac{1}{1-{\mathrm{ps}}}\)用于对照队列。
效应估计
使用Nelson-Aalen估计器在指数日期后定义时间点评估每个队列的累积风险函数。通过使用卡方检验(α = 0.05)在每个评估时间点上比较队列对之间的累积风险分布差异来确定等效性。缺失协变量使用多重插补链式方程方法进行插补。
选择Nelson-Aalen估计策略的动机是先前知识,即某些评估暴露(特别是ZVL)的疗效随时间显著减弱。使用Cox比例风险模型进行风险比估计假设风险比随时间保持恒定,这在我们的情况下被违反,因为已知疗效减弱。基于Nelson-Aalen的方法不需要比例风险假设,因此适用于此设置。此外,我们提供不同时间点的效应估计,以捕捉疫苗接种对痴呆和带状疱疹风险的时变效应。
研究设计通过审查确保比较队列之间随访时间没有系统差异。不再被观察的个体(例如,没有后续EHR记录)从分析中审查,如"人群和随访"中所定义。换句话说,这些个体不再被视为"有风险",并且在审查事件后不贡献结果。在真实世界数据集中的一个重要考虑是,两个队列中被审查个体之间的系统差异可能指向残余混杂。我们通过使用上述匹配方法以及量化残余混杂的额外分析(如时间偏移验证)来解决这一风险。
【全文结束】