摘要
背景
基于参与者在神经心理学测试组合中的表现来确定整体认知障碍的流行率具有挑战性;因此,我们定义并验证了一种二分法认知障碍/无认知障碍指标(CII),该指标使用基于人群研究中实施的神经心理学测试组合。该CII近似于临床实践中对神经心理学测试组合的解释方法,并可应用于任何神经心理学数据集。
方法
利用加拿大老龄化纵向研究中45-85岁参与者的数据,这些参与者接受了电话神经心理学测试组合(追踪队列,N=21,241)或更长的面对面测试组合(综合队列,N=30,097),基于与常模数据的比较,确定每个神经心理学测试的认知障碍情况。我们使用常模样本中显示的低分基线率,调整了多个神经心理学测试中异常低分的联合概率,并创建了二分法CII(即,认知障碍vs无认知障碍)。使用逻辑回归分析评估了CII的聚合效度和区分效度。
结果
使用CII,追踪队列中认知障碍的流行率为4.3%,综合队列中为5.0%。CII展示了强大的聚合效度和区分效度。
结论
CII的方法是一种可行的方法,用于识别在测试组合中表现出认知障碍的参与者。这些方法可应用于其他使用神经心理学测试组合的流行病学研究。
加拿大老龄化纵向研究是一项基于人群的研究,参与者在入组时年龄为45-85岁。CLSA的一个主要优势是使用神经心理学测试组合来测量认知能力。与认知筛查测试不同,神经心理学测试组合不提供认知状态的总体总结,也不容易合并。其他纵向研究已经使用临床医生评估来确定参与者在神经心理学测试组合中的表现是否存在整体认知障碍的证据。已经为健康与退休研究开发了从神经心理学测试组合创建的复合评分的临界值,但CLSA中没有进行临床医生评估。我们提出了一种基于参与者在CLSA神经心理学测试组合中的表现来确定认知障碍的方法,并提供了其有效性的证据。
确定每个神经心理学测试中异常低表现依赖于与常模样本的比较和设定障碍临界值。基于神经心理学测试组合中多个测试的表现来确定一个人的整体认知障碍是复杂的。如果异常低分数的临界值是第5百分位,即使在没有真正认知障碍的情况下,每个人在给定测试上的表现被记录为异常低的概率为5%。在测试组合中有多个测试时,即使没有认知障碍,至少有一个测试低于第5百分位的概率也大于5%。测试组合中的测试数量越多,错误得出"障碍"结论的概率就越高。忽视这种虚假障碍分数的膨胀概率会导致对认知障碍的高估。在确定整体认知障碍时,校正神经心理学测试组合中障碍分数的这种膨胀概率对于良好的临床神经心理学实践至关重要,可以使用基线率方法进行研究。基线率方法涉及估计非常低分数的预期数量的算法,有助于解释神经心理学测试组合。
为CLSA追踪队列中使用的四个神经心理学测试创建了常模比较标准,为综合队列中使用的八个测试中的七个创建了常模比较标准。
认知障碍指标(CII)是从参与者在测试组合中每个测试的表现推导出来的,其中将每个测试分数与CLSA的常模数据进行比较。使用了Crawford及其同事的基线率算法,在对人的整体表现进行分类之前,调整了虚假低分数的概率。为了评估CII的聚合效度和区分效度,我们使用了参与者对一系列关于医生诊断的慢性疾病问题的回答。根据文献,我们有三组假设:(1)CII将与可能导致认知障碍的神经系统疾病相关,如痴呆或阿尔茨海默病、中风、短暂性脑缺血发作、多发性硬化、帕金森病和癫痫;(2)CII将与医生诊断的记忆问题强相关;(3)是认知障碍风险因素的医疗状况将与CII相关,但程度较轻。是认知障碍风险因素的慢性疾病包括糖尿病、高血压、心脏病、重度抑郁症、外周血管疾病、肾脏疾病和甲状腺功能障碍。我们不期望CII与过敏、关节炎、偏头痛、骨质疏松、癌症病史、溃疡或背痛相关。
方法
目标、设计和背景
目标是开发和验证一个总结神经心理学测试组合认知表现的认知障碍指标。采用前瞻性队列设计,但当前项目使用横断面分析。研究背景是基于社区的。
参与者
CLSA参与者已在其他地方描述。简而言之,从45至85岁加拿大人口中选取了年龄分层随机样本作为追踪队列,从加拿大十一个数据收集点附近的居民中随机选取样本作为综合队列。追踪队列(N=21,241)通过电话接受问卷调查,包括关于34种慢性疾病的医生诊断的是/否问题,以及四个神经心理学测试。综合队列(N=30,097)接受了面对面评估。尽管CLSA是一项持续的纵向研究,但当前项目的数据来自基线数据收集阶段的横断面数据。
测量
神经心理学测试CLSA中使用的神经心理学测试包括:雷伊听觉词语学习测试即刻回忆(REY I)和5分钟延迟回忆(REY II)、心理交替测试(MAT)和动物流畅性测试(AF)。综合队列还完成了控制性口语词语联想测试(字母FAS总分)和修改版维多利亚斯特鲁普测试(斯特鲁普干扰—干扰比,即完成"颜色"任务所需时间除以"点"任务的表现)。除斯特鲁普测试外,分数越高表示认知表现越好;对于斯特鲁普干扰分数,分数越低表示干扰越小。
慢性疾病参与者被要求回答"医生是否曾告诉您患有(慢性疾病)?"的问题。我们检查了每种疾病与CII的单独关联,并根据先验假设创建了三个分组。一个标记为"神经"的组包括报告患有痴呆或阿尔茨海默病、记忆问题、中风、短暂性脑缺血发作、多发性硬化、帕金森症或帕金森病或癫痫的参与者;与否认任何神经疾病的参与者相比。第二个标记为"风险神经"的组包括报告至少有一种已知认知障碍风险因素的参与者:糖尿病、高血压、心脏病、重度抑郁症、外周血管疾病、肾脏疾病或甲状腺功能障碍。为了提供CII的发散效度支持,创建了第三组,包括报告我们不期望与认知障碍增加可能性相关的自我报告状况的参与者:关节炎、偏头痛、骨质疏松、癌症病史或溃疡。
分析方法
认知障碍指标(CII)的推导对于每个队列,CII的推导涉及三个步骤。首先,将每个参与者的原始分数根据与神经健康常模样本的比较转换为常模分数,通过回归常模校正参与者的年龄、性别和教育程度。其次,使用参与者的常模分数通过将分数与异常低分数的临界点比较,获得每个神经心理学测试的低分指标(障碍vs正常范围)。临界点是来自常模样本分数自举分布的第5百分位。第三,基于参与者在整个神经心理学测试组合中的表现确定CII。这种将整体障碍vs非障碍的分类纳入了低分的基线率。
我们使用Crawford等人的算法确定了在认知健康人群中异常低分数的预期频率。对于CLSA追踪队列,该算法估计认知健康人群中在四测试组合上至少有一个异常低分数的比例为15.9%(英语)和15.7%(法语),而至少有两个异常低分数的比例仅为3.7%(英语)和3.8%(法语)。我们认为一个异常低测试的概率太高(超过15%),而两个或更多测试的概率足够罕见,可能表明认知障碍,因此我们为CII使用了两个或更多测试障碍的临界值。
对于综合队列,四测试组合上至少有一个异常低分数的基线率为15.6%(英语)和15.9%(法语),而至少有两个异常低分数的基线率为3.5%。六测试综合组合上,至少有一个异常低分数的估计比例为22.6%,而两个或更多低分数的比例为5.8%,三个或更多异常低分数的比例仅为1.4%。一个异常低分数太常见(超过22%),但三个或更多测试的低分数在不到2%的人群中出现,过于罕见,因此我们选择使用两个或更多测试作为认知障碍的临界值。
总之,对于追踪队列和综合队列,获得两个或更多异常低测试分数的参与者被分类为整体认知障碍(CII=1);否则被分类为无认知障碍(CII=0)。
CII的同时效度和区分效度为了探索CII的效度,我们使用逻辑回归分析评估了个体或慢性疾病组是否与CII相关,正如我们的先验假设所预测的。对于慢性疾病组的分析,我们使用了抽样权重,这些权重针对加拿大人口进行了调整,以探索这是否影响与CII的关联。对于逻辑回归的比值比(OR)估计,我们使用了Chen等人提供的OR大小描述符。
结果
CLSA中认知障碍的流行率为追踪队列4.3%(应用抽样权重前为4.1%)和综合队列4.3%(应用抽样权重前为3.1%)。痴呆或阿尔茨海默病与认知障碍的大增加几率相关,记忆问题在两个队列中均与中等大小的OR相关。中风在追踪队列中具有中等大小的OR,在综合队列中具有小大小的OR。帕金森症/帕金森病和多发性硬化的OR在追踪队列中为中等大小,在综合队列的四测试CII中为小大小。创伤性脑损伤的残余症状与认知障碍的几率显著增加相关。
神经状况组(追踪队列n=1694;综合队列n=2312)表现出认知障碍几率的小到中等增加;这一发现是预期的,因为这些状况被用作常模子样本的排除标准。图1还显示了作为认知障碍风险因素的状况组(追踪队列n=13,181;综合队列n=18,975)的认知障碍几率增加幅度很小。最后,我们没有发现CII与我们不期望与之相关的状况组(追踪队列n=11,164;综合队列n=15,378)之间存在关联的证据。
讨论
逻辑回归分析为CII的有效性提供了证据,表明CLSA中认知障碍的流行率为追踪队列4.3%和综合队列4.3%。这里提出的识别认知障碍并在CLSA中创建新CII变量的方法在临床神经心理学实践中很常见,但在流行病学老龄化研究中的应用较新。了解神经心理学测试低分的基线率有助于加深对流行病学研究中如痴呆等神经状况的理解。
与认知障碍增加几率相关的医疗状况是我们预期会与认知障碍相关的状况,即医疗专业人员诊断的记忆问题、痴呆或阿尔茨海默病或中风。这一发现是预期的,因为CII是从常模分数推导出来的,并针对认知健康子样本中预期的低分基线率进行了校正,该子样本排除了如痴呆、记忆问题和中风等神经状况。尽管常模子样本也排除了短暂性脑缺血发作、帕金森病(或帕金森症)、多发性硬化和癫痫的患者,但这些状况在本研究中不一定与认知障碍几率增加相关。这一发现可能反映了被诊断患有这些状况的患者认知状况的异质性——并非所有患有这些神经状况的个体都表现出认知障碍。
情绪障碍诊断与认知障碍几率的小到微小增加相关,这与元分析显示的抑郁症和认知之间的小关联幅度一致。同样,感觉丧失与认知障碍的关联也很微小,这与认知和感觉功能之间报告的关联一致。大便失禁与认知障碍风险增加相关,可能是由于大便失禁与某些神经状况(如更高级别的痴呆)的共病;或者,这一发现可能与通过迷走神经连接肠道疾病和认知的可能联系有关。
在此样本中,认知障碍的流行率相对较低:追踪队列为4.3%,综合队列为5.0%。CLSA抽样程序可能导致认知障碍流行率较低。CLSA参与者在研究入组时必须能够同意,无需代理同意程序,有效地将明显认知障碍的人排除在研究之外。尽管如此,CLSA中的认知障碍频率似乎与Hänninen等人报告的相似,他们在60-76岁人群的基于人群的研究中识别出5.3%的参与者有认知障碍(但无痴呆)。
局限性
本研究中使用自我报告的神经和其他医疗状况是这些数据的主要局限性,目前CLSA只有这些数据可用。医疗状况也缺乏与认知相关的重要细节。我们没有足够的创伤性脑损伤细节来将人分类为轻度、中度或重度;没有关于癌症严重程度、治疗或癌症距离的细节;没有关于多发性硬化类型或帕金森病患者是否患有帕金森病痴呆的细节。一些自我报告的状况,例如痴呆,包括的人很少,扩大了置信区间。理想情况下,当前CII的有效性将包括相对于临床评估的分类准确性作为金标准参考。
CII的另一个局限性是所用测试的有限性质,没有运动或处理速度测试,例如,我们期望这些测试会显示某些多发性硬化或帕金森病患者的缺陷。CII的另一个局限性是它仅在完成所有神经心理学测试时计算;因此,CII只能在77%的追踪队列和83%(六项)、90%(四项)的综合队列中计算,因为存在缺失值。尽管不同指标的缺失值存在差异,但研究结果的可比性令人放心,然而,缺失数据是一个局限性,可能反映了来自认知障碍者的缺失数据。
结论
CII似乎有良好的聚合效度和区分效度证据。作为CII推导核心的基线率方法近似于临床神经心理学的最佳实践,这种方法可以应用于任何包含神经心理学测试组合的流行病学数据库。然而,它确实错过了程序或过程方法数据,这是临床神经心理学实践的一个关键方面,无法从摘要分数中详细说明(即,原始测试分数不能传达参与者如何处理任务)。CII可以在未来使用CLSA数据的研究中使用,我们用来创建CII的方法可以应用于其他使用神经心理学测试组合的流行病学研究。
【全文结束】

