摘要
背景 功能认知障碍(FCD)由于与其它神经认知障碍相似且生物标志物准确性有限,给诊断带来了挑战。我们的目标是开发一种新的诊断检查清单,用于识别FCD与其他神经认知障碍。
方法 该临床检查清单通过混合方法开发:(1)文献综述,(2)来自12个国家的45名临床医生参与的三轮德尔菲研究,以及(3)在英国七个记忆服务中心就诊的连续患者中进行的试点区分准确性研究。达成共识的项目被纳入试点检查清单。使用phi系数评估项目冗余。通过移除缺失数据超过10%的项目,生成了更简短的检查清单。使用Cronbach's alpha测试内部效度。使用受试者工作特征曲线分析确定最佳截断分数。
结果 生成了一个包含11项的完整检查清单和一个包含7项的简短检查清单。总共纳入239名患者(143名FCD,96名非FCD诊断)。检查清单分数在各亚组(FCD和其他神经认知障碍)之间存在显著差异(F(2, 236)=313.3, p<0.001)。完整检查清单(0.97, 95%置信区间0.95-0.99)及其简短版本(0.96, 95%置信区间0.93-0.98)的曲线下面积都非常优秀。最佳截断分数对应识别FCD的特异性为97%,阳性预测值为91%。两个版本均显示出良好的内部效度(>0.80)。
结论 这项试点研究表明,简短的临床检查清单可以作为快速辅助工具,用于区分神经退行性病变患者和FCD患者。需要在不同人群中进行前瞻性、盲法、大规模验证。
已知信息
⇒功能认知障碍的诊断基于提示内部不一致的阳性诊断特征。然而,该诊断缺乏标准化,需要一种可操作化的临床方法。
本研究新增内容
⇒我们基于文献证据和临床专家共识开发了临床检查清单,在本次试点评估中显示出卓越的区分能力,可区分功能认知障碍与其他神经认知障碍亚组。
本研究对研究、实践或政策的影响
⇒该诊断检查清单可能成为一种便捷方式,改善临床和研究环境中功能认知障碍与其他神经认知障碍的识别。未来前瞻性盲法研究将阐明它是否支持诊断工作流程的分层并减少对昂贵且有害的检查和治疗的需求。该检查清单还影响未来认知障碍试验的纳入/排除标准,并支持病史采集。
引言
功能认知障碍(FCD)是功能性神经障碍(FND)的认知亚型,在专业记忆服务中心就诊的患者中约占三分之一。FCD的诊断具有挑战性,因为其表象可能与神经退行性疾病相似。最近的共识小组将FCD定义为具有临床证据表明存在内部不一致(即在某些时间能够执行任务而在其他时间表现受损,特别是当任务成为注意力焦点时)的认知症状,但当前诊断标准在区分FCD与神经退行性病变方面的应用尚未得到评估。
FCD在临床实践中可能被低估,通常与主观认知障碍或轻度认知障碍(MCI)归为一类,这些诊断标签涵盖了各种潜在疾病。FCD也有可能被误诊为早期神经退行性病变,导致改变生活的决定和暴露于潜在有害药物(包括抗胆碱酯酶抑制剂),特别是在专业程度较低的环境中。临床实践的轶事证据还显示,患有神经退行性疾病的患者可能被错误地诊断为FCD。在这两种情况下,患者都被剥夺了适当的护理、诊断后支持和准确的预后信息,进一步影响个人、医疗保健和社会成本,导致生产力下降、失业和生活质量受损。
在过去十年中,我们对神经认知障碍(特别是阿尔茨海默病)的生物学基础的理解,导致了新型体液和脑成像生物标志物的出现。然而,目前可用的检查在准确区分FCD与其他神经认知障碍方面存在显著局限性,且并非广泛可用,也没有达成共识方法。脑脊液(CSF)生物标志物和正电子发射断层扫描(PET)显示淀粉样蛋白阳性/tau阴性的患者,在尸检中AD诊断假阳性风险增加,与对照组相比,可能永远不会进展为MCI和痴呆。最近,基于血液的生物标志物在预测潜在AD方面并未显示出优于临床参考模型的优势,表明它们不适合无差别测试。此外,FCD的结构神经影像学发现和心理测量特征可能与早期神经退行性病变无法区分,尤其是在认知储备较高的个体中。因此,证明正常或临界测试结果不足以做出正确诊断,特别是对于那些继续经历致残性认知症状的患者。
在最近的系统综述中,我们发现了几个可在床边区分FCD与神经退行性病变的临床体征。随后,我们进行了一项使用FCD和神经退行性病变虚构认知病例的专家临床医生德尔菲研究,并观察到FCD与神经退行性病变分离的高评分者间一致性,但在FCD与其它神经退行性疾病的概念化和管理方面共识较低,强调了诊断操作化和仔细临床表征的重要性。
我们假设,简短的床边检查清单可以构成一种实用的临床工具,用于区分有认知症状的患者的FCD与神经退行性病变。该检查清单基于文献中确定的关键临床特征和专家共识意见开发。随后,我们在英国七个中心的门诊记忆服务就诊的回顾性样本患者中进行了试点诊断准确性研究。
方法
该检查清单通过三相关研究的混合方法迭代开发(图1)。
检查清单原型的开发:德尔菲研究
采用改良的德尔菲方法。我们邀请了认知障碍和FND领域的专家参与,如我们之前所述。
系统文献综述为调查提供了临床特征,这些特征被发现是FCD的典型特征。专家被要求根据每个项目支持FCD诊断的程度进行排名,使用从"极其不重要(1)"到"极其重要(7)"的李克特量表,通过三轮连续调查。调查于2022年3月开放,第三轮于2022年8月结束,此时未来诊断检查清单的原型得以实现。
统计分析
对每个陈述的整体评分使用中位数和四分位距(IQR)进行量化。当至少80%和66%的参与者将陈述评为7点李克特量表的顶部或底部2分时,分别达成包含或排除陈述的强或中度共识(表1)。
诊断准确性研究
数据收集和患者群体
该检查清单在英国七个独立专业记忆服务中心就诊的连续认知症状(记忆、注意力和集中困难和/或思维问题)患者样本中进行了回顾性试点(NHS Lothian、NHS Fife、NHS Forth Valley、North Bristol NHS Trust、Ashford and St. Peter's Hospitals、St George's University Hospitals和Oxford University Hospitals)。所有患者均由11名顾问级临床医生(9名顾问神经科医生和2名顾问神经精神科医生)进行评估。"参考"专家诊断(FCD和其他神经认知障碍)是根据当地实用做法独立于检查清单项目做出的,基于临床评估、多学科讨论、神经心理学测试、脑成像和流体诊断测试(如适用)(例如,AD基于多领域认知下降、异常CSF/遗传学和/或神经成像进行诊断)。对于病因多因素导致认知障碍的患者,使用多因素痴呆标签。排除诊断不确定、认知症状无病因、晚期痴呆(即显著认知和/或身体残疾并依赖他人照顾)、任何可能解释认知困难的毒性、代谢或系统性疾病、主要精神疾病或精神活性药物的患者。如果合并症(包括轻度情绪障碍)不解释全部症状学,则允许所有疾病组存在合并症。参与提供患者数据的11名临床医生中有3名未参与初始德尔菲研究中的检查清单开发。参与统计分析的11名临床医生均未参与。所有医生都熟悉FCD的拟议标准,并基于存在内部不一致(例如,任务表现的可变性、自我报告症状与日常功能或认知测试表现之间的显著差异)来识别FCD病例,在不存在另一种更能解释症状的医疗或精神疾病的情况下。
邀请临床医生使用至少10名在其诊所就诊的FCD患者的临床信件和医疗图表信息填写诊断检查清单,以及10名其他具有其他神经认知诊断的患者,以创建FCD和非FCD诊断患者数量均衡的两组。数据提取在202023年9月至2024年2月之间进行。除了以存在或不存在编码的检查清单项目外,主治临床医生还提取了:性别、症状发作年龄、诊断时年龄和最后一次随访时的最终诊断。患者被纵向随访至少12个月。在提取过程中,记录中不可用的项目留空,以减少任何潜在偏差和诊断不精确性。缺失数据被记录用于分析。对于完整检查清单分析,假设如果某些特征未在医疗记录中提及,则可能不存在,因为临床医生不太可能提及不存在的发现,即使他们在访谈中被问及,如先前研究所述。
统计分析
对匿名数据的统计分析由VC进行。该研究遵循诊断准确性报告标准(STARD)指南。
检查清单简化
比较FCD和非FCD诊断组中每个项目阳性回答的百分比,以验证所有项目在FCD组中是否更常见。计算每对问题的phi系数,以评估冗余项目(即相关性高于0.9)。由于所有项目在FCD组中更常见,且没有近乎完美的相关性,因此没有基于前两个步骤消除任何项目。通过移除缺失值超过10%的项目,生成了更简短的检查清单。使用Cronbach's alpha测试检查清单的内部效度:0.8-0.9良好,>0.9优秀。
检查清单性能
获得所有患者的总分和简短诊断检查清单得分,得分越高表明FCD可能性越大。使用Shapiro-Wilk和Kolmogorov-Smirnov测试确认正态分布。对连续变量计算独立t检验,对分类变量进行χ²分析。进行单向方差分析,以比较不同诊断组(FCD和其他神经认知障碍,包括AD)的平均总分。统计显著性设定为双侧p≤0.05。
使用受试者工作特征(ROC)曲线分析确定区分FCD与其他神经认知障碍的最佳截断分数。相关的曲线下面积(AUC)统计量表示区分准确性,分类如下:≤0.7差,0.7-0.8一般,0.8-0.9好,≥0.9优秀。为每个截断值计算敏感性、特异性、阳性预测值(+PV)和阴性预测值(-PV)。鉴于此检查清单的目标是识别FCD与其他神经认知障碍,而不是在确定最佳检查清单分数截断点时筛查所有高风险患者,因此选择具有更高特异性的阈值。还计算了Youden指数(最佳截断点)。
所有统计分析均使用R V.3.3和ROC曲线的MedCalc27进行。
该方案已在OSF注册(
结果
德尔菲研究
45位专家参与了第一轮,39位(87%)参与了后续轮次。大多数专家在三级医院的认知诊所工作。最初基于初步综述生成了29个试点项目。在第一轮中,对三个项目获得了强(≥80%)或中(≥66%)共识:"自我报告与观察到的认知功能之间的差异"、"患者提供其记忆问题的详细病史并附带具体例子"以及"能够详细列出处方药物和/或回忆与其他医生的先前互动"。由于冗余,讨论后合并了两个项目:"症状持续时间较长而无进展"和"随时间稳定或改善"。参与者被匿名发送他们自己的评分,并收到有关每个陈述达成的组共识水平的反馈。提出了五个额外项目,在第二轮中与之前未达成共识的项目一起进行审查,并对"不同情况下症状的显著可变性"和"合并非认知功能性障碍"获得了中至强共识(≥66%)。在最后一轮中,小组公开讨论了共识低/边界低(≥50%)的项目,最终纳入了六个额外项目(在线补充文件1)。
表2中呈现了"FCD诊断检查清单"的初步11项版本,并提供了进一步指导(框1)。分数(最高11分)通过添加肯定答案获得。
诊断准确性研究
患者群体
总共纳入239名患者(143名FCD和96名神经认知障碍),包括129名女性和110名男性(表3)。与其它神经认知障碍相比,FCD患者的症状发作年龄较年轻(平均年龄50岁对65岁)且诊断时年龄较年轻(p<0.001)。症状出现至诊断前的平均持续时间(3年)和性别在各组之间无差异。
检查清单简化和内部效度
检查清单上的所有项目在FCD组患者中显著更常见(表3)。如预期,许多项目相关,但没有一对具有完美相关性(在线补充图2)。四个项目缺失数据超过10%(3、4、7和11),并生成了不含这四个项目的更简短检查清单。完整检查清单具有良好的内部效度(Cronbach's alpha=0.85),简短版本也是如此(Cronbach's alpha=0.80)。
检查清单性能
FCD与其他神经认知障碍之间的完整和简短检查清单得分存在显著差异(图2A,B)。在诊断亚组中,FCD组获得的平均完整检查清单得分为7.9,其次是可能AD组(平均得分1.9),然后是包括多因素痴呆、额颞叶痴呆、路易体痴呆、MCI、血管性痴呆、正常压力脑积水和自身免疫性脑炎在内的其他非AD认知障碍组(总体平均完整检查清单得分为2.4)(F(10, 228)=73.89, p<0.001表示完整检查清单,F(10, 228)=70.4, p<0.001表示不含项目3、4、7和11的简短版本)(图2C和表4)。
完整(曲线下面积=0.97, 95%置信区间0.95至0.99, p<0.001)和简短(曲线下面积=0.96, 95%置信区间0.93至0.98, p<0.001)版本的检查清单在区分FCD与其他神经认知障碍方面的曲线下面积均非常优秀。为获得更高诊断特异性计算的最佳截断点为完整检查清单5.5和简短检查清单3.5。完整检查清单得分为6,简短检查清单得分为4,对应FCD的特异性为97%,+PV为91%(图3中FCD为阳性实际状态)。
讨论
认知症状对临床医生构成了重大诊断挑战,因为FCD与早期神经退行性病变(特别是AD)在临床表现和诊断检查方面的相似性。虽然先前已确定阳性区分特征,但这些特征的有用性尚未标准化或系统地进行检查。该试点诊断检查清单代表了首次尝试将仅来自病史和检查的临床特征组合起来,以支持FCD与其他神经认知障碍的准确区分。在本初步回顾性研究中,这种新工具获得了强大的内部效度和区分FCD与非FCD神经认知诊断的优秀准确性。简短的七项版本显示出相当的准确性,可能简化繁忙或专业程度较低环境中的评估。完整检查清单得分6或以上,简短检查清单得分4或以上,对FCD的诊断特异性为97%,+PV为91%。
在我们的多步骤德尔菲过程中,投票范围扩大到包括关于在更广泛的神经认知障碍群体中识别FCD的关键挑战的讨论。达成较高共识(至少三分之二的小组)的项目得到了现有文献的进一步支持。具体而言,纳入症状报告项目旨在捕捉报告症状与实际日常功能之间观察到的差异、提供详细症状描述的能力以及认知波动或分心的存在,所有这些都支持FCD诊断。此外,增加的内省和对记忆问题的意识以及信息提供者报告与患者关注之间的不一致被发现有助于作为筛查方法,支持项目6的纳入。合并症,如非认知FND、躯体症状(疼痛、疲劳)和心理压力源,在FCD中很常见,是潜在的易感和诱发因素。FCD患者通常表现出随时间的稳定或改善,并可能表现出突然发作,与神经退行性障碍中渐进性和隐匿性发作形成对比。人口统计学因素(如较年轻年龄、女性性别、教育水平和痴呆家族史)未达到足够共识纳入此检查清单,因为它们对个体进展风险的附加价值有限。同样,虽然人格特征可能指向FCD的易感性增加,但这些特征不太可能对诊断有帮助,并可能强调主观判断。表现效度测试未达到足够共识纳入,且仅在少数患者中发现异常;此外,FCD患者不一定比其他组更频繁地失败这些测试。随后的检查清单性能回顾性分析证实了所包含项目的相关性,增强了我们对所选症状和体征的信心,这些症状和体征有助于早期识别FCD与其他神经退行性障碍。然而,必须强调的是,该检查清单设计为不单独考虑任何单个项目,这些发现需要进一步的盲法前瞻性评估。
作为潜在优势,该诊断检查清单可根据标准临床访谈中获得的信息在约5分钟内完成,且不依赖主观严重性评分或侵入性诊断检测。
我们的发现增加了FCD诊断筛查工具的文献。先前,面向患者的工具识别了FCD的典型症状,但发现在健康个体中过度诊断FCD。其他基于对话分析、语言和交互特征的机器学习方法显示出优秀的准确性,但在小得多的样本量中进行了测试,并需要广泛不可用的复杂设备和分析。
检查清单的含义和未来研究
不同临床医生在多个中心应用该检查清单支持基于阳性体征("确定")而非排他性特征(即阴性检查)的诊断。然而,它是一种决策辅助工具,旨在补充而非替代全面临床评估。
未来应在更大样本和不同环境(包括初级保健、低收入国家和教育水平较低的人群)中进行盲法前瞻性验证,然后才能推荐临床使用。我们计划探索检查清单区分FCD与其他模拟物(包括神经退行性病变的非典型表现、精神诊断以及药物和睡眠障碍的认知效应)的能力,以及该工具是否为现有工具和生物标志物增加价值。未来研究还可能阐明检查清单是否有助于分层诊断工作流程和转诊,以及减少对特异性不足的昂贵、侵入性和潜在有害诊断测试的需求。例如,需要神经退行性病变评估的患者(可能有资格接受疾病修饰治疗)可能优先考虑专业认知诊所,而FCD可能在神经精神科服务机构得到更好管理,获得更合适的治疗,如心理治疗和言语语言治疗。
FCD的早期识别也对神经退行性障碍的疾病修饰治疗和未来FCD试验的纳入/排除标准有影响。最后,检查清单的传播具有教育意义,通过支持病史采集,增加非专家临床医生诊断FCD的信心,并以更高的确定性进行此诊断沟通。
局限性
这项试点研究存在重要局限性。检查清单是回顾性填写的,临床医生未被设盲,因此不能排除诊断怀疑偏差(即临床医生仅在FCD患者中引出并准确记录检查清单中包含的特征)。选择这种方法是为了获得更大的样本量,至少12个月随访,以增加对个体诊断的信心。虽然有问题,但这在一定程度上通过(1)由文献支持的多学科专业知识的多步骤德尔菲方法;(2)在检查清单开发前记录的信息;以及(3)参与诊断准确性研究的三名临床医生未参与检查清单开发而得到缓解。虽然量表不能实时填写,但这主要影响了四个项目,促使开发了一个获得类似初步准确性的更简短检查清单。基于英国的记忆服务中心主要关注65岁以下的个体,可能限制了这些发现的普遍性,因为其他神经退行性诊断(包括血管性痴呆和路易体痴呆)的样本量较小,这些疾病主要影响老年人群。经验丰富的临床医生可能以不同于专业知识较低者的不同方式吸收信息。另一个潜在批评涉及将临床专家诊断用作"参考标准"。虽然从科学角度看,所有病例都希望获得病理支持,但我们的方法符合当前实用做法、多学科评估和FCD的诊断标准。然而,我们不能排除少量FCD患者可能处于AD的前驱阶段,即使我们FCD样本的94%在随访中稳定或改善。在先前的立场声明中,该小组认为,当专家诊断确定时,对每位患者进行侵入性检查相当不切实际且经济上不合理,会增加假阳性诊断的风险,并且取决于当地可用性。实际上,FCD和非FCD组得分之间存在一定程度的重叠是预期的,但在我们的样本中,使用完整和简短检查清单,非FCD患者的比例分别低于6%和8%。应进行进一步调查,建议进行随访。目前尚不清楚该检查清单是否能识别症状持续时间较短的FCD患者,对于这些患者,症状的稳定性或随时间的改善可能难以判断。由于这些局限性,在推荐临床使用前,包括截断分数的检查清单需要在更大更多样化的队列中进行前瞻性验证。
结论
一种用于识别FCD与其他神经退行性障碍的新试点检查清单可能是一种辅助临床工具,有助于更早、更准确地诊断FCD。需要在不同环境中由对诊断设盲且专业知识较低的临床医生进行未来前瞻性验证,以验证此检查清单并评估FCD诊断和管理的一致性和成本效益的潜在改进。
【全文结束】

