数字痴呆症与退化神经网络的认知干预测试Digital dementia and testing of cognitive intervention for degenerating neural networks | npj Systems Biology and Applications

环球医讯 / AI与医疗健康来源:www.nature.com加拿大 - 英语2025-11-14 14:38:55 - 阅读时长19分钟 - 9339字
本研究介绍了一种使用卷积神经网络(CNN)作为计算机模型来模拟视觉系统退化和评估干预策略的计算框架。通过建模受控突触退化并比较三种不同的重新训练方法(随机数据、基于准确性和基于熵),研究发现基于准确性的重新训练在中间退化阶段表现最佳,能够维持模型性能并保持最优的流形几何结构。这一计算分析支持优先考虑针对准确性的干预措施进行认知补偿,为减缓神经退行性疾病中的视觉认知衰退提供了新思路,架起了机制洞察与临床转化之间的桥梁。
神经退行性疾病后皮质萎缩视觉阿尔茨海默病认知干预卷积神经网络突触退化视觉认知保留基于准确性重新训练对象流形几何PCA神经表征认知康复视觉处理缺陷干预策略
数字痴呆症与退化神经网络的认知干预测试

摘要

开发针对神经退行性疾病(如后皮质萎缩,一种视觉阿尔茨海默病变体)的有效干预措施仍然是一个重大的临床挑战。我们介绍了一种使用卷积神经网络(CNN)作为计算机模型来模拟视觉系统退化和评估干预策略的计算框架。通过建模受控突触退化并比较三种不同的重新训练方法——随机数据(对照)、基于准确性和基于熵的方法,我们评估了它们对分类性能和神经表征几何的影响。我们的结果表明,在中间退化阶段,基于准确性的重新训练优于其他策略,能够维持模型性能并保持最优的流形几何结构。这一计算分析支持优先考虑针对准确性的干预措施进行认知补偿。我们的框架能够快速评估干预效果,同时阐明神经退行和恢复背后的计算原理。这种方法为完善减缓神经退行性疾病中视觉认知衰退的策略提供了平台,架起了机制洞察与临床转化之间的桥梁。

引言

人工智能特别是深度学习的最新进展为研究大脑功能和神经退行性疾病提供了前所未有的机会。在此背景下,卷积神经网络(CNN)已成为探索视觉处理的特别有价值的工具,因为它们与人类生物视觉系统在架构和功能上具有显著的相似性。与腹侧视觉流的层次结构类似,CNN通过一系列越来越抽象的层处理视觉信息,本质上将低级视觉特征转化为复杂的对象表征。这些相似性从早期视觉处理延伸开来,在早期视觉处理中,CNN过滤器模仿了V1中发现的感受野,到高级视觉区域,两个系统都为复杂对象(如面部和地点)开发了专门的特征检测器。

人工和生物视觉系统之间的相似性甚至超出了架构上的相似。例如,先前的研究表明,经过自然图像训练的CNN发展出的内部表征与灵长类视觉层级中的神经活动模式强烈相关。这种脑-模型对应关系已通过各种方法得到证明,包括表征相似性分析和神经预测性研究,在这些研究中,CNN激活成功预测了V4和IT区域中的神经反应。

CNN与生物视觉系统之间的这些相似性支持了将人工神经网络确立为强大的计算机模型系统,不仅用于研究正常的视觉处理,还用于研究其病理。更具体地说,通过操纵网络架构、训练方案和引入受控干扰,现在可以探究关于视觉计算的基本问题,这些问题在真实的生物系统中难以解决。在此背景下特别感兴趣的是后皮质萎缩(PCA)的模拟,这是一种以高级视觉处理功能进行性恶化为特征的独特神经退行形式。PCA通常被称为阿尔茨海默病的视觉变体,是一种以后脑区域萎缩为特征的疾病。这种神经退行模式导致视觉处理缺陷的特征性发作:患者最初在复杂视觉任务上遇到困难,随后更基本的视觉功能逐渐受损。PCA早期阶段记忆和洞察力的保留,结合进行性视觉功能障碍,为在计算机PCA模型中研究有针对性的认知干预创造了一个独特的机会。

最近的几项研究成功地在CNN中模拟了PCA,每项研究都模拟了疾病进展的不同关键方面。这些模型在复制疾病表现(如突触萎缩和认知衰退)方面的成功表明,CNN确实可以作为研究PCA基本疾病机制和潜在干预的有价值计算模型。在这项工作中,我们研究了进行性神经退行的计算模型是否能为不同认知干预策略的有效性提供见解。通过在基于CNN的PCA计算机模型中系统评估各种重新训练方法,我们旨在理解可能为开发保留PCA患者视觉认知的治疗干预措施提供信息的基本原理。

虽然现有文献为早发性阿尔茨海默病或轻度认知障碍提供了一些认知干预方法的见解,但我们对它们在延迟功能性视觉衰退方面的基本功效理解仍然存在重大差距。PCA尤其如此,因为PCA通常被误诊为眼部疾病,导致诊断时间延迟。尽管已在人类中进行了许多研究,但只有很少的研究提供了认知疗法技术潜力的基础性承诺。目前针对神经退行性疾病患者的认知干预通常侧重于补偿策略和环境修改,而不是直接修复视觉处理缺陷。虽然一些文献提供了基于精确性的认知疗法的见解,但我们相信,我们的疾病进展计算机模型可能为简化和发现更有效的认知干预提供途径,特别是针对PCA患者。

在这项工作中,我们使用了一个在CIFAR100上训练用于对象识别的压缩VGG19深度学习模型,作为完整视觉皮层的计算机模型。完整网络的功能是正确识别来自100个预定义对象列表(CIFAR100)的32×32像素图像中描绘的对象。接下来,我们通过衰减和冻结突触权重来模拟模型中的萎缩,遵循Moore等人描述的方法。本工作的创新之处在于调查了三种旨在保留视觉认知和功能的不同重新训练策略。为了进行此分析,干预步骤与模型损伤步骤交错进行,其中模型根据三种特定重新训练策略之一在选定图像上重新训练。这些策略既受到临床认知干预方法(基于准确性的重新训练)的启发,也受到机器学习原理(基于熵的重新训练)的启发。本工作中探索的重新训练策略概述如下,并在图1中进行了可视化:

  1. 第一种策略旨在为比较提供基线,其中重新训练数据从初始模型训练中预留的数据集中随机采样。我们测试不同的参数组合,调整重新训练图像的数量。
  2. 第二种策略采用更有针对性的方法,通过优先为因损伤而性能下降的对象类别采样重新训练数据,专注于维持所有对象类别的高模型对象分类准确性。在这种策略中,在疾病每次进展后评估类别准确性。在此分析之后,根据类别准确性的逆分布对重新训练数据进行采样。通过这种方式,模型表现较差的对象类别在重新训练数据中更为普遍。
  3. 我们的最终策略借鉴了主动学习原理,利用基于熵的不确定性度量来识别和解决模型混淆的区域。在人类中,这种"不确定性"度量的替代物可以通过渲染分类或识别任务的延迟来测量。这种重新训练策略旨在保持模型中的低熵或不确定性。为此,在每次疾病步骤后,通过识别训练数据集中与最高不确定性水平相关的样本来分析模型的熵。然后,使用与这些不确定样本相似的图像来策划重新训练数据集。

图1:模型退化和三种重新训练技术的流程

从完整网络开始,一组突触权重被衰减和冻结。然后,根据对象识别准确性和softmax概率的熵来评估模型。接下来,根据重新训练方案1、2或3重新训练模型的剩余健康突触。重新训练的模型再次在相同的指标上进行评估,然后重复该过程。对于第一种重新训练策略(随机选择或零假设),模型的健康突触在随机选择的、平衡的预留数据子集(训练期间未见过)上重新训练。对于基于类别准确性的重新训练(2),模型在预留数据集上重新训练,该数据集的示例数量代表每个类别与模型的类别准确性成反比。最后,在基于熵的重新训练(3)期间,模型在与推理时表现出最高不确定性的图像最相似(最低均方误差)的预留数据上重新训练。

这些策略代表了认知干预的不同理论方法,每种方法对临床实践都有不同的影响。随机采样方法作为对照条件或零假设,类似于没有特定目标或干预重点的一般认知刺激。基于准确性的策略模仿了专注于加强特定弱化能力的针对性认知训练计划。基于熵的方法代表了一种可能专注于减少对象之间混淆的计划。在计算机中测试这些有针对性的策略可能导致开发响应个体认知衰退模式并增强患者预期结果的自适应认知干预协议。

为了评估这些方法,我们采用了机器学习模型性能的传统指标(对象识别准确性)和最近提出的网络内部表征的几何分析。对于几何分析,我们使用先前建立的对象流形框架,并检查这些流形的几何和维度如何在结合网络损伤和康复的影响下演变。我们假设这些几何变化是进行性疾病负荷引起的认知变化的有意义指标,可能为视觉处理网络中退化和认知干预的机制基础提供见解(图2)。

图2:健康、患病和康复神经网络中对象流形几何变化的示意图

A 在健康模型中,对象类别(例如,花朵、汽车、树木)在表征空间中保持线性可分离性,从而实现准确分类。B 模拟神经退行后,对象流形表现出增加的维度和减少的线性可分离性。这种流形结构的不可分离性与受损的分类性能相关,如模型在花朵和树木类别之间的混淆所示。C 战略性重新训练干预有助于恢复导致更容易分离的对象流形的几何特性,部分恢复不同的类别表征并降低维度。这种几何恢复与改善的分类性能相关,表明神经退行性条件下认知康复的潜在计算机制。

结果

不同重新训练方案的准确性差异

按照Moore等人描述的方法,CNN模型在N=10次突触衰减和重新训练迭代中进行了评估。在每次衰减和重新训练迭代中分析定量结果。重新训练模型的结果在每次突触衰减的10%间隔处报告,而衰减模型结果显示为每次迭代之间的中间点(图3)。初始完整模型(用于图像/对象分类的压缩VGG19)在ImageNet上进行了预训练,然后在CIFAR100上进行了微调,在对象分类中达到了69.5%的准确率。我们的CNN模型中进行性突触衰减的实施揭示了不同重新训练策略下准确率下降的不同模式。图3展示了三种重新训练/干预方法的比较模型准确率轨迹:随机选择的数据(零假设)、基于准确性的重新训练和基于熵的重新训练,在不同程度的突触退化和不同大小的重新训练数据集(500、1000和3000张图像)下进行评估。对于500张重新训练图像(图3A),在10%至60%的突触被衰减期间,基于准确性的重新训练相比零假设和基于熵的重新训练方案表现出更优越的性能。统计分析显示,与零假设和其他两种方法相比,基于准确性的重新训练具有显著优势(p < 0.05),特别是在衰减的中间阶段(10-40%)(p = [4.29E−2, 2.61E−6, 1.09E−5, 1.22E−5]);虽然在衰减达60%时,它在统计上优于基于熵的重新训练(p = [1.30E−6, 9.52E−8, 2.67E−5, 1.87E−4, 4.53E−5, 9.32E−5])。在70%衰减后,模型通常无法通过重新训练恢复任何有意义的功能。在图3B中,显示了使用1000张重新训练图像进行三种策略的结果,显示出类似的趋势,即基于准确性的重新训练通常优于零假设和基于熵的策略。此外,我们发现零重新训练策略在多个突触衰减的进行性迭代中(包括20%、30%、50%和60%的重新训练模型状态)在统计上显著优于基于熵的策略(p = [2.89E−2, 1.27E−3, 3.82E−2, 1.70E−4])。这种现象在3000图像数据集中也可以复制。对于几乎所有重新训练模型状态(10-70%衰减),基于准确性和零假设的重新训练导致模型保持比基于熵的方案显著更高的准确率水平。当重新训练子集包含预留集中可用于采样的总图像的更大比例时,三种策略之间的差异减小。

图3:随着网络突触逐渐衰减和重新训练的模型准确率

结果报告为十个不同种子的平均值±标准差。模型性能以循环模式评估:在每次10%的突触衰减增量应用后,我们首先测量模型的退化性能(显示在10%增量之间),然后进行重新训练,并测量重新训练的性能。因此,报告的指标显示了在整个疾病进展过程中下降(衰减后)和潜在恢复(重新训练后)的交替模式。三种不同重新训练策略的准确性显示为不同数量的重新训练数据。A 基于准确性的重新训练在使用500张重新训练图像池时,始终优于零假设和基于熵的重新训练。B 基于准确性的重新训练在使用1000张重新训练图像的情况下继续保留最高水平的准确性。C 使用3000张重新训练图像时,基于准确性的重新训练和零假设(随机选择的图像)收敛到相似的准确性水平,但两者始终优于基于熵的重新训练。

通常,重新训练数据集大小的影响主要体现在性能轨迹的稳定性上,而不是绝对准确性水平。虽然更大的重新训练数据集(3000张图像)产生了更平滑的退化曲线,但策略有效性的基本模式在所有数据集大小中保持一致。所有策略之间性能差异的统计显著性(图3中用星号表示)在图3A、B(500和1000张重新训练图像)中尤为明显,特别是在关键的30-60%衰减范围内。尽管在图3C(3000张重新训练图像)中基于零假设和基于准确性的重新训练之间的显著差异减小,但这种性能趋势仍然存在。

退化网络中的对象流形几何

此外,我们研究了进行性神经退行期间对象流形的几何特性。遵循Chung等人建立的理论框架,我们检查了网络不同层在不同程度突触衰减下的三个关键几何指标——容量、相关性和维度(图4)。之所以特别研究这些特性,是因为有可能将这种分析扩展并转化为生物神经活动,为检查生物和计算机表征和信息处理能力提供统一框架。在此背景下,一些先前分析神经数据和深度语言模型的工作发现了两者之间相似且可预测的几何特性。因此,来自神经数据(例如,功能性磁共振成像(fMRI)、脑电图)的流形的几何特性可作为有价值的生物标志物进行计算建模。虽然我们的几何结果由于多次重新训练迭代中权重存储的计算限制而代表单个实验种子,但它们为退化和康复场景下神经表征的几何转换提供了有价值的见解。

图4:在不同程度网络衰减和重新训练下,所有卷积和线性层中对象流形的几何分析

顶行显示了模型的容量,或随着网络衰减,各层中流形的线性可分离性。在20-60%的突触衰减水平下,基于准确性的重新训练在深层中显示出更高水平的模型容量。中间行显示了流形之间的相关性。随着疾病进展,所有层中的相关性都会增加。流形之间的边界变得不太可分离,因此在不同对象之间具有更高的相关性。最后一行描述了流形的维度。基于准确性的重新训练在后期层中维度降低方面表现略好。

容量量化了网络维持可分离对象表征的能力,在重新训练策略中显示出不同的模式。在所有三种条件下(零假设、基于准确性和基于熵的重新训练),容量在网络的深层中显示出特征性的增加,特别是在第20层之后(图4中的layer_20_Conv2d)。然而,这种增加的幅度随突触衰减水平而变化。在20%衰减时,所有策略都导致相对相似的容量分布,但在更高的衰减水平(40-80%)下出现了明显的分歧。值得注意的是,即使在严重退化(60-80%衰减)下,基于准确性的重新训练在深层中也显示出更高水平的容量,表明对对象可区分性的更强大维持。

各层之间的相关性模式为对象流形之间网络表征相似性提供了见解。所有重新训练策略都导致深层中相关性略有增加的一般趋势,这与更抽象对象表征的出现一致。基于准确性的重新训练策略显示出特别有趣的行为,在20-60%突触衰减下的严重衰减条件下,与基于零假设的重新训练相比,在后期层中保持较低的相关性值。通常,完整的"健康"网络倾向于沿层层次结构去相关流形。这已被解释为有助于网络容量的"对象神经编码的改进"。当遭受更多损伤时,模型无法去相关,更多地依赖流形之间的相关性来表示对象,特别是在基于零假设的重新训练情况下。

维度分析揭示了重新训练策略之间更有趣的差异,特别是在它们如何影响深层网络层中的表征压缩方面。在中度突触衰减(20-40%)期间,与基于零假设和基于熵的方法相比,基于准确性的重新训练在深层中表现出更好的(即使只是稍微好一点)维度降低模式。这种增强的压缩与先前建立的理论原则一致,其中最优对象识别与通过处理层次结构的渐进维度降低相关联。

基于准确性的重新训练策略似乎更好地维持了这种有益的压缩特性,特别是在第22层之后(图4中的layer_22_Conv2d)。当与容量指标一起考虑时,这一发现尤其值得注意,其中基于准确性的重新训练也显示出优越的性能。这表明,即使在持续的突触退化下,基于准确性的重新训练也能更好地维持网络形成紧凑、可区分的对象类别表征的能力。综合来看,基于准确性的重新训练技术在对象流形的准确性和几何特性方面表现出优越的性能。

讨论

虽然认知干预和职业治疗方法在神经退行性条件下已被广泛研究,但对其有效性的实证和分析证据仍然有限。我们的计算机研究为未来如何优化和个性化有针对性的认知训练提供了新的见解,特别是通过神经网络中表征动态的视角。我们在计算模型中观察到的几何原理与生物神经记录有相似之处——可以对通过fMRI和多电极记录等技术测量的群体水平神经活动执行类似的流形分析。基于准确性的重新训练在多个计算指标上的优越性能表明,专注于加强特定退化能力的有针对性的干预策略可能比更一般的认知康复方法具有优势。这些计算发现可以指导基于神经群体几何的生物标志物开发,可能通过神经影像和电生理测量实现对疾病进展和治疗效果的更精确监测。这在我们的几何分析中尤为明显,其中基于准确性的重新训练有助于维持对象类别的最佳流形特性,即维持线性可分离性,同时在深层网络层中保持有益的维度降低(图4)。

尽管不同的重新训练策略导致显著不同的效果,但这些差异的适度性质,特别是零假设方法(随机采样)令人惊讶的稳健性能,反映了与生物相似的重要原理。更确切地说,随机采样策略的有效性表明,即使非针对性的认知刺激在神经退行期间也能提供实质性的好处。这一发现也与临床观察一致,即一般认知参与有助于在神经退行性条件下维持功能。随机采样方法仍然为网络提供多样化的视觉体验,通过视觉系统未受损区域的突触可塑性帮助维持功能。策略之间差异的有限性也可能反映了我们重新训练协议的基本限制,包括所有策略都从相同的预留图像池中采样,这可能会限制方法之间实质性差异的可能性。特别是,由于这个预留池仅由5000张图像组成,随着用于重新训练的图像数量增加,所有采样的重新训练集彼此之间的重叠更多。当突触损伤变得严重(>60%衰减)时,所有策略都收敛到较差的性能,反映了当神经退行变得广泛时,补偿存在生物学限制。建模结果表明,在中度退化(20-60%衰减)期间存在一个"干预窗口",有针对性的干预显示出最明显的好处。

我们的工作还探讨了维度降低和计算效率之间的关系。这种关系显示了神经信息处理的基本原理,其中连续的层应该将高维感官输入转换为更紧凑、语义上有意义的表征。基于准确性的重新训练在中度退化(20-40%衰减)下维持这一特性这一事实表明,它可能更好地保持网络形成高效、可区分表征的能力。表征效率的这种维持至关重要,因为它表明网络即使在持续的神经退化下也能保持提取和组织相关视觉特征的能力。这种维持的组织原则可以与成功的认知干预帮助患者在神经退行进展时保持功能性视觉处理能力的机制平行。我们在退化网络中发现的流形维度的整体增加得到了研究生物退化系统中神经群体反应的维度和噪声增加的工作的支持。最近对阿尔茨海默病的计算研究表明,受影响的大脑显示出改变的低维流形结构,因此信息处理受损。这些结果表明,随着退化的发生,压缩的对象表征变得噪声更大,因此更难区分。因此,根据我们的工作结果,我们认为未来的干预策略可以开发为针对神经群体反应的流形大小和可分离性,以便在神经退行性疾病存在和进展的情况下更有效地保留认知。这项工作中开发的计算机模型允许进行此分析,以识别理想的干预技术。

虽然这项工作代表了朝着最终可能指导认知康复数字孪生方法的计算框架迈出的早期步骤,但在解释这些结果时必须承认几个重要限制。这些限制从基于CNN的生物视觉建模中固有的基本抽象到准确表示PCA病理的具体挑战。一个主要考虑因素是CNN和生物视觉系统之间信息处理仍然存在的明显差异。更确切地说,CNN中的学习机制,特别是反向传播、批量归一化和softmax激活,代表了对真实生物学习过程的重大抽象。尽管存在这些架构和计算差异,CNN已证明具有惊人的能力来预测灵长类视觉皮层中的神经激活模式,优于视觉系统的其他计算模型。这种预测能力表明,虽然CNN可能与生化过程不同并将其简化,但它们捕捉了层次视觉处理的重要计算原理。我们通过突触衰减对PCA进展的模拟带来了额外的限制。虽然我们通过均匀权重退化来模拟神经退行,但PCA的实际病理涉及tau蛋白积累、突触功能障碍和细胞死亡之间的复杂相互作用。PCA的从后向前进展表明,更复杂的层特异性和方向偏向退化模型可能更好地捕捉疾病动态。我们当前的方法虽然有助于理解层次视觉系统退化的一般原理,但也未能完全捕捉tau病理和随后的神经退行的时空模式。最后,我们受限的5000张图像预留集可能无法为活动学习策略的最佳实施提供足够的语义多样性,特别是在识别针对目标重新训练的真正相似示例方面。这一限制可以通过在未来的使用更大、更多样化的数据集(如ImageNet)的工作来解决,这些数据集更好地捕捉了现实世界视觉处理需求的复杂性。此外,虽然softmax熵被广泛用作模型不确定性的计算,但它确实存在潜在的缺点。更确切地说,softmax层熵可能低估模型不确定性,因为神经网络倾向于产生过度自信的预测,导致即使对于"不确定"的输入,熵水平也很低。即使对于错误分类或分布外输入也可能发生这种情况。有限的样本池和softmax熵限制可能导致活动学习管道中图像选择意义不大,这反映在这种策略表现不佳上。尽管存在这些限制,我们的计算框架为神经退行性条件下认知康复的潜在机制提供了有价值的见解。即使在我们的简化模型中,有针对性的重新训练策略的优越性能也为开发PCA患者更有效的认知干预指明了有希望的方向。

另一个考虑因素是我们目前对视觉处理层次结构的关注。PCA病理已知发生在更广泛的脑网络中,其中后部区域与颞叶、顶叶和皮层下区域广泛连接。纳入这些更广泛的网络效应可能会通过考虑来自健康脑区域的补偿机制、网络级干预策略以及通过连接脑区域更真实的病理传播模式来提高模型的准确性和真实性。例如,先前的研究发现,与伴随阿尔茨海默病的典型情景记忆丧失相比,PCA患者存在工作记忆缺陷。因此,通过某种形式的计算记忆(例如Hopfield网络)增强CNN可以允许对工作记忆和视觉处理之间的真实整合进行更复杂的建模。然而,我们的基于CNN的方法提供了一个经过验证的模型,特别是针对PCA中受影响的层次视觉处理流,将此设置扩展到全脑建模将需要不同的计算架构,可能会掩盖我们在此工作中旨在了解的关于视觉系统康复的特定原理。因此,我们将当前工作视为建立计算干预测试的可行性,而更广泛的网络建模代表了该框架有价值的未来扩展。

这种疾病进展和干预反应的平行跟踪为未来在临床实施前开发和改进治疗方法提供了独特的平台。原则上,此类计算框架的未来迭代,当通过患者数据验证并使用个体生物标志物和认知特征初始化时,可能有助于开发个性化建模方法。然而,在此类应用变得可行之前,需要重大的方法学进步和临床验证。尽管如此,神经退行的计算模型可能最终能够探索反事实场景:如果在不同时间点尝试不同的干预措施会怎样?如果疾病进展遵循不同的轨迹会怎样?这些在临床环境中难以或不可能解决的问题在计算领域变得更容易处理。这种能力对于理解各种治疗干预的时间和效果特别有价值,可能带来更个性化和更有效的治疗策略。虽然我们当前的实现在线完全捕捉PCA的生物学复杂性方面存在明显限制,但这里建立的框架展示了计算机方法在系统评估认知干预策略方面的潜力。随着计算方法的不断发展和我们对生物疾病机制理解的加深,这些方法在彻底改变神经退行性疾病的诊断、治疗和管理方面具有巨大前景。通过此类计算框架的迭代完善,我们更接近于开发更有效、个性化的治疗策略,以应对进行性认知衰退带来的复杂挑战。

【全文结束】

大健康

猜你喜欢

    大健康
    大健康

    热点资讯

    大健康

    全站热点

    大健康

    全站热文

    大健康