摘要:阿尔茨海默病(AD)是一种主要发生在老年人群中的神经退行性疾病。如果能够早期诊断AD,无论是预防还是治疗都将对患者大有裨益。因此,我们的团队提出了一种名为3D-CNN-VSwinFormer的新型深度学习模型。该模型由两部分组成:第一部分是配备了3D卷积块注意力模块(3D CBAM)的3D卷积神经网络(CNN),第二部分是一个经过微调的视频Swin Transformer。我们的研究从受试者级别的3D磁共振成像(MRI)数据中提取特征,并且每位参与者仅保留一张3D MRI图像。这种方法规避了数据泄漏问题,同时解决了2D切片无法捕获全局空间信息的缺陷。我们使用ADNI数据集验证了所提出的模型。在区分AD患者和认知正常(CN)个体时,我们的模型分别达到了92.92%的准确率和0.9660的AUC值。与其它关于AD和CN识别的研究相比,我们的模型表现出优越的结果,提升了AD诊断的效率。
引言:阿尔茨海默病的主要患病群体是老年人,其主要表现为渐进性记忆障碍、认知功能障碍、人格改变以及语言困难,显著影响社会、职业和日常生活能力。根据阿尔茨海默病协会2023年的报告,估计有670万65岁及以上的美国老年人患有AD。除非在预防、减缓或治愈AD方面取得医学突破,否则到2060年这一数字可能增加到1380万。
方法:本文提出的方法框架包括3D卷积注意力机制(3D CBAM)和视频Swin Transformer。随后,我们将详细介绍本研究所构建的3D-CNN-VSwinFormer模型。模型代码可从以下链接获取:
实验结果:图6展示了分类任务中AD和CN受试者的测试损失和准确率曲线。可以看到,模型在经过500轮训练后趋于收敛,达到最佳准确率为92.92%。为了验证所提出的3D-CNN-VST算法的有效性和优越性,我们在ADNI数据集上进行了对比实验。表2显示了与近年来其他研究的比较结果。值得注意的是,我们的实验完全避免了数据泄漏,确保了结果的可靠性和真实性。尽管实验结果可能不如一些存在数据泄漏的研究那么亮眼,但我们的实验可信度和可靠性得到了保证。从表2可以看出,在AD和CN分类任务中,所提出的模型在准确率和敏感性方面均优于其他研究人员在2023年和2024年提出的方法。所达到的准确率为92.92%,敏感性为95.41%,充分证明了我们的模型在计算机辅助AD早期诊断领域的优势和贡献。
讨论:目前,训练好的模型在ADNI数据集上取得了令人满意的预测结果。然而,如何将模型整合到临床实践中及其对早期AD诊断的影响是未来工作中值得讨论的重要问题。为了成功实现所提出的模型在临床实践中的应用并取得优异的诊断性能,我们认为关键在于确保与现有医学影像系统的无缝集成。通过对患者的3D MRI图像进行自动预处理和分析,模型可以快速生成分类结果并呈现给临床医生。这使医生能够迅速获得模型提供的诊断建议,同时提供直观的热图以突出模型识别的感兴趣区域,进一步辅助临床决策。模型能够捕捉人眼难以察觉的细微病理变化,帮助医生做出决策。这不仅提高了诊断准确性,还显著缩短了诊断时间,减轻了医生的工作负担,并降低了患者的医疗成本。
结论:本文提出了一种新型深度学习模型3D-CNN-VSwinFormer,用于阿尔茨海默病的早期诊断。在该模型中,基于残差的深度可分离卷积神经网络与3D CBAM模块相结合,从MRI数据中提取低维特征。视频Swin Transformer逐步整合局部空间特征,以获取阿尔茨海默病患者大脑结构变化的信息。我们首次将视频Swin Transformer应用于3D医学影像AD诊断领域,并将其与定制的3D CNN集成,取得了令人满意的结果。
(全文结束)

