国内健康环球医讯家医百科药品库医药资讯

智能阿尔茨海默病诊断与残疾评估:基于ResNet-50和EfficientNet-B3集成学习的稳健医学影像分析

Frontiers | Intelligent Alzheimer's diagnosis and disability assessment: robust medical imaging analysis using ensemble learning with ResNet-50 and EfficientNet-B3

沙特阿拉伯英语医学人工智能与神经影像学
新闻源:unknown
2025-09-04 22:19:53阅读时长9分钟4149字
阿尔茨海默病健康医学影像分析ResNet-50EfficientNetB3集成学习疾病诊断深度学习MRI图像早期筛查

内容摘要

本研究开发了一种基于ResNet-50和EfficientNet-B3集成学习的阿尔茨海默病诊断系统,通过分析高分辨率磁共振成像(MRI)图像实现99.32%的总体诊断准确率。该系统在轻度、中度痴呆及非痴呆病例中表现出卓越分类性能,通过归一化、重缩放和噪声消除等预处理技术提升模型鲁棒性,为临床早期筛查和辅助诊断提供可靠工具。

智能阿尔茨海默病诊断与残疾评估:基于ResNet-50和EfficientNet-B3集成学习的稳健医学影像分析

阿尔茨海默病(AD)是一种进行性神经退行性疾病,其特征是严重的认知功能损害,会降低生活质量。通过早期详细诊断进行疾病管理及有效干预是关键。本研究构建了一个集成系统,利用ResNet-50和EfficientNet-B3对高分辨率磁共振成像(MRI)图像进行自动化AD诊断。该模型采用ResNet-50提取特征,结合EfficientNet-B3作为稳健分类器,在准确率和泛化性能方面表现优异。研究使用包含33,984张MRI图像的大型高质量数据集,涵盖四个疾病阶段:轻度痴呆、中度痴呆、非痴呆和极轻度痴呆。通过归一化、重缩放和去噪等预处理技术提升模型性能,最终在准确率、精确度、召回率、F1分数和ROC曲线下面积等指标上取得显著成果,集成模型总体准确率达99.32%。混淆矩阵评估结果显示,轻度和中度阶段及非痴呆病例分类效果优异,在极轻度痴呆病例中保持最小误判。实验结果证明深度学习算法在准确检测AD各阶段的能力,提出的模型具有在医疗环境中辅助放射科医生进行早期筛查和治疗开发的潜力。未来需在多样化临床环境中进一步优化和验证模型,以满足实际诊断需求。

1 引言

阿尔茨海默病是一种主要的神经退行性疾病,占全球所有痴呆病例的60%-70%,导致老年人认知和记忆功能进行性损害及整体身体残疾。该病临床定义为大脑中淀粉样斑块和神经纤维缠结的沉积,导致脑容量逐渐萎缩,表现为混淆、判断力差、语言障碍、性格改变以及无法执行日常活动。老龄化仍是AD最大风险因素,但遗传因素、不健康生活方式、心血管疾病和物理环境也会影响其发展。尽管尚无治愈方法,但医学研究的进展提供了管理方案,包括胆碱酯酶抑制剂、美金刚胺,以及通过饮食改变和严格锻炼计划改善患者状况。

传统诊断依赖临床评估、病史和神经心理学评估,但灵敏度较低且费时费力。磁共振成像(MRI)和正电子发射断层扫描(PET)虽可检测大脑异常,但缺乏计算工具时准确性不足。近年来,深度学习方法在医学影像诊断中取得突破,尤其是阿尔茨海默病的诊断更为精确、快速且误差更少。卷积神经网络(CNNs)在MRI模式诊断方面表现出色,通过从原始图像数据中学习特征超越了传统机器学习模型。集成深度学习模型因其整合多个架构结果的能力而受到关注,ResNet-50和EfficientNet-B3因其图像分类性能优异成为热门架构。

ResNet架构通过50层深度残差网络解决梯度消失问题,深层网络在捕捉图像细节的同时良好收敛。EfficientNet-B3使用复合缩放方法控制网络深度和宽度,在少量计算需求下实现高效准确的特征提取。ResNet-50和EfficientNet-B3的集成模型通过互补弱点、结合优势,提升了诊断效率,增强了MRI扫描中微小异常的检测鲁棒性。本研究的主要目标是通过整合ResNet-50和EfficientNet-B3模型,提高区分阿尔茨海默病和正常认知状态的深度学习模型性能,开发一种自动、准确且易于实施的诊断系统。此外,研究还关注在数据不平衡、MRI扫描噪声和变异情况下实现稳健的准确诊断工具。主要贡献包括开发ResNet-50和EfficientNet-B3集成模型,评估其性能,并证明该模型在提高阿尔茨海默病分类诊断准确性方面的有效性。

2 文献综述

阿尔茨海默病分类受到医学研究领域的广泛关注,尤其是深度学习方法的引入,表明它们可以超越传统诊断方法。本研究中的两个最佳表现深度学习模型是卷积神经网络(CNNs),特别是ResNet-50和EfficientNet-B3,显示出从脑MRI扫描中进行高效AD诊断的前景。

Raza等的研究涉及使用迁移学习(TL)和特定CNN对阿尔茨海默病MRI图像进行分割和分类。模型在10、25和50个epoch时平均准确率为97.84%。迁移学习和分割技术在医学影像分析中显示出显著优势,提高了诊断准确性。Sharma等提出了一种基于迁移学习和基于投票的分类器的机器学习模型,使用DenseNet-121和DenseNet-201提取特征,支持向量机、朴素贝叶斯和XGBoost分类器的准确率为91.75%,特异度为96.5%,F1分数为90.25%。Zhang等提出了基于VGG-16模型改进的ADNet,通过深度可分离卷积减少参数量,使用ELU激活函数避免梯度爆炸问题,并引入SE模块进行有效特征重新校准。实验结果显示,ADNet在AD与认知正常(CN)对比中准确率提高4.18%,在轻度认知障碍(MCI)与CN对比中准确率提高6%。Solano等使用三维DenseNet模型检测阿尔茨海默病,总体准确率为0.86,敏感度为0.86,特异度为0.85,ROC曲线下面积(微平均)为0.91。Carcagnì等研究了CNN和自适应自注意力机制在脑MRI数据中识别阿尔茨海默病的性能,结果显示自动化诊断工具在灵敏度和特异度方面优于传统实践。

3 方法论

本研究提出了一种全面的阿尔茨海默病诊断框架,包括数据集概述、预处理技术和模型构建。

3.1 数据集描述

本研究使用的数据集是从Kaggle获取的公开"增强型阿尔茨海默MRI数据集",包含33,984张2D T1加权MRI切片图像,均匀分布在四个诊断类别:轻度痴呆、中度痴呆、非痴呆和极轻度痴呆。图像以JPEG格式保存,训练集经过数据增强处理以防止过拟合,验证集和测试集未进行改动。数据集按80%训练集、10%验证集和10%测试集划分,分别为27,188、3,397和3,399张图像。由于缺乏患者标识符,数据集按图像级别而非患者级别分割。

3.2 预处理

数据预处理包括归一化、重缩放和数据增强技术。所有图像调整为224×224像素并归一化到[0,1]范围,使用随机旋转、缩放、翻转和亮度变化增强训练数据。这些预处理步骤提高了输入图像质量,有助于模型更好地识别阿尔茨海默病各阶段。

3.3 模型构建

本研究构建了ResNet-50和EfficientNet-B3的集成模型。

3.3.1 ResNet-50

ResNet-50包含50层,包括卷积层、池化层、批归一化(BN)和全连接层。其核心创新是残差块,通过"快捷"或直接路径将输入传递到输出,解决深层网络中的梯度消失问题。残差块的数学表示为:

y = F(x, {wi}) + x

最后一个分类层的输出为:

y_resnet = softmax(W_resnet × Y_global + b_resnet)

3.3.2 EfficientNet-B3

EfficientNet-B3通过复合缩放系数优化深度、宽度和分辨率,平衡模型复杂度、准确性和计算需求。其缩放公式为:

d = α^ϕ, w = β^ϕ, r = γ^ϕ

EfficientNet-B7的输出为:

y_efficientnet = softmax(W_efficientnet × f_global + b_efficientnet)

3.3.3 集成模型架构

ResNet-50和EfficientNet-B3分别训练后,通过软投票方法(简单平均)结合输出。集成模型使用批归一化稳定训练,减少内部协变量偏移,随后是256个神经元的密集层和ReLU激活函数。采用L1和L2正则化技术防止过拟合,并使用dropout层进一步提高泛化能力。最终分类通过全连接层映射处理后的特征到类别概率,使用分类交叉熵损失函数进行训练。集成模型的融合公式为:

y_fusion = 1/2 × (y_efficientnet + y_resnet)

4 结果

集成模型在阿尔茨海默病MRI分类任务中表现出色,使用标准评估指标(准确率、精确度、召回率、F1分数)评估四个阶段的分类性能。结果显示集成方法在分类准确率和泛化能力方面优于单一模型。

4.1 评估参数

4.2 训练和验证结果

EfficientNet-B3在训练和验证阶段表现出色,训练和验证准确率均达到95%。ResNet-50训练准确率从60%提升至95%,验证准确率从70%提升至87%。集成模型在10个训练周期内表现出色,训练和验证准确率迅速提升,最终达到100%和95%。损失图显示训练和验证损失均显著下降。

4.3 测试结果

集成模型在轻度、中度痴呆和非痴呆病例中分类准确率、召回率和F1分数均为1.00,在极轻度痴呆病例中准确率为0.98,召回率为1.00,F1分数为0.99。EfficientNet-B3在精确度(0.95 vs. 0.87)、召回率(0.95 vs. 0.87)和F1分数方面均优于ResNet-50。ResNet-50在极轻度痴呆病例识别中表现较差,召回率为0.76。

5 外部验证

使用包含6,400张MRI图像的独立数据集进行外部验证,集成模型总体准确率为97%,所有类别的精确度、召回率和F1分数均保持高位。非痴呆类别精确度0.96,召回率0.94,F1分数0.95。极轻度痴呆类别(样本量n=10)精确度、召回率和F1分数均为1.00。轻度和中度痴呆类别F1分数分别为0.97和0.96。

6 与前沿方法的比较

与现有方法相比,本研究提出的集成模型在分类准确率方面表现出显著优势。ResNet-50和EfficientNet-B3的集成达到99%总体准确率,轻度、中度痴呆和非痴呆类别的精确度、召回率和F1分数均为1.00。EfficientNet-B3在精确度(0.95 vs. 0.87)和F1分数(0.99 vs. 0.95)方面优于ResNet-50。通过结合EfficientNet-B3的优化架构和ResNet-50的深度特征学习能力,本研究提出的模型在自动阿尔茨海默病检测和早期诊断决策支持方面具有巨大潜力。

7 讨论

本研究开发的集成模型在阿尔茨海默病检测中展现出临床应用价值,为神经学家和放射科医生提供准确且稳健的诊断工具。然而,数据集中缺乏患者级人口统计学数据(如年龄和性别)限制了模型对不同亚群性能差异的分析。未来研究将使用临床注释数据集提高可解释性和公平性,并允许按患者划分数据以确保适当泛化。

8 结论

通过使用高分辨率MRI扫描,研究团队开发了准确率达99%的集成深度学习诊断系统。该模型使用ResNet-50提取有效特征,EfficientNet-B3进行稳健分类,并通过归一化、重缩放和去噪等预处理技术提高模型质量。综合评估显示,模型在阿尔茨海默病各阶段的精确度、召回率、F1分数和ROC曲线下面积指标均表现出色。混淆矩阵分析显示,模型在轻度、中度和非痴呆病例中产生准确结果,极轻度痴呆病例识别准确率令人满意。高质量数据与深度学习的结合提高了诊断准确性,模型适合临床使用,为医生提供早期疾病检测和持续护理决策支持。未来研究需在多种临床环境中评估模型优化和实施,以进行更广泛的应用验证。

【全文结束】

声明:本文仅代表作者观点,不代表本站立场。

本页内容撰写过程部分涉及AI生成(包括素材的搜集与翻译),请注意甄别。

7日热榜