我们提出了一种基于组合图的机器学习(ML)框架,用于阿尔茨海默病(AD)的检测。该框架从模块化组件中构建复杂的ML预测器。在我们的有向计算图中,数据集被表示为节点 \(n_i\),而深度学习(DL)模型被表示为有向边 \(n_i \rightarrow n_j\),从而能够将复杂的图像处理管道 \(n_1 \rightarrow n_2 \rightarrow n_3... \rightarrow n_T\) 建模为端到端的DL预测器。图中的每条有向路径都作为一个DL预测器,支持前向传播以转换数据表示,以及反向传播以进行模型微调、显著图计算和输入数据优化。我们在阿尔茨海默病预测问题上演示了该模型,这是一个需要整合多种数据(包括不同模态和对比度的扫描、基因数据和认知测试)的复杂问题。
我们构建了一个包含11个节点(数据)和14条边(ML模型)的图,其中每个模型都经过训练以处理特定任务(例如去除MRI扫描中的头骨、AD检测、图像到图像翻译等)。通过采用模块化和自适应方法,我们的框架有效地整合了不同类型的数据,应对分布变化,并扩展到任意复杂度,为推进阿尔茨海默病诊断及其他复杂医疗预测任务提供了一种实用工具,即使某些模态缺失时仍保持准确性。
结果表明,单个深度学习模型在各个边缘的表现良好。例如,颅骨剥离模型(路径1和2)表现出强大性能,交并比(IoU)得分超过97.3%,有效去除了MRI扫描中的头骨。对于基于图像和特征的AD诊断模型,认知测试MLP模型在检测AD方面达到了最高的95.2%的准确率,超过了其他模型如PET分类器(85.8%)和MRI分类器(82.2%)。
在集成预测方面,加权集成方法进一步提高了分类性能。我们使用了七种方法的集成(包括MRI到AD/CN、PET到AD/CN、体积到AD/CN等),并通过多数投票法实现了89.2%的合理准确率。然而,当多达5个特征缺失时,其性能下降至77.2%。为了应对缺失数据的挑战,我们用一个四层MLP模型替换了集成方法,该模型在训练过程中学习每个特征的重要性,使其即使在数据不完整的情况下也能做出稳健的预测。MLP模型在测试阶段表现稳定,当没有特征缺失时,其平衡测试准确率达到94.3%,即使五个特征缺失时,准确率仅下降1.1%至93.2%。
此外,我们在AIBL和MIRIAD数据集上进行了额外的外部验证。这些数据集在成像模式和人口统计组成方面与ADNI存在显著差异,带来了领域转移挑战。结果表明,尽管由于领域转移、扫描仪差异和模态缺失导致性能下降,但对AIBL的简短微调缓解了一些领域转移,突显了高效适应策略在临床应用中的重要性。
(全文结束)

