一种用于阿尔茨海默病诊断的可解释性混合多通道融合方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Bratislava Medical Journal》：An Interpretable Hybrid Multi-Channel Fusion Approach for Alzheimer’s Disease Diagnosis

【字体：大中小】 时间：2026年05月23日 来源：Bratislava Medical Journal 1.1

编辑推荐：

　　阿尔茨海默病（Alzheimer disease, AD）是老年人群中常见的神经退行性疾病，及时且准确的诊断对于延缓疾病进展至关重要。本研究描述了一种深度学习方法，用于对阿尔茨海默病神经影像学倡议（Alzheimer Disease Neuroimaging

阿尔茨海默病（Alzheimer disease, AD）是老年人群中常见的神经退行性疾病，及时且准确的诊断对于延缓疾病进展至关重要。本研究描述了一种深度学习方法，用于对阿尔茨海默病神经影像学倡议（Alzheimer Disease Neuroimaging Initiative, ADNI）数据集中的AD、轻度认知障碍（Mild Cognitive impairment, MCI）和认知正常（cognitively normal, CN）受试者的磁共振成像（magnetic resonance imaging, MRI）脑部扫描进行分类。研究人员训练并比较了多种最先进的卷积神经网络（convolutional neural network, CNN）模型（DenseNet、ResNet、InceptionV3、Xception和EfficientNet），以建立性能基线。为进一步提升诊断准确率，研究人员通过特征层与决策层融合的混合策略，构建了一种融合DenseNet169和ResNet18模型的融合模型（Proposed Fusion Model）。该模型优于所有基线模型，包括EfficientNetB0（准确率92.45%），取得了更优的性能（按准确率计）：准确率96.66%、平衡准确率95.44%、精确率97.37%、召回率95.43%、F1分数96.30%、曲线下面积（area under the curve, AUC）99.42%和马修斯相关系数（Matthews Correlation Coefficient, MCC）94.70%。这些发现证明了多通道融合方法能够有效利用互补特性，从而增强泛化能力并提升对类别不平衡的鲁棒性。该框架为检测阿尔茨海默病早期迹象提供了一种可靠且可解释的计算辅助诊断系统，并对深度学习在神经退行性疾病研究中的后续临床应用展现了积极前景。

本研究旨在通过整合MRI图像、高精度模型与可解释人工智能（explainable artificial intelligence, XAI）方法，推动深度学习方法在阿尔茨海默病诊断中的应用，从而解决医学领域中人工智能的核心需求。

研究背景与问题：阿尔茨海默病是全球最常见的神经退行性疾病，主要累及老年群体，已成为重大公共卫生关切。该病以大脑区域进行性退化为特征，导致神经元死亡和突触功能障碍，引发严重认知障碍，包括记忆丧失、思维与推理困难、语言障碍及人格改变。阿尔茨海默病通常始于轻度认知障碍，并可发展为更严重的痴呆阶段。然而，MCI与AD之间的界限模糊，使得疾病早期诊断面临挑战。早期诊断至关重要，因其有助于实施可能延缓疾病进展的治疗措施，从而提高患者生活质量。MCI可视为AD的前驱阶段，但并非所有MCI患者都会进展为AD，部分患者可保持稳定状态，这种不确定性给AD早期阶段的准确诊断和区分带来显著困难。传统的诊断方法如认知测试、基因检测和生物标志物研究耗时且需要专业技能，存在主观性强、易出错等问题，可能导致假阳性或假阴性结果。尽管深度学习模型在分析脑部图像和识别早期结构变化方面展现出潜力，但现有CNN系统往往依赖单一数据类型，难以全面理解AD对不同脑区造成的多种变化。此外，数据不平衡、模型过拟合以及泛化能力不足等问题仍待解决。同时，可解释性人工智能工具对于提高深度学习模型在临床环境中的透明度和可接受性至关重要。

研究人员开展的studies及结论：研究人员基于ADNI数据集开展了一项深度学习研究，该数据集包含2,294例MRI扫描，来源于1.5-Tesla MRI系统的MPRAGE序列，受试者年龄约60-90岁，分为CN（705例）、MCI（1,113例）和AD（476例）三组。研究人员从每个.nii格式文件中提取第83和84层两个中矢状面切片，将数据集扩充至4,588张图像，并按70:15:15比例划分为训练集、验证集和测试集，图像统一缩放至224×224像素并转换为三通道格式。研究人员首先训练并评估了DenseNet121、DenseNet169、DenseNet201、Xception、InceptionV3、ResNet50、ResNet101、ResNet152V2和EfficientNetB0等多种CNN模型作为基线，随后提出了一种混合融合模型，该模型结合DenseNet169和ResNet18骨干网络，通过早期融合（特征层融合）和晚期融合（决策层融合）策略进行整合。早期融合将两网络特征拼接后输入多层感知机；晚期融合则通过可学习的SoftMax加权机制动态确定各模型的贡献。训练采用标签平滑（LS=0.1）、类别加权损失、两阶段微调（先冻结预训练层，再全局微调）等策略，使用Adam优化器，最大训练轮数为100，配合早停和学习率衰减机制。研究结果表明，所提出的融合模型准确率达96.66%、平衡准确率95.44%、精确率97.37%、召回率95.43%、F1分数96.30%、AUC 99.42%和MCC 94.70%，显著优于所有单网络基线模型。此外，该模型在OASIS数据集上验证时达到99.91%的准确率，证明了良好的泛化能力。可解释性分析通过梯度加权类激活映射（Gradient-weighted Class Activation Mapping, Grad-CAM）技术验证，模型关注区域集中于海马、颞叶和顶叶等AD相关脑区，与其病理机制一致，支持了模型的临床可靠性。这些发现表明，多通道融合方法能够有效利用互补特性，增强泛化能力和对类别不平衡的鲁棒性，为AD早期检测提供了可靠且可解释的计算辅助诊断工具。

研究意义：该研究提出的混合多通道融合框架不仅显著提升了AD诊断的准确性，还通过XAI技术增强了模型的临床可解释性，为深度学习在神经退行性疾病研究中的临床转化应用提供了有希望的前景，未来有望整合入临床决策支持系统。

关键技术方法：样本来源于ADNI1数据集2,294例受试者的MRI扫描，从中提取中矢状面切片构建4,588张图像的三分类数据集；采用DenseNet169与ResNet18双骨干网络，结合特征层拼接融合与决策层自适应加权融合的混合策略；运用Grad-CAM可视化技术进行模型决策的可解释性分析。

研究结果部分介绍：

基线模型性能比较：EfficientNetB0在单模型中表现最优，准确率达92.45%，但所提出的融合模型以96.66%的准确率超越所有基线。DenseNet121训练准确率高但验证准确率仅约80%，存在明显过拟合（MCC 75.00%）；DenseNet169验证准确率接近训练准确率，泛化良好（准确率90.86%，AUC 98.62%）；DenseNet201训练与验证曲线近乎平行，准确率91.15%，学习过程稳定；ResNet50训练准确率快速上升但验证增长缓慢，过拟合倾向明显（准确率80.41%）；ResNet101表现更为稳定，为ResNet系列最优（准确率91.00%，AUC 98.40%）；ResNet152验证曲线波动，存在过拟合风险（准确率89.26%）；Xception训练与验证差距小，泛化能力高（准确率90.42%，AUC 98.12%）；InceptionV3验证曲线不够稳定，中等水平表现（准确率88.82%）。

提出的融合模型：该模型验证起始值高达90.00%且优于其他模型，验证与训练准确率接近，曲线波动最小，表明学习过程稳定且泛化性能高。定量结果显示准确率96.66%、平衡准确率95.44%、F1分数96.30%、AUC 99.42%和MCC 94.70%，证明特征融合策略具有 superior 且可靠的分类性能。

损失曲线分析：DenseNet121验证损失波动强烈，过拟合明显；DenseNet169和DenseNet201学习曲线更稳定，后者尤为平衡；ResNet50验证损失显示泛化不良，ResNet101更为稳定，ResNet152有时出现过拟合；Xception泛化相对成功，损失曲线低且平衡；InceptionV3因验证损失不规则而表现中等；EfficientNetB0训练与验证损失紧密跟随，泛化性能优异；所提出的融合模型训练和验证损失均低且恒定，学习高效平衡，验证损失的一致性证实其未过拟合且泛化能力极佳。

ROC曲线分析：所提出模型的AUC值在AD为99.20%、CN为99.60%、MCI为99.50%，总体微观平均99.50%，接近完美，表明敏感性和特异性俱佳。ROC曲线靠近左上角，说明假阳性率低且分类能力高，融合架构有效整合了局部和全局特征。

Grad-CAM可解释性分析：模型决策主要集中于海马、颞叶和顶叶等AD早期受累脑区，与文献报道的病理改变区域一致，证实其决策过程具有神经解剖学一致性，在XAI框架下增强了临床可解释性。

OASIS数据集验证：为验证模型泛化能力，在Kaggle公开的OASIS数据集上进行评估，准确率达99.91%，优于文献报道的99.80%、99.79%和99.50%等结果。

讨论与结论部分总结：本研究提出了一种完整的深度学习模型，基于ADNI数据集的MRI脑图像对AD、MCI和CN进行分类。数据以.nii格式预处理转换为2D矢状面图像，确保结构一致性和解剖细节保留。多种CNN结构被评估作为性能基准，其中EfficientNetB0为单模型最优。所提出的融合模型结合DenseNet169和ResNet18骨干网络，通过特征层和决策层混合融合策略，取得了准确率96.66%、平衡准确率95.44%、精确率97.37%和AUC 99.42%的优异结果。该多尺度结构和纹理特征融合方法赋予了诊断更强的鲁棒性、更佳的泛化能力，并更好地缓解了类别不平衡的影响。同时，XAI方法尤其是Grad-CAM的应用提供了视觉可解释性，证实模型主要关注海马等AD病理相关的临床重要脑区。研究结论表明，所提出的混合框架不仅具有高度诊断准确性，还提供了一个可理解、可信赖的计算辅助诊断工具，可用于阿尔茨海默病的早期检测，并有望在未来整合入临床决策支持系统。

联系信箱：

粤ICP备09063491号

热点排行