多模态深度学习神经影像学方法在增强基于CT的阿尔茨海默病诊断中的应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Psychiatry Research: Neuroimaging》：Multimodal Deep Learning Neuroimaging Approach to Enhance CT-Based Diagnosis of Alzheimer’s Disease

【字体：大中小】 时间：2026年05月02日 来源：Psychiatry Research: Neuroimaging 2.1

编辑推荐：

　　阿斯兰·阿巴斯 | 蔡信治 | 许玉玲 | 穆特比·约翰·肯尼思 | 巴希尔·侯赛因 | 莉莲·M·赖 | 许炳穆
台湾嘉义县国立中兴大学地球与环境科学系

**摘要**
神经影像技术在阿尔茨海默病（AD）的诊断中发挥着关键作用，磁共振成像（MRI）和正电子发射断层扫描（PET）为基于深度学习（DL）的分类提供了详细的结构和功能信息。然而，高昂的成本和有限的可用性限制了其在临床上的广泛应用。计算机断层扫描（CT）虽然价格合理且易于获取，但在检测与早期AD相关的细微神经退行性变化方面诊断能力不足。为了解决这一局限，本研究提出了一个多模态DL框架，通过利用从MRI中学习到的互补特征表示来提升基于CT的AD诊断效果。使用来自开放获取影像研究系列（OASIS-3）的配对CT和MRI数据训练并评估了一个自定义的卷积神经网络（CNN）。根据临床痴呆评定（CDR）得分和相应的临床诊断，共选择了772名具有可用MRI和CT扫描的参与者。参与者被分为正常对照组（NC，CDR=0，n=300）、轻度认知障碍（MCI，CDR=0.5，n=250）或AD（CDR≥1，n=222）。总体性别分布为352名男性和420名女性。仅使用CT的模型准确率为84%，AD分类的敏感性为92%，特异性为83%。所提出的多模态模型表现出更优的性能，准确率为92%，敏感性为95%，特异性为91%。重要的是，在仅使用CT进行推断时，多模态框架在识别疾病状态方面保持了高诊断准确性，表明MRI派生的特征有效转移到了CT上。这些结果突显了一种可扩展的解决方案，用于在资源有限的医疗环境中使用CT成像来改善AD的检测。

**引言**
痴呆是一种进行性的神经认知综合征，其特征是记忆、语言和行为功能的退化，最终导致显著的功能障碍。全球约有5500万人受到影响（Chouliaras和O’Brien，2023），预计由于全球人口老龄化，这一数字将大幅增加。痴呆不是一种单一疾病，而是一种包含多种病因的临床综合征。最常见的痴呆类型包括阿尔茨海默病（AD）、路易体痴呆（LBD）、血管性痴呆（VaD）和额颞叶痴呆（FTD）（Hategan等人，2018），每种类型都有特定的神经病理学和临床特征。其中，AD是最常见的形式，约占60-70%（世界卫生组织，2023）。大脑中的病理变化在临床症状出现前十年就开始了（Ritchie等人，2016）。AD的神经病理学标志包括皮质萎缩、脑室扩大、海马体萎缩以及淀粉样β斑块和tau缠结的异常积累（Plascencia-Villa和Perry，2022）。AD从正常认知发展到轻度认知障碍（MCI），然后进一步发展为更严重的痴呆阶段（Chen和Mobley，2019）。相比之下，VaD通常与缺血性病变和白质损伤相关（Zhang等人，2024），LBD则表现为认知波动、视觉幻觉和枕叶功能障碍（Taylor等人，2020）。另一方面，FTD主要影响额叶和颞叶，导致早期行为和语言障碍（Buccellato等人，2024）。尽管经过数十年的研究，目前尚无根治方法，现有的治疗方法只能缓解症状或稍微减缓病情进展（Korczyn和Grinberg，2024；Liu等人，2025）。因此，早期和准确的诊断对于及时干预和改善生活质量至关重要（Chu，2012；Dubois等人，2023）。

神经影像技术在痴呆的诊断、特征描述和亚型区分中起着核心作用。广义上，神经影像技术可以分为结构性和功能性两种模式。结构性成像方法如磁共振成像（MRI）和计算机断层扫描（CT）可以提供高分辨率的大脑形态可视化。这些方法能够评估皮质萎缩、海马体积损失、脑室扩大和其他结构异常，有助于区分AD与其他类型的痴呆（Ali等人，2024）。功能性成像技术，包括脑电图（EEG）、功能性磁共振成像（fMRI）和正电子发射断层扫描（PET），通过检测异常的淀粉样β和tau沉积（Castellano等人，2024）或捕捉区分AD与其他痴呆的功能连接性和神经活动模式（Benwell等人，2020；Bonifacio和Zamboni，2016）提供互补的信息。基于EEG的研究显示，AD患者的振荡活动减慢和功能连接性中断，反映了可能在结构变化前几年就出现的早期突触功能障碍（Ayd?n和Ayd?n，2024；Benwell等人，2020）。其低成本、非侵入性和高时间分辨率使其特别适合大规模筛查和纵向监测。

尽管功能性神经影像具有诊断价值，但实际障碍限制了其广泛应用。例如，PET扫描成本高昂且不常可用，而EEG虽然易于获取，但在检测对AD进展至关重要的结构性脑变化方面效果较差（Dang等人，2023；Dash等人，2022；Farina等人，2020）。相比之下，结构性神经影像方法如MRI和CT由于更广泛的可用性、较低的成本和更高的临床实用性而常用于临床痴呆评估（Cuttler等人，2016；Dash等人，2022）。这些方法能够识别AD的已知解剖生物标志物，包括海马萎缩、皮质变薄和脑室扩大，这些可以通过自动化图像处理和机器学习方法进行定量分析（Abushakra等人，2025；K?lin等人，2017）。CT覆盖大部分身体区域的能力及其在急诊和诊断护理中的常规使用进一步增强了其临床效用（Pasi、Poggesi和Pantoni，2011）。虽然CT在检测细微海马萎缩方面不如MRI敏感，但它对于识别有助于区分AD与其他痴呆的宏观结构变化（如VaD中的区域性梗死、FTD中的明显额叶萎缩或正常压力性脑积水模拟）仍然很有价值，使其成为多种临床环境中的实用首选工具。然而，CT扫描的空间分辨率较低，在区分细微脑组织变化方面效果较差，这限制了其在早期AD检测中的准确性（Adduru等人，2020；Zeng等人，2021）。为了克服这些挑战，机器学习和人工智能（AI）方法已成为增强神经影像解释和支持成本效益高、准确且可扩展的AD诊断的有希望的策略。

**深度学习在医学影像数据分析中的应用**
AI的最新进展显著改善了医学影像数据的分析，并促进了用于神经退行性疾病的计算机辅助诊断系统的发展。AI在分析MRI、CT和PET扫描方面特别有用，有助于检测传统视觉检查可能遗漏的细微脑变化（Song等人，2021；Yeasmin等人，2024；Zarei等人，2024）。这些系统为临床医生在疾病评估期间提供了客观的支持信息，以实现及时、准确且无主观性的诊断（Bruun等人，2019；Dubois等人，2018）。在AI方法中，深度学习（DL）技术，特别是卷积神经网络（CNN），因其能够自动从复杂的神经影像数据集中提取临床相关特征而特别强大（Ahmed等人，2018；Odusami等人，2023）。它从大规模、多模态的脑图像中学习层次化模式的能力使其特别适合AD诊断，因为在AD中检测微小但渐进性的脑变化至关重要。

多项研究表明，使用DL对PET和MRI扫描进行AD诊断具有可比的有效性，在分类和检测研究中都取得了较高的准确率。例如，Zhang等人（2023）提出了一个端到端的3D CNN框架，通过使用ADNI数据库增强了从结构性MRI扫描中提取特征的能力，并实现了89.71%的诊断准确率。同样，Chen、Qiao和Zhu（2022）开发了一个使用多个子网络提取局部切片级特征的模型，在ADNI-1数据集上实现了91.1%的准确率。此外，Zhang等人（2023）提出了一个3D CNN框架，用于从结构性PET扫描中提取特征，并实现了91.18%的诊断准确率。另一项研究构建了一个级联3D CNN来学习用于分类AD的PET脑图像的多级成像特征，实现了92.2%的准确率（Cheng和Liu，2017）。这些研究表明，结合深度学习的PET和MRI图像可以准确诊断AD。然而，由于PET的高成本和有限的可用性，这些模型的临床应用仍然具有挑战性，尤其是在常规和资源有限的环境中。

**多模态神经影像在AD诊断中的应用**
多模态神经影像已成为一种强大的AD诊断方法，因为它整合了不同成像模式的互补信息，提高了敏感性和准确性。最近的研究表明，将MRI与PET结合使用比单一模态方法性能更优。例如，Castellano等人（2024）使用OASIS数据集开发了一个联合3D MRI和淀粉样-PET框架，在检测AD生物标志物方面实现了91%的准确率。同样，Zhang和Shi（2020）应用了一个带有注意力机制的深度多模态融合网络，处理ADNI数据集中的MRI和PET数据，实现了95.21%的准确率，用于区分正常对照组（NC）和AD。此外，Qiu等人（2022）通过整合MRI与临床和认知特征，进一步推进了这一方向，在Mayo Clinic数据集上实现了95%的平衡准确率。相比之下，单一模态方法通常准确率较低。例如，Zarei等人（2024）使用ADNI的T1加权MRI图像实现了82.6%的准确率，而Castellano等人（2024）使用MRI单独实现了80.78%的准确率，PET单独使用实现了72%的准确率。这些发现强调了多模态神经影像在增强基于AI的AD诊断中的关键作用。

**本研究的方法论贡献**
基于多模态表示学习的概念，本研究探讨了在统一的DL框架内整合MRI和CT图像是否可以增强CT对AD检测的诊断能力。虽然之前的研究主要集中在将MRI与其他高分辨率模式结合使用，但相对较少关注提高CT的诊断性能，尽管CT在临床中广泛可用。我们假设使用MRI和CT扫描进行多模态训练可以使模型学习到互补的结构表示，使CT特征受益于MRI在训练期间提供的更丰富的解剖信息。与之前的工作（如Mustafa和Luo（2023）不同，他们应用了早期-晚期融合（ELF）策略对MRI和CT图像进行了处理，并使用OASIS-3数据集实现了97.19%的准确率，我们的研究通过实现仅使用CT的推断做出了方法论贡献。具体来说，在训练过程中，CT特征与MRI表示对齐，使模型能够从MRI中学习互补的结构信息。通过在校准模型训练期间对齐CT特征和MRI特征，我们的框架传递了增强基于CT的诊断的互补信息。最终，这种方法扩展了多模态AI的临床适用性，为早期AD检测提供了一种经济、可扩展且实用的解决方案。

**研究数据集**
本研究使用了公开可用的开放获取影像研究系列（OASIS-3）数据集（LaMontagne等人，2019），该数据集由华盛顿大学圣路易斯分校（WUSTL）的Knight阿尔茨海默病研究中心（ADRC）收集。完整的OASIS-3队列包括1378名年龄在42-95岁之间的参与者，整合了超过30年的临床研究的多模态数据，包括2,842张MRI、2,157张PET和1,472张CT脑成像。

**仅使用CT模型的性能**
使用多种指标评估了仅使用CT模型在区分认知障碍类别方面的性能，包括准确率、精确度、召回率、F1分数和AUC。在测试集上，单模态CT模型在AD上的AUC值为0.98，在MCI上为0.91，在NC上为0.94（见图4A）。这些ROC曲线展示了在不同决策阈值下敏感性和特异性之间的权衡，而相应的AUC值量化了模型的整体性能。

**讨论**
早期和准确的AD诊断对于及时干预和改善患者结果至关重要。虽然PET和MRI提供了详细的结构和功能信息，但它们仍然成本高昂且在常规临床环境中不易获得（Odusami等人，2023；Young等人，2020）。相比之下，CT扫描更广泛可用、更经济，并且经常在MRI禁忌的情况下使用（Srikrishna等人，2024）。尽管CT在检测AD特异性神经退行性变化方面的敏感性较低，但……具体而言，该多模态模型取得了显著的效果。未引用的参考文献包括LaMontagne等人（2012年）和Zhang等人（2025年）。作者贡献如下：Arslan Abbas负责概念化、方法论设计、形式分析、软件开发、数据可视化以及初稿撰写和审稿编辑工作；Hsin-Chi Tsai参与概念化、模型验证、资源整理、数据管理以及审稿编辑；Yu-Ling Hsu参与概念化、方法论设计及审稿编辑；Mutebi John Kenneth负责方法论设计、数据管理及模型验证；Bashir Hussain负责方法论设计、数据管理及可视化工作。CRediT作者贡献声明：Arslan Abbas负责审稿编辑、初稿撰写、数据可视化、软件开发、方法论设计及概念化；Hsin-Chi Tsai负责审稿编辑、模型验证、资源整理及数据管理；Yu-Ling Hsu负责审稿编辑、方法论设计；Mutebi John Kenneth负责数据可视化、模型验证及方法论设计；Bashir Hussain负责数据可视化、模型验证及方法论设计；Lillian M. Lai负责审稿编辑。

作者声明：他们没有已知的财务利益冲突或个人关系可能影响本文的研究结果。

本研究得到了花莲慈济综合医院和Ditmanson医学基金会与嘉义基督教医院-国立中兴大学联合研究计划（CYCH-CCU-2024-07）的支持。

联系信箱：

粤ICP备09063491号

热点排行