利用深度学习和大型语言模型对精神疾病进行双重表征结构磁共振成像分类

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Psychiatry Research: Neuroimaging》：Dual-Representation Structural MRI Classification of Psychiatric Disorders Using Deep Learning and Large Language Models

【字体：大中小】 时间：2026年01月19日 来源：Psychiatry Research: Neuroimaging 2.1

编辑推荐：

　　准确区分精神分裂症与双相情感障碍等疾病面临症状重叠和神经解剖差异微小的挑战。本研究提出双表示结构MRI框架，通过原始T1加权MRI切片和颜色编码分割地图训练两个独立ResNet-18 CNN，结合LLM后分析提升分类性能与解释性，解决小样本问题。

希迪尔·塞尔丘克·诺盖 | 霍贾特·阿德利

土耳其布尔萨乌卢达格大学工程学院电气与电子工程系

摘要

由于精神疾病（如精神分裂症和双相情感障碍）的症状重叠以及神经解剖结构的细微差异，准确区分这些疾病仍然是一个重大的临床挑战。本研究提出了一种双重表示的结构磁共振成像（MRI）框架，该框架利用相同的成像方式获得的原始T1加权MRI切片及其对应的彩色编码组织分割图，通过两个独立训练的ResNet-18卷积神经网络（CNN）进行分析。研究的四个诊断组包括：健康对照组、精神分裂症谱系、伴有精神病性的双相情感障碍以及不伴有精神病性的双相情感障碍。由于数据集规模有限（N = 103），因此采用了迁移学习（Transfer Learning, TL）和数据增强（Data Augmentation, DA）技术。

模型训练完成后，使用大型语言模型（Large Language Model, LLM）作为事后分析工具，以解释CNN的输出结果，并提供关于两种MRI表示方法相对贡献的解读。结果表明，双重表示方法提高了四分类的准确性，并能够系统地比较原始数据和基于分割的数据所捕获的结构信息。这些发现突显了将深度学习模型与LLM辅助的解释能力相结合的潜力，从而支持更透明、更具信息量的精神疾病神经影像学诊断工具。

引言

精神健康障碍，如精神分裂症和双相情感障碍，是复杂的多因素疾病，对准确诊断和有效治疗提出了重大挑战（Dickinson等人，2008年）。这些疾病的特点是症状重叠、临床表现多样，且对治疗的反应各不相同，这使得鉴别诊断成为临床医生的一个关键而困难的任务。传统的诊断方法通常依赖于临床访谈和行为评估，可能无法完全捕捉患者之间的神经生物学差异。因此，人们越来越关注利用神经影像学数据来支持诊断过程，以了解与各种精神健康状况相关的脑结构和功能变化（Acharya等人，2015年；Liu等人，2022年；Zhang等人，2023年）。最近在精神疾病神经影像学领域的研究中，应用了机器学习模型结合图论指标来辅助广义焦虑障碍的诊断，展示了拓扑网络特征在精神疾病分类中的潜力（Jiang等人，2023年）。

成像技术的最新进展，特别是磁共振成像（MRI），使我们能够更详细地了解患有精神疾病个体的大脑结构和功能变化。MRI能够无创地检查大脑解剖结构，提供关于皮层厚度、灰质体积等结构生物标志物的宝贵信息。非侵入性技术如脑电图（EEG）也在继续被探索作为精神疾病和认知障碍的功能生物标志物，为结构成像提供补充信息（Koenig等人，2020年）。然而，手动解读MRI图像耗时且容易受到观察者偏见的影响；因此，需要自动化方法（如机器学习，Adeli和Hung，1995年）来提高诊断准确性。

深度学习和卷积神经网络（CNN）在医学领域的成功应用已经应用于多种任务，例如检测和分类肿瘤、在部分遮挡情况下识别人类活动（Vernikos等人，2023年）、诊断神经系统疾病（如癫痫，Yousif和Ozturk，2023年）和重度抑郁症（MDD，Shahabi等人，2023年）以及心血管疾病。在精神病学研究中，CNN被应用于MRI数据以分类精神健康障碍，显示出区分精神分裂症和双相情感障碍与健康对照组的有希望的结果。最近，Al Fahoum和Zyout（2024年）使用小波变换、重构的相空间和深度学习神经网络进行基于EEG的精神分裂症检测。然而，精神疾病的复杂性和异质性要求采用先进的方法来充分挖掘CNN在临床应用中的潜力（Siuly等人，2023年；Korda等人，2022年）。

除了MRI之外，能够可视化突出特定脑区的图像分割技术还可以提供关于大脑解剖和结构方面的补充信息（Mirzaei和Adeli，2019年）。先前的研究（例如Zhang等人，2019年；Masoudi等人，2021年）探讨了相关主题，但在基于CNN的分类中独立使用分割图像的研究仍然较少。为了进一步提高所提出的鉴别诊断模型的可解释性和实用性，本研究结合了大型语言模型（LLM）来辅助处理、解释和解释双重CNN模型的输出结果（Yang等人，2024年；Raiaan等人，2024年）。

本研究重点关注四个具有临床和神经生物学意义的诊断组：健康对照组（HC）、精神分裂症谱系障碍（SCZ）、伴有精神病性的双相情感障碍（BDWiP）以及不伴有精神病性的双相情感障碍（BDWOP）。选择这些组是因为它们代表了精神病学中最具挑战性的鉴别诊断问题之一。SCZ和BD具有重叠的症状、部分相似的脑结构改变以及类似的认知损伤轨迹，仅凭传统的临床评估很难准确区分。此外，区分伴有精神病性和不伴有精神病性的BD对预后和长期治疗计划有重大影响。儿童和青少年神经发育计划（CANDI）数据集为这四个组提供了高质量的结构MRI数据，使得在受控的成像环境中系统地评估解剖差异成为可能。

本研究提出了一种新颖的双模型方法，结合了MRI和图像分割的优势，用于精神健康障碍的鉴别诊断。分别在每种数据类型上独立训练CNN模型，从而从同一成像方式获得两种不同的图像表示。然后使用LLM分析这些模型的输出结果，以提高结果的可解释性和实际应用价值。

为了解决样本量有限的挑战，采用了迁移学习（TL）和数据增强（DA）技术，使模型能够利用现有知识并提高泛化能力。整合CNN和LLM的目的是：（1）评估MRI和分割数据对分类性能的独立贡献；（2）探索结合这两种模态的协同效益；（3）评估LLM在提高精神病学研究中复杂模型可解释性方面的潜力。

精神健康障碍的日益普遍给全球医疗系统带来了重大挑战。精神分裂症、双相情感障碍等精神疾病不仅对患者本人造成严重影响，也给家庭和社会带来巨大负担。世界卫生组织（WHO）估计，大约25%的人口在其一生中会受到精神健康障碍的影响，这凸显了有效诊断和治疗策略的迫切需求。传统的诊断方法往往依赖于临床访谈和行为评估，可能无法完全捕捉患者之间的神经生物学差异。因此，人们越来越重视利用神经影像学数据来支持诊断过程，以了解与各种精神健康状况相关的脑结构和功能变化（Acharya等人，2015年；Liu等人，2022年；Zhang等人，2023年）。最近在精神疾病神经影像学方面的研究利用机器学习模型结合图论指标来辅助广义焦虑障碍的诊断，展示了拓扑网络特征在精神疾病分类中的潜力（Jiang等人，2023年）。

成像技术的最新进展，特别是磁共振成像（MRI），使我们能够更详细地了解患有精神疾病个体的大脑结构和功能变化。MRI能够无创地检查大脑解剖结构，提供关于皮层厚度、灰质体积等结构生物标志物的宝贵信息。非侵入性技术如EEG也在继续被探索作为精神疾病和认知障碍的功能生物标志物，为结构成像提供补充信息（Koenig等人，2020年）。然而，手动解读MRI图像耗时且容易受到观察者偏见的影响；因此，需要自动化方法（如机器学习，Adeli和Hung，1995年）来提高诊断准确性。

深度学习和卷积神经网络（CNN）在医学领域的成功应用已经应用于多种任务，例如检测和分类肿瘤、在部分遮挡情况下识别人类活动（Vernikos等人，2023年）、诊断神经系统疾病（如癫痫，Yousif和Ozturk，2023年）和重度抑郁症（MDD，Shahabi等人，2023年）以及心血管疾病。在精神病学研究中，CNN被应用于MRI数据来分类精神健康障碍，显示出区分精神分裂症和双相情感障碍与健康对照组的有希望的结果。最近，Al Fahoum和Zyout（2024年）使用小波变换、重构的相空间和深度学习神经网络进行基于EEG的精神分裂症检测。然而，精神疾病的复杂性和异质性要求采用先进的方法来充分发挥CNN在临床应用中的潜力（Siuly等人，2023年；Korda等人，2022年）。

除了MRI之外，能够可视化突出特定脑区的图像分割技术还可以提供关于大脑解剖和结构方面的补充信息（Mirzaei和Adeli，2019年）。先前的研究（例如Zhang等人，2019年；Masoudi等人，2021年）探讨了相关主题，但在基于CNN的分类中独立使用分割图像的研究仍然不足。为了进一步提高所提出的鉴别诊断模型的可解释性和实用性，本研究结合了大型语言模型（LLM）来辅助处理、解释和解释双重CNN模型的输出结果（Yang等人，2024年；Raiaan等人，2024年）。

本研究重点关注四个具有临床和神经生物学意义的诊断组：健康对照组（HC）、精神分裂症谱系障碍（SCZ）、伴有精神病性的双相情感障碍（BDWiP）以及不伴有精神病性的双相情感障碍（BDWOP）。选择这些组是因为它们代表了精神病学中最具挑战性的鉴别诊断问题之一。SCZ和BD具有重叠的症状、部分相似的脑结构改变以及类似的认知损伤轨迹，仅凭传统的临床评估很难准确区分。此外，区分伴有精神病性和不伴有精神病性的BD对预后和长期治疗计划有重大影响。儿童和青少年神经发育计划（CANDI）数据集为这四个组提供了高质量的结构MRI数据，使得在受控的成像环境中系统地评估解剖差异成为可能。

本研究提出了一种新颖的双模型方法，结合了MRI和图像分割的优势，用于精神健康障碍的鉴别诊断。分别在每种数据类型上独立训练CNN模型，从而从同一成像方式获得两种不同的图像表示。然后使用LLM分析这些模型的输出结果，以提高结果的可解释性和实际应用价值。

为了解决样本量有限的挑战，采用了迁移学习（TL）和数据增强（DA）技术，使模型能够利用现有知识并提高泛化能力。整合CNN和LLM的目的是：（1）评估MRI和分割数据对分类性能的独立贡献；（2）探索结合这两种模态的协同效益；（3）评估LLM在提高精神病学研究中复杂模型可解释性方面的潜力。

精神健康障碍的日益普遍给全球医疗系统带来了重大挑战。精神分裂症、双相情感障碍等精神疾病不仅对患者本人造成严重影响，也给家庭和社会带来巨大负担。世界卫生组织（WHO）估计，大约25%的人口在其一生中会受到精神健康障碍的影响，这凸显了有效诊断和治疗策略的迫切需求。传统的诊断方法往往依赖于主观评估，可能导致诊断和治疗结果的差异。

最近的神经影像学研究，特别是使用MRI的研究，揭示了包括自闭症谱系障碍（ASD）（Nogay和Adeli，2023年；Nogay和Adeli，2024年）、精神分裂症（Pei等人，2024年）和重度抑郁症（MDD）（Ahmadlou等人，2013年）在内的几种精神疾病的重要结构和功能变化。

MRI使研究人员和临床医生能够可视化大脑结构并识别可能有助于诊断精神疾病的关键生物标志物。然而，MRI数据的解读复杂，需要复杂的分析技术。这种复杂性需要整合先进的计算方法，特别是机器学习（ML）和深度学习（DL），以改进评估过程。

最近的研究强调了CNN在多种医学应用中的成功，包括精神健康障碍的诊断。例如，先前的工作已经证明了基于CNN的模型在从结构MRI数据中分类精神分裂症方面的有效性（Wang等人，2016年；Hu等人，2022年），而其他研究则结合了结构和功能MRI特征使用深度学习来提高检测性能（Masoudi等人，2021年）。然而，这些研究通常仅使用单个CNN模型，并且仅依赖原始MRI数据。相比之下，本研究引入了一种双重CNN架构，其中两个网络分别在原始MRI和基于分割的图像上进行训练，从而从同一成像方式获得互补的特征。此外，使用LLM分析分类结果以提高可解释性和背景相关性。这种集成框架提高了四个诊断类别的分类性能，并提供了一个新的解释层，增强了透明度，支持精神病学诊断中的临床决策。

尽管取得了有希望的结果，但大多数现有研究主要关注原始MRI数据，对图像分割的补充作用关注较少。分割技术可以通过隔离特定的脑结构和异常来提高模型性能，从而提高分类准确性。尽管一些先前的研究将分割图纳入深度学习工作流程，但这些通常仅作为中间处理步骤或与MRI结合使用（Havaei等人，2017年；Zhao等人，2020年）。

此外，当前研究领域的大多数研究依赖于在原始MRI图像上训练的单一CNN模型（Hu等人，2022年），这可能限制了捕捉神经解剖数据多样性的能力。在精神疾病分类的背景下，使用双重CNN模型——其中一个网络处理原始MRI图像，另一个网络处理基于分割的图像——的研究较少。本研究通过评估从同一成像方式获得的数据表示的独立贡献，解决了这一不足。这种双重模型方法提供了从结构数据和空间定位的脑区提取互补特征的机会，从而更全面地理解精神疾病。

为了解决精神疾病诊断的复杂性，本研究引入了一种双重CNN框架，独立分析原始MRI和分割图像以捕获互补的神经解剖信息。整合LLM提供了一个事后解释层，使模型的决策能够在临床意义上得到解释。这些组件共同致力于推进基于AI的准确和可解释的诊断工具的发展。

方法论

本研究的目的是使用两个CNN基于MRI和分割图像对精神健康障碍进行分类。方法论包括数据采集、预处理、模型架构设计、训练和评估。

MRI模型结果

使用原始脑MRI图像训练的MRI模型在精神疾病分类中表现出强大的性能。表2展示了每个类别的评估指标，包括准确性、精确度、召回率和F1分数。这允许对模型在每个特定类别上的性能进行详细分析。

主要发现包括：

BDWOP（不伴有精神病性的双相情感障碍）：该模型在分类患有双相情感障碍的个体方面表现出卓越的性能

LLM辅助分析

使用LLM进行事后分析，以提高CNN模型的可解释性。LLM帮助完成了以下任务：

?

模型比较：通过分析MR和分割模型的输出，LLM识别了每种模态的优点和缺点，有助于选择最适合特定诊断任务的模型。

?

结果解释：LLM将复杂的数值输出（例如混淆矩阵和性能指标）总结为临床可理解的格式

结论与讨论

本研究展示了使用原始MRI和分割图像对精神疾病进行分类的双重CNN架构的潜力。虽然基于MRI的模型在区分健康对照组和精神分裂症患者方面表现出更高的性能，但基于分割的模型提供了补充的解剖信息，增强了整体分类能力。这些发现表明，利用结构上不同的表示方法

未引用的参考文献

AbaeiKoupaei和Al Osman，2023年；Deng等人，2009年；He等人，2015年；Hinton等人，2012年；Liu等人，2019年；Meshram和Rambola，2023年；Sharma等人，2023年；Xu等人，2022年；Deng等人，2009年；Akbari等人，2021年；Beheshti等人，2020年

CRediT作者贡献声明

希迪尔·塞尔丘克·诺盖：撰写——原始草稿，验证，监督，项目管理，方法论，调查，正式分析，概念化。霍贾特·阿德利：撰写——审稿与编辑，监督，方法论，概念化。

利益冲突声明

本文所述的研究未获得任何组织的资助。作者声明没有利益冲突。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号

摘要

引言

相关文献

相关工作

方法论