利用区域特定分层融合图神经网络通过静息态fMRI脑网络诊断早期轻度认知障碍陈志亮、宋淼和吴宁格

《Information》：Early Mild Cognitive Impairment Diagnosis via Resting-State fMRI Brain Networks Using a Region-Specific Hierarchical Fusion Graph Neural Network Zhiang Chen, Miao Song and Ningge Wu

【字体：大中小】 时间：2026年05月10日 来源：Information 2.9

编辑推荐：

　　摘要：早期轻度认知障碍（EMCI）是阿尔茨海默病（AD）最早可干预的阶段。尽管图神经网络（GNNs）已经开始利用大脑网络拓扑结构，但传统的基于fMRI的诊断方法通常依赖于向量化特征，从而忽略了这些结构模式。此外，现有的GNNs往往忽视了区域间的功能异质性和群体层面的辨别模式，导致

　　摘要：早期轻度认知障碍（EMCI）是阿尔茨海默病（AD）最早可干预的阶段。尽管图神经网络（GNNs）已经开始利用大脑网络拓扑结构，但传统的基于fMRI的诊断方法通常依赖于向量化特征，从而忽略了这些结构模式。此外，现有的GNNs往往忽视了区域间的功能异质性和群体层面的辨别模式，导致准确性和生物标志物解释能力有限。为了解决这些问题，我们提出了HF-BrainGNN，这是一种用于EMCI识别的端到端分层图学习框架。我们的方法引入了功能亲和区域卷积（FAR-Conv）层来学习区域自适应核，差异焦点池化（DF-Pool）模块通过最大化群体间差异来识别疾病显著的大脑区域，以及分层集成分类器（HIC）来融合多层次的图表示。该框架通过分类、焦点分离和一致性正则化损失进行了优化。在ADNI数据集（104例EMCI，114例认知正常）上的实验表明，HF-BrainGNN的准确率达到86.78%，比最佳基线（Hi-GCN）高出4.64%。此外，自动识别的区域，如双侧海马体和默认模式网络枢纽，与已建立的EMCI生物标志物相符。最终，HF-BrainGNN提供了一个高效、可解释的人工智能工具，用于精确的大脑网络表征和早期AD干预。

1. 引言
阿尔茨海默病（AD）是一种进行性神经退行性疾病，全球有超过5000万人受到影响，预计到2050年这一数字将增加到1.52亿[1]。AD通常从轻度认知障碍（MCI）发展而来，而早期轻度认知障碍（EMCI）代表了最早可临床检测和潜在可干预的阶段[2]。尽管EMCI仅表现为轻微的认知下降，不会严重影响日常生活，但其及时和准确的识别对于延缓向痴呆症的进展至关重要[3]。由于EMCI症状的轻微和非特异性，仅基于临床评估的诊断仍然具有挑战性，这突显了需要客观的基于神经成像的生物标志物的需求[4]。功能性磁共振成像（fMRI）提供了一种非侵入性的方法来量化大脑的功能活动和连接性，为与AD相关的早期神经异常提供了关键见解[5]。静息态fMRI（rs-fMRI）不需要认知任务，特别适合于涉及不同认知能力水平患者的临床和研究环境。从rs-fMRI获得的大脑功能连接网络反映了局部和全局的神经相互作用，已被广泛用于研究整个AD连续体[6,7]。

传统的rs-fMRI分析方法通常依赖于基于种子的相关性映射、独立成分分析（ICA）或图论指标[8,9]。这些方法通常遵循两阶段流程：手工特征提取，然后通过传统的机器学习算法进行分类。例如，Khazaee等人[10]结合了图论特征和支持向量机（SVMs）进行AD分类；Wee等人[11]在多模态模型中整合了体积和扩散张量成像（DTI）数据；Tijms等人[12]总结了整个AD谱系中的基于图的生物标志物。尽管这些方法提供了有用的信息，但它们严重依赖于手动特征设计和先验知识，限制了端到端的优化和可解释性[13]。

最近，深度学习——特别是图神经网络（GNNs）为建模大脑连接数据提供了一个强大的框架[14]。通过在图结构上传递信息，GNNs以端到端的方式共同学习节点属性和拓扑关系，实现了辨别性连接模式的自动化发现。值得注意的例子包括用于自闭症谱系障碍的群体图GNN[15]、用于基于fMRI的生物标志物检测的BrainGNN架构[16]，以及用于捕捉时间连接变化的动态注意力网络[17]。这些进展表明GNNs可以提取大脑疾病的复杂且有信息量的表示。

然而，在将GNNs应用于基于fMRI的认知障碍分析时仍存在几个关键挑战。首先，大多数模型对所有节点采用统一的卷积核，忽略了大脑区域间的功能特异性和解剖多样性。其次，现有的图池化方法主要评估单个图内的节点重要性，忽视了不同受试群体之间的系统差异，从而限制了它们识别疾病特异性区域的能力。第三，许多GNN框架仅依赖最后一层的特征进行分类，忽略了在分层传播过程中获得的多层次表示。结合跨层的多跳邻域信息将允许更全面地整合局部和全局的连接模式。

具体来说，为了解决区域异质性问题，我们引入了功能亲和区域卷积（FAR-Conv）层。它通过整合功能相似性和解剖接近性来构建区域特定的核，使模型能够捕捉多样的区域间依赖性。同时，为了发现群体层面的生物标志物，差异焦点池化（DF-Pool）层通过基于软掩码的机制比较群体间的焦点得分分布来识别疾病相关区域。最后，分层集成分类器（HIC）被设计用来以可学习的权重自适应地融合多层次特征，确保通过结合局部和全局视角来做出稳健的诊断。

此外，该框架优化了三个互补的损失函数——分类、焦点分离和一致性正则化——以在诊断准确性和生物学可解释性之间取得平衡。提出的HF-BrainGNN在ADNI队列的静息态fMRI数据上进行了评估，包括104例EMCI患者和114例认知正常个体。实验结果表明，HF-BrainGNN的准确率优于现有方法，提高了准确率、敏感性和特异性。此外，DF-Pool识别出的关键大脑区域与以往神经科学研究中报告的EMCI相关区域高度一致[18]，强调了所提模型的生理合理性和临床可解释性。

2. 方法
本节详细介绍了用于EMCI分类的HF-BrainGNN框架。如图1所示，整个工作流程包括三个不同的阶段：（1）大脑网络构建（第2.1节），其中通过基于图谱的分割处理fMRI数据以生成功能连接网络；（2）HF-BrainGNN学习，提取分层特征并识别辨别区域（第2.2节、第2.3节、第2.4节、第2.5节和第2.6节）；以及（3）诊断和解释，模型输出分类结果并突出潜在的生物标志物。以下小节详细说明了这一流程的每个组成部分。

2.1. 大脑网络构建
在本研究中，使用自动解剖标签（AAL90）模板将大脑划分为N个解剖区域（），这为神经成像研究提供了广泛采用的标准解剖学参考[19]。每个感兴趣的区域（ROI）对应于大脑图中的一个节点。首先根据所有ROI的平均时间序列计算皮尔逊相关矩阵。每个元素反映了区域间的功能连接（FC）强度。然后从R中导出邻接矩阵A来定义图拓扑结构。为了强调最重要的功能连接，我们通过保留绝对相关系数的前20%来对相关矩阵进行阈值处理。具体来说，前20百分位的元素被设为1（表示存在边），其余的被设为0，从而形成二进制邻接矩阵A。在构建大脑图之后，从相同的FC矩阵定义节点特征。节点的特征由其相应的FC向量表示，其中表示R的第i行。因此，初始节点特征矩阵可以表示为。在本研究中，仅使用FC信息来形成节点特征，不引入额外的形态学或临床协变量[20]。本节使用的所有符号总结在表1中。

2.2. HF-BrainGNN方法概述
所提出的分层聚焦大脑图神经网络（HF-BrainGNN）如图2a所示。它包括三个主要组成部分：FAR-Conv层、差异焦点池化层和分层集成分类器。该模型以单个受试者的大脑图及其初始节点特征（由FC行向量形成）作为输入。图2. HF-BrainGNN的分层图学习框架及其核心功能模块。图中的箭头表示数据流路径，彩色条代表区域亲和向量，彩色节点代表具有不同属性的大脑区域。第1层和第2层通过FAR-Conv和DF-Pool实现分层特征提取，用于EMCI/CN分类。如图2a所示，HF-BrainGNN包含两个级联处理层，每个层都整合了一个FAR-Conv层、一个差异焦点池化（DF-Pool）层和一个全局池化操作（Mean/Max Pool），以获得特定于层的图表示（,）。这些表示在分层集成模块中自适应地融合，并输入到多层感知器（MLP）中用于EMCI/CN分类。在每个分层大脑处理单元（HBPU）中，FAR-Conv计算区域亲和向量以生成区域特定的卷积核，并执行两跳信息传递，以实现多层次邻域聚合，为两个级联处理层（）生成表示（）。然后DF-Pool计算群体增强的焦点得分，以选择前k个疾病相关的大脑区域，并输出用于后续层处理的诱导子图。最后，分层集成分类器通过对所有层的读出向量进行加权融合，并通过MLP输出最终的分类概率。整个流程从特征提取（FAR-Conv）到区域选择（DF-Pool），然后到特征集成和分类。三个互补的损失函数共同优化，以确保强大的预测性能和可解释性，如第2.6节所述。

2.3. 功能亲和区域卷积层
图神经网络在大脑网络分析中显示出有希望的潜力；然而，它们的应用有一个显著的局限性：现有模型通常对所有节点使用统一的卷积核进行特征提取。这种方法可能无法完全捕捉不同大脑区域的独特功能特性和解剖位置差异。神经科学研究表明，大脑区域表现出明显的功能特化和复杂的交互模式[21]。例如，前额叶皮层主要介导执行功能，而颞叶参与听觉和语言处理。这种功能差异和区域特异性对于全面理解大脑网络动态至关重要，因此在计算模型设计中需要特别考虑。

为了解决这个问题，我们提出了FAR-Conv层，它考虑了大脑区域的功能相似性和解剖位置特征，为不同的大脑区域分配了区域特定的嵌入策略。FAR-Conv的核心思想是在保持每个区域解剖特异性的同时，增强功能相似大脑区域之间的信息交换，如图2b所示。对于每个大脑区域节点，我们引入了一个区域亲和向量，该向量表示节点对每个功能区域的隶属程度[22]。在本研究中，根据神经科学研究中广泛采用的八网络划分定义了功能网络[23]。为了结合多维位置信息，区域亲和向量定义为，其中表示大脑区域i到第k个功能网络中心的欧几里得距离；表示大脑区域中心的标准化3D坐标，是节点的位置编码。位置编码采用以下形式：（1）其中是大脑区域的3D坐标向量，是比例参数。这种公式提供了一个6维的位置嵌入（3个正弦和3个余弦分量），使模型能够区分位于不同解剖位置的大脑区域，即使它们表现出相似的FC模式。

第k个功能网络的质心坐标计算如下：（2）其中是网络K的质心坐标，是第k个功能网络中的大脑区域集合，是大脑区域的位置编码。基于区域亲和性，计算每个节点的区域特定卷积核如下：（3）其中是共享的基础权重，是第k个功能网络的基础权重矩阵。在这里，表示大脑区域与网络k的质心之间的欧几里得距离。为了确保位于功能网络附近的大脑区域获得更高的聚合权重，我们在softmax函数中应用了负距离（），有效地将距离度量转换为相似性度量。上标l索引分层处理层，每个层包括一个FAR-Conv和一个DF-Pool操作。两个这样的级联层在所提出的架构中堆叠在一起。

通过边权重增强因子实现功能相似大脑区域之间的信息传递：（4）这里，表示Sigmoid函数，确保增强因子受限在范围内，是原始边权重。该设计增强了具有相似区域亲缘关系的节点对之间的信息传递，同时削弱了不同节点对之间的信息传递。FAR-Conv的最终前向传播由以下公式给出：(5)，其中表示第l层节点的特征表示，是节点的区域特定图卷积核，是基于区域亲缘关系的边权重增强因子，表示第l层节点的邻居集合，是邻居节点的区域特定图卷积核。2.4. 差分焦点池化图池化是图神经网络中的一个基本操作，在降低计算复杂性和提取显著特征方面起着至关重要的作用[24,25]。然而，传统的池化方法主要评估单个图或数据集中的节点重要性，而没有明确模拟组间差异模式。在脑网络分析中，这种局限性降低了识别疾病特异性关键区域的能力[26]。受到这些观察结果的启发，我们提出了差异焦点池化（DF-Pool）机制（图3），该机制通过比较不同受试者组间的节点级表示来自动识别与疾病相关的脑区：它首先计算每个受试者的节点焦点分数，然后估计组间差异以突出高区分度区域，最后执行基于阈值的池化以保留最具信息量的节点，从而实现有针对性的特征提取和有效的降维。这一机制基于一个广泛接受的神经影像学原理——具有高诊断价值的脑区通常在患者和健康对照组之间存在显著差异[27]（这一原理已在多种神经精神疾病中得到验证，并为发现信息丰富的差异性生物标志物提供了理论基础）——我们设计了DF-Pool实施的三个步骤：(1) 节点焦点分数计算，(2) 组间差异估计，(3) 差异节点选择。图3. 差分焦点池化（DF-Pool）机制的概述。图中，红色点代表HC组的脑区，蓝色点代表EMCI组的脑区。首先，我们计算脑图中每个节点的焦点分数，以量化其对分类目标的贡献：(6)，其中是FAR-Conv在第l层输出的隐藏特征矩阵，是一个可学习的投影向量，是其归一化因子。焦点分数衡量了节点特征沿方向的投影强度，反映了节点相对于学习到的表示的显著性。然后我们应用最小-最大归一化来将焦点分数限制在区间内：(7)，这确保了范围的一致性并保持了节点重要性的相对排名，防止了极端值的偏差。接下来，我们估计受试者之间的组间差异。对于每个类别c，我们计算其组级平均焦点分数（方程(8)），并得出组间差异矩阵D（方程(9)）：(8) (9)，其中表示属于类别c的受试者集合，是受试者的数量。Hadamard积运算符（⊙）共同编码了两个互补的因素[28]：绝对差异量化了组间差异，而平均激活水平捕获了整体节点活动。这种设计强调了同时表现出强组间区分性和高激活度的脑区，这些可能对应于疾病特异性生物标志物。组级平均焦点和差异矩阵D作为中间表示，指导随后的节点选择，突出具有更强组间区分性的节点。最后，执行基于阈值的池化以保留最具信息量的节点：(10) 在实施过程中，组级平均焦点和差异矩阵D仅使用训练集中的受试者来计算，以防止数据泄露。在推理阶段，矩阵D作为学到的先验保持不变。对于单个未见过的受试者，池化操作（方程(10)）仅依赖于受试者的个别焦点分数和预训练的D，确保诊断不依赖于真实标签或其他测试数据。(11) (12)，其中表示选定脑区的空间索引集，操作返回综合得分向量中最高的k个值的对应索引。我们设置，意味着每个池化层保留50%的节点[29]。这里，和表示池化的节点特征矩阵和相应的邻接矩阵。在节点选择之前，采用了一种软掩码机制来平滑特征重要性的过渡[30]。通过在池化之前用焦点分数加权特征，这种方法(1)通过保留低焦点节点的部分贡献来减少突然的信息丢失，(2)通过连续调整特征重要性来稳定训练。2.5. 分层整合分类现有的脑网络分析方法通常依赖于最后一层的特征表示来进行分类[31]。然而，先前的研究表明，这种单层分类策略可能会限制诊断准确性，因为它忽略了不同层中特征的互补信息。最近的研究进一步表明，从多个网络深度中提取的表示为各种神经系统疾病提供了多样且互补的诊断线索[32,33]。受到这些发现的启发，多层特征融合已成为改进脑疾病分类的关键策略。受此概念的启发，我们提出了一个分层整合分类（HIC）框架。具体来说，我们堆叠FAR-Conv层和DF-Pool模块，构建了一个两级架构，捕获了分层的脑FC模式（即ROI节点之间的多跳交互）。所提出的网络架构包括多个顺序连接的区域处理模块（如图2所示）。每个区域处理模块由一个FAR-Conv层和一个DF-Pool操作组成。这种设计的核心目标是使每个模块能够在不同的表示层次提取脑网络特征，然后系统地整合这些多层级特征用于疾病分类。对于第l层区域处理模块的输出图及其对应的节点特征矩阵，应用一个特征聚合函数来获得固定大小的图级表示：(13)，这里计算平均节点特征以捕捉全局分布模式，而提取每个维度中最显著的特征值。然后，连接运算符（‖）结合这两种表示，保留了全局统计和局部区分信息，产生一个全面的图级特征嵌入。与仅连接不同层表示的传统方法不同，我们引入了一种自适应加权整合机制：(14) (15)，其中表示通过softmax归一化计算的适应层权重，是表示第l层相对重要性的可学习标量，表示将不同层的特征映射到统一嵌入空间的投影函数。所有参数通过反向传播共同优化，使网络能够自动确定每个层在整个分类过程中的贡献。最后，整合的特征向量通过多层感知器（MLP）然后是softmax激活得到最终预测的标签：(16) 2.6. 损失函数设计为了优化我们提出的HF-BrainGNN模型——特别是为了指导第2.3节中介绍的分层整合分类器的有效学习——我们设计了三个互补的损失函数。这些损失函数分别针对分类准确性、特征选择清晰度和组内一致性，共同形成了一个多目标优化框架。2.6.1. 分类损失作为主要的优化目标，我们采用了标准的二元交叉熵损失函数[34]，它有效地解决了脑疾病数据集中常见的类别不平衡问题：(17)，这里表示受试者m的真实类别标签，表示模型预测该受试者属于阳性类别（EMCI）的概率。是分层整合分类器（在第2.5节中介绍）输出的预测概率。2.6.2. 焦点分离损失为了增强DF-Pool层的特征选择能力，并引导分层整合分类器学习独特且具有区分性的节点表示，我们设计了焦点分离（FS）损失：(18) 这个损失的核心思想是最大化选定（top-k）节点和未选定节点的平均焦点分数之间的差异。对于每个受试者m，我们首先按降序对标准化的焦点分数进行排序。这里表示第i高的标准化焦点分数。然后我们计算前k个选定节点和剩余未选定节点的平均分数，并取它们的差值的负值。通过最小化，从而明确要求池化层在信息丰富和信息较少的脑区之间产生更清晰的对比。2.6.3. 一致性正则化为了平衡脑疾病模式的个体变异性和类内一致性[35]，我们引入了一致性正则化（CR）损失：(19)，这里表示属于类别c的受试者索引集，是该类中的受试者数量。这个项计算同一类中不同受试者的前k个节点焦点分数的平均L1距离。采用L1范数来减少异常值的影响并提高鲁棒性。通过约束同一类的受试者保持相似的焦点分布，这种正则化促进了组级一致性。它使分层整合分类器能够形成稳定的、类别特定的注意力权重模式，从而加强区分性特征表示并提高分类性能。2.6.4. 总损失我们将这三个损失函数组合成一个总损失函数，其中每个组分的权重通过超参数进行调整：(20) 这种多目标优化设计使模型能够同时追求多个目标：通过直接优化分层整合分类器的输出来确保预测准确性；增强节点选择的清晰度；平衡个体特异性和组内一致性，从而提高分层整合的稳定性。超参数和在平衡中起着关键作用：通过调整它们的值，我们可以在模型的分类性能和可解释性之间进行权衡[36]。3. 实验和结果 3.1. 数据集我们使用了阿尔茨海默病神经影像学计划（ADNI；https://adni.loni.usc.edu，访问日期为2025年3月6日）的公共数据，其中包括104名EMCI患者和114名认知正常（CN）参与者的静息态功能性磁共振成像（rs-fMRI）数据。研究参与者的 demographics 和临床特征在表2中总结。为了量化参与者的认知状态，我们使用了Mini-Mental State Examination（MMSE），这是一种广泛认可的30分临床工具，用于筛查认知障碍和痴呆。MMSE分数范围从0到30，分数越高表示认知功能越好。通常，27-30分被认为是认知正常的，而较低的分数反映不同程度的认知下降。所有数据都是使用Philips Medical Systems 3.0T MRI扫描仪获得的，扫描参数如下：重复时间（TR）= 3000 ms，回波时间（TE）= 30 ms，翻转角度 = 80°，切片厚度 = 3.3 mm，切片数量 = 48。表2. 研究参与者的demographics和临床特征。数据预处理使用GRETNA软件包[37]进行，关键步骤包括：丢弃前10个时间点，时间切片校正，头部运动校正，空间归一化到Montreal Neurological Institute（MNI）空间（分辨率：mm3），空间平滑（6 mm full-width at half-maximum（FWHM）高斯核），线性趋势去除，以及带通滤波（0.01–0.1 Hz）。这些预处理步骤符合rs-fMRI数据分析的广泛接受的标准[38]。3.2. 实验设置本研究中的所有实验都在PyTorch框架（版本2.5.1）中实现，训练和测试在配备NVIDIA RTX 3090Ti GPU（24 GB内存）的工作站上进行。模型架构（图2）包括两个亲和力感知的区域卷积（FAR-Conv）层和两个差异焦点池化（DF-Pool）层，形成了两个完整的区域处理模块。对于EMCI与CN分类任务，我们设置了以下参数：（AAL模板中的脑区数量）；（功能网络的数量）；（第一层的输出特征维度）；（第二层的输出特征维度）；以及（类别的数量）。池化率设置为0.5，意味着每个池化层保留50%的节点；经过两个池化层后，大约25%的原始节点作为关键脑区域被保留。(功能社区的数量)的设置基于神经科学研究中常用的八个功能网络划分[23]。我们使用5折交叉验证来评估模型性能：整个数据集被随机分成五个大小大致相等的互斥折。在每个折中，四个折（80%的数据）用作训练集（其中20%的训练数据进一步划分为超参数调整的验证集），剩下的一个折（20%）用作测试集。这个过程重复五次（每次折叠都作为一次测试集），以确保每个受试者的数据只被包含在测试集中一次，并且在不同的折叠中保持独立性。最终的性能指标是五次折叠结果的平均值。模型使用Adam优化器进行训练，初始学习率为0.001（每30个周期减半），权重衰减为0.0005，批量大小为32，最大训练周期为120。应用了提前停止策略（如果验证集准确率连续15个周期没有提高，则停止训练），以避免过拟合。对于损失函数的超参数，我们使用训练集和验证集来调整（焦点分离损失系数）和（一致性正则化损失系数）。模型评估指标包括准确率、敏感性、特异性和AUC；所有结果都以5折交叉验证的平均值和标准差的形式报告。

3.3 超参数讨论和消融研究
3.3.1 超参数设置
为了研究超参数对模型性能的影响，我们使用训练集和验证集对损失函数中的和进行了网格搜索，搜索范围设定为和。如第2.6节所定义的，控制焦点分离（FS）损失，较大的值会鼓励更明显的焦点得分，而控制一致性正则化（CR）损失，平衡个体多样性和组别一致性。较大的有助于促进共同的组别模式，而较小的则能捕捉到个体特定的变化。为了评估提出的亲和感知区域卷积（FAR-Conv），我们通过用标准图卷积（Standard-Conv）替换FAR-Conv层来进行消融研究。两者之间的性能差距反映了区域适应性的效果。我们采用了启发式调整程序：首先将固定为0或0.1，然后根据最佳调整，接着根据最佳值优化。图4显示了不同超参数组合对验证准确率的影响。图4. 不同损失函数系数下FAR-Conv与Standard-Conv的比较。(a) 将设置为0并调整；(b) 将设置为0.1并调整；(c) 将设置为0.1并调整。在每个子图中，红色条形表示Standard-Conv，蓝色条形表示FAR-Conv，误差条表示重复运行中的标准差。前两个图表显示了在不同固定值下的影响，而第三个图表分析了在固定为0.1时的变化情况。

3.3.2 消融研究
我们系统地研究了（焦点分离，FS损失）和（一致性正则化，CR损失）的影响，并评估了FAR-Conv与标准卷积版本的贡献。图4展示了不同损失系数对两种变体验证性能的影响。当时，准确率相对稳定，但当达到1.0时准确性下降；图4a。最高的准确率出现在，表明适度的一致性正则化有效缓解了过拟合，而过度约束则导致了欠拟合。当增加到0.1时（图4b），当超过0.2时性能下降。值得注意的是，在下的结果比使用时更高，表明FS损失本身引入了轻微的正则化效果，稳定了训练过程。在固定后，将变化范围在0到0.5之间调整可以获得最佳准确率（图4c），而更强的FS约束（或0.5）会略微降低性能，这表明在组间差异和模型灵活性之间存在最佳折衷。

在所有超参数设置中，FAR-Conv始终优于Standard-Conv，这一点在每个子图中都非常明显。这种性能差距突显了FAR-Conv分配特定于区域的卷积内核的能力，有效捕捉了统一内核所忽略的脑网络的功能异质性。基于综合分析，和被选为最佳系数组合，实现了最高的验证准确率。因此，这种配置被用于所有后续实验，并在独立的测试集上评估其可靠性。

3.4 与基线方法的比较
为了评估所提出的HF-BrainGNN的有效性，我们将其与传统的机器学习模型以及广泛使用的深度学习方法在EMCI与CN分类任务上进行了比较。传统的手工方法包括Ridge分类器[39]、带有RBF内核的支持向量机（SVM）[40]和带有100个估计器的随机森林[41]。这些模型使用向量化的全连接（FC）矩阵作为输入特征，并通过scikit-learn库[42]实现。对于深度学习方法，我们采用了标准的深度神经网络（DNN）[43]。专为脑分析设计的基于图的神经网络模型包括GCN[44]、GAT[45]、BrainGNN[16]、MVS-GCN[46]、PopulationGCN[47]和Hi-GCN[48]。值得注意的是，虽然像PopulationGCN[47]这样的模型采用了群体图方法（节点代表受试者），但我们的HF-BrainGNN和其他基线如Hi-GCN遵循的是受试者图范式（节点代表脑区间）。这使得HF-BrainGNN能够专注于学习个体脑网络内的区域适应特征和层次结构。所有模型都在ADNI数据集（218名受试者）上进行了相同的实验配置评估，以确保公平和可比的性能评估，重复进行了5次5折交叉验证，最终结果以所有重复次数的平均值±标准差的形式报告。传统的机器学习和DNN方法采用了8100维的向量化连接特征作为输入，而所有基于GNN的模型使用了从AAL90图谱构建的脑图，其中边权重通过皮尔逊相关性计算得出，并且只有最强的20%的连接被保留用于图谱构建。对于所有深度学习模型，包括DNN和各种GNN变体，统一采用了学习率为0.001的Adam优化器，并应用了一致的提前停止策略来缓解过拟合。此外，所有比较模型的超参数（例如，正则化系数、隐藏层维度、top-k池化比率）都是通过在每个交叉验证折叠的验证集上进行的统一网格搜索来优化的，以确保所有方法之间的超参数调整标准和实现方法的一致性。定量结果报告在表3中，包括准确率（Acc）、敏感性（Sen）、特异性（Spe）、曲线下面积（AUC）和F1分数。如表所示，传统的手工方法表现不佳，准确率低于75%，特异性大多低于65%。这表明基于向量的方法丢失了拓扑结构信息，使它们容易产生误报和分类错误。DNN的准确率略好（76.84%），受益于非线性特征学习，但仍受到向量化固有的空间邻接信息丢失的影响。

相比之下，所有基于GNN的模型都优于传统和一般的深度学习方法，证明了保持脑网络结构的重要性。其中，Hi-GCN实现了82.14%的最高准确率——在现有基线中表现最好——而其他GNN变体（GAT 78.52%，BrainGNN 79.81%，PopulationGCN 80.23%）紧随其后。从表3可以看出，所提出的HF-BrainGNN显示出最高的整体性能：准确率=，敏感性=，特异性=，AUC=。灵敏度的提高尤其显著，表明它具有正确识别EMCI患者的优越能力。高敏感性在临床诊断中至关重要，可以最小化误报，确保早期轻度认知障碍的患者能够被可靠地检测出来。与Hi-GCN相比，HF-BrainGNN的准确率提高了4.64%，特异性提高了15.82%，同时比SVM（最好的传统方法）的特异性提高了21.01%。此外，跨交叉验证折叠进行的配对t检验确认了HF-BrainGNN相对于最佳表现基线（Hi-GCN）的总体性能提升在统计上具有显著性。这些改进主要归因于：1. 区域适应性卷积（FAR-Conv），捕捉不同脑区的不同连接模式；2. 疾病导向的差分焦点池化（DF-Pool），强调与EMCI相关的区分性区域；3. 分层特征整合机制，利用了互补的多层信息。总体而言，HF-BrainGNN始终优于传统的和现有的基于GNN的基线，实现了更高的诊断灵敏度和减少了误报——这是可靠临床应用的重要属性。

3.5 HF-BrainGNN的可解释性
3.5.1 生物标志物检测
为了验证HF-BrainGNN识别出的关键脑区域的神经生物学意义，我们分析了由差分焦点池化（DF-Pool）层自动选择的显著ROI，并将它们与之前报告的EMCI生物标志物进行了比较。二十三个显著脑区域的平均节点焦点得分按降序排列在所有EMCI受试者中。特别是，这些得分代表了来自所有5折交叉验证运行中测试受试者的平均重要性值。然后选择前十个区域作为深度分析的核心生物标志物。它们的差分焦点得分范围从0.52到0.88（表4），区域重要性的变化显示在图5b中。表4. HF-BrainGNN识别出的十个核心脑区域。图5. HF-BrainGNN识别的关键脑区域及其对EMCI分类的重要性得分。(a) 在多视图脑图谱上可视化了十个核心脑区域（标记为蓝色节点），直观地展示了它们在不同脑视角下的空间分布。(b) 通过热图显示了这些脑区域的重要性得分（即CN和EMCI组之间的差分焦点得分）：右侧的颜色条表示得分范围（0.50–0.90，更深的蓝色对应更高的重要性）；热图中的星号表示组间得分差异的统计显著性（****：，***：，**：，*：）。所有p值都使用了Benjamini–Hochberg假发现率（FDR）方法进行了多重比较校正。HF-BrainGNN识别的十个最具区分性的脑区域（图5a）包括左右海马体（HIP.L，HIP.R）、左侧前楔叶（PCUN.L）、右侧后扣带回（PCG.R）、左侧角回（ANG.L）、左侧中间颞回（MTG.L）、右侧海马旁回（PHG.R）、左侧内侧上额叶（SFGmed.L）、右侧前扣带回（ACG.R）和左侧下顶叶（IPL.L）。这些区域显示出功能导向的分布模式，其中海马体表现出最强的记忆相关特性。

为了检查DF-Pool在折叠间的稳定性，我们在五折交叉验证方案中提取了每个折叠的前五个节点，并构建了一个二进制“ROI × Fold”选择矩阵（，）。如图6所示，像海马体（37 HIP.L，38 HIP.R）这样的区域在多个折叠中被反复选中，显示出高重现性和稳定的EMCI相关生物标志物识别。值得注意的是，尽管HIP.L获得了最高的整体差分得分（表4），但在个别交叉验证折叠内的局部数据分布导致折叠特定的前五名排名略有波动。这种行为是预期的，并准确反映了功能连接性的自然受试者间变异性。图6. 5次折叠中的前五名选择矩阵。每一行是一个ROI（AAL-ID和缩写），每一列是一个CV折叠；黄色=被选中（1），紫色=未被选中（0）。虽然DF-Pool层在网络传递过程中数学上保留了节点，但这个矩阵仅可视化了每个折叠的绝对前五个节点，以清晰地展示最具区分性的生物标志物的稳定性。大多数顶级区域与早期EMCI病理功能相关。在海马体记忆系统中，双侧海马体和右侧海马旁回作为记忆编码和巩固的核心组成部分；它们与后扣带回的功能性断开，如Sorg等人[49]所报告的，与记忆衰退相关。HF-BrainGNN准确地捕捉到了这些区域，验证了其识别记忆相关损伤的能力。在默认模式网络（DMN）中，前楔叶和后扣带回作为自我参照处理的整合枢纽。Greicius等人[50]证明DMN异常区分了健康老年人和AD患者；我们的结果揭示了这种中断在EMCI阶段就可以被检测到。在语义网络中，左侧角回和左侧中间颞回参与语义记忆的存储和检索，它们连接的减弱可能解释了EMCI患者的早期语义缺陷。总体而言，这些发现与之前的EMCI研究结果高度一致，证实了所识别区域的神经生物学相关性。减少的海马体连接[49]、DMN枢纽异常[51]和减弱的角回连接[23]与我们的模型结果高度一致。此外，HF-BrainGNN识别出的右侧海马旁回、左侧内侧上额叶、右侧前扣带回和左侧下顶叶也已在之前的EMCI研究中被报告为重要生物标志物[52,53,54,55]。这种高度一致性验证了我们方法的科学严谨性和生理合理性，提供了可靠的早期EMCI诊断和预后评估的成像生物标志物。此外，为了研究学习到的焦点得分的临床有效性和可解释性，我们进行了受试者级别的焦点得分（汇总在前五个区域）与临床确立的MMSE得分之间的皮尔逊相关性分析。如图7所示，观察到一种强烈且统计上显著的负相关性。这证实了HF-BrainGNN赋予的较高关注度分数确实对应着较低的认知功能（即较低的MMSE分数）。最终，我们模型得出的指标与标准临床认知评估之间的这种稳健一致性突显了所提出框架的临床相关性和可解释性。图7显示了模型得出的标准化关注度分数（前5名汇总）与临床MMSE分数之间的显著负皮尔逊相关性，阴影区域代表95%的置信区间。

3.5.2 核心脑区的功能连接性分析
为了进一步验证HF-BrainGNN识别的核心脑区的病理学意义，我们检查了CN组与EMCI组之间十二个关键功能连接的差异模式，这些连接是从十个核心生物标志物区域构建的。如图8所示，这十二个连接可以分类为：海马记忆系统内的连接（HIP.L–HIP.R，HIP.L–PHG.R）；海马-默认模式网络（DMN）链接（HIP.L–PCUN.L，HIP.R–PCG.R）；DMN内的连接（PCUN.L–PCG.R，PCUN.L–ANG.L，PCG.R–SFGmed.L，ACG.R–PCUN.L）；语义认知网络连接（ANG.L–MTG.L，MTG.L–PHG.R）；以及执行控制链接（SFGmed.L–ACG.R，IPL.L–ANG.L）。图8的箱线图展示了不同脑区之间的关系，并使用独立样本t检验评估了其统计显著性。这些连接的Cohen’s d值将在3.5.2节中报告。统计分析显示，所有十二对连接的FC强度在EMCI组中都表现出不同程度的减弱。这些差异的显著性是通过使用FDR校正的多重比较独立样本t检验来评估的（q < 0.05）。其中，海马记忆系统中的连接显示出最显著的损伤：双侧海马链接（HIP.L–HIP.R）在EMCI受试者中显著减弱，右侧海马-后扣带回连接（HIP.R–PCG.R）也显著下降。DMN内的连接也类似地减弱——例如，前楔叶-后扣带回连接（PCUN.L–PCG.R）在EMCI中显著减少。

相比之下，语义和执行控制连接似乎相对保持完好。有几对连接，如HIP.L–PCUN.L、PCUN.L–ANG.L、MTG.L–PHG.R和SFGmed.L–ACG.R，并未显示出显著的组间差异，这表明它们对早期损伤具有部分抵抗力，或者EMCI中涉及了补偿机制。这种独特的连接减弱模式凸显了海马和DMN网络的脆弱性，并支持HF-BrainGNN识别区域的临床相关性。总体而言，这些结果为理解早期轻度认知障碍的神经病理机制提供了有力的网络级证据。为了进一步量化这些差异的程度，我们计算了Cohen’s d作为十二个识别连接的效果大小的度量，其值范围从0.32到0.91。具体来说，双侧海马之间的连接（HIP.L-HIP.R）表现出中等效果大小，而前楔叶-后扣带回连接（PCUN.L-PCG.R）表现出较大的效果大小。这些结果表明，识别出的FC减弱不仅在统计上显著，也代表了EMCI大脑中的实质性生物改变。

4. 讨论
所提出的分层聚焦脑图神经网络（HF-BrainGNN）在分类早期轻度认知障碍（EMCI）与对照正常组（CN）方面显示出明显的优势，准确率达到86.78%，显著优于现有的基于图和传统的机器学习方法。这些改进源于其三个关键组件的协同效应。首先，FAR-Conv层通过整合功能相似性和解剖邻近性引入了特定于区域的核函数，有效解决了传统GNN忽视区域功能异质性的问题。消融实验证实，FAR-Conv在各种参数配置下始终优于标准图卷积，验证了区域自适应建模的好处。这一机制符合神经科学的功能专业化原则，为脑连接分析提供了一个生物学上合理的表示框架。其次，DF-Pool层通过比较组间关注度分数来执行疾病导向的特征选择，自动识别与EMCI相关的脑区。发现的十个显著生物标志物涵盖了海马记忆系统、默认模式网络和语义网络，与之前的EMCI研究结果高度一致，并且与MMSE分数呈负相关。这一结果为模型预测提供了可解释的神经生物学基础。除了生物标志物识别之外，分层集成分类器（HIC）通过可学习的权重自适应地融合了多层次表示，捕捉了脑网络内的多尺度功能交互。结合多目标损失函数，该模型在性能和可解释性之间实现了最佳平衡，增强了其在临床应用中的潜力。此外，本研究的结果依赖于用于定义图节点的AAL90解剖划分方案。虽然AAL90是一个广泛接受的解剖参考，但它可能会引入划分偏差，因为解剖边界并不总是与功能特化区域完全对齐。未来的研究应该评估HF-BrainGNN在不同脑模板（如功能性或多分辨率多尺度图谱）上的鲁棒性，以减轻图谱选择对诊断性能的影响。尽管如此，仍有几个方向有待进一步探索。虽然HF-BrainGNN在ADNI数据集上表现出优越性能，但其在不同成像协议和不同人群中的泛化能力尚未完全确立。将数据集扩展到多中心队列和跨扫描仪采集将有助于评估模型的泛化能力，并确保识别出的生物标志物的稳健性。此外，将HF-BrainGNN扩展到其他神经精神疾病（如帕金森病或抑郁症）可能扩大其在早期诊断和预后成像生物标志物发现中的实用性。

5. 结论
本研究提出了基于rs-fMRI脑网络的HF-BrainGNN，这是一种用于EMCI诊断的分层图神经网络，它结合了包括FAR-Conv、DF-Pool和HIC在内的创新设计，以解决现有方法中的功能异质性、组级特征选择和多层次特征利用问题。在ADNI数据集上的实验表明，HF-BrainGNN取得了出色的性能，分类准确率为86.78%，敏感性为85.2%，特异性为87.3%。识别出的生物标志物与现有的神经系统发现一致，确保了算法的性能和可解释性。这项研究为基于神经影像的疾病诊断提供了一个新的技术框架，并为早期EMCI诊断提供了一个可解释的AI工具，对AD的早期干预具有重要意义。未来的工作将集中在多中心数据集验证、MCI进展分析以及HF-BrainGNN框架在跨疾病应用方面的研究，以推进脑成像精准医学的发展。

热点排行