《Human Brain Mapping》:Sex Classification Based on the Functional Connectivity Patterns of the Language Network: A Resting State fMRI Study
编辑推荐:
本研究通过机器学习方法,基于语言网络静息态功能连接(rs-FC)模式对健康成人性别进行分类,准确率达91.3%。关键鉴别特征锚定于左侧额下回岛盖部(opIFG)、左侧颞平面(planum temporale)和左侧颞中回前部(aMTG),这些区域与枕极、角回等异模式联合皮层连接存在性别差异(男性连接更强)。研究凸显了语言网络功能架构的性别特异性,为理解语言相关疾病(如失语症)的性别差异提供了新视角。
引言
人类大脑通过分布式神经系统的动态相互作用支持记忆、注意、情绪和语言等一系列复杂认知功能。理解这些网络的功能组织方式及其在个体间的变异是认知神经科学的核心目标。其中,语言网络在支持言语理解、产生、语音处理、正字法解码和语义整合等交流功能中扮演核心角色。该网络并非定位于单一解剖结构,而是涉及左侧化(某些情况下为双侧)的额颞顶叶区域,组织成部分分离但又相互作用的子系统。
功能磁共振成像(fMRI)通过分析功能连接(FC)在绘制该网络结构和组织方面发挥了重要作用。FC定义为不同脑区空间上遥远的神经生理事件在时间上的相关性。在fMRI中,此术语通常指空间 distant 脑区之间血氧水平依赖(BOLD)信号波动的时间相关性。其背后的假设是,显示相关功能行为的区域是耦合的或属于同一网络。FC提供了脑区如何作为一个连贯网络的一部分相互作用的洞见。通过使用任务态或静息态fMRI(rs-fMRI),研究人员可以评估不同条件下(包括语言网络内部)脑系统的FC。
理解语言网络的功能组织及其连接模式在个体间的变异是一个关键问题。其中一个仍未得到很好理解的个体变异维度是生物性别在塑造语言网络架构中的作用。虽然男性和女性的整体语言表现趋于相似,但研究一致报告在特定语言能力(如言语流畅性、阅读和语言习得速度)上存在细微的组水平差异,尽管这些效应通常较小且因年龄和任务而异。超越行为表现,语言相关障碍的患病率和临床特征的性别差异进一步表明,支持语言的神经架构可能存在性别差异。例如,声音、言语和语言障碍在男孩中的患病率高于女孩。在老年人中,研究表明女性患布罗卡失语症的风险高于男性,而男性患命名性失语症的风险更高。此外,男性往往表现出比女性更严重的失语症症状。这些发现提出了生物性别可能影响语言网络在网络层面的组织方式的可能性,使得不同性别对各种病理状况的易感性不同。
为研究语言功能网络中的性别差异,先前的研究使用任务态fMRI(tb-fMRI)来比较性别在执行语言任务期间的激活模式。然而,任务态分析侧重于区域特异性激活,对网络水平相互作用的洞察有限。因此,FC已成为研究语言处理中性别差异的神经关联的补充方法。先前一项研究使用机器学习方法对基于任务态FC的性别进行分类,准确率达到74%,表明FC特征包含性别特异性信息。然而,该研究依赖相对较小的样本量,并且仅关注语义处理网络。
静息态fMRI为在无任务需求下检查脑网络的固有组织提供了独特机会,允许同时调查多个语言相关子网络。与任务态设计相比,rs-fMRI能够从单次扫描中调查涉及语义处理、发音-语音处理、言语感知和正字法-音位转换的多个语言子系统的基线连接模式。使用rs-fMRI数据的种子到体素方法已表明,锚定于已知负责发音、语音、正字法-音位转换和语义过程的关键区域的rs-FC模式与通过任务态fMRI获得的言语产生、言语感知、正字法处理和语义处理的子网络重叠。这些结果表明,通过对rs-fMRI数据使用种子到体素方法,可以同时研究主要语言子网络中的rs-FC模式。
越来越多的研究现在应用机器学习对rs-fMRI数据基于全脑FC模式进行性别分类。然而,此类方法面临高维度、可解释性以及难以将结果与语言等特定认知域联系起来的挑战。一项研究对rs-fMRI数据应用了基于脑区(parcel-wise)的机器学习算法,根据每个脑区的rs-FC模式进行性别分类,准确率约为74%。在实现最高性别分类准确率的脑区中,那些属于语言域的脑区,如左侧额下回和左侧颞极被列出。这表明分析语言网络作为一个整合系统,而不是孤立的脑区,可能提供对静息态连接中性别相关变异的更全面理解,并可能提高分类性能。
综上所述,这些发现表明性别差异可能存在于语言网络内部的连接水平,但目前的证据受限于狭窄的任务范围、小样本量以及缺乏包含子网络的全网络静息态分析。本研究旨在调查是否可以根据核心语言网络的静息态FC模式对性别进行分类,并探索rs-FC在理解大脑架构中性别相关变异的潜力。
材料与方法
参与者样本来自人脑连接组计划(HCP)的S1200数据集。筛选标准为具有完整静息态fMRI协议(四个rs-fMRI sessions)且无质控问题的参与者。仅选择爱丁堡利手问卷量表侧性商数≥50的右利手参与者。最终样本包括558名健康成年人(270名男性,288名女性;年龄范围:22-36岁),两组在年龄和教育水平上匹配。将样本随机分为包含80%参与者的训练-测试集和20%的保留集。
数据采集与预处理所有参与者在华盛顿大学圣路易斯分校的定制西门子3T “Connectome Skyra” 系统上接受扫描。T1加权3D MPRAGE图像和rs-fMRI图像(梯度回波EPI序列)参数详见原文。rs-fMRI数据使用HCP提供的最小预处理流程数据进行预处理,包括梯度非线性畸变校正、头动校正、相位编码方向畸变校正、与T1w图像的配准、非线性配准到MNI空间、强度归一化、脑掩膜和高通时间滤波。数据使用独立成分分析 followed by ICA-FIX进行去噪,并回归掉24个头动参数。预处理后的功能数据使用6 mm全宽半高高斯核进行平滑。对于种子到体素连接分析,从未平滑图像中提取每个种子区域的时间序列以保留种子信号的局部特异性。
种子到体素静息态功能连接分析使用Python中的Nilearn进行种子到体素分析。种子区域基于Battistella等人的工作定义,这些区域被确定为语言处理子系统的核心区域:左侧额下回岛盖部(opIFG,发音-语音过程)、左侧颞平面/顶叶岛盖部(planumtemp,言语感知)、左侧颞中回前部(aMTG,语义处理)和左侧颞下回后部(pITG,正字法-音位转换),以及它们在右半球的同源区域,共八个种子区域(半径为8 mm的球体)。从未平滑数据中提取每个种子区域的平均BOLD时间序列,从平滑的全脑预处理图像中提取体素级BOLD时间序列。计算种子时间序列与每个脑体素时间序列之间的皮尔逊相关系数,产生每个run和每个种子的种子到体素FC图。这些相关图使用Fisher的r-to-z转换转换为z-score图,最终对四个run的z-map进行平均,得到每个种子区域的最终Fisher z-map。
为降低数据维度,将八个FC图根据Destrieux图谱(每半球74个脑区)进行分割。对于每个脑区,通过平均该脑区内所有体素的Fisher z-score来计算平均相关值。为控制灰质(GM)密度对FC图的影响,使用相同的Destrieux图谱对HCP提供的GM密度图进行分割,获得每个脑区的平均GM密度值。对每种基于种子的FC图,使用普通最小二乘法拟合广义线性模型,以FC值为因变量,GM密度值为预测变量。保留该回归的残差作为校正后的FC值。为每个参与者创建每个种子区域148个种子到脑区FC校正值的初始矩阵。最后,将八个矩阵(每个种子一个)连接起来,形成每个参与者的单个矩阵,维度为8个种子区域 × 148个Destrieux脑区。这些矩阵用作分类模型的输入特征。
分类分析使用线性支持向量机分类器(SVC)根据FC矩阵对参与者性别进行分类。对包含所有种子组合的FC矩阵以及每个种子区域的单独矩阵分别应用分类过程,共产生九个模型。将主要样本的20%随机分配至保留集,用于进一步探索判别特征的预测能力。剩余的80%用于训练和测试模型。训练-测试集按80/20比例分割;分类器在训练-测试集的80%上训练,在剩余的20%上测试。采用自助抽样重采样程序评估哪些图谱脑区对模型性能做出了稳定贡献,并得出性能指标的置信区间。该过程包括有放回地随机对训练-测试集抽样10,000次。对每个样本应用具有20折交叉验证(分层以保持每次分割的性别比例)的线性SVC。每次迭代中,使用保留集评估模型性能。
为从10,000次自助抽样迭代中识别前10个最重要特征,首先将每次迭代的特征权重(系数)通过乘以相应特征的标准差转换到原始特征尺度。转换后的权重在所有自助抽样迭代中平均,得到每个特征重要性的单一稳定度量。最后,基于其平均转换后权重对特征进行排序,并提取具有最高值的前10个特征作为模型性能最稳定的贡献者。进行置换检验以确定模型的统计显著性。为进一步探索分类结果,进行独立t检验比较前10个预测变量的FC值在男性和女性之间的差异。作为补充分析,独立选择模型识别的每个判别对,并评估每个对之间的FC模式是否能在保留样本中区分男性和女性。
结果
性别分类结果:准确性基于八个种子组合的线性SVC模型实现了最高的分类准确性,能够以91.3% ± 0.03%的平均准确率成功分类男性和女性。模型的平均敏感性和特异性分别为91.2% ± 0.04%和91.9% ± 0.04%。置换检验显示准确率显著高于机会水平。模型在测试集上的总体AUC为0.91 ± 0.03。在保留集上评估时,模型达到78.1% ± 0.03%的平均准确率,平均敏感性和特异性分别为73.6% ± 0.03%和83.9% ± 0.03%,AUC为0.78 ± 0.03。
基于每个种子单独的分类模型在测试集上分类男性和女性的准确率在77%到84%之间。在保留集上评估时,准确率在68%到74.8%之间。锚定于左侧和右侧opIFG网络以及左侧pITG网络的FC模式在测试集上实现了较高的分类准确率,但在保留集上准确率有所下降。
训练测试集中前10个最佳预测因子的功能连接值差异基于八个种子组合模型的前10个最具预测力的种子到图谱脑区对包括:左侧颞平面与左右枕极之间、左侧opIFG与右侧角回、左侧额上沟之间、左侧aMTG与左侧顶内沟和右侧扣带回来后 ventral 部分(vPCC)之间、右侧aMTG与左侧枕颞外侧回之间、右侧pITG与左侧初级中间沟(Jensen氏)和左侧枕前沟之间。t检验补充分析显示,在10个最佳预测因子中,有9个种子到图谱脑区对的连接强度存在显著的性别差异。在所有显著的对中,男性的连接值均高于女性。小提琴图显示,在所有种子到脑区对中,男性和女性的FC值存在很大程度的重叠。
基于每个判别对的分类在保留集上独立测试每个判别对的分类准确率在39%到65%之间,最高的是左侧颞平面与右侧枕极之间的模式,最低的是左侧aMTG与左侧顶内沟之间的FC模式。
讨论
本研究结果表明,当结合所有种子区域的连接数据时,分类器在训练-测试集上达到了91.3%的高准确率。该性能超过了基于单个种子区域的模型,突出了整合跨语言子网络的连接数据以提高分类的价值。基于所有八个组合种子的模型的最佳预测因子主要锚定于左半球,更具体地说,是左侧颞平面、左侧opIFG、左侧aMTG和右侧pITG。虽然男性和女性之间的连接模式存在相当大的重叠,但在所有判别对中都观察到连接强度的显著性别差异,男性表现出比女性更高的FC值。这些结果表明,语言子网络核心区域的FC特征包含区分性别的关键信息。
据我们所知,这项研究是第一个基于锚定于语言网络核心区域的rs-FC模式,使用机器学习方法对性别进行分类的研究。当将所有种子组合成单个模型时,分类准确率在训练-测试集上达到91.3%,超过了先前发表的结果。我们的发现强调了将语言网络作为一个整体(结合所有对语言子网络至关重要的种子区域)进行检查的重要性,而不是专注于孤立的种子区域。
先前的研究提供证据表明,语言网络的rs-FC模式可能是性别分类的关键贡献者。与这些结果一致,当我们基于每个种子区域的rs-FC分别计算分类模型时,锚定于左右opIFG和左侧pITG的FC图具有最高的准确率。此外,我们使用自助抽样程序提取了最可靠的判别种子区域-图谱脑区对,这些是在组合所有八个种子的模型中最一致报告的对。从自助抽样程序提取的前10个判别FC模式主要锚定于左侧颞平面、左侧opIFG、左侧aMTG和右侧pITG种子区域,并涉及与语言处理直接相关的区域,以及其他涉及更广泛认知网络的区域。
本研究中,最具预测性的FC模式是左侧颞平面和右侧枕极之间,其在连接强度上显示出显著的性别差异。左侧opIFG种子区域显示出与沿背侧通路的几个脑区的判别性FC。左侧aMTG种子区域显示出与右侧vPCC和左侧顶内沟的判别性连接。这些结果支持了以下假设:锚定于左侧opIFG的言语产生子网络和锚定于左侧aMTG的语义子网络内的FC模式包含能够预测性别的关键信息。
尽管机器学习模型识别了允许分类的判别特征,但这些特征并不能保证在组间存在显著差异。在本研究中,由组合所有八个种子区域的模型识别的十个判别对中有九个在FC强度方面存在显著的性别差异。尽管男性和女性之间的FC模式存在普遍重叠,但仍观察到这些差异。对男性和女性之间判别特征内FC强度的分析显示,在所有十个顶级预测对中,男性往往表现出比女性整体更高的FC值。这些结果与使用相同HCP S1200数据集的先前研究结果一致。
分类研究结果可推广性的另一个重要因素是保留样本的分类性能。虽然我们使用训练-测试数据预测性别达到了91.3%的准确率,但使用保留集评估时,模型的性能下降至78.1%。未来的研究应考虑通过使用更多样化的样本集并在独立数据集上验证结果来提高机器学习结果的可推广性。
研究大脑与语言表现之间的联系超出了本研究的范围。因此,关于观察到的FC模式是否具有行为相关性无法得出结论。此外,我们的研究侧重于生物性别,因为无法获得性别认同数据。未来的研究应旨在阐明语言网络功能组织中性别与性别认同之间的复杂关系。
总之,我们的研究结果揭示,锚定于语言子网络核心区域的FC连接模式可以准确分类性别,当组合所有种子区域时性能最高。这些结果强调了性别作为塑造语言网络功能组织的一个关键生物学变量的重要作用。我们的发现为未来探索这些连接模式如何促成如失语症和其他语言网络障碍中的性别特异性风险和结局奠定了基础。