《Communications Biology》:Individual identifiability following Procrustes alignment of functional gradients: effect of subspace dimensionality
编辑推荐:
本研究针对fMRI功能连接梯度分析中Procrustes对齐梯度数量选择缺乏系统评估的问题,通过分析HCP-YA、AOMIC和Cam-CAN四个高质量数据集,发现增加对齐梯度数量会提高个体识别率,但会使主梯度吸收更多低阶梯度信息,且对齐变换幅度与头动信号(FD)和功能连接典型性(TFC)显著相关。研究强调了Procrustes对齐参数选择对个体水平分析的重要影响,为功能梯度研究的规范化提供重要依据。
在大脑功能连接研究中,功能梯度已成为揭示皮层组织层次结构的重要工具。特别是从单模感觉运动皮层到异模联合皮层的"主梯度",为理解个体差异提供了新视角。然而,将不同个体的功能梯度进行对齐以进行有意义的组间比较一直是个挑战。目前广泛使用的Procrustes对齐方法虽然能标准化梯度,但对齐过程中使用的梯度数量选择缺乏明确指导,这可能影响个体水平分析的有效性。
研究人员发现,虽然文献中常默认使用10个梯度进行对齐,但下游分析往往只关注前几个有明确生物学解释的梯度。由于Procrustes对齐会使用所有参与对齐的梯度信息来变换每个梯度,对齐梯度数量的选择可能显著影响结果。更重要的是,如果对齐过程捕获了噪声或依赖不必要的信号(如头动),可能会对个体水平分析产生误导。
为了系统评估Procrustes对齐中梯度数量选择的影响,Leonard Sasse团队在《Communications Biology》上发表了他们的研究成果。他们利用人类连接组计划(HCP-YA)、阿姆斯特丹开放MRI集合(AOMIC)和剑桥老龄化与神经科学中心(Cam-CAN)四个高质量fMRI数据集,深入分析了不同对齐梯度数量对主梯度特性及下游分析的影响。
研究采用的主要技术方法包括:功能连接梯度提取使用BrainSpace工具箱,采用标准化角度相似性核函数和扩散映射嵌入降维技术;Procrustes对齐分析通过计算变换矩阵来量化对齐前后梯度的对应关系;个体识别分析通过计算不同扫描会话间的识别准确率和差异可识别性;机器学习预测使用岭回归和交叉验证方法预测流体智力和年龄;运动信号分析采用帧间位移(FD)和功能连接典型性(TFC)作为运动指标。
识别和差异可识别性
研究发现,随着Procrustes对齐中使用的梯度数量增加,基于主梯度的个体识别准确率显著且单调提高。当应用Fisher's r-to-z转换后,差异可识别性也呈现一致增加趋势。然而,不使用Fisher转换的差异可识别性随对齐梯度数量增加而降低,这解释了以往研究中识别准确率与差异可识别性不一致的观察结果。
对齐主梯度的混合特性增强
通过计算对齐前后主梯度之间的对应关系,研究发现随着对齐梯度数量的增加,这种对应关系逐渐降低。这表明主梯度逐渐吸收了更多来自低阶梯度的信息,呈现出越来越混合的特性。这种变化反映了Procrustes对齐拟合能力的增强,本质上导致了"过拟合"的对齐主梯度。
Procrustes对齐与运动信号的相关性
研究发现,平均帧间位移(FD)与Procrustes变换幅度呈正相关,且这种相关性随对齐梯度数量的增加而增强。功能连接典型性(TFC)与变换幅度呈负相关,表明运动较大的个体需要更大程度的对齐变换。这些关系在未应用运动回归和ICA-FIX去噪的最小处理fMRI数据中更为明显,表明Procrustes对齐有能力利用可用的运动相关信息。
在不同数据集中的验证
在AOMIC PIOP1、PIOP2和Cam-CAN数据集中的验证分析证实了主要发现。对齐前后主梯度的对应关系随对齐梯度数量增加而降低的趋势在所有数据集中一致存在。虽然不同数据集中运动信号与对齐变换的相关性强度有所差异,但TFC与变换幅度的关系最为一致。
流体智力和年龄预测
研究发现,在Cam-CAN数据集中,使用对齐后的主梯度可以预测流体智力和年龄,且预测性能随对齐梯度数量的增加而提高。当去除FD和年龄等混杂因素后,预测性能显著下降,表明头动信号对预测成功有贡献。而在HCP-YA和AOMIC数据集中,未发现明显的流体智力预测证据。
运动信号预测
研究尝试使用对齐后的主梯度通过机器学习分类"高运动"和"低运动"受试者。在Cam-CAN数据集中发现了高于随机水平的分类性能,这可能与该数据集更广泛的年龄分布有关。然而,在所有数据集中,未发现分类准确率随对齐梯度数量增加而呈现明显变化模式。
研究结论强调,Procrustes对齐中使用的梯度数量显著影响对齐后主梯度的特性及其在个体水平分析中的应用。增加对齐梯度数量虽然能提高组水平拟合度,但由于对齐过程平等对待所有梯度,可能导致低方差梯度对主梯度产生不成比例的影响。这种影响既可能引入有意义的个体间信号,也可能引入不必要的干扰效应(如运动相关伪影)。
这些发现对功能梯度研究的实践有重要指导意义。研究人员建议基于特定生物学模型而非临时预定义数量来选择对齐梯度数量,并进行鲁棒性分析检验结果对不同对齐梯度数量的稳定性。此外,应充分考虑头动作为功能梯度研究中的混杂因素,并探索加权重方案的可能性,以便在保留多梯度对齐优势的同时优先考虑信息量最大的梯度。
该研究为功能梯度分析的方法学标准化提供了重要依据,强调了参数选择对结果解释的关键影响,为未来个体水平脑功能连接研究奠定了方法学基础。