编辑推荐:
本研究旨在解决功能磁共振成像(fMRI)预测脑龄(一种关键的神经影像学生物标志物)准确性的难题,该问题对理解衰老及神经退行性疾病(如阿尔茨海默病)至关重要。研究人员汇集了四个大型队列(FHS, HCP, MESA, UKBB)的静息态fMRI(rs-fMRI)数据,构建了超过四万个功能连接组,并系统比较了多种连接组变换(如Fisher z变换、Bures-Wasserstein对数矩阵)和机器学习模型(如岭回归、支持向量回归)。研究结果表明,通过先进的数据处理和分析策略,能够从功能数据中获得更可靠、与健康及认知指标显著相关的脑龄预测模型,为未来功能性脑衰老生物标志物的开发和应用开辟了新途径。
随着年龄的增长,人类大脑的结构和功能会发生复杂而系统的变化。这些变化不仅仅是正常衰老的一部分,许多慢性疾病,特别是阿尔茨海默病等神经退行性疾病,常常表现为大脑的“加速衰老”。因此,如果有一种方法能够精确度量大脑相对于生理年龄的“老化程度”,将不仅能深化我们对衰老过程本身的理解,还能为疾病的早期筛查、诊断和干预提供强大的工具。这种度量工具,被称为“脑龄”,正成为神经科学和临床医学交叉领域的前沿热点。
传统的脑龄预测研究多依赖于结构性磁共振成像(sMRI),它能提供大脑解剖结构的精细图像。然而,大脑的功能,即各个脑区之间如何协同工作,同样蕴藏着丰富的年龄信息。功能磁共振成像(fMRI),特别是记录大脑在静息状态下自发活动的静息态fMRI(rs-fMRI),是研究大脑功能网络的核心工具。通过分析不同脑区活动在时间上的关联性,可以构建出描绘全脑功能连接模式的“功能连接组”。理论上,这个庞大的网络图中应该编码了个体的年龄信息。但难题在于,功能连接组数据维度极高(通常涉及数百个脑区之间的连接),数学性质特殊,且其估计的可靠性容易受到扫描时间、噪声等多种因素影响,导致从功能数据中准确预测脑龄远比从结构数据中预测更具挑战性。那么,我们能否利用海量的功能数据,结合先进的机器学习方法,攻克这一难题,从而开发出更灵敏、更能反映大脑功能健康状态的“功能脑龄”生物标志物呢?这正是发表于《Brain Research Bulletin》的这项研究试图回答的核心问题。
为了回答上述问题,研究人员没有从零开始收集数据,而是巧妙地整合了四个国际知名的大型神经影像队列的宝贵资源。他们处理了来自弗雷明汉心脏研究(FHS)、人类连接组计划(HCP)、多种族动脉粥样硬化研究(MESA)和英国生物样本库(UKBB)的静息态fMRI扫描,最终构建了一个包含超过四万个个体功能连接组的超大规模数据集。有了数据基础,研究团队系统性地比较了三种不同的策略。首先,他们对原始功能连接组进行了三种数学变换:直接使用原始相关性矩阵、应用经典的Fisher z变换、以及采用一种基于矩阵流形理论、能更好处理正定矩阵特性的Bures-Wasserstein对数变换。接着,他们利用截断奇异值分解(SVD)对高维数据进行降维,提取主要变异信息,并应用神经影像学中常用的Harmonization(协调)方法(如ComBat)来校正不同队列间因扫描仪和预处理流程差异引入的偏倚。最后,他们训练了三种机器学习回归模型——岭回归、线性支持向量回归(SVR)和基于径向基函数(RBF)核的非线性SVR——来学习从处理后的功能连接特征到个体实际年龄的映射关系。整个分析过程严格遵循交叉验证原则,以确保结果的可靠性和泛化性。
主要研究结果
- •
数据与人口统计学特征:研究共纳入了40,414名参与者的数据,其中男性18,965人,女性21,449人。四个队列在年龄分布上存在显著差异,例如HCP参与者最年轻(平均28.82岁),而MESA参与者年龄最大(平均74.19岁)。统计检验表明,数据在性别比例上均衡,但存在与性别和队列相关的年龄小偏差,这通过后续的分层分析和协调方法进行了控制。
- •
最优年龄预测模型的确定:通过严谨的参数设置和十折交叉验证,研究发现,无论对于男性还是女性参与者,使用Bures-Wasserstein对数变换处理连接组,再结合岭回归模型,能取得最准确的脑龄预测效果。其预测误差(平均绝对误差,MAE)显著低于使用原始相关性或Fisher z变换的模型。这一结果凸显了先进数学变换在提升功能神经影像数据分析性能方面的潜力。
- •
功能脑衰老生物标志物的构建与验证:基于最优模型(经Bures-Wasserstein变换的岭回归模型),研究人员为每个个体计算了预测脑龄与实际年龄的差值(δ)。为了消除该差值中可能残留的与年龄、性别相关的线性趋势,他们进一步定义了一个校正后的“功能脑衰老生物标志物”(μ)。利用UKBB丰富的表型数据,他们发现这个新定义的生物标志物μ与众多健康和认知指标存在统计学上显著的关联。例如,μ与更佳的整体健康状况、更高的流体智力得分、更快的数字符号替换测试(DSST)表现、以及更低的抑郁评分正相关。相反,μ与舒张压、吸烟包-年等不良健康指标负相关。这些关联表明,该生物标志物可能不仅仅反映了大脑的“计时”功能,更可能是一个与整体脑健康密切相关的综合性指标。
- •
方法学优势的进一步验证:研究还包括了补充实验,证实了他们所采用的数据协调方法有效地减少了不同预处理流程(例如,HCP、FHS、MESA使用空间滤波去噪,而UKBB使用独立成分分析ICA去噪)可能引入的批次效应,从而确保了跨队列分析结果的一致性和可靠性。
研究结论与意义
本研究通过整合超大规模(>4万)多队列功能磁共振成像数据,系统评估了多种连接组处理和机器学习方法在预测脑龄方面的效能。核心结论是:采用Bures-Wasserstein对数矩阵对功能连接组进行变换,能显著提升基于岭回归模型的脑龄预测精度。基于此最优模型构建的功能脑衰老生物标志物,经与UKBB多维健康数据的关联分析证实,其与广泛的认知功能、心理健康及生理健康指标显著相关,提示它有望成为一个反映大脑功能健康状态的综合性、敏感的生物标志物。
这项工作的意义深远。首先,在方法论上,它首次在大规模数据上验证了Bures-Wasserstein变换在处理功能连接组数据、提升预测任务性能方面的优越性,为后续的神经影像机器学习研究提供了新的技术思路。其次,在临床应用上,研究成功推导出了一个与多维度健康表型相关联的功能性脑衰老指标,为未来将其应用于神经精神疾病(如抑郁症、精神分裂症)和神经退行性疾病(如阿尔茨海默病)的早期识别、风险分层和疗效评估奠定了坚实基础。它有望弥补现有主要基于脑结构的“脑龄时钟”的不足,提供一个从大脑功能网络角度评估其“生物学年龄”和健康状态的新窗口。最后,在资源贡献上,研究整合并标准化处理了多个公共数据集,所建立的分析流程和预测模型为科学界进一步探索大脑衰老与疾病的复杂机制提供了有价值的工具和基准。