编辑推荐:
脑年龄差(Brain age gap, BAG),即磁共振成像预测的脑年龄与实足年龄之间的差值,被认为是神经生物学老化的一个标志物,但其跨诊断意义仍不明确。本项荟萃分析评估了阿尔茨海默病(Alzheimer's disease, AD)、轻度认知障碍(mild
脑年龄差(Brain age gap, BAG),即磁共振成像预测的脑年龄与实足年龄之间的差值,被认为是神经生物学老化的一个标志物,但其跨诊断意义仍不明确。本项荟萃分析评估了阿尔茨海默病(Alzheimer's disease, AD)、轻度认知障碍(mild cognitive impairment, MCI)、多发性硬化(multiple sclerosis, MS)、帕金森病(Parkinson's disease, PD)、精神分裂症(schizophrenia, SCZ)、卒中(stroke)和双相情感障碍(bipolar disorder, BD)中的BAG,旨在确定加速脑老化模式的共性和疾病特异性。共纳入了65项基于磁共振成像的研究。针对每个队列,研究人员提取或计算了BAG,并使用随机效应模型计算了患者组与健康对照组(healthy controls, HC)之间的标准化均值差(Hedges‘s g)。通过亚组分析和元回归评估了年龄和疾病特征的影响。使用Egger检验、I2统计量以及剪补法评估了发表偏倚和异质性。所有疾病的BAG均显著升高。最大效应出现在MS(平均校正BAG = 7.81年;g = 0.89)和AD(5.57年;g = 0.66)中。对具有足够统计效能的疾病进行的荟萃分析显示,SCZ(4.40年;g = 0.42)和MCI(3.77年;g = 0.43)存在中等程度的升高,而PD显示出较小但显著的加速(3.52年;g = 0.37)。描述性数据显示,卒中(2个队列;平均校正BAG = 4.63年)和BD(1个队列;平均校正BAG = 4.84年)也显示出BAG升高,尽管研究数量不足妨碍了对这些疾病进行正式的荟萃分析。BAG在神经退行性疾病中很大程度上独立于实足年龄,但在SCZ中随年龄增长而增加。这些发现支持BAG在荟萃分析证据基础坚实的疾病(AD, MCI, MS, PD, SCZ)中作为加速脑老化的跨诊断指标,而卒中和BD由于队列数量有限,证据仍然是初步的。BAG的大小在不同疾病间存在显著差异,且研究间异质性极高(大多数疾病中I2> 90%)意味着汇总效应量应结合预测区间进行解读。
引言
本研究的背景是探讨脑年龄差(brain age gap, BAG)作为神经生物学老化指标的跨诊断意义。BAG是指通过神经影像学模型预测的脑年龄与个体实足年龄之间的差值。它通过整合大脑结构(如皮层厚度、皮层下体积和白质微结构)的多元模式,提供一个关于大脑完整性的单一量化指数。BAG为正表示相对于同龄常模出现了加速老化或过早的结构性衰退,为负则反映了相对的保存。与传统的基于感兴趣区域的分析不同,BAG提供了一种反映累积神经生物学负担或恢复能力的整体性测量。其生物学基础反映了老化轨迹的异质性,与慢性神经炎症、氧化应激、血管问题、代谢失调和神经毒性暴露等病理过程相关。机器学习技术,特别是监督式学习算法(如支持向量回归SVR、高斯过程回归GPR、深度卷积神经网络),对于从大型健康队列中学习结构特征与年龄之间的复杂映射关系至关重要。然而,模型存在“回归到均值”的偏差,即年轻人的脑年龄被高估,老年人的被低估,因此现代研究流程会加入偏差校正程序。结构磁共振成像,特别是T1加权成像,因其高空间分辨率、优异的软组织对比度和无电离辐射,成为脑年龄预测的主流模态。已有证据表明,BAG在包括阿尔茨海默病、帕金森病、多发性硬化、精神分裂症、双相情感障碍和重度抑郁症在内的多种神经精神疾病中均升高。尽管这些疾病的病因各异,但它们都表现出偏离正常老化轨迹的共同特征。然而,不同疾病间的证据强度差异显著,且各研究在图像采集、预处理、特征提取、模型架构和偏差校正等方面存在巨大的方法学异质性,限制了跨诊断模式的定量比较。为了澄清BAG是否代表了不同疾病间共享的生物学特征,还是疾病特异性的不同轨迹,研究人员对涵盖七种主要神经精神疾病的磁共振成像脑年龄研究进行了系统性综述和荟萃分析,旨在量化疾病水平的BAG差异,检验BAG与实足年龄的关系,识别研究间异质性的方法学和生物学贡献因素,并评估BAG作为神经影像生物标志物的转化相关性。
方法
本研究遵循PRISMA 2020指南进行了系统性综述和荟萃分析。研究方案已在开放科学框架上注册。文献检索覆盖了从2000年1月1日至2025年1月28日期间的PubMed/MEDLINE、Scopus、Web of Science和PsycINFO数据库。检索策略结合了与脑年龄估计、脑年龄差和磁共振成像相关的受控词表和自由词。研究的纳入标准包括:研究对象为人类;采用磁共振成像模态;报告了患者组与健康对照组比较的脑年龄或脑年龄差值;研究设计为横断面、纵向、回顾性或多队列;患者诊断为AD、MCI、MS、PD、SCZ、卒中和BD之一;提供足够数据以提取或计算效应量;全文为英文。排除标准包括:综述、元分析、社论、病例报告、动物研究、非成像研究,或无法提取相关数据的研究。两位评审员独立筛选文献并提取数据。数据提取模板涵盖了研究标识符、设计、样本特征、临床人群、磁共振成像模态、脑年龄估计分析方法、BAG估计值以及关键协变量。任何分歧通过讨论解决,必要时咨询第三位资深评审员。统计分析方面,针对每个队列,提取了临床组和健康对照组的BAG。使用汇总标准差计算了标准化效应量Hedges’s g。校正后的BAG(患者组均值减去健康对照组均值)被用作主要效应指标。所有分析均采用限制性最大似然法估计的随机效应模型,以考虑研究间的生物和方法学异质性。计算了每个疾病的汇总效应量、95%置信区间和p值。使用Cochran’s Q统计量、异质性比例I2和组间方差估计tau2评估了研究间异质性。同时计算了95%预测区间以增强临床可解释性。对于有足够队列数的疾病,使用Egger回归检验和剪补法评估了发表偏倚。为了探究BAG是否随实足年龄发生系统性变化,研究人员进行了元回归分析,将效应量估计值对队列平均年龄进行回归。所有模型均使用R软件中的“metafor”包实现。敏感性分析包括对每个汇总估计进行留一法诊断。鉴于预期存在较大的研究间异质性,研究人员报告了95%预测区间,并在I2> 75%时强调预测区间和个体研究分布而非汇总点估计。
结果
共纳入65项研究,涵盖7个主要临床人群:AD(31项)、MCI(32项)、MS(11项)、PD(5项)、SCZ(8项)、卒中(2项)和BD(1项)。其中有五项疾病(AD, MCI, MS, PD, SCZ)具有足够数量的研究进行正式的随机效应荟萃分析。卒中和BD因研究数量不足,仅作描述性呈现。值得注意的是,许多研究在同一框架内调查了不止一种临床疾病。磁共振成像模态以T1加权成像为主(46/65项研究)。部分研究采用了多模态方法以提高预测性能,例如结合功能磁共振成像、弥散张量成像、18F-FDG PET或FLAIR序列。样本量从小型临床队列到大规模人口数据集不等。大多数研究为横断面设计,但也有部分包含了纵向随访数据。分析方法显示了明显的方法学演进,早期研究依赖支持向量回归、高斯过程回归等方法,而近期研究越来越多地应用深度学习架构、集成框架和图模型。疾病特异性的研究重点也有所不同,AD证据基础最为庞大,MCI研究侧重于早期检测和疾病进展,MS研究调整了BAG流程以适应病灶敏感对比度,PD证据相对较少但结合了结构和功能模态,SCZ研究将患者与健康对照及BD队列进行了比较。卒中证据有限,BD则仅有一项专门研究。
阿尔茨海默病
共有31个AD队列被纳入荟萃分析。与健康对照组相比,AD组的BAG值一致升高。AD校正BAG(即研究中AD组与健康对照组BAG的差值)范围为1.67至12.83年,汇总平均值为5.57年。随机效应荟萃分析显示AD对BAG具有大且统计学显著的影响,汇总Hedges’s g = 0.66。研究间异质性非常高(I2= 95.3%),95%预测区间为-0.23至1.56。对AD校正BAG与队列平均年龄的元回归表明无显著的年龄效应。漏斗图视觉检查无明显不对称,Egger检验和剪补法均未发现发表偏倚证据。
轻度认知障碍
共有32个独立MCI队列被纳入荟萃分析。与健康对照组相比,MCI组的BAG估计值一致更高。MCI校正BAG范围为0.35至10.40年,汇总平均值为3.77年。随机效应荟萃分析显示MCI相对于健康对照组的BAG存在显著增加,汇总效应量Hedges’s g = 0.43。研究间异质性非常高(I2= 92.6%),95%预测区间为-0.16至1.02。元回归分析显示队列平均年龄与BAG无显著相关性。Egger检验和剪补法未发现小研究效应或发表偏倚证据。
帕金森病
在五个纳入的PD队列中,与健康对照组相比,PD患者的BAG值一致升高。PD校正BAG值范围从+2.0到+5.64年,汇总平均值为+3.52年。随机效应荟萃分析表明PD组的BAG较健康对照组有统计学显著升高,Hedges’s g = 0.37。研究间异质性为中等(I2= 60.1%),95%预测区间为0.086至0.660。对PD校正BAG与队列平均年龄的线性回归显示出负斜率趋势,但未达统计学显著性。漏斗图视觉检查无明显不对称,但Egger回归检验检测到显著的小研究效应,不过剪补法未估算出缺失研究,汇总效应保持不变。
帕金森病统一帕金森病评定量表与脑年龄差关系
帕金森病统一帕金森病评定量表评分与BAG之间的关系显示出混合但以正向为主的相关性,多种方法学因素影响了相关性的强度和显著性。多项研究报道了BAG与帕金森病统一帕金森病评定量表分量表(特别是第二部分,日常生活活动)之间的显著正相关,表明BAG与更差的运动障碍相关。一项大型分析也显示BAG与运动障碍及更快的运动功能下降相关。然而,研究结果存在异质性,有研究未发现BAG与帕金森病统一帕金森病评定量表评分之间的显著相关性。这种变异性源于脑年龄计算方法、评估的特定帕金森病统一帕金森病评定量表分量表以及疾病阶段、认知状态等样本特征的差异。重要的是,多队列分析揭示了BAG存在年龄依赖性模式,年轻PD队列表现出更大的脑年龄偏离。
多发性硬化
在11个MS队列中,BAG值较健康对照组显著升高。校正后的BAG范围从0.74到18.6年,汇总平均值为7.81年。随机效应荟萃分析显示MS相对于健康对照组存在巨大且高度显著的汇总效应,Hedges’s g = 0.89,这是本研究评估的所有疾病中最大的效应。研究间异质性极高(I2= 98.3%),95%预测区间为-0.34至2.12。对BAG与队列平均年龄的元回归显示出正向但不显著的关联。漏斗图对称,Egger检验和剪补法均未发现发表偏倚证据。
卒中
仅有两项独立的卒中队列符合本综述的纳入标准。在两项研究中,健康对照组BAG值接近零,而卒中患者则显示出正的BAG,卒中校正BAG范围为3.76至5.50年,平均为4.63年。这表明,平均而言,卒中患者的大脑相对于实足年龄看起来比健康对照老了约4-5年。
精神分裂症
在八个纳入的SCZ队列中,BAG值较健康对照组一致升高。SCZ校正BAG范围从0.1到7.7年,汇总平均值为4.40年。随机效应荟萃分析显示SCZ相对于健康对照组的BAG存在显著且中等程度的升高,汇总效应量Hedges’s g = 0.42。研究间异质性高(I2= 85.1%),95%预测区间为-0.14至0.99。对队列平均年龄与SCZ校正BAG的元回归显示出显著的正相关,表明平均年龄较高的队列表现出相对于健康对照组越来越大的BAG差异。漏斗图视觉检查无明显不对称,Egger检验和剪补法未发现发表偏倚证据。
双相情感障碍
仅有一项符合条件的研究调查了双相情感障碍的脑年龄差。该BD队列中,健康对照组BAG略为负值(-0.15年),而双相情感障碍患者的BAG为4.69年,BD校正BAG为4.84年。这表明在该队列中,双相情感障碍与相对于对照组的脑预测年龄升高约5年相关。