《Human Brain Mapping》:A Systematic Evaluation of the Performance of Multiple Brain Age Algorithms in Two Cohorts of Youth
编辑推荐:
本文系统评估了五种主流大脑年龄算法在青少年群体中的表现,填补了该领域在代表性样本中验证的空白。研究通过比较Drobinin、Whitmore、Pyment、Kaufmann和Centile等算法在密歇根双胞胎神经遗传学研究(MTwiNS)和青少年神经发育研究(SAND)两个队列中的预测准确性、对扫描参数敏感性、人口统计学变异敏感性和遗传相似性等指标,发现Pyment算法在9-19岁群体中表现最优(与年龄相关性r=0.68,平均绝对误差MAE=1.78年),而所有算法在窄年龄范围(15-17岁)的低收入少数族裔群体中预测效能显著下降。该研究为发育神经科学领域选择合适的大脑年龄估计算法提供了重要基准,并揭示了算法在跨群体泛化中的局限性。
研究背景与意义
大脑年龄作为反映个体大脑成熟程度的生物标志物,近年来被广泛应用于评估神经发育状况。然而,现有大脑年龄估计算法多在以白人优势群体为主的成人样本中开发,其在青少年群体特别是代表性样本中的适用性尚不明确。本研究首次系统比较了五种主流算法在两个基于人群的青少年队列中的性能,为后续应用研究提供基准。
研究方法与算法选择
研究选取三种跨生命周期算法(Kaufmann等2019;Leonardsen等2022;Yu等2024)和两种青少年专用算法(Drobinin等2022;Whitmore等2023),在MTwiNS队列(N=593,9-19岁)和SAND队列(N=198,15-17岁)中进行验证。评估指标包括预测准确性(与实足年龄的相关性、平均绝对误差MAE)、对扫描参数(采集序列、图像质量)和人口统计学特征(性别、青春期)的敏感性、单卵双胞胎的组内相关性以及算法间收敛性。
主要发现与算法性能比较
在MTwiNS队列中,Pyment算法表现最佳,与实足年龄相关性最强(r=0.68),且对采集序列、图像质量和青春期状态不敏感。Drobinin和Centile算法也显示出良好性能(r=0.51-0.61)。相反,Whitmore和Kaufmann算法预测准确性较低(r=0.34-0.44),且Whitmore算法在单卵双胞胎中显示出近乎完美的组内相关性(ICC=0.95-0.99),表明其区分相似大脑的能力有限。
值得注意的是,所有算法在SAND队列(窄年龄范围、主要为黑人低收入青少年)中表现均较差,预测与实足年龄的相关性均低于0.24。后续分析表明,这种性能下降主要归因于测试样本的窄年龄范围,而非人口统计学背景的差异。
算法敏感性与特异性分析
不同算法对扫描参数和人口统计学特征的敏感性存在显著差异。Drobinin算法对8通道头线圈、较低图像质量和较早青春期阶段预测出更先进的大脑年龄,而Kaufmann和Centile算法则显示出相反模式。Pyment算法对这些参数均不敏感,显示出更好的鲁棒性。
在算法收敛性方面,Pyment、Drobinin和Centile算法预测的大脑年龄值和脑龄差距之间存在中度至强相关性(r=0.30-0.77),而Whitmore算法与其他算法的相关性较弱甚至呈负相关。
研究启示与局限性
本研究揭示了大脑年龄算法性能受到训练样本与测试样本间年龄范围对齐程度的显著影响。算法在窄年龄范围样本中的预测准确性普遍降低,这为在发育研究中应用这些算法提出了重要注意事项。
研究局限性包括仅评估了五种算法,且主要关注横断面数据。未来研究需要开发专门针对青少年群体、能够捕捉非线性发育轨迹的新型算法,并验证其在纵向数据中的可靠性。
结论与展望
本研究为在青少年群体中选择合适的大脑年龄估计算法提供了实证依据。Pyment算法在广泛年龄范围内表现最优且鲁棒性强,而Drobinin和Centile算法也可作为备选。研究结果强调,在应用大脑年龄算法时,需考虑样本年龄范围与训练样本的对齐程度,特别是在发育研究中。未来研究应致力于开发能够更好地捕捉青少年大脑发育特异性且适用于多样化群体的新算法。