《Journal of Neural Transmission》:Decoding cortical folding with deep learning: toward neurodevelopmental biomarkers of psychiatric disorders
编辑推荐:
为了解决精神疾病的神经发育起源生物标志物发现难题,研究人员开发了基于深度学习的皮层褶皱表征新方法,通过在大规模人群中自监督预训练,成功从成年磁共振成像中提取出可预测精神分裂症(SCZ)、双相情感障碍(BD)和自闭症谱系障碍(ASD)的个体化褶皱特征。该研究为回溯早期脑发育异常提供了全新工具,推动了精准精神病学的发展。
人类大脑并非生来就是布满沟回的模样。在孕晚期和出生早期,原本光滑的脑表面会经历一场激烈的形态转变,如同大地上被雕刻出纵横交错的峡谷与山脊,形成了复杂的脑回(gyri)和脑沟(sulci)。这个被称为“皮层褶皱”的过程,主要由早期的遗传、表观遗传和环境影响塑造,一旦成形便基本保持稳定,成为一个伴随终身的、凝固的神经发育印记。
然而,近年来,越来越多的证据将多种精神疾病的根源指向了生命早期的神经发育中断。虽然像自闭症谱系障碍(Autism Spectrum Disorder, ASD)这类典型神经发育障碍,其症状在婴儿期就已显现,但传统上不归类为神经发育障碍的精神分裂症(Schizophrenia, SCZ)和双相情感障碍(Bipolar Disorder, BD),也被发现其病理生理学过程与早期大脑发育的偏离密切相关。这引出了一个关键的科学和临床问题:对于成年后才出现症状的患者,我们能否通过他们此刻的大脑影像,去回溯并识别出那些早在生命初期就已埋下的、预示着疾病风险的生物学标记?
皮层褶皱的终生稳定性,使其成为一个理想的候选“时光胶囊”。理论上,成年大脑的褶皱模式中,封存着个体早期发育过程的独特信息。过往研究已经发现,患者与健康对照组之间,在整体或局部的皮层褶皱复杂程度(通常用量化指标“脑回指数”Gyrification Index衡量)上存在差异。但这些基于传统指数的方法存在局限,它们无法捕捉皮层褶皱的全部形态学信息,例如脑沟的深度和形状特征。更重要的是,大多数研究仅停留在群体层面的比较,难以实现针对单个个体的疾病风险预测。
为了突破这些瓶颈,并寻找真正反映神经发育起源的影像生物标志物,一篇发表在《Journal of Neural Transmission》上的研究采取了全新的策略。研究人员将目光投向人工智能的前沿——深度学习(Deep Learning, DL),目标是直接学习皮层褶皱的深层表征,实现精神疾病的个体化预测。他们并非从零开始训练模型,而是巧妙地利用了大规模健康人群数据库(如英国生物样本库UK Biobank)进行自监督预训练,先让模型学会理解和表征健康大脑的标准褶皱模式,形成一个“褶皱特征基础模型”。随后,研究者将预训练好的模型“迁移”到精神病学临床数据集上,通过微调或添加新分类器,使其能够区分特定疾病患者(如SCZ、BD、ASD)与健康对照。为了平衡模型的预测性能和可解释性,研究团队还设计了一种区域集成策略:训练一系列专门针对不同脑区的深度学习模型,最后将各区域的预测结果整合,从而更直观地揭示哪些特定脑区的褶皱异常对疾病分类贡献最大。
总而言之,这项研究通过创新的深度学习框架,直接从结构磁共振成像(Structural Magnetic Resonance Imaging, sMRI)中提取皮层褶皱的丰富表征,首次系统性地证明了这些表征可以用于对SCZ、BD和ASD这三种主要精神疾病进行显著的个体水平预测。这不仅为理解精神疾病的神经发育基础提供了强有力的计算神经影像学证据,也为未来通过成人脑影像推断其早期发育轨迹、实现患者的精准分层与治疗,开辟了新的可能性。
本研究主要采用了以下几项关键技术方法:首先,利用BrainVisa/Morphologist和DeepFolding工具箱对大规模健康人群队列(英国生物样本库,UK Biobank)和三个多中心临床队列(含ASD、BD、SCZ患者及健康对照)的sMRI数据进行预处理,提取并标准化皮层褶皱骨架图像。其次,构建并应用了三种深度学习策略:1)基于临床数据从头训练的全局模型作为基线;2)基于Barlow Twins自监督框架在UK Biobank数据上预训练,再迁移到临床任务的全局“基础模型”;3)使用区域特异性基础模型Champollion进行集成预测的“区域模型”策略。模型评估采用受试者工作特征曲线下面积(ROC AUC)作为主要指标。
研究结果
预测性能
比较三种方法在三种疾病分类任务上的表现(如表2所示):
- •
全局模型(无预训练):直接从临床数据训练时,模型预测性能较差,且无法有效泛化到训练集未包含的扫描站点(外部测试集)。
- •
全局模型(带预训练):在UK Biobank上进行自监督预训练后,迁移学习显著提升了所有任务在所有测试集上的预测性能。例如,在外部测试集上,AUC分别提升了13个点(ASD)、7个点(BD)和4个点(SCZ)。所有内部测试集的预测结果均具有统计学显著性(p<0.05)。对于ASD任务,模型在外部测试集上也取得了显著预测,表明其对未见过的扫描站点具有较好的泛化能力。
- •
区域集成方法:该方法的预测性能介于上述两种全局模型之间,但其优势在于更高的可解释性。
ASD实验的特征重要性与可解释性
- •
基于全局预训练模型的特征重要性:使用遮挡敏感性分析(Occlusion Sensitivity)试图理解全局模型在预测ASD时的决策依据(如图2所示)。生成的敏感性图谱虽然显示了某些脑区的重要性,但结果较为弥散,难以清晰地指向已知与ASD相关的特定解剖区域。
- •
基于区域方法得出的预测性脑区:区域集成方法因其设计而自然提供了可解释性。通过分析每个脑区特异性模型的独立预测效能(如图3所示),可以直接识别出对ASD分类贡献最大的脑区。结果显示,颞上沟(superior temporal sulcus)和颞顶交界区(parieto-temporal junction)的模型预测效能最高。这两个区域是“心智理论”网络的关键组成部分,其异常与ASD的社会认知功能障碍密切相关,这与既往文献发现一致。
讨论与结论
本研究成功实现了基于个体大脑褶皱模式的临床状态预测,证明了早期神经发育阶段塑造的皮层褶皱模式,其信息足以在个体水平上区分主要的精神疾病类别。这为精神疾病的神经发育假说提供了实证支持。
研究发现,褶皱信息对ASD(一种典型的神经发育障碍)的预测效能最高,且在限制输入仅为褶皱骨架时,其预测效能的下降远小于SCZ和BD。这表明皮层褶皱捕捉了ASD相关结构变异的大部分信息,但对于SCZ和BD,其他可能反映后天环境或病程影响的脑结构特征(如灰质体积、皮层厚度)可能包含更多诊断相关信息。因此,褶皱模式可能特别适用于识别那些具有高神经发育负荷的患者亚群。
在方法学层面,研究证实了在大规模健康人群数据上进行自监督预训练(即构建“基础模型”)对于提升小规模、异质性临床数据集上模型性能与泛化能力的重要性。然而,扫描站点效应仍然是影响模型跨中心泛化的主要挑战。区域集成方法在可解释性方面展现出优势,能够直接、清晰地指出与疾病相关的候选脑区,虽然其绝对预测精度略低于全局模型,但为平衡性能与解释性提供了可行方案。
研究的发现与强调精神病理学发展起源和维度性质的美国国家心理健康研究所“研究领域标准”(Research Domain Criteria, RDoC)框架相契合。皮层褶皱作为早期发育轨迹和特定脆弱期窗口的“化石记录”,为量化个体的神经发育负荷提供了一种潜在的影像学生物标志物。
从临床视角看,识别与疾病相关的神经发育负荷水平,有助于实现治疗个性化。例如,对于神经发育负荷高的患者,可能需要调整用药剂量、加强副作用监测,甚至预测其对一线治疗的反应,从而更快地转向更有效的药物(如氯氮平)。尽管目前的分类性能尚不足以直接应用于临床诊断,但该研究为开发基于脑影像的、用于患者分层和精准干预的实用工具迈出了重要的第一步。未来的工作应致力于整合多模态脑特征以提升预测能力,并进一步探索褶皱模式在跨诊断维度和个体发展轨迹中的应用潜力。