基于ABIDE I数据库的数据/模型驱动置换检验方法揭示自闭症谱系异质性

《Brain and Behavior》:Unraveling the Autism Spectrum Heterogeneity: Insights From ABIDE I Database Using Data/Model-Driven Permutation Testing Approaches

【字体: 时间:2026年02月02日 来源:Brain and Behavior 2.7

编辑推荐:

  本文通过数据/模型驱动的置换检验方法分析ABIDE I数据库,探讨自闭症谱系障碍(ASC)的脑结构异质性。研究发现,多中心变异性和样本量限制显著影响结构神经影像学研究的可靠性,采用统计参数映射(SPM)和统计不可知映射(SAM)两种方法均未发现ASC与健康对照(HC)之间存在显著脑区差异,提示需要更统一的数据集和先进分析方法来避免机器学习(ML)模型过拟合。

  
引言
自闭症谱系障碍(Autism Spectrum Condition, ASC)是一种神经发育障碍,其特征为沟通障碍、社交互动受损以及限制性或重复性行为。尽管已有大量研究利用神经影像技术试图识别ASC个体与神经典型个体之间的脑结构差异,但不同中心的图像采集协议变异如何影响这些观察到的差异,却鲜有关注。本研究基于自闭症脑成像数据交换I(ABIDE I)数据库的结构磁共振成像(sMRI)数据,结合置换检验方法,采用统计参数映射(Statistical Parametric Mapping, SPM)和统计不可知映射(Statistical Agnostic Mapping, SAM)两种统计映射方法,旨在揭示ASC的脑结构异质性。
材料与方法
ABIDE I数据集
ABIDE I数据库包含来自20个国际中心的磁共振图像,共计1032幅图像,其中527幅来自健康对照(HC),505幅来自ASC个体。所有图像经过预处理和分割,仅使用每个图像的完整灰质(GM)图。脑体积被划分为116个感兴趣区(ROI),采用自动化解剖标记(AAL)方法。研究还进行了基于中心和基于条件的分析,比较ASC与HC以及HC与HC之间的差异。
预处理与异常值检测
磁共振图像使用SPM软件和计算解剖学工具箱(CAT12)进行预处理和分割,包括空间标准化、分割和去噪。仅使用GM图进行分析。预处理后,生成每个MRI图像的概率图,值在0到1之间,表示体素属于特定组织(如WM、GM或CSF)的概率。
统计参数映射
SPM是一种神经影像工具,利用体素水平的统计分析来检查比较结构性和功能性脑数据。本研究采用基于一般线性模型(GLM)的单变量质量方法,使用双样本t检验将MRI图像分为两个相等大小的组。图像通过8毫米全宽半高的高斯滤波器进行平滑,模型通过限制性最大似然估计参数。为控制多重比较中的假阳性风险,应用了全脑簇水平家族错误(FWE)校正,显著性水平(α)设为0.05。
统计不可知映射
SAM是一种非参数机器学习方法,用于在体素或区域水平评估神经影像数据。它通过交叉验证(CV)技术解决有限样本量导致的风险估计不稳定问题,并在最坏情况下提供FWE校正的p值。SAM过程包括特征提取和选择(FES)阶段,使用偏最小二乘回归(PLS)进行特征提取,并采用支持向量机(SVM)进行训练。
置换检验的统计分析
研究采用置换检验进行双样本统计分析,评估观察到的分类准确性是否显著优于随机预期。通过比较观察到的准确性与多次随机标签排列得到的准确性,计算p值。置换检验在每种情况下进行1000次排列,比较ASC与HC以及HC与HC之间的差异。
样本量与功效计算
研究从每组中随机选择特定数量的图像进行分析。基于条件的分析中,从每组中取约100幅图像;基于中心的分析中,从每个中心的每组中取1/3的图像。这确保了样本量与可用数据集之间的平衡,在每次置换中创建不同的亚组。
实验结果
SAM分析
基于条件的分析显示,在ASC与HC和HC与HC比较中,均存在脑区显示显著差异,但未达到统计学意义。去除异常图像后,结果与原始发现高度一致。分析还发现,假阳性率与区域大小相关,即使在HC与HC比较中也是如此,表明该效应与ASC条件无关。基于中心的分析显示,不同中心之间存在高变异性,某些中心由于样本量小,未显示任何显著差异,而其他中心则显示几乎所有区域都有差异。NYU中心由于样本量大,提供了更可靠的结果,但SAM和SPM在识别差异区域方面相互矛盾。
SPM分析
SPM分析在组I中心(样本量小)失败,而在NYU中心仅显示极少数体素差异。SPM分析未发现任何区域或体素在ASC与HC之间存在显著差异,表明该方法过于保守。与SAM相比,SPM在识别差异区域方面不一致,突出了多中心数据库的异质性挑战。
讨论
基于条件的研究
SAM和SPM分析均未发现ASC与HC之间存在显著脑区差异。SAM突出显示了中央后回、枕中回等区域,而SPM则强调了壳核、丘脑等区域,但两种方法的结果不一致。这表明观察到的差异可能更多与非疾病因素相关。
基于采集中心的研究
SAM和SPM分析均需区分NYU中心与其他中心。小样本中心的结果不可靠,而大样本中心如NYU的结果虽更可靠,但两种方法仍不一致。多中心变异性和样本量限制是影响结果可靠性的主要因素。
与现有文献比较
许多研究报道了ABIDE I数据库中脑体积的差异,识别了额上回、颞中回等特定脑区。SAM分析也突出了类似区域的差异,但未能达到统计学意义。这与先前报道的机器学习方法在ABIDE数据库sMRI数据中随机分类水平的准确性一致。
结论
本研究旨在识别ABIDE I数据库中可作为ASC可靠生物标志物的特定脑区。使用置换检验结合SAM和SPM方法,未发现任何脑区在ASC与HC之间存在显著差异。多中心变异性和样本量限制显著影响结果可靠性,提示需要更统一的数据集和先进分析方法来避免过拟合,并进一步研究ASC的结构基础。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号