ACVAE:一种基于注意力的对比变分自编码器,用于识别自闭症谱系障碍(ASD)亚群及其与基因表达的关联

《Neurocomputing》:ACVAE: An attention-based contrastive variational autoencoder for identifying ASD subgroups and their association with gene expression

【字体: 时间:2026年03月01日 来源:Neurocomputing 6.5

编辑推荐:

  基于高阶时空连接性的注意力对比变分自编码器模型研究,揭示自闭症谱系障碍(ASD)亚组特征及与基因表达关联。通过整合ABIDE数据集的静息态fMRI动态连接性矩阵,构建ACVAE模型分离ToM、DMN、CEN、SN网络的高阶协变模式,成功识别与临床亚型(ATD/APD/PDD)匹配的三个ASD亚组(F1=0.88),并验证其与Allen脑图谱基因表达谱的关联性。首次实现神经影像与基因组学的跨模态亚组划分。

  
Km Bhavna|Shubham Sharma|Alfredo Rosado-Mu?oz
印度拉贾斯坦邦焦特布尔印度理工学院计算机科学与工程系,342037

摘要

自闭症谱系障碍(ASD)的特点是社交认知、互动、沟通能力受损,行为受限以及感觉异常。功能性磁共振成像(fMRI)研究表明,心智理论(ToM)网络、默认模式网络(DMN)、中央执行网络(CEN)和显著性网络(SN)与ASD有关。该疾病的多样临床表现使得诊断和治疗变得复杂,因此需要更深入地了解其异质性。本研究旨在从静息态fMRI数据中识别新的特征,以确定ASD样本中的亚群。我们提出了一种基于注意力的对比变分自编码器(ACVAE)模型,利用ToM、DMN、CEN和SN网络之间的高阶边缘连接性(时空连接性)来识别ASD亚群。通过使用自闭症脑成像数据交换(ABIDE)数据集,我们分析了静态、动态和时空功能连接性,以理解大脑拓扑结构。我们的方法成功识别出了三个ASD亚群及其与基因表达的关联。我们将功能连接性矩阵与基因表达谱整合起来,探讨生物学基础,研究fMRI衍生的模式与与ASD相关功能紊乱的关键基因之间的共变关系。这种整合方法架起了神经影像学和基因组学之间的桥梁,为理解ASD的异质性和潜在生物标志物提供了见解。据我们所知,这是首次使用ACVAE结合高阶连接性特征和基因表达整合来揭示ASD亚群的研究。

引言

自闭症谱系障碍(ASD)是一种普遍存在的神经系统疾病,其特征是社交沟通能力和互动能力不足,以及重复性行为和感觉异常[8]、[10]。根据先前的研究[6]、[8]、[35]、[44],使用fMRI发现,自闭症主要影响与心智理论(ToM)网络、默认模式网络(DMN)、中央执行网络(CEN)和显著性网络(SN)等特定大脑网络相关的社交认知、互动和沟通能力[9]。在过去几十年中,自闭症的诊断已经从一种局限于幼儿的罕见疾病转变为一种具有终身挑战的广泛性障碍。目前,超过1%的儿童被诊断出患有自闭症,其表现出高度的多样性,意味着没有两个ASD患者的表型是完全相同的[39]。ASD患者在生物学和行为特征上表现出多层次的异质性[32],包括遗传[5]、[23]、神经系统[25]、[30]和临床表型[39]。ASD患者的临床特征存在差异,这些差异体现在多个维度上,如社交技能、沟通能力、语言能力、症状出现年龄、智力功能[21]、性别差异[7]、[26]、[34]、[56]、执行功能[24]以及发育史[38]、[47]。因此,ASD通常被视为多个谱系的集合,而不仅仅是一个单一的表型。许多临床医生和研究人员认为,它由多个亚群或多维节点组成,这些亚群或分类有助于理解该疾病的成因和管理[30]、[37]、[54]。然而,这些亚群尚未得到充分的认识和定义。在过去的几十年里,一些研究[15]、[22]、[36]、[45]、[68]试图通过分析某些行为或认知特征来识别ASD的亚类别。先前的研究[30]根据MRI标记将ASD分为三个独特的解剖亚群:ASD-I,其特征是皮层厚度增加和表面积增大;ASD-II,其特征是皮层变薄和距离减小;ASD-III,其特征是距离增大。其他研究[50]在ASD内识别出三种主要情况:自闭症障碍(ATD)、阿斯伯格障碍(APD)和未另行指定的广泛性发育障碍(PDD)[20]。在文献[14]、[15]、[36]、[37]、[54]中报道,基于神经影像学生物标志物识别神经生理亚群可以改善对ASD异质性的理解,从而实现更精确的诊断和针对性治疗。
深度学习模型通过使用大规模神经影像数据集(如ABIDE数据集[17])在识别ASD亚群方面做出了显著贡献。特别是卷积神经网络(CNNs)和循环神经网络(RNNs)被应用于静息态fMRI(rs-fMRI)和结构MRI数据,根据功能连接性和皮层特征对ASD及其亚群进行分类[29]、[63]、[67]。这些深度学习方法结合了多模态数据融合技术、元学习策略和可解释性框架,以提高ASD亚型的分类准确性并增强临床应用[48]。利用ABIDE的数据集进行的研究探索了特征提取技术,如图卷积网络(GCNs)来模拟大脑连接模式,以及无监督聚类方法来揭示ASD内的潜在亚群[46]。先前的研究[29]使用自编码器学习神经影像数据的潜在表示,主要关注默认模式网络(DMN)、中央执行网络(CEN)和显著性网络(SN)等大脑网络,从而基于功能连接性区分ASD亚群。尽管取得了有希望的发现,但数据异质性、不同扫描地点之间的领域差异以及标记亚群的有限可用性等问题限制了这些模型的通用性[1]。
在上述研究中,以往的研究侧重于使用结构化特征集或功能连接性作为特征集,或基于行为评分使用深度学习方法识别ASD人群中的异质性[21]、[30]、[53]。需要一个能够理解ASD人群复杂大脑拓扑结构的独特特征集。为了克服这些挑战,本研究提出了以下研究问题:a) 新特征集的识别:如何为静息态fMRI数据识别一个独特的特征集,以提高对ASD样本中异质性的识别能力?b) 模型架构:如何提出一个更好解释性和通用性的模型架构,以理解高阶相关特征集(时空连接性)的表示?
在这项研究中,我们假设边缘连接性——代表ToM、DMN、CEN和SN大脑网络之间的高阶相关性——可以作为基于注意力的对比变分自编码器(ACVAE)模型的独特特征集,从而无需专门的特征工程即可识别ASD样本中的亚群(图1)。我们还假设边缘连接性可以作为识别ASD亚型与基因表达之间关联的特征集。我们将这种边缘连接性称为时空连接性(STC)。选择时空连接性的原因是静态功能连接性(SFC)和动态功能连接性(dFC)的局限性。SFC提供了大脑区域之间的平均相关性,但忽略了对认知和行为至关重要的瞬态波动,而dFC使用滑动窗口捕获时变相关性,但忽略了高阶交互。为了解决这个问题,我们提出了时空连接性,它量化了大脑区域之间dFC波动随时间的变化。与SFC和dFC不同,时空连接性揭示了分布式网络中的协调动态,通过整合空间连接性和时间变化提供了更全面的大脑组织视图。在这项研究中,我们考虑了ABIDE I和ABIDE II数据集。本研究的主要贡献如下:1.
我们选择了ToM、DMN和SN大脑网络,这些网络已被确定为自闭症的关键网络[13]、[53]。为了提取基于边缘连接性的特征集作为高阶相关特征集,我们为每个个体计算了时空连接性(STC)矩阵,从上述网络中提取时间序列信号,并使用滑动窗口方法计算dFC流[3]。我们将每个功能连接(FC)链接视为连接两个区域的动态变量。最后,我们提取了不同动态变量链接的时间序列之间的N(N-1)-times-N(N-1)协方差矩阵。我们将这种类型的互连协方差矩阵称为时空连接性。
  • 2.
    我们使用基于注意力的对比变分自编码器(ACVAE)模型识别ASD亚群或ASD人群中的异质性,其中一个编码器捕获全局连接模式,而另一个编码器关注局部细粒度变化。双编码器框架中的注意力机制选择性地权衡了相关的连接特征,增强了模型区分ToM、DMN、CEN和SN网络之间有意义的高阶相关性的能力。通过动态优先处理关键连接,注意力机制细化了潜在表示,提高了ASD亚群的聚类效果,同时减少了噪声和无关特征。
  • 3.
    我们将临床确定的亚群,即ATD、APD和PDD,作为经过验证的亚群类别。我们将ATD视为ASD亚群1,APD视为ASD亚群2,PDD视为ASD亚群3。使用这些临床亚群作为标签,我们评估了发现的亚群是否与已建立的类别一致,准确率为90%,F1分数为0.88。
  • 4.
    最后,为了识别ASD亚型与基因表达之间的关联,我们使用Allen人类脑图谱(AHBA)[28]、[64]、[65]、[66]进行了基因表达分析,以研究与ASD相关的基因。
  • 小节片段

    fMRI数据集和预处理

    本研究的fMRI解剖学和静息态功能扫描数据来自自闭症脑成像数据交换(ABIDE I和ABIDE II)数据集(https://fcon_1000.projects.nitrc.org/indi/abide/)[17]。每个站点列出的功能扫描参数被用于进一步预处理。ABIDE I包含用于研究的预处理图像。从ABIDE II获取的数据也进行了进一步预处理,遵循了预处理ABIDE I数据集的过程。

    时空连接性矩阵的计算

    在本研究中,我们从ToM、DMN、CEN和SN大脑网络中提取了时间序列信号,并为每个个体计算了功能连接性矩阵。FC矩阵具有独特的对称性,尽管它们的N值很大,但只有少量的唯一条目,代表了矩阵的下三角部分。我们还计算了dFC流,其输出是一个大小为的3D张量,其中F是帧数。我们根据文献[27]选择了20秒的窗口大小。

    讨论

    自闭症谱系障碍(ASD)是一种影响社交认知、沟通和互动能力的神经发育障碍。ASD研究中的一个主要挑战是识别ASD样本中的隐藏亚群,因为该疾病的异质性[2]、[49]、[57]、[61]。为了解决这个问题,我们的研究使用时空连接性矩阵作为高阶相关矩阵来识别不同的ASD亚群。我们提出了一种基于注意力的对比变分自编码器

    结论

    在这项研究中,我们使用时空连接性矩阵作为高阶相关矩阵来捕捉ASD样本中的异质性。与假设连接稳定的SFC或仅捕获短期变化的dFC不同,时空连接性整合了时间波动。为了识别ASD样本中的亚群,我们提出了基于注意力的对比变分自编码器(ACVAE)模型。ACVAE中的自注意力机制有助于关注最重要的

    CRediT作者贡献声明

    Km Bhavna:撰写——原始草稿、可视化、验证、软件、资源、项目管理、方法论、正式分析、数据管理、概念化。Shubham Sharma:撰写——原始草稿、验证、方法论、正式分析、概念化。Alfredo Rosado-Mu?oz:撰写——原始草稿、可视化、验证、监督、资源。

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能会影响本文报告的工作。

    致谢

    我们衷心感谢所有参与数据收集和分析的参与者及研究人员。我们还要感谢印度理工学院焦特布尔分校提供的必要资源和计算设施。特别感谢我们的同事和导师们提供的宝贵见解和讨论,这些都有助于完善我们的方法论。
    Km Bhavna目前担任印度科塔印度信息科技学院的助理教授。她获得了印度理工学院焦特布尔分校的博士学位。她的研究兴趣包括人工智能、深度学习、用于心理健康的人工智能框架以及认知神经科学。她的工作重点是开发智能计算模型,以理解认知过程并支持心理健康评估。
    相关新闻
    生物通微信公众号
    微信
    新浪微博

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号