一种用于神经退行性疾病成像遗传学的因果双向选择性状态空间模型
《Neural Networks》:A Causal Bidirectional Selective State Space Model for Imaging Genetics in Neurodegenerative Diseases
【字体:
大
中
小
】
时间:2026年01月12日
来源:Neural Networks 6.3
编辑推荐:
脑成像遗传学中,提出CausalMamba模型解决长遗传序列特征提取及因果关联问题。通过分割遗传序列和MRI影像为局部区域,分别提取细粒度特征,再利用因果推断策略结合对比学习筛选关键特征,建立遗传-影像-疾病的因果链。最终通过双向选择性状态空间模型整合特征,实现高效多模态全局表征。实验表明在ADNI和PPMI数据集上,模型诊断阿尔茨海默病和帕金森病的准确率分别达80.5%和77.3%,较现有方法提升4.2%和2.7%,且计算效率更高。
刘洪瑞|桂园园|赵冰冰|卢慧|刘漫华
上海交通大学人工智能研究所人工智能教育部重点实验室,中国上海东川路800号,200240
摘要
脑成像遗传学旨在揭示脑部疾病的病理机制并改进其诊断方法,尤其是神经退行性疾病。尽管深度学习在该领域提升了特征提取和关联建模的能力,但仍面临两大挑战:从长遗传序列中提取有意义的信息,以及建立遗传学、成像和疾病之间的因果关系。为了解决这些问题,本文提出了一种深度因果双向选择性状态空间模型(CausalMamba),该模型将多层次特征提取和因果推断整合到一个统一的表示学习框架中。首先,将长序列遗传数据和全脑成像数据划分为局部部分,提取细粒度特征。然后,提出了一种基于反事实推理和对比学习的因果推断策略,以识别最相关的遗传和成像特征,并通过成像建立从遗传到疾病的因果链。最后,双向选择性状态空间模型(BiMamba)将选定的特征高效地整合到特定模态的全局特征中,从而实现准确的疾病诊断。我们的模型在遗传数据和成像数据上联合训练,但在测试时仅需遗传数据。我们在模拟数据集、阿尔茨海默病神经影像学计划(ADNI)数据集和帕金森病进展标志物计划(PPMI)数据集上验证了所提出的方法。实验结果表明,仅使用遗传数据,我们的方法在区分阿尔茨海默病和帕金森病与正常对照组时的准确率分别为80.5%和77.3%,相比现有方法分别提高了4.2%和2.7%,同时计算效率也更高。这些结果表明,CausalMamba能够有效识别整个基因组和大脑中的因果相关生物标志物。
引言
成像遗传学是一个快速发展的领域,它结合了神经成像和基因组数据,以揭示遗传变异如何塑造大脑结构和功能。大规模队列研究表明,许多由成像衍生的表型(IDPs)具有显著的遗传性,并确定了单核苷酸多态性(SNPs)与IDPs之间的众多关联(Elliott等人,2018年)。通过系统地描述由遗传因素驱动的大脑变异性,成像遗传学为挖掘反映潜在遗传结构的IDPs提供了强大的框架,并证实了基因组因素对IDPs的影响(Shen和Thompson,2019年)。这些关联对于理解复杂的神经退行性疾病(NDs)尤为重要,因为IDPs作为中间表型,连接了遗传风险和疾病机制,从而揭示了病理过程的发病和进展(Leventhal等人,2025年)。这样的机制洞察最终有助于实现早期诊断、个性化预后评估和针对性治疗干预的发展。
在过去十年中,包括传统的全基因组关联研究(GWAS)(Huang等人,2017年)、稀疏典范相关分析(SCCA)(Yan等人,2014年)和平行独立成分分析(pICA)(Ghosal等人,2021年)等多种方法已被广泛用于脑成像遗传学中,以绘制SNPs与IDPs之间的关联。然而,这些方法主要依赖于线性假设,限制了它们捕捉大脑特征和疾病的复杂遗传结构中的非线性、高阶和多基因相互作用的能力。为了解决这些限制,最近的研究探索了深度学习方法,如卷积神经网络(CNNs)(Zeng等人,2016年)和变换器(Ji等人,2021年),以学习遗传数据的层次化和非线性表示。深度学习方法还成功扩展到了多组学分析中,整合了基因组、转录组和神经成像数据来构建全面的疾病模型(Du等人,2020年;Zhou等人,2023a;Zhou等人,2023b)。这些进展显著提高了与ND相关的遗传和成像生物标志物的发现,从而提高了ND与NC分类的准确性。
尽管如此,深度学习方法在捕捉长遗传序列中SNPs之间的长距离相互作用方面仍面临挑战。为此,状态空间模型(SSM)作为一种有前景的解决方案应运而生(Nguyen等人,2024年;Nguyen等人,2023年)。SSM使用动态系统为基因组序列中的长距离相互作用提供了更有效的建模框架。然而,现有遗传SSM中的信息流通常是单向的,仅捕获上游信息而忽略下游上下文。这一限制限制了它们在成像-遗传分析中的适用性,因为在成像-遗传分析中需要整合长遗传序列中的双向信息并建立SNPs与IDPs之间的稳健关联。
此外,最近的综合性综述记录了基于深度学习的多模态方法在神经成像和神经退行性疾病分析中的快速扩展,包括阿尔茨海默病诊断(Sharma等人,2023年);帕金森病诊断(Tanveer等人,2022年)、脑年龄估计(Tanveer等人,2023年)以及精神分裂症诊断(Verma等人,2023年)。虽然这些综述强调了在整合异构数据源方面取得的进展,但也揭示了一个关键差距:相对较少的研究结合了因果推断技术或明确模拟了遗传变异通过中间IDPs影响疾病风险的生物学机制。这一差距突显了迫切需要统一框架,将因果推理与多模态整合结合起来进行成像-遗传分析。同时,新兴的鲁棒表示学习进展提供了补充性的见解。例如,一种结合基于扩散的增强和引导去噪的联邦推荐系统显示出在保留用户特定信号的同时抑制噪声的强大潜力(Di等人,2025年)。同样,同步抑制-激活机制也被用来在弱监督下实现细粒度定位(Fan等人,2025a)。总体而言,这些发展强调了挖掘因果生物标志物以应对生物医学预测任务固有复杂性的重要性。
本文提出了CausalMamba,这是一种因果双向选择性状态空间模型,它在单一表示学习框架内统一了多层次特征提取和因果推断,用于脑疾病的成像遗传学分析。具体来说,该模型首先将字符串编码的全基因组SNP序列分割成短片段,将每个位点转换为独热向量,并投影以获得SNP令牌嵌入;同时,3D全脑MRI被划分为不重叠的补丁,由DenseNet主干编码形成成像令牌特征。然后,两个因果推断模块明确选择因果SNPs和MRI令牌。与现有的直接构建遗传或成像特征与疾病状态之间因果联系的因果推断深度学习方法不同(Tang等人,2024年;Zhang等人,2023年),本文提出了一种基于反事实推理和对比学习的因果推断策略,以对齐遗传和成像特征,并通过成像特征建立从遗传特征到疾病的间接因果路径,如图1所示。最后,选定的SNP和MRI令牌被输入到两个双向选择性状态空间网络(BiMamba)中,这些网络具有SNP块和MRI补丁上的滑动窗口,以高效地将长距离依赖性整合到特定模态的全局表示中,用于疾病诊断。值得注意的是,我们的模型是在成像和遗传数据上训练的,但仅在遗传数据上进行测试。我们的方法使用两个公共数据集进行了验证:阿尔茨海默病神经影像学计划(ADNI)(Jack等人,2008年)和帕金森病进展标志物计划(PPMI)(Marek等人,2011年)。实验结果表明,CausalMamba在阿尔茨海默病(AD)和帕金森病(PD)分类任务上始终优于现有的成像-遗传学模型,实现了更高的诊断准确率和更低的计算成本。总之,本工作的主要贡献如下:
1)我们提出了一个基于因果推断策略和双向选择性状态空间的深度因果学习框架,用于从长序列遗传数据和全脑成像数据中高效提取特征,以进行脑疾病的成像遗传学分析。
2)提出了一种因果推断策略,结合反事实推理和对比学习来减少混杂偏差,并通过脑成像数据建立遗传数据与疾病之间的因果链。
3)我们的方法在ADNI和PPMI上进行了验证,证明了其能够以更高的准确性识别因果遗传和成像生物标志物,同时减少混杂偏差并提高AD和PD疾病的诊断潜力。
相关工作
相关工作
本节简要回顾了脑成像遗传学中关于长序列建模和生物标志物挖掘的相关工作,以用于疾病诊断。
方法
在本节中,我们介绍了用于遗传学、成像和疾病之间因果分析的CausalMamba模型。图2展示了所提出方法的总体框架,包括三个主要组成部分:局部特征提取、因果推断和全局特征提取。首先,从SNP序列和MRI扫描中独立提取局部特征,并将两种模态编码为令牌化表示。随后,采用了一种新的因果推断策略
结果
在本节中,我们展示了评估所提出的CausalMamba方法性能的实验。首先,我们生成了一个模拟MRI和SNP数据的合成数据集,以评估我们提出方法的因果推断能力。随后,我们在阿尔茨海默病(AD)和帕金森病(PD)诊断的真实世界遗传和MRI数据上进行了实验,使用的数据集来自阿尔茨海默病神经影像学计划(ADNI)(Jack等人,2008年)
结论
在这项研究中,我们介绍了CausalMamba,这是一种因果双向选择性状态空间模型,它有效地将特征提取和因果推断整合到一个统一的表示学习框架中,并通过因果正则化进行了增强。通过结合BiMamba架构和新的因果推断策略,我们的方法可以从遗传和MRI数据中识别潜在的因果特征。在ADNI和PPMI数据集上的实验评估证明了CausalMamba的优越性
CRediT作者贡献声明
刘洪瑞:撰写——原始草稿、可视化、验证、方法论、形式分析。桂园园:软件、方法论、数据管理。赵冰冰:软件、验证、撰写——审稿与编辑。卢慧:撰写——审稿与编辑、监督、数据管理。刘漫华:撰写——审稿与编辑、监督、资金获取、概念化。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号