SpaMode:一种广泛适用的利用多模态解缠专家解析空间多组学的框架

《Advanced Science》:SpaMode: A Broadly Applicable Framework for Deciphering Spatial Multi-Omics Using Multimodal Mixture of Disentangled Experts

【字体: 时间:2026年05月06日 来源:Advanced Science 14.1

编辑推荐:

  空间多组学技术能够在组织原位同时分析多种组学特征,为研究生物过程和疾病提供了前所未有的机遇。随着对组织空间结构研究的复杂性增加,需要能够支持垂直(同一切片内)、水平(跨切片)和镶嵌(跨不同组学)整合的广泛适用模型。在此,研究人员提出了SpaMode,这是一个广

空间多组学技术能够在组织原位同时分析多种组学特征,为研究生物过程和疾病提供了前所未有的机遇。随着对组织空间结构研究的复杂性增加,需要能够支持垂直(同一切片内)、水平(跨切片)和镶嵌(跨不同组学)整合的广泛适用模型。在此,研究人员提出了SpaMode,这是一个广泛适用的框架,旨在适应所有三种模式及四种组学类型(包括转录组学、蛋白质组学、表观基因组学和代谢组学)的空间多组学整合。SpaMode将每种组学模态解缠为模态不变(modality-invariant)和模态特异(modality-variant)分布,以表征潜在的生物分子共性和特异性,随后分层聚合这些分布以解决空间异质性。水平和镶嵌整合通过多切片联合正则化和缺失模态翻译在SpaMode框架内实现统一。研究人员在垂直、水平和镶嵌整合方面对SpaMode进行了基准测试,结果表明SpaMode在所有整合设置中均优于现有的针对性方法。此外,SpaMode就不变和可变的多层次生物分子特征如何不同地贡献于组织空间背景提供了新颖的见解,为黑盒神经网络提供了一种可解释的替代方案。SpaMode为空间多组学数据分析提供了通用且值得信赖的解决方案,为系统解码细胞状态和疾病演变的原位复杂机制铺平了道路。
该研究针对空间多组学数据在垂直、水平和镶嵌三种整合场景下的计算挑战,提出了一种名为SpaMode的通用框架。SpaMode的核心在于构建一个多层次关联网络(multi-level association network),融合K近邻(KNN)图和空间邻近关系。其模型架构采用解缠变分自编码器,将每种组学模态编码为模态不变(modality-invariant)和模态特异(modality-variant)分布,并通过混合专家加权机制(Mixture of Experts Weighting, MoEW)进行自适应组合,最终利用变分混合策略(Variational Mixing)生成统一的联合分布。研究使用了包括模拟数据及人类淋巴结(HLN)、扁桃体(HT)、小鼠胚胎(MISAR)、小鼠脑(MB)、透明细胞肾细胞癌(ccRCC)在内的多个真实数据集进行验证。结果表明,SpaMode在识别空间域、消除批次效应及缺失模态填补方面均表现出色,且具有良好的生物学可解释性。该研究成果发表于《Advanced Science》。
关键技术方法主要包括:构建基于特征KNN图和空间KNN图的融合多层次关联网络;采用解缠图变分自编码器(Graph Variational Autoencoder)框架分离模态不变与模态特异特征;引入混合专家加权机制(MoEW)自适应调整特征权重;利用专家乘积(Product of Experts, PoE)进行多组学变分混合;通过多切片联合正则化实现水平和镶嵌整合;以及利用图卷积网络(GCN)解码器重构输入数据并辅以对抗学习确保特征解缠。样本队列来源于公开的转录组-蛋白组(Visium CytAssist)、转录组-表观组(MISAR-seq)及转录组-代谢组(ccRCC)测序数据。
1. SpaMode解析组织空间异质性
在垂直整合任务中,SpaMode在人类淋巴结(HLN)和人类扁桃体(HT)的RNA-ADT(转录组-蛋白组)联合分析中,相比SpatialGlue、COSMOS等方法,识别出与真实情况最一致的空间域,并在八项定量指标上表现最优。研究人员发现,多层次关联网络比单一模态图能捕获更多真实的spot间连接。MoE加权可视化揭示了RNA和ADT模态在不同组织区域(如皮质、髓质窦)对不变与可变特征的差异化关注。在RNA-ATAC(转录组-表观组)整合中,SpaMode在模拟数据和小鼠胚胎数据集上也取得了最佳性能,并能结合外部单细胞RNA测序(scRNA-seq)参考数据进行扩展分析,显著提升了解析精度。在RNA-代谢组联合分析中,SpaMode成功解析了肾癌肿瘤微环境,量化了恶性区域(依赖转录组方差)与基质区域(依赖代谢特征)的模态贡献差异。
2. SpaMode在多切片中捕获生物信号并消除批次效应
在水平整合任务中,SpaMode利用跨批次特征图和联合正则化,有效消除了模拟数据集和小鼠胚胎多切片数据中的批次效应。UMAP可视化和k-BET指标表明,SpaMode生成的潜在嵌入既能保持跨切片的类别信息,又能显著优于GraphST、STAligner等基线方法,实现了稳健的多切片联合分析。
3. SpaMode整合镶嵌多组学并翻译空间表达谱
针对镶嵌整合(部分切片缺失模态)的挑战,SpaMode通过将任务转化为近似缺失模态的主成分(PC)特征,再进行垂直整合来解决。在人类扁桃体和小鼠胚胎数据集上,SpaMode在缺失模态推理任务中表现出最高的Moran's I值和最低的Geary's C值,证明了其识别低噪声空间区域的能力。此外,SpaMode还能重建缺失模态的原始计数矩阵,其翻译出的空间表达模式与真实情况高度吻合(Pearson相关系数PCC更高)。
讨论
SpaMode是一个通用且可解释的空间多组学解析模型。它通过构建多层次关联网络和细粒度解缠变分学习,全面表征了空间背景下的多组学特征分布。与现有模型相比,SpaMode具有四大优势:一是通用性强,不局限于特定任务设计;二是首次打破了不同组学模态间的信息壁垒;三是通过权重可视化提供了编码过程的可解释性;四是通过重建缺失模态降低了后续研究成本。尽管原始测序数据存在稀疏性问题,但SpaMode通过对低维连续潜在嵌入施加高斯先验有效缓解了这一问题。未来,随着空间组学技术发展,SpaMode有望支持更多模态(如H&E图像)的整合,并进一步扩展至处理非配对数据的联合整合与推理,为挖掘空间多组学数据中的生物标志物和调控关系提供新的解决方案。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号