综述:用于空间多组学整合的计算方法

《Biotechnology Advances》:Computational methods for spatial multi-omics integration

【字体: 时间:2026年01月20日 来源:Biotechnology Advances 12.5

编辑推荐:

  空间多组学整合算法研究综述,系统分类比较了生成-概率框架、图表示学习框架及矩阵分解混合框架,分析了转录组-表观组-蛋白质组数据融合策略,总结下游任务如细胞异质性分析及疾病机制探索,并指出数据不平衡、非线性关系建模等核心挑战。

  
敖云庚|崔春燕|罗振杰|徐俊林|孟亚杰|崔菲菲|魏乐怡|邹全|张子龙
海南大学计算机科学与技术学院,海口570228,中国

摘要

空间多组学技术的快速发展使得可以从同一组织切片中同时获取转录组学、蛋白质组学和表观基因组学信息。然而,不同模态在分布特性、数据维度和噪声水平上存在显著差异,加之空间信息本身的稀疏性和不完整性,给数据整合和建模带来了重大挑战。近年来,基于深度学习的空间多组学整合算法迅速涌现,为构建统一的潜在表示和实现跨模态融合提供了新的方法。在这篇综述中,我们首次系统地总结了现有的空间多组学整合方法,并从两个角度对它们进行了分类和比较。我们不仅系统地调查了这些方法使用的数据集,还强调了它们支持的关键下游分析任务,并进一步总结了当前空间多组学整合研究中面临的主要挑战。此外,我们比较了不同方法的优点和局限性,以帮助研究人员更有效地选择合适的方法,从而推进空间多组学在揭示组织微环境和疾病过程的多层调控机制中的应用。

引言

在多细胞系统中,空间组织不仅是维持细胞秩序的外部形式,也是决定细胞分化轨迹和功能发展过程的基本因素(Tirosh等人,2016年)。在发育过程中,精确的空间分隔确保了正确的细胞分化和组织的适当形成,这对生长和功能维持至关重要。合理的空间排列能够实现高效的细胞间信号传递和交流,保证营养物质和能量的有序分布,并允许快速响应环境变化,从而维持生物体的动态平衡和稳态。然而,在病理状态下,空间组织的破坏通常伴随着功能受损;例如,在癌症中,不受控制的细胞增殖和结构紊乱会损害组织功能并引发系统性健康问题(Egeblad等人,2010年)。因此,深入理解空间组织不仅有助于揭示多细胞生物学的基本原理,还为人类健康和疾病机制提供了理论见解(Vandereyken等人,2023年;Duan等人,2024年)。
随着高通量测序技术的不断进步,单细胞测序大大加速了细胞生物学和疾病机制的研究(Stark等人,2019年)。然而,单一组学层面往往不足以完全捕捉细胞状态和功能。单细胞多组学的出现旨在整合多模态信息,从而提供更全面的细胞特征描述(Li等人,2023年;Zhang等人,2022年;Zhang等人,2025a)。不同的组学模态在细胞类型识别方面具有互补的优势,有助于更深入地探索健康和疾病背后的分子机制。尽管如此,单细胞多组学技术通常需要细胞分离,这会导致空间背景的丢失以及分子表达变化与空间邻近性和细胞间相互作用的脱钩(Zhang等人,2021年)。空间转录组学克服了这一限制。现有的空间转录组学技术大致可以分为两类:基于测序的方法和基于成像的方法。基于测序的平台和技术,包括ST(St?hl等人,2016年)、10× Visium(Lewis等人,2021年)、Slide-sEq.(Rodriques等人,2019年)和Stereo-sEq.(Chen等人,2022年),通常使用空间条形码阵列或荧光编码策略从组织切片中捕获mRNA分子。捕获的转录本随后通过高通量测序进行反转录和定量,从而实现全基因组范围的基因表达分析。因此,基于测序的空间转录组学数据目前是计算方法开发中最广泛使用的输入。相比之下,基于成像的平台如MERFISH(Chen等人,2015年)、seqFISH+(Eng等人,2019年)、CosMx SMI(Wu等人,2024年)和Xenium(Huynh等人,2025年)依赖于迭代轮次的原位杂交、荧光成像或原位扩增,直接在显微镜下解码单个mRNA分子的空间位置,实现单细胞甚至亚细胞分辨率。由于这些根本性的差异,这两种技术范式在捕获机制、空间分辨率、基因通量、噪声特性和数据表示方面存在显著差异,共同构成了当代空间转录组学的核心技术景观。最近,空间多组学技术进一步发展,能够在同一组织切片中同时获取多种分子模态的信息。这提供了每个点的多维和互补视图,揭示了转录组学和蛋白质组学表达之间的差异,突出了代谢和表观遗传修饰在调节细胞状态中的关键作用,并促进了组织结构与功能之间关系的深入研究(Vandereyken等人,2023年)。
近年来,空间多组学平台和技术(例如SPOTS(Ben-Chetrit等人,2023年)、MISAR-sEq.(Jiang等人,2023年)、Stereo-CITE-sEq.(Liao等人,2004年)、Spatial CUT&Tag-RNA-sEq.(Li等人,2025a)的快速发展以及数据的爆炸性增长带来了重大的分析挑战。首先,不同的组学数据集在分布、规模和噪声特性上存在显著差异,简单的串联通常会导致信息冗余甚至关键信号的丢失。其次,空间多组学数据通常具有明显的稀疏性和技术噪声,尽管其表现因不同的模态和检测技术而异。例如,空间转录组学数据通常表现出零膨胀现象(Shang和Zhou,2022年;Covert等人,2023年;Miao等人,2021年;Cui等人,2025a;Li等人,2024a)。在空间蛋白质组学中,基于质谱的方法往往受到低丰度蛋白质检测灵敏度有限的限制(Breckels等人,2024年;Mund等人,2022年;Jiang等人,2024年;Qian等人,2006年),而基于抗体的多重免疫测定(如CITE-seq或多重免疫荧光)则更常遇到抗体特异性、背景信号和有限面板大小相关的挑战(Mou等人,2022年;Black等人,2021年)。此外,尽管不同模态提供了互补的信息,但它们之间的关系往往是非线性和动态的,使得用传统的统计方法难以准确建模。更重要的是,在当前的实验条件下,同一样本中不同模态的数据质量和信噪比往往高度不平衡。如果在数据融合过程中某个模态被过度加权或过度对齐,最终的联合潜在表示可能会被该模态主导,从而降低其他模态信息的有效保留和贡献,最终影响整合结果的可靠性和稳健性。因此,基于深度学习的空间多组学整合算法的发展成为全面解释细胞异质性和功能状态的关键方法论范式(Coleman等人,2024年;Walsh和Quail,2023年;Gao等人,2025年;Luo等人,2025年;Fu等人,2025年;Cui等人,2025b)。为了解决这些挑战,自SpatialGlue(Long等人,2024年)引入以来,出现了许多基于深度学习的方法,重点关注多组学融合(Zhou等人,2025年;Li等人,2025b;Chen等人,2025a;Cai等人,2025)和表示学习(Tian等人,2024年;Coleman等人,2025年;Yao等人,2025年;Yan等人,2010年)。
在空间多组学研究中,实验设计可以根据获取不同组学模态的方式分为同一切片和连续切片策略。同一切片设计在同一组织切片上同时或依次测量多种分子模态,从而在坐标层面实现模态间的内在空间对齐,因此更适合在同一空间单元上进行纵向空间多组学整合。相比之下,在连续切片设计中,不同的组学数据来自相邻或不同的组织切片,通常需要额外的横截面注册和映射程序,使得整合过程更接近于“对角线”整合。如图1所示,本综述的重点是将空间多组学整合作为空间生物学中的核心研究方向。总体目标是在保留空间组织结构的同时,联合建模来自同一组织切片的多层分子信息,从而学习统一且可解释的潜在表示,以便于表征细胞异质性、跨模态调控关系以及组织微环境中的潜在动态轨迹演变(Long等人,2024年;Liu等人,2008年;Miao等人,2025年;Argelaguet等人,2020年;Ashuach等人,2023年)。值得注意的是,大多数现有和广泛采用的纵向空间多组学整合方法主要是为点级空间数据设计的,通常专注于两种组学模态的联合测量,如转录组学-蛋白质组学或转录组学-表观基因组学。在此背景下,本综述特别关注此类纵向空间多组学整合场景,并提供了相关计算模型和方法的系统概述和分析。
在这篇综述中,我们首次系统而全面地调查了空间多组学整合算法,特别关注了从同一组织切片收集的多模态分子测量数据的整合方法。首先,我们系统地回顾了目前空间多组学整合算法使用的数据集。然后,我们从两个角度对现有算法进行了分类和比较:(i)算法框架,包括生成框架和概率框架、基于图的表示学习框架以及矩阵分解和混合框架;(ii)空间多组学融合策略,包括基于串联的融合、注意力引导的融合和子空间分解融合。随后,我们总结了空间多组学整合的下游任务,这些任务不仅展示了方法论的实用性,还为推进多组学研究提供了具体的生物学目标。最后,我们分析了当前空间多组学研究中存在的问题和挑战。

部分摘录

空间多组学的数据来源

随着空间多组学平台和技术的快速发展,不同平台和测序方法生成的可公开数据量稳步增加,这为整合工具的发展带来了重大挑战和机遇。在当前的空间多组学算法开发领域,可用的数据集主要集中在转录组学-蛋白质组学和转录组学-表观基因组学的联合测量上。

挑战与未来展望

尽管过去两年空间多组学整合算法取得了显著进展,但整个领域仍处于快速发展阶段,仍在实验和计算建模层面面临一系列未解决的挑战。一个核心挑战在于跨模态的统一编码,即如何将具有显著不同来源、规模和噪声特性的多个组学特征共同映射在一起

结论

空间多组学整合算法正在快速发展,为从统一的角度联合解释多模态分子信息和组织空间结构提供了新的方法论框架。在这篇综述中,我们首次系统地总结了现有的空间多组学整合方法,强调了如何将转录组学、表观基因组学和蛋白质组学层次与空间坐标共同建模。这一新兴领域为

资助

本工作得到了国家自然科学基金(编号:62131004、62261018)、海南省自然科学基金(编号:324MS009)和海南省科技专项基金(编号:ZDYF2024GXJS018)的支持。

利益冲突声明

作者声明没有利益冲突。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号