S2potAE：一种集成空间转录组学、组织学和空间坐标的多模态深度学习框架用于精确的spot去卷积

《Briefings in Bioinformatics》：S2potAE: multimodal spatial spot autoencoder integrating image and transcriptomic features for deconvolution

【字体：大中小】 时间：2026年02月01日 来源：Briefings in Bioinformatics 7.7

编辑推荐：

　　本刊推荐：本文提出S2potAE——首个统一的多模态深度学习框架，创新性地整合空间转录组学（ST）数据、组织学图像特征和空间坐标信息，通过图神经网络（GNN）编码空间上下文、多尺度视觉特征提取和辅助病理分类任务，显著提升了spot水平细胞组成解卷积的准确性与生物学可解释性。该方法在模拟和真实数据集（如10x_HBC、DLPFC）上均优于现有方案（如Tangram、GraphST），为解析组织微环境异质性提供了强大工具。

S²potAE框架架构与多模态集成

空间转录组学（ST）技术的快速发展为解析组织空间异质性提供了前所未有的机会，但spot水平数据的细胞组成解卷积仍是一个重大挑战。现有方法往往难以同时有效利用ST数据固有的多模态信息——包括基因表达矩阵、空间坐标和匹配的组织学图像。为此，本研究提出了S²potAE，一个新颖的多模态深度学习框架，旨在通过集成这些异构数据源来实现精确的spot去卷积。

S²potAE的核心是一个条件自编码器结构，其编码器（E）将真实的ST数据（X_real）映射到潜在空间，而解码器（D）则负责从潜在表示中重建ST矩阵。该框架独特地包含了三个关键模块：Spot Correlation Encoding (SCE)、Spot-level Feature Extraction (SFE)以及一个辅助的Spot Pathological Classification (SPC)任务。

通过图编码建模空间依赖性

为了捕捉真实ST数据中spot之间的空间关系，SCE模块利用位置信息构建了一个基于图的表示。具体而言，通过识别每个spot的k-近邻（KNN, k=5）来构建邻接矩阵A_ij，并引入自环进行归一化以确保数值稳定性。图编码器（E_G）通过多层图卷积层传播和变换节点特征，其前向传播公式为H^(l+1)= σ(?^-1/2??^-1/2H^(l)W^(l))，其中H^(l)是第l层的节点特征矩阵，W^(l)是可学习的权重矩阵，σ(·)是ReLU激活函数。最终输出的图编码特征（X_real^g）既包含了基因表达谱，也编码了空间位置信息。这些特征随后被送入编码器E生成中间表示（f_real^g），并在解码阶段通过融入位置编码结构来确保重建的ST矩阵保持空间一致性。

spot级特征提取与融合

ST数据通常配有H&E染色的组织学图像，为解读空间基因表达提供了至关重要的形态学背景。SFE模块旨在利用这一信息。对于真实数据中的每个spot，以其为中心提取多尺度图像块（P_s，如P₁₅₀, P₁₀₀, P₅₀）。每个图像块被输入到UNI编码器以获得token级特征：f_UNI⁽ⁱ⁾= UNI(P_s⁽ⁱ⁾)。收集所有尺度的输出后，应用自注意力池化（AttnPool）为每个尺度生成紧凑的表示：p_s= AttnPool(U_{f_uni}) = softmax(W_(i)f_UNI⁽ⁱ⁾/ √d) f_UNI⁽ⁱ⁾。随后，设计了一个专门的多层感知机（MLP）融合结构，将这些多尺度表示整合成一个统一的spot级感知特征嵌入（f_perc= F_fuse(concat(p_s))）。为了将这些感知先验注入到条件解码阶段，解码器D采用了基于注意力的融合策略。具体来说，感知嵌入作为Transformer多头注意力块中的Key和Value向量，而来自ST数据的中间级特征（f_real^g）作为Query。这种跨模态注意力机制表示为Attn(Q, K, V) = softmax(QK^T/√d_k)V，其中Q = f_real^gW_Q, K = f_percW_K, V = f_percW_V。

作为去卷积辅助任务的spot病理分类

spot去卷积的基本目标是推断每个空间spot的细胞比例组成。对于模拟的ST数据，模拟的病理区域比例由Y_prop表示。编码器E根据模拟的ST数据（X_simu）生成潜在表示f_latent^simu= E(X_simu)。同时，我们提出了一个名为Spot Pathological Classification (SPC)的辅助任务，明确利用spot级的病理注释来补充主要的去卷积任务。具体地，使用来自真实ST图像的标注病理标签（Y_hist）。真实标注spot的潜在表示类似地通过编码器E获得：f_latent^hist= E(X_real)。认识到这两个任务的互补性，我们引入了一个精心设计的三层MLP作为共享特征提取器（F_shared），生成共享嵌入f_shared^simu和f_shared^hist。这些共享嵌入随后被它们各自的预测头使用，以强制执行隐式对齐和跨任务特征一致性。

对于spot去卷积任务，病理比例预测器（C_prop）输出每个spot的估计比例组成：?_prop= C_prop(f_shared^simu)。主要的去卷积损失L_deconv定义为分类交叉熵损失。对于辅助的spot病理分类任务，病理分类头（C_hist）预测每个标注spot的病理类别：?_hist= C_hist(f_shared^hist)。相应的辅助分类损失L_hist也使用分类交叉熵来制定。

总体损失与优化

为了全面优化S²potAE框架，我们整合了多个互补的损失函数。首先，采用基于均方误差（MSE）的重建损失（L_recon）来确保空间基因表达模式的准确重建。为了处理模拟和真实ST数据之间的分布差异，我们采用了一个基于梯度反转层（GRL）的域判别器（M），通过对抗性训练促进域不变特征学习，增强了潜在表示的跨域泛化能力和生物学一致性。域判别损失定义为一个二元交叉熵目标（L_match）。S²potAE架构的总训练损失将所有定义的损失组件整合到一个统一的优化目标中：L_total= L_deconv+ λ₁·L_hist+ λ₂·L_recon+ λ₃·L_match，其中超参数λ₁, λ₂, λ₃平衡每个损失项的相对重要性，以确保稳定有效的训练。

使用S²potAE进行稳健的spot去卷积

在模拟数据和真实ST数据集上的评估表明，S²potAE在spot级去卷积任务中 consistently 优于八种最先进的spot去卷积方法（包括Tangram, GraphST, Spoint, Cell2location, DestVI, scpDeconv, SpaDeconv, MACD）。在32个模拟数据集上，S²potAE实现了平均PCC为0.7951，以0.0197的幅度超过了第二好的方法MACD。对于真实数据集（如10x_HBC, 10x_MBA, DLPFC），该方法展示了强大的泛化能力，PCC值 consistently 高于其他方法，改进幅度高达0.0340。

真实数据集中空间解析的spot去卷积

在10x_MBA（小鼠脑图谱）数据集中，该方法准确地重建了神经元层的空间分布，与组织学H&E染色图像中观察到的相应解剖结构紧密对齐。在DLPFC（人背外侧前额叶皮层）数据集中，S²potAE在白质区域和细胞组成分析方面明显优于现有方法，能够精确地解卷积关键细胞类型，如“Micro/Macro”和“Oligos_1”，并显示出增强的空间分辨率。

模型组件和收敛行为的综合分析

消融研究揭示了SCE和SFE模块以及辅助损失函数（L_hist和L_match）的贡献。包含SCE在所有数据集上都带来了显著的性能提升。同样，添加SFE模块（从组织学图像中提取分层空间特征）在三个测试数据集（10x_HBC, 10x_MBA, DLPFC）上也带来了一致的性能增益。辅助病理分类损失（L_hist）作为有效的正则化机制，指导模型学习更具生物学意义和空间一致性的表示。域匹配损失（L_match）被发现在数据集表现出强烈的域特异性变异时能提高泛化能力。收敛曲线可视化显示，所有四个损失组件（L_deconv, L_hist, L_recon, L_match）在多个ST数据集上都能稳定下降并收敛，证明了该框架的鲁棒性。

病理感兴趣区域（ROI）

对病理ROI的剖析揭示了不同的免疫和基质细胞群在不同组织区室（如肿瘤核心、边界和瘤周基质）中的差异定位。例如，管腔细胞在上皮区域富集，而巨噬细胞/树突状细胞/单核细胞簇主要定位于基质和免疫浸润区域。内皮细胞亚型（包括淋巴和血管内皮细胞）突出了血管系统和淋巴引流空间组织。浆细胞、NK细胞和B细胞的存在和空间分布为了解局部免疫监视和反应提供了额外的见解。

BRCA组织微环境中细胞类型的空间映射

在10x_HBC（人类乳腺癌）数据集中，可视化分析表明，淋巴管内皮细胞主要位于肿瘤区域的外周和专门的血管生态位中。B细胞在肿瘤边界和相邻的基质区室中富集。管腔上皮细胞密集集中在肿瘤和癌前区域的上皮核心。这种区室化突出了细胞群的空间异质性，并强调了组织内恶性、基质和免疫元素之间复杂的相互作用。

跨平台和进一步的生物学验证

在Slide-seqV2海马数据集和MERFISH下丘脑数据集上的额外实验证明了S²potAE在不同ST平台和生物背景下的鲁棒性和泛化性。该方法在解析精细的解剖结构和区分具有挑战性的区域（如CA3和MH）方面表现出色，生成的 spatial domains 更少碎片化，更具生物学连贯性。

在计算机模拟伪影扰动下的鲁棒性评估

为了全面评估模型的鲁棒性，进行了全面的计算机模拟扰动实验，系统性地模拟了H&E染色组织学图像中常见的伪影（如裂纹、组织褶皱、染色不规则及其组合）。定量评估表明，该模型在个体扰动条件下表现出稳定可靠的性能。仅在组合扰动条件下观察到更明显的性能下降，但模型仍保留了强大的预测能力，表明即使在存在严重成像缺陷的情况下也具有鲁棒性能。

讨论：S²potAE鲁棒性的架构基础

S²potAE的鲁棒性源于其显式的多模态正则化框架，而不是任何单一的架构组件。通过联合利用空间转录组、空间坐标和组织学图像特征，该模型整合了互补的生物信息来源。这种多模态融合不仅丰富了表示学习，而且作为防止过度拟合模态特定噪声或伪影的天然保障。此外，使用辅助任务和域适应作为额外的正则化，鼓励模型学习具有生物学意义和域不变的特征。这些设计选择确保了S²potAE在不同数据集、组织类型和技术条件下保持稳定的性能。

结论

S²potAE是一个创新的空间自编码器框架，通过系统整合空间坐标、组织学图像特征和转录组谱，显著增强了spot水平细胞组成推断。其多级聚合策略有效捕捉了异质组织固有的复杂空间依赖性和形态特征。该框架在模拟和真实世界数据集上的广泛评估证明了其准确剖析细胞异质性、精确描绘肿瘤边界和稳健处理复杂组织架构的能力。展望未来，S²potAE可作为ST分析的基础方法论，促进对组织组织和病理学的更深入生物学洞察。

热点排行

新闻专题