空间转录组学中灵敏度、特异性和信号污染的解析

《Nature Methods》:Resolving sensitivity, specificity and signal contamination in Xenium spatial transcriptomics

【字体: 时间:2026年05月01日 来源:Nature Methods 32.1

编辑推荐:

  空间转录组学能够在完整组织中实现高分辨率基因表达图谱绘制。Xenium因其可靠性、可及性和数据质量而被广泛采用,但Xenium衍生数据的特性和局限性仍未得到充分表征。在此,研究人员展示了迄今为止最全面的Xenium数据集之一,涵盖使用多种基因Panel分析的超

  
空间转录组学能够在完整组织中实现高分辨率基因表达图谱绘制。Xenium因其可靠性、可及性和数据质量而被广泛采用,但Xenium衍生数据的特性和局限性仍未得到充分表征。在此,研究人员展示了迄今为止最全面的Xenium数据集之一,涵盖使用多种基因Panel分析的超过40个乳腺和肺肿瘤切片。利用这一资源,研究人员系统地剖析了技术噪声——包括转录本溢出——以及检测特异性、Panel性能和分割策略。他们证明单核RNA测序(single-nucleus RNA sequencing, snRNA-seq)能够精确量化转录本污染。基于这些发现,研究人员引入了SPLIT(Spatial Purification of Layered Intracellular Transcripts,空间分层细胞内转录本纯化),这是一种通过解析混合转录本信号来提高信号纯度的方法。SPLIT增强了背景校正和细胞类型分辨率,并能够揭示与恶性细胞共定位相关的T细胞耗竭特征——这些信号原本会被掩盖。总之,这些发现为Xenium性能提供了关键基准,并引入了一种可扩展的信号优化策略。
论文解读:Xenium空间转录组学中的灵敏度、特异性与信号污染解析
本研究由科研人员团队完成,发表于《Nature Methods》。随着空间分辨转录组学技术的快速发展,成像为基础的平台如Xenium、MERSCOPE和CosMx能够在细胞和亚细胞水平实现高分辨率转录本定量。然而,现有研究在数据规模和系统性比较上存在局限,通常仅包含少量患者样本或依赖组织微阵列,且缺乏对靶向Panel与新型5K Panel在转录本灵敏度和特异性方面的直接比较。此外,转录本错误分配导致的信号污染(signal contamination)问题,严重影响下游分析的准确性。为解决这些关键问题,研究人员构建了迄今为止最全面的Xenium数据集之一,旨在系统评估Xenium平台的性能特征,并开发新的计算方法以校正空间转录组学数据中的信号污染。
为实现上述目标,研究人员采用了多项关键技术方法。首先,构建了大规模临床样本队列,包含来自27名供体的41个组织切片(19个乳腺癌和22个非小细胞肺癌(NSCLC)切片),并使用了多种基因Panel(靶向Breast/Lung Panel、定制免疫肿瘤学Panel及5K PRIME Panel)进行分析。其次,结合匹配的单核RNA测序(snRNA-seq)数据作为参考,利用稳健细胞类型分解(Robust Cell Type Decomposition, RCTD)算法进行细胞类型注释和混合信号解析。第三,开发了SPLIT(Spatial Purification of Layered Intracellular Transcripts)计算方法,通过整合RCTD输出的权重与参考谱,对受污染的转录本信号进行解构和纯化。此外,还通过多重免疫组化(IHC)对特定细胞类型进行了正交验证。
研究结果
数据与实验概览
研究人员生成了来自乳腺癌和NSCLC样本的Xenium空间转录组数据,所有样本均进行了细胞分割以获得单细胞分辨率。结合匹配的snRNA-seq和IHC数据,研究人员展示了实验设计、每个样本的细胞数、每个细胞的转录本数和每个Panel的基因数的关键指标。
snRNA-seq数据实现Xenium数据集的稳健注释
利用部分匹配且已注释的snRNA-seq数据集,研究人员应用RCTD将细胞类型注释转移到每个Xenium样本。结果显示,RCTD在双联体(doublet)模式下不仅能识别细胞类型,还能有效处理由分割误差或转录本溢出引起的混合信号,证明了匹配参考在癌症研究中的价值。
Xenium数据在患者和技术重复间表现出高度一致性
通过对所有样本进行基于Uniform Manifold Approximation and Projection (UMAP)的联合分析,研究人员发现技术重复产生的数据具有近乎完美的 concordance,证实了该平台的高重现性。非恶性细胞群在不同个体间保持一致,而恶性细胞则呈患者特异性聚类,且无需批量校正即可实现跨样本的细胞类型一致性。
靶向基因Panel在灵敏度上优于5K Panel
尽管5K Panel检测到的转录本和基因总数更高,但在控制基因含量后,其灵敏度反而低于靶向Lung Panel。约60%的5K数据集细胞因低转录本计数未能通过质量控制(QC)。这表明5K Panel虽然覆盖基因更广,但存在显著的灵敏度权衡。
靶向和5K Panel在细胞类型组成上显示出高度一致性
尽管5K Panel灵敏度降低,但相邻切片间的细胞类型组成仍具有良好的一致性。靶向Panel(Custom IO和Lung)之间的一致性最高,表明Xenium对基因Panel设计的变异具有鲁棒性。
靶向基因Panel为定义主要细胞类型提供了广泛信息
即使限制在共享基因集内,Chromium数据也能实现清晰的细胞类型分离,这表明Xenium数据中观察到的分辨率降低并非完全归因于分析基因数量的减少,而是与转录本溢出导致的细胞类型边界模糊有关。
Xenium数据表现出显著的转录本溢出
研究人员利用RCTD双联体模式发现,所谓的“双联体”实际上反映了信号混合而非生物学上的真实双联体,因此将其称为“污染”。通过分析细胞局部邻域中次要细胞类型的丰度与RCTD分配的权重(w2)之间的关系,证实了存在显著的二维平面转录本溢出。定义了溢出指数(spillover index),发现恶性细胞具有最高的溢出倾向。IHC染色进一步验证了肿瘤细胞特异性转录本扩散至邻近CD8+T细胞的现象。
信号分解减少溢出并增强细胞类型纯度
基于此,研究人员提出了SPLIT框架。SPLIT利用RCTD模型和细胞分解,将混合表达谱按比例分配给最可能的来源。UMAP嵌入显示,经SPLIT校正后的细胞聚类得到改善。SPLIT默认保留主要细胞类型的表达谱,并能利用空间信息选择性地进行分解,从而避免了对参考中缺失表型(如循环肿瘤细胞)的过度校正。
SPLIT与其他校正方法的比较优势
通过与ResolVI和ovrlpy等其他校正方法的比较,SPLIT在细胞类型分离、与Chromium snRNA-seq谱的余弦相似性方面表现最佳。虽然所有校正方法都能减少污染,但ovrlpy和ResolVI会大幅减少基因数量并产生大量空细胞,而SPLIT能更好地保留基因检出率。结合ProSeg分割算法时,SPLIT取得了最大的整体改进。
靠近恶性细胞的T细胞表现出增加的耗竭特征
在生物学验证方面,研究人员比较了靠近恶性细胞和远离恶性细胞的T细胞表型。在原始数据中,靠近肿瘤的T细胞表现出虚假的恶性和上皮基因特征富集。经过SPLIT校正后,这些非特异性信号被去除,同时保留或增强了T细胞特征,特别是耗竭标志物如HAVCR2 (TIM-3)、CTLA4、PDCD1、LAG3和CXCL13的表达显著增强。
讨论与结论
研究人员讨论了本研究的主要发现及其意义。首先,大规模Xenium数据集的分析证实了其高质量、高重现性,为单样本和多样本空间研究提供了坚实基础。其次,关于Panel设计的比较揭示了靶向Panel虽基因少但灵敏度高,足以解析主要细胞类型;而5K Panel虽覆盖面广但单基因灵敏度较低,这为未来Panel的优化提供了依据。
研究确认了Xenium数据易受转录本污染的影响,这种污染源于分割不准确和转录本溢出。利用互补的RCTD反卷积和IHC数据,研究揭示了这种伪影普遍存在,且不成比例地影响低RNA含量的细胞(如T细胞)。这强调了开发稳健计算策略以校正污染的必要性,尤其是在推断细胞生态位(niches)时。
研究人员展示了结合snRNA-seq作为参考能显著增强细胞类型注释。SPLIT作为一种新颖的信号纯化方法,通过分解混合信号来校正转录本溢出。与现有的校正方法相比,SPLIT不易产生过度校正伪影,保留了更多的基因检出量,且具有更好的可解释性。尽管SPLIT最初是为RCTD开发的,但它现在是去卷积无关的,支持通用的去卷积输出。
最后,研究人员指出了使用SPLIT时的注意事项,包括解释混合细胞表型时的挑战,以及在参考中缺少特定表型时可能导致的错误分解。未来的工作将集中于开发无需参考的SPLIT版本,以进一步扩展其适用性。总之,本研究为Xenium平台的性能提供了关键基准,并提出的SPLIT方法为空间转录组学数据的信号优化提供了一个可扩展的策略。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号