《NAR Genomics and Bioinformatics》:SM3DD with segmented PCA: a comprehensive method for interpreting 3D spatial transcriptomics
编辑推荐:
为解决空间转录组分析中细胞分割算法依赖性强、忽略三维空间信息的问题,研究人员开发了标准化最小三维距离(SM3DD)方法,结合分段主成分分析(PCA),在SARS-CoV-2感染肺组织和肺纤维化样本中成功识别出干扰素信号、细胞外基质沉积等关键通路,甚至无需病毒转录本即可检测"SARS-CoV-2感染"通路。该方法为空间转录组学提供了无需细胞注释的全局分析新范式,显著提升病理机制的解读深度。
当科学家试图在组织切片中解读生命的分子密码时,空间转录组学技术让他们能够看到基因在细胞中的"居住地图"。然而,现有的分析方法大多依赖细胞分割算法——这种需要先勾画出每个细胞边界的方式,在细胞形态高度异质性的组织中往往力不从心,更遗憾的是,现有方法常常将三维数据压缩为二维,忽略了生物组织原本的立体结构。如何在避免细胞分割误差的前提下,充分利用空间转录组数据的三维信息,成为领域内亟待突破的瓶颈。
针对这一挑战,研究团队在《NAR Genomics and Bioinformatics》上发表了一项创新研究,开发了名为标准化最小三维距离(Standardised Minimum 3D Distance, SM3DD)的全新分析方法。该方法完全摆脱了对细胞分割或注释的依赖,通过计算每个转录本位置到各类转录本的最短三维距离,并进行标准化处理,从而捕捉转录本在空间上的邻近关系变化。更巧妙的是,团队还引入了分段PCA策略,将分析按转录本类型进行分割,进一步提升了通路水平分析的灵敏度。
研究人员将SM3DD应用于两个重要疾病模型:一是比较16例正常肺组织与18例因SARS-CoV-2感染导致急性呼吸窘迫综合征(ARDS)的尸检肺组织(使用CosMx?空间分子成像仪获得1000重数据);二是分析8例肺纤维化患者匹配的"高纤维化"与"低纤维化"区域(公开Xenium 343重数据集)。令人惊叹的是,即使检测面板中不包含任何SARS-CoV-2转录本,该方法仍能通过宿主转录本的空间分布变化识别出"SARS-CoV-2感染"通路。
关键技术方法
研究采用CosMx?空间分子成像仪对组织微阵列进行三维空间转录组检测(Z轴深度6.4微米),通过计算每个视野内所有转录本到各类转录本的最短三维距离并标准化,获得SM3DD矩阵。采用分段PCA分析差异,使用t检验比较组间距离均值(FDR校正),并通过PathCard数据库进行通路富集分析。肺纤维化数据来自公开Xenium数据集。
计算结果
Mean SM3DD comparison between SARS-CoV-2 and normal
在SARS-CoV-2与正常样本的比较中,45%的转录本对距离存在显著差异。最显著的差异是FKBP11与MZT2A转录本间距离缩短(P=1.06×10?17)。聚类分析显示功能相关基因自动聚集,如FKBP11与干扰素受体亚基聚类。通路分析识别出干扰素γ信号、ECM沉积、病原体吞噬等关键过程。
Segmented PCA facilitates pathway identification
分段PCA在前四个维度识别出12条SARS-CoV-2相关超级通路,包括"先天免疫系统""神经生长锥坍塌"等新机制。该方法无需先验知识即发现O2/CO2交换、脂肪酸生物合成等代谢重编程过程。
Fibrotic Lung
在肺纤维化模型中,SM3DD成功检测到未折叠蛋白反应和脂代谢紊乱。分段PCA进一步揭示表面活性物质代谢紊乱(与CSF2R缺陷相关)以及FOXA1/PPAR信号通路失调是纤维化进展的关键特征。
研究结论与意义
SM3DD通过极大量的转录本间距离计算,突破了空间转录组低密度数据的限制。其不仅能验证已知病理机制(如干扰素风暴、ECM重塑),更发现了神经轴突导向异常、脂代谢重编程等新现象。特别值得注意的是,该方法对红细胞、神经末梢等难以分割的细胞类型同样有效,首次报道了SARS-CoV-2感染肺组织中可能存在神经生长锥坍塌现象。在肺纤维化应用中,SM3DD揭示了表面活性物质代谢与脂质稳态的深层关联,为理解纤维化提供了新视角。该方法代码已开源,随着全转录组空间检测技术的发展,这种无细胞分割的分析范式有望成为空间多组学研究的标准工具。