PathCLAST:基于通路增强对比学习的可解释空间转录组学分析新方法

《Briefings in Bioinformatics》:PathCLAST: pathway-augmented contrastive learning with attention for interpretable spatial transcriptomics

【字体: 时间:2026年02月03日 来源:Briefings in Bioinformatics 7.7

编辑推荐:

  本文推荐一种名为PathCLAST的创新计算框架,该研究针对当前空间转录组学工具在识别组织空间域时存在的生物学解释性不足、难以有效整合多模态数据等挑战,通过将基因表达谱转化为具有生物学意义的通路图,并与组织病理学图像进行双模态对比学习,实现了高精度且可解释的空间域识别。研究结果表明,PathCLAST在多个公共数据集上均达到领先性能,并能揭示域特异性通路特征、空间自相关及域间相互作用,为深入解析肿瘤微环境的空间异质性提供了有力工具。

在生物医学研究领域,解密分子程序在组织内的空间组织方式对于理解肿瘤进化及微环境相互作用至关重要。空间转录组学技术能够在保留空间背景的同时分析基因表达,为原位研究细胞异质性、组织结构和疾病进展提供了独特能力。然而,现有分析方法多依赖于基因水平特征,忽略了生物通路丰富的拓扑结构,或仅能提供缺乏机制洞察的“黑箱”聚类结果,限制了其转化应用潜力。
为解决这些难题,研究人员开发了PathCLAST(Pathway-augmented Contrastive Learning with Attention for interpretable Spatial Transcriptomics),这是一个将基因表达、组织病理学图像和经过整理的通路图通过双模态对比学习进行整合的生物信息学框架。与将基因表达视为抽象特征向量的传统方法不同,PathCLAST通过生物学结构化的通路级图对基因表达谱进行编码,实现了可解释且功能有意义的降维。通过直接整合人工整理的基因-通路关系,PathCLAST确保表征既受数据驱动又受生物学约束,促进了跨模态的更准确对齐。
该研究在五个公共空间转录组学数据集上对PathCLAST进行了基准测试,结果显示其在空间域识别方面实现了最先进的性能,同时提供了通路级注意力分数以供机制解释。通路嵌入还可作为一种明确的、基于生物学的降维方案。PathCLAST不仅能够识别域特异性通路和空间组织的信号活动,还能量化域内异质性、空间自相关以及域间相互作用,为肿瘤进展和组织结构提供了细粒度的见解。
在技术方法上,该研究主要包含几个关键步骤:首先进行数据预处理和基于通路的图构建,使用KEGG通路数据库生成通路图;接着对通路图和图像块进行数据增强;然后通过专用编码器块处理增强后的数据;最后执行联合表征学习,采用基于SimCLR框架的对比损失函数,包含图到图、图像到图像和图到图像三个对比目标。
研究结果部分通过多个维度展示了PathCLAST的有效性。在空间域聚类方面,PathCLAST在多个数据集上表现出优于或与现有11种方法相媲美的性能。通路注意力分析揭示了不同空间域的特异性通路特征,例如侵袭性区域中ErbB信号通路受到高度关注,而DCIS/LCIS区域中孕酮介导的卵母细胞成熟通路更为突出。域内异质性分析表明,侵袭性区域在代谢通路上表现出均匀的高异质性,反映了肿瘤中普遍存在的空间代谢重编程。空间自相关分析进一步显示,侵袭性聚类通常比健康聚类表现出更高的莫兰指数,表明恶性区室中通路活动具有更强的空间结构。
尤为值得注意的是,域间通路串扰分析通过构建空间解析的通路相互作用图,量化了相邻区域间通路注意力得分的空间相似性。研究发现侵袭区域与相邻肿瘤边缘和DCIS/LCIS区室之间存在广泛的串扰,凸显了恶性进展的相互关联性。例如,在DCIS/LCIS中高度关注的Hippo信号通路与侵袭区域中的细胞因子-细胞因子受体相互作用通路之间存在强串扰,这从生物学上是合理的,因为Hippo通路整合了机械和炎症线索来调节肿瘤生长和转移。
研究的讨论部分指出,PathCLAST的通路中心设计使其能够提供机制性解释,这是现有域识别算法很少能够实现的。通过将空间组织与通路活动联系起来,PathCLAST在分子过程与组织学背景之间架起了桥梁,促进了包括域内异质性、空间自相关和域间通路串扰在内的下游生物学分析。此外,轨迹推断进一步证明,空间上不同的肿瘤区室可以嵌入到一个连续的进展轴中,表明通路级嵌入沿着生物学有意义的梯度组织组织结构。
研究人员也坦诚讨论了当前方法的局限性,特别是通路图嵌入需要足够的基因覆盖才能获得有意义的表征,因此该方法目前不太适合低基因数平台如Xenium。未来的工作将侧重于自适应通路重建策略,以将PathCLAST扩展到稀疏基因ST平台,并更好地将scRNA-seq插补方法整合到流程中。
从生物学角度看,PathCLAST揭示的空间异质性具有潜在的临床意义。侵袭性肿瘤的不同子区域表现出不同的通路特征,表明可能存在局部生态位,其中包含治疗耐药或转移起始群体。绘制这些域内变异可能为针对空间受限信号轴的精准治疗策略提供信息。将通路注意力谱与临床结果数据整合,代表了下一代空间知情的癌症分层的方向。
综上所述,PathCLAST通过将基因表达投射到经过整理的通路结构上,执行了基于生物学的降维,比基于高变基因的方法更稳定、更抗噪声,同时实现了直接的通路级可解释性。通过双模态对比学习,PathCLAST产生了统一的嵌入,在多个空间转录组学基准测试中优于现有方法。除了准确的空间域识别外,该框架还揭示了域特异性通路活动、域内分子异质性、通过莫兰指数实现的空间组织信号模式,以及通过跨莫兰指数实现的跨区室串扰。这些见解说明了基于通路的建模如何捕获局部和全局组织组织。总体而言,PathCLAST为传统的特征选择提供了一种可解释且具有生物学结构的替代方案,为空间系统生物学以及未来在微环境分析和精准肿瘤学中的应用奠定了坚实基础。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号