《Nature Communications》:FineST: contrastive learning integrates histology and spatial transcriptomics for nuclei-resolved ligand-receptor analysis
编辑推荐:
本研究为克服空间转录组学(ST)分辨率有限、数据稀疏性高的挑战,开发了名为FineST的深度对比学习模型。该模型融合ST数据和病理切片,实现了精细的空间转录组学分析,包括细胞核精准分割、高分辨率RNA表达插补,以及细胞间通讯(CCC)模式的解析。在结直肠癌和乳腺癌等数据集中验证,FineST显著提升了RNA插补、细胞类型预测及配体-受体互作分析的性能,为肿瘤免疫等研究提供了新范式。
在生命科学的微观世界里,细胞并非孤立存在,它们时刻都在通过复杂的信号网络彼此“交谈”,这便是细胞间通讯(CCC)。理解CCC对于揭示从胚胎发育到癌症进展等多种生物学过程至关重要。近年来,空间转录组学(ST)技术的兴起,使得研究者能够“看到”组织中不同位置的RNA表达谱,为原位解析CCC模式带来了前所未有的机遇。然而,当前广泛使用的ST技术,如10x Genomics公司的Visium平台,其空间点位通常覆盖多个细胞,导致分辨率不足;加之ST数据天生具有高稀疏性的特点,这些都极大地限制了对复杂组织内精细CCC模式的深入刻画。为了突破这些瓶颈,一项整合了人工智能与生物信息学的前沿研究应运而生,并将成果发表在了国际顶级期刊《Nature Communications》上。
研究人员敏锐地注意到,在ST实验中,与基因表达数据同步获取的,还有高分辨率的组织病理学(H&E染色)图像。这些图像蕴含了丰富的细胞形态与组织结构信息。那么,能否将这两类数据深度融合,取长补短,从而“看见”更精细的生物学图景呢?基于此构想,研究团队开发了一个名为FineST的深度学习模型。FineST的核心思想是“对比学习”,它像一个聪明的翻译官,能够从组织学图像的视觉特征和ST数据的分子特征中,学习到一个共享的、对齐的表示空间。通过这种方式,模型可以利用高分辨率的图像信息来指导和增强对低分辨率、稀疏的ST数据的解读。
这项研究主要运用了几个关键技术方法。首先是深度对比学习框架,这是FineST模型的核心,它被设计用来融合H&E组织病理图像和空间转录组数据,学习两者的联合表征。其次是高分辨率RNA表达插补技术,模型基于学习到的表征,能够预测每个细胞核位置(而不仅是ST点位)的基因表达水平。再者是精细的细胞核分割与注释,利用模型增强后的信息,结合细胞核形态,实现更精准的细胞类型识别。此外,研究还涉及了配体-受体(L-R)互作分析,用于推断细胞间通讯事件。在数据方面,研究使用了来自公共数据集的结直肠癌VisiumHD数据和乳腺癌Xenium数据作为验证,并将FineST系统应用于包括乳腺癌、鼻咽癌和肝细胞癌在内的多种癌症类型的Visium平台数据,以探索肿瘤免疫相互作用的生物学新见解。
研究人员在多个层面验证了FineST的有效性,并得出了系列重要结论。
高分辨率RNA表达插补
通过对比实验,FineST在从低分辨率ST数据中预测高分辨率基因表达的任务上,显著超越了其他现有方法。这意味着FineST能够更准确地将ST点位的混合信号“分解”到更精细的空间尺度,甚至是单个细胞核的水平,极大地提升了数据的空间解析度。
细胞类型预测
利用插补得到的高分辨率表达数据,FineST实现了更精确的细胞类型注释。模型不仅能区分主要的细胞大类,还能识别出更精细的细胞亚群,为理解组织的细胞组成提供了更清晰的视野。
细胞间通讯模式发现
这是FineST最具价值的应用之一。在精细的细胞类型和空间位置信息基础上,研究者系统分析了配体-受体对的互作关系。例如,在结直肠癌数据中,FineST揭示了过去被掩盖的、发生在特定空间区域(如肿瘤边界)的特定免疫细胞与肿瘤细胞之间的通讯事件。
跨癌种的肿瘤免疫新见解
研究将FineST聚焦于应用广泛的Visium平台数据,深入分析了多种癌症类型:
- •
在乳腺癌中,FineST精细刻画了肿瘤-侵袭前沿的细胞互作网络,发现了与肿瘤侵袭过程密切相关的特定CCC模式。
- •
在鼻咽癌中,模型深入分析了三级淋巴结构(TLS) 内部的细胞通讯,揭示了支撑这种抗肿瘤免疫“前哨站”形成和功能的关键信号对话。
- •
在肝细胞癌中,研究探索了与PD-1治疗抵抗相关的肿瘤微环境,识别了可能构成“耐药屏障”的细胞群落及其通讯特征,为理解免疫治疗耐药机制提供了新线索。
综上所述,FineST研究建立了一个通过整合易于获取的组织病理学图像来增强空间转录组学分析的新范式。它成功解决了ST技术固有的分辨率和数据稀疏性难题,将分析精度提升到了亚点位乃至细胞核级别。该模型在RNA表达插补、细胞类型预测,尤其是在解析复杂的空间依赖性细胞间通讯模式方面,都展现出了卓越的性能。其在不同癌症类型中的应用,不仅验证了工具的普适性和强大功能,更带来了关于肿瘤免疫相互作用的具体而新颖的生物学发现,例如侵袭前沿、三级淋巴结构微环境和治疗耐药屏障中的关键通讯事件。这项工作表明,深度学习方法,特别是对比学习策略,能够有效地桥接组织形态学与分子组学数据,为全面、精细地解码组织功能与疾病机制开辟了新的道路。