细胞邻域拓扑结构指导下的关键罕见细胞亚群鉴定新框架

《Nature Communications》:Cell neighborhood topology directs rare cell population identification

【字体: 时间:2026年04月01日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对单细胞和空间组学技术时代,鉴定对疾病和生物学过程至关重要的罕见细胞仍面临巨大挑战的问题。研究人员开发了名为RareQ的高效、可扩展的算法框架。该框架通过评估单细胞组学数据中每个细胞的k-最近邻“闭聚性”(cliquishness)来精准识别罕见细胞。研究证明RareQ在多种模拟和真实数据集中,其准确性、灵敏度和效率均优于现有方法,并能有效识别特定模态及跨模态的共享罕见细胞。该工具的成功应用,为深入揭示组织结构和疾病机制提供了新的强大工具。

在生命科学的微观世界里,细胞是构成组织和器官的基本单元。长久以来,科学家们如同观察一片广袤的森林,能够分辨出主要的树种,但对于那些零星散布、却可能对森林生态系统起关键作用的稀有植物,往往难以察觉。随着单细胞组学(single-cell omics)和空间组学(spatial omics)技术的飞速发展,我们前所未有地获得了窥探细胞“身份”和空间“住址”的能力,为解析复杂生物系统的细胞组成和组织结构带来了革命性的变化。然而,一个核心挑战依然顽固地横亘在前:如何从海量的细胞数据中,精准地找出那些数量稀少但对疾病发生(pathogenesis)和关键生物学过程至关重要的罕见细胞(rare cells)?它们的“低调”(低丰度)往往使其“淹没”在占主导地位的主要细胞群体中,成为精准医学和基础生物学研究中亟待“打捞”的宝藏。
为了解决这一难题,一项最新发表在《Nature Communications》上的研究提出了一个名为RareQ的创新框架。研究人员认识到,仅仅依靠单个细胞的基因表达特征来识别罕见细胞是远远不够的,必须将细胞置于其微观的“社交网络”——即细胞邻域(cell neighborhood)中来看待。他们的核心思路是:一个真正的罕见细胞,其周围邻居(k-最近邻, k-nearest neighbor)的类型很可能与它自身不同,即它的“朋友圈”是“排外”的。基于此,研究团队开发了RareQ算法,通过定量评估每个细胞局部邻域的“闭聚性”(cliquishness),从而高效、可扩展地从单细胞组学数据中识别出罕见细胞群体。
研究人员运用了多种关键技术方法对RareQ进行了验证。在数据层面,他们使用了多样化的模拟数据集和来自不同组织的真实单细胞RNA测序(single-cell RNA sequencing, scRNA-seq)数据。在计算层面,核心是构建和分析细胞的k-最近邻(k-nearest neighbor, k-NN)网络,并计算网络密度等图论(graph theory)指标来量化“闭聚性”。该框架还兼容了空间转录组学(spatial transcriptomics)数据,通过整合空间坐标信息,从拓扑和空间位置双重视角识别罕见细胞。整个框架在Python中实现,确保了高计算效率。
研究结果
RareQ在不同数据集中准确识别罕见细胞
通过对大量模拟数据的系统评估,研究人员证明RareQ在识别已知的罕见细胞亚群方面,其性能(包括准确性、敏感性和特异性)显著优于其他现有的罕见细胞检测方法。无论是在不同的测序深度、细胞总数还是罕见细胞比例设置下,RareQ都表现出稳健且优异的性能。
RareQ在真实单细胞数据中揭示生物学相关的罕见细胞
研究将RareQ应用于多个已发表的真实单细胞RNA测序数据集。结果表明,RareQ不仅能够复现已知的、具有重要功能的罕见细胞类型(如某些干细胞前体细胞),还能发现此前未被报道的、具有独特分子特征的潜在新罕见亚群。这些被鉴定出的罕见细胞通常表达与特定功能(如组织修复、免疫调节)相关的关键基因。
RareQ能够识别模态特异性和跨模态共享的罕见细胞
在多组学(multi-omics)数据整合分析中,RareQ展现了其独特优势。它能够有效区分出仅在某一种测量模态(如转录组)中才显现的罕见细胞,以及在不同模态(如转录组和染色质可及性)数据中都稳定存在的、真正的跨模态共享罕见细胞,这对于精确定义细胞状态至关重要。
RareQ应用于空间转录组学揭示具有解剖位置特异性的罕见细胞
将RareQ的分析维度扩展到空间,研究人员将其应用于小鼠大脑和人类乳腺癌等组织的空间转录组学数据。令人兴奋的是,RareQ成功鉴定出了具有明确解剖位置偏好性的罕见细胞群体。例如,在小脑(cerebellum)的特定层(layer)中发现了富集的罕见细胞亚型。在肿瘤样本中,它识别出的空间罕见细胞亚群与特定的肿瘤微环境(tumor microenvironment)特征和临床预后(prognosis)指标显示出潜在关联,凸显了其临床转化价值。
结论与讨论
本研究成功开发并验证了RareQ,这是一个基于细胞邻域拓扑结构的高效计算框架,专门用于从单细胞和空间组学数据中识别罕见细胞。与以往主要依赖基因表达阈值或统计离群值检测的方法不同,RareQ的创新之处在于利用了细胞在其局部微环境中的“社交关系”模式——即邻域闭聚性,这一特性使得它能够更自然、更稳健地将罕见细胞与主流群体区分开来。
该研究的结论强调了几个重要方面。首先,RareQ在计算性能上具有显著优势,其快速、可扩展的特性使其能够轻松处理当前日益庞大的单细胞数据集。其次,其生物学意义深远,RareQ不仅是一个计算工具,更提供了一个新的视角来理解细胞异质性和组织层级结构。通过发现那些具有独特功能分子特征和特定空间定位的罕见细胞,RareQ为深入探究发育、稳态维持和疾病(如癌症、免疫疾病)过程中这些关键“少数派”细胞的作用机制打开了新窗口。最后,该框架的通用性保证了其能够广泛应用于各种生物背景和数据类型,从基础研究到临床样本分析,为未来在精准医学中靶向特定罕见细胞亚群提供了重要的方法学基础和发现引擎。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号