
-
生物通官微
陪你抓住生命科技
跳动的脉搏
通过单细胞数据的分层聚类,在Atlas规模上揭示基因模块
《Nature Communications》:Unveiling gene modules at Atlas scale through hierarchical clustering of single-cell data
【字体: 大 中 小 】 时间:2026年05月27日 来源:Nature Communications 15.7
编辑推荐:
摘要单细胞RNA测序(scRNA-seq)分析中的一个主要挑战是跨数据集恢复具有生物学意义的细胞本体树和保守的基因模块。数据整合和批量效应校正方法已经能够有效地分析多个数据集,但往往无法区分异质样本(如癌症和免疫系统)中的细胞状态。在这里,我们提出了Super Single-Ce
单细胞RNA测序(scRNA-seq)分析中的一个主要挑战是跨数据集恢复具有生物学意义的细胞本体树和保守的基因模块。数据整合和批量效应校正方法已经能够有效地分析多个数据集,但往往无法区分异质样本(如癌症和免疫系统)中的细胞状态。在这里,我们提出了Super Single-Cell Clustering(SuperSCC)这一计算框架,它利用机器学习模型在无需数据整合的情况下发现多个数据集中的细胞身份和基因模块。值得注意的是,SuperSCC可以在细胞谱系和细胞状态两个层面上进行应用,从而构建具有特定细胞身份和基因模块的细胞程序层次结构。这些信息可以用来识别跨数据集共享的稀有细胞群体,而不受批量效应的影响,并且在将细胞标签从参考数据集映射到查询数据集方面具有优势。我们使用SuperSCC对超过90个数据集进行了图谱级别的数据分析,并构建了健康和疾病状态下复杂组织(如人类肺部)的细胞状态图谱。SuperSCC在识别细胞背景方面优于现有方法,实现了更高的注释准确性,并识别出表明肺部微环境中保守的免疫细胞状态的基因模块。