基于课程设置的差异调度方法提升了单细胞聚类的鲁棒性

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Neural Networks》：Curriculum-guided divergence scheduling improves single-cell clustering robustness

【字体：大中小】 时间：2026年01月12日 来源：Neural Networks 6.3

编辑推荐：

　　单细胞RNA测序聚类面临数据稀疏、高维噪声和传统静态模型偏差问题。本文提出动态课程学习框架DAGCL，通过双分支架构分离内容重构与结构学习，结合时间递增的注意力机制和监督压力调节，采用熵正则化Sinkhorn投影实现全局平衡的软聚类。实验表明该框架在27个基准测试中聚类精度（ARI）显著优于基线方法。

周美华|郑天龙|王百花|童新宇|冯伟坚|杨莉

中国芜湖皖南医学院医学信息学院

摘要

由于单细胞RNA-seq数据的极端稀疏性和噪声，深度聚类面临重大挑战。我们提出了DAGCL（动态注意力增强图嵌入与课程学习），这是一种将表示学习视为从粗到细的进化过程的动态图嵌入框架。与传统静态范式不同，DAGCL采用了一种基于课程的调度机制，在整个训练过程中主动调节注意力强度和监督严格性。这种策略使模型复杂度与特征成熟度保持一致，有效缓解了早期确认偏置。为了进一步稳定优化，我们引入了熵正则化的Sinkhorn投影，以实现全局平衡的软分配。在27个基准测试上的广泛实验表明，DAGCL在聚类准确性和鲁棒性方面始终优于基线方法。我们的工作为无监督学习建立了一种原则性策略，其中结构约束和监督压力与学习到的表示共同进化。

引言

单细胞RNA-seq（scRNA-seq）能够高分辨率地描述细胞多样性，并阐明发育和病理过程（Josephides & Chen, 2025; Kolodziejczyk, Kim, Svensson, Marioni, & Teichmann, 2015; G. Li, et al., 2023; Nagayama, et al., 2022; Z. Wang, et al., 2024）。然而，下游分析仍受到极端数据稀疏性、高维度和技术噪声的挑战，这些因素掩盖了微妙的转录差异，阻碍了对细粒度细胞状态的解析，尤其是在复杂系统中（Kharchenko, 2021; Lin, Tian, Wei, & Hakonarson, 2022; Song, et al., 2020）。传统的流程——通常是静态神经架构或固定投影后进行聚类——往往在早期训练中无法捕捉到精细结构，在后期则过度拟合虚假模式，从而限制了准确性和泛化能力（Shaheen, Mrabah, Ksantini, & Alqaddoumi, 2025）。

基于图的方法通过将细胞-细胞关系建模在非欧几里得空间中部分解决了这些问题（Baran, et al., 2019; J. Li, Chen, Pan, Yuan, & Shen, 2022; Lou, Li, Wan, & Li, 2024）。例如，图注意力网络（GATs）可以根据特征相似性自适应地加权细胞邻域。然而，大多数实现依赖于在整个训练过程中固定的注意力范围、嵌入容量和损失权重（An, et al., 2022; Zhao, et al., 2025）。这种刚性可能导致过度平滑和优化不稳定，特别是在表示噪声较大的早期阶段。同时，使用静态Kullback–Leibler（KL）散度指导聚类的自监督框架容易受到确认偏置的影响，从而过早地强化错误的分割（Abdelnour, et al., 2022; Baron & van Oudenaarden, 2019; Hartley, et al., 2020; Klemm, Shipony, & Greenleaf, 2019; Stark & Scott, 2023; Vogel & Marcotte, 2012）。

为了克服这些限制，我们引入了DAGCL（动态注意力增强图嵌入与课程学习）。现有的深度聚类框架通常在静态学习范式下运行，其中网络架构、损失权重系数和正则化强度在整个训练过程中保持不变。这种静态方法迫使模型从一开始就同时学习低级特征表示和高级结构簇。然而，在训练的早期阶段，图拓扑通常包含噪声，潜在特征尚未成熟。过早施加强结构约束或聚类压力会导致过早过拟合、错误传播和次优收敛。

与这些静态方法不同，DAGCL将深度聚类视为一个从粗到细的进化过程。DAGCL不是强加固定的表示复杂性，而是采用了一种新颖的动态课程策略，随时间主动调节网络的注意力强度和监督严格性。

（i）早期阶段。模型优先学习稳定、低方差的内容特征（基因表达），同时施加较弱的结构约束，有效过滤掉dropout噪声。（ii）后期阶段。随着课程的进展，模型逐渐引入更强的图注意力和聚类压力，以解析更精细的生物学细节。这种有节奏的学习策略使模型的复杂度与嵌入空间的成熟度保持一致，防止了标准图神经网络（GNNs）中常见的“过度平滑”现象。

DAGCL的核心是一个双分支架构，它通过一个时间依赖的参数将内容重建与结构学习解耦。这与Sinkhorn正则化分配模块相结合，后者用全局平衡的、熵正则化的分配替代了标准的Softmax预测。这确保了聚类结果尊重细胞群体的全局几何结构，防止所有细胞聚合成一个簇的平凡解。

总之，我们的工作通过三个独特贡献区别于现有的图聚类方法：

(1)

完全动态的课程范式。与仅重新加权训练样本的先前方法不同，DAGCL是第一个同时动态调节网络内部注意力权重和损失景观的方法。这确保了监督压力与特征成熟度在时间上保持一致，从而缓解了确认偏置。

(2)

解耦的双流编码。我们引入了一种并行架构，明确地将内在基因表达学习与拓扑图学习分开。通过独立优化然后动态融合这两种视图，我们避免了早期图噪声导致的特征退化。

(3)

几何感知的概率细化。我们提出了一个结构受限的聚类模块，将Sinkhorn最优传输与von Mises–Fisher（vMF）方向建模相结合。这为标准K-means或基于欧几里得的软分配提供了一种数学上稳健的替代方案，确保了全局一致性和簇平衡。

通过将课程动态嵌入到基于图的框架中，DAGCL为单细胞分析建立了一个新原则：模型复杂度应与数据表示共同进化。在多种物种和组织上的广泛基准测试表明，DAGCL在聚类准确性（ARI）和生物学可解释性方面始终优于基线方法。

部分内容摘录

基于投影和深度嵌入的聚类流程

传统和主流方法主要遵循两阶段或端到端的“降维/嵌入+聚类”框架。投影方法（例如PCA-Reduce（?urauskien? & Yau, 2016）通过线性或非线性降维压缩高维表示，然后再应用K-means或谱聚类（Liu, Yang, Han, & Xie, 2024）。尽管计算效率高，但这些方法对投影维度、噪声和稀疏性敏感，常常会受到影响

DAGCL框架概述

单细胞RNA测序（scRNA-seq）数据的无监督聚类面临根本性挑战，因为细胞基因表达谱具有高维度、极端稀疏性和组成噪声。传统的深度聚类框架通常处理结构信息——通过来自成对表达相似性的细胞-细胞图——或内容信息——通过直接在原始表达矩阵上训练的自编码器——但很少同时处理两者

实验设置

为了评估鲁棒性和泛化能力，我们首先在七个公共scRNA-seq数据集上测试了DAGCL，这些数据集涵盖了人类胰腺（三个来源）、肝脏、神经组织、小鼠膀胱和外周血衍生的CITE-seq；数据集属性（测序深度、平台、细胞类型粒度）在补充表1中总结。此外，我们还在来自不同生物体、器官和文库类型（Smart-seq2和10x）的20个进一步的语料库上进行了泛化测试，包括Adam、Bach等

结论

在本文中，我们提出了DAGCL，这是一种基于课程的图嵌入框架，将单细胞聚类视为一个分阶段的、从粗到细的过程。我们用实证和机制证据支持这一观点。在27个scRNA-seq基准测试中，将容量增长（动态注意力）与监督压力（进度感知的KL调度）同步，结合熵正则化的分配平衡，从而在ACC、NMI和ARI方面获得了持续的改进

作者贡献

这项研究由M.Z.构思和领导，他设计了整体模型框架，实现了算法，并进行了实验和手稿起草。T.Z.参与了可解释性策略和可视化分析的开发。B.W.进行了文献综述。X.T.参与了模型架构和内部机制的可视化。L.Y.提供了监督和资金。W.F.对手稿的语言和风格进行了编辑。

代码可用性

我们的主要代码和数据集可在https://github.com/mh-zhou/DAGCL获取。

补充信息：有关详细的补充信息，请参阅相关的PDF文档。

CRediT作者贡献声明

周美华：写作 – 审稿与编辑，写作 – 原始草稿，可视化，验证，监督，软件，资源，项目管理，方法论，调查，形式分析，数据 curation，概念化。郑天龙：可视化，验证，监督，数据 curation。王百花：监督，数据 curation。童新宇：验证，监督。冯伟坚：写作 – 审稿与编辑，监督。杨莉：监督，项目管理，资金提供

热点排行

新闻专题

联系信箱：

粤ICP备09063491号