
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于内存一致性引导的划分与征服学习方法在泛化类别发现中的应用
《INTERNATIONAL JOURNAL OF COMPUTER VISION》:Memory Consistency Guided Divide-and-Conquer Learning for Generalized Category Discovery
【字体: 大 中 小 】 时间:2026年03月07日 来源:INTERNATIONAL JOURNAL OF COMPUTER VISION 9.3
编辑推荐:
针对半监督学习中的通用类别发现问题,提出基于记忆一致性的分治学习框架MCDL,通过在线更新记忆库记录未标注样本的历史预测,提升样本可信度评估,有效利用可信未标注数据并抑制噪声影响,实验表明在多个基准上显著优于现有方法。
广义类别发现(GCD)旨在解决半监督学习中更为现实和具有挑战性的问题:在这种情况下,只有部分训练样本被分配了类别标签,导致未标记数据中存在一些未被发现的语义模式。为了获得更具泛化能力的分类模型,仅利用标记数据集的信息来发现潜在的新类别至关重要。以往的方法通常通过采用简单的对比学习或对所有样本进行无监督聚类来实现这一目标。然而,这些方法往往忽略了正在训练的模型历史预测中包含的关键信息。具体来说,我们通过实验发现,大量未标记样本的历史预测与其真实类别是一致的。基于这一观察结果,我们提出了一个基于“记忆一致性”指导的“分而治之”学习(MCDL)框架。在该框架中,我们引入了两个在线更新的记忆库来记录未标记数据的历史预测结果,并利用这些记录来准确评估每个样本的预测一致性。在信用度的指导下,我们设计了一种分而治之的学习策略,以便利用未标记数据中可信且具有区分性的信息,同时减轻噪声标签的负面影响。在多个基准测试上的广泛实验结果表明,我们的方法具有普遍性和优越性,其性能始终大幅优于现有最先进模型,并且能够以即插即用的方式提升这些模型在通用图像识别以及具有挑战性的语义变换场景下的性能(例如,在CUB数据集上提升了8.4%,在斯坦福汽车数据集上提升了8.1%)。
广义类别发现(GCD)旨在解决半监督学习中更为现实和具有挑战性的问题:在这种情况下,只有部分训练样本被分配了类别标签,导致未标记数据中存在一些未被发现的语义模式。为了获得更具泛化能力的分类模型,仅利用标记数据集的信息来发现潜在的新类别至关重要。以往的方法通常通过采用简单的对比学习或对所有样本进行无监督聚类来实现这一目标。然而,这些方法往往忽略了正在训练的模型历史预测中包含的关键信息。具体来说,我们通过实验发现,大量未标记样本的历史预测与其真实类别是一致的。基于这一观察结果,我们提出了一个基于“记忆一致性”指导的“分而治之”学习(MCDL)框架。在该框架中,我们引入了两个在线更新的记忆库来记录未标记数据的历史预测结果,并利用这些记录来准确评估每个样本的预测一致性。在信用度的指导下,我们设计了一种分而治之的学习策略,以便利用未标记数据中可信且具有区分性的信息,同时减轻噪声标签的负面影响。在多个基准测试上的广泛实验结果表明,我们的方法具有普遍性和优越性,其性能始终大幅优于现有最先进模型,并且能够以即插即用的方式提升这些模型在通用图像识别以及具有挑战性的语义变换场景下的性能(例如,在CUB数据集上提升了8.4%,在斯坦福汽车数据集上提升了8.1%)。