学习面向未来的兼容与领域不变表示用于跨领域少样本类增量学习 (Learning Forward-Compatible and Domain-Invariant Representations for Cross-Domain Few-Shot Class-Incremental Learning)
《Neural Networks》:Learning Forward-Compatible and Domain-Invariant Representations for Cross-Domain Few-Shot Class-Incremental Learning
编辑推荐:
研究人员介绍了跨领域少样本类增量学习 (Cross-Domain Few-Shot Class-Incremental Learning, CDFSCIL) 这一更现实且更具挑战性的问题,该问题要求模型在数据稀缺和领域偏移的条件下,持续学习新类知识而不遗忘已学
研究人员介绍了跨领域少样本类增量学习 (Cross-Domain Few-Shot Class-Incremental Learning, CDFSCIL) 这一更现实且更具挑战性的问题,该问题要求模型在数据稀缺和领域偏移的条件下,持续学习新类知识而不遗忘已学知识。为应对此挑战,研究人员提出了一个统一框架,称为学习向前兼容与领域不变表示 (Learning Forward-Compatible and Domain-Invariant Representations, FCDI)。通过三个互补组件的协同设计,FCDI 学习到的表示对未来未见类具有兼容性,且对领域偏移具有鲁棒性。具体而言,FCDI 构建结构化表示空间以保留未来类的容量,使有限样本的新类别能够以稳定方式增量集成。为增强领域鲁棒性,语义和领域特征被显式解耦,使模型专注于学习领域不变的语义表示。此外,FCDI 使模型接触多样的领域变化,并鼓励跨领域的一致表示,从而进一步促进领域不变表示的学习。在所提出的 CDFSCIL 基准测试和标准 FSCIL 任务上的大量实验表明,该方法显著优于最先进的方法。
一、 研究背景与问题提出
监督学习在视觉识别任务中取得了显著成功,但通常假设类别预定义且有充足的训练数据。现实中,数据通常是动态的,且标注样本稀缺。在此背景下,少样本类增量学习 (Few-Shot Class-Incremental Learning, FSCIL) 成为一个有前景的范式,它能够从有限数据中持续学习新知识而不遗忘。然而,现有的 FSCIL 研究通常基于一个强假设:所有类共享相同的领域。在现实场景中,增量类通常来自与基类差异显著的领域,即存在领域偏移 (domain shift)。例如,在临床应用中,疾病诊断模型可能需要使用来自不同成像条件和采集设备的数据持续对新疾病进行分类。跨领域少样本学习 (Cross-Domain Few-Shot Learning, CDFSL) 等相关领域主要关注在未见目标域的性能提升,而未考虑对源域知识的保留,限制了其在增量场景中的应用。领域自适应 (Domain Adaptation, DA) 和领域泛化 (Domain Generalization, DG) 通常假设源域和目标域共享相同的标签空间,不适合存在语义偏移的场景。
因此,本研究首次正式提出了一个更实用、更具挑战性的问题:跨领域少样本类增量学习 (Cross-Domain Few-Shot Class-Incremental Learning, CDFSCIL)。该问题要求模型在仅有单个领域的基类会话基础上,从来自未见领域的极少量样本中持续分类新类,同时不遗忘先前获得的知识。CDFSCIL 面临三个核心挑战:1) 新类训练样本稀缺导致的过拟合;2) 在稳定性(抑制旧知识遗忘)与可塑性(适应新知识)之间取得平衡;3) 跨会话的显著领域偏移。现有 FSCIL 方法难以应对这些交织的挑战,在 CDFSCIL 设定下性能急剧下降,亟需能够联合应对数据稀缺、知识保留和跨领域泛化的新策略。
二、 研究内容与结论
为克服上述局限,研究人员提出了一种新颖的统一框架:学习向前兼容与领域不变表示 (FCDI)。该框架通过协调设计三个互补组件,联合应对前述挑战。FCDI 在基会话中执行向前兼容训练,以将新类增量集成到一个结构化表示空间中,同时构建一个领域鲁棒模型,从而无需额外适应即可有效泛化到未来未见领域。该工作的贡献包括:首次提出 CDFSCIL 问题;提出 FCDI 方法,通过向前兼容框架、特征解耦和多领域联合训练来构建向前兼容和领域不变的表示;在跨单领域和跨多领域两类任务、五个数据集上进行了大量实验,结果表明 FCDI 优于之前的先进方法,且在传统非跨领域场景下也表现良好。本论文发表在《Neural Networks》期刊。
三、 关键技术方法概述
FCDI 框架由三个紧密耦合的模块组成:(1) 向前兼容框架 (Forward-compatible framework): 构建结构化表示空间,在最大化类间可分离性的同时,为未来类别保留足够容量,使有限样本的新类能以稳定方式增量集成。(2) 特征解耦 (Feature decoupling): 为减轻领域变化的影响,将语义信息与领域相关信息解耦,使模型专注于学习领域不变的语义表示,从而获得更鲁棒和更具判别性的特征,有利于向前兼容表示学习。(3) 多领域联合训练 (Multi-domain joint training): 为进一步提高对领域偏移的鲁棒性,在基训练期间让模型接触多样化的领域变化。这种多样性鼓励领域不变表示的学习,同时提供更丰富的特征变化,促进更有效的特征解耦。
四、 研究结果
- •
问题定义 (Problem Formulation): 研究人员对 CDFSCIL 进行了形式化定义。给定一个带标签的训练集流 Dtrain= {Dttrain}Tt=0,其中每个会话 t 有其标签空间 Ct,且不同会话的标签空间互斥。基类 (t=0) 来自一个领域,而增量新类 (t≥1) 来自不同的、与基类领域偏移的领域。目标是训练一个模型,使其在每个增量会话后,在累积的测试集上获得良好的性能。
- •
方法论 (Methodology): 详细介绍了 FCDI 方法。FCDI 的核心是通过联合设计前述三个组件,在基会话训练中学习向前兼容和领域不变的表示。向前兼容性通过构建结构化的原型空间和正则化损失实现。特征解耦通过特定的网络架构和损失函数,分离出语义特征和领域特征。多领域联合训练则在基会话训练时引入辅助的领域多样化数据,以增强模型的领域泛化能力。
- •
数据集 (Datasets): 实验使用了五个数据集:mini-ImageNet (包含 100 个类别的自然图像)、Cars (包含 196 个类别的汽车品牌和型号图像)、CUB200 (包含 200 个类别的鸟类图像)、Places (包含 365 个类别的场景图像) 和 Plantae (包含 200 个类别的植物图像)。所有图像大小调整为 224 × 224 像素。研究人员基于这些数据集构建了跨单领域和跨多领域两种 CDFSCIL 任务进行评测。
- •
实验与对比 (Experiments): 研究人员将现有的先进 FSCIL 方法应用于 CDFSCIL 问题以建立基线,并与 FCDI 进行对比。实验结果表明,在两种 CDFSCIL 任务设定下,FCDI 方法在最终准确率 (Final Accuracy) 和最后会话准确率 (Last Session Accuracy) 等指标上均显著优于所有基线方法,验证了其在应对数据稀缺、灾难性遗忘和领域偏移方面的有效性。消融研究也证实了每个组件(向前兼容、特征解耦、多领域联合训练)的必要性和贡献。
五、 讨论与结论
在讨论部分,研究人员分析了实验结果,验证了 FCDI 在 CDFSCIL 任务上的优越性,并通过消融实验证明了各个组件的有效性。研究强调了在存在领域偏移的现实场景中,联合处理增量学习和领域泛化的重要性。
结论 (Conclusion): 在本文中,研究人员引入了一个新的实际问题:跨领域少样本类增量学习 (CDFSCIL),该问题要求模型在领域偏移下,从有限样本中持续学习新类,同时减轻灾难性遗忘。为应对此挑战,研究人员提出了 FCDI,这是一个统一的框架,旨在学习同时具有向前兼容性和领域变化鲁棒性的表示。通过联合鼓励结构化表示学习、领域不变语义特征学习和多样化领域特征学习,FCDI 能够有效应对 CDFSCIL 带来的挑战。在多个数据集上的大量实验表明,所提方法在 CDFSCIL 任务中表现出色,并且在传统 FSCIL 任务中也具有良好的性能。