《Frontiers in Microbiology》:EMDS-7-FSCIL: a benchmark for Few-Shot Class-Incremental Learning in environmental microorganism recognition
编辑推荐:
本文系统构建了环境微生物识别领域首个少样本类增量学习(FSCIL)基准,基于EMDS-7数据集对10种代表性方法(如SAVC、FACT等)进行统一评估。研究发现,在具有高类内多样性和细微类间差异的微生物图像上,表征驱动型方法(如SAVC)虽能达到最高平均精度(AA=80.4%),但存在显著的性能下降(PD=26.7%);而基于频率域分解的PFR方法虽稳定性更优(PD=20.1%),却受限于识别精度上限(AA=67.2%)。该研究为动态环境下的微生物监测提供了可复现的算法评估平台,揭示了通用FSCIL方法在生态影像领域的迁移局限性。
1 引言
环境微生物作为生态系统的重要组成部分,在营养循环、水体净化和生态平衡维持中发挥着关键作用。传统微生物识别方法依赖人工镜检、生化检测和分子测序,存在耗时费力、成本高昂且依赖专家经验的局限性。随着计算机视觉与深度学习技术的发展,自动化微生物检测与识别(AMDR)系统通过分析微生物显微图像的形态与纹理特征,显著提升了识别效率与客观性。然而,现实环境中微生物群落持续演化,监测任务常涉及训练集未覆盖的新类别,且这些新类别往往样本稀缺、标注困难。少样本类增量学习(FSCIL)通过平衡稳定性(抑制旧类遗忘)与可塑性(快速适应新类)的特性,为动态环境下的微生物识别提供了理想解决方案。
2 相关工作
少样本学习(FSL)专注于利用极少量样本识别新类别,其方法主要包括数据增强、元学习和图神经网络三类。类增量学习(CIL)则关注模型在逐步引入新类别时对旧类知识的保持能力,代表性方法如基于样本回放的iCaRL和基于特征蒸馏的LUCIR。FSCIL作为FSL与CIL的结合,要求模型在极少样本支持下持续学习新类的同时抵御灾难性遗忘。现有FSCIL方法(如TOPIC、CEC、FACT等)虽在自然图像基准上表现良好,但面对环境微生物图像中存在的细粒度形态差异、光照不均和背景噪声时,其泛化能力面临严峻挑战。
3 基准构建
本研究以EMDS-7数据集为基础构建标准化FSCIL评估平台。该数据集包含41类微生物的2,365张图像,涵盖自然水体中采集的13,216个标注目标,具有微生物重叠、染色不均、背景杂质等真实生态特征。基准采用3-way 3-shot增量会话设计,将会话划分为包含20个类别的基础会话和7个增量会话(每会话引入3个新类)。所有图像统一预处理为224×224分辨率,并采用Session-ID评估协议,以平均精度(AA)和性能下降率(PD)量化模型长期性能。
4 实验结果与分析
4.1 实验设置
在ImageNet预训练ResNet-18骨干网络上,系统比较了CEC、FACT、SAVC、PFR、ADBS等10种FSCIL方法。基础会话训练100轮次,增量阶段冻结骨干网络仅更新分类器。
4.2 定量结果
SAVC与FACT以80.4%和79.9%的AA值领先,但PD值较高(26.7%/25.0%);PFR虽AA值较低(67.2%),却展现出最优稳定性(PD=20.1%)。ADBS与TEEN以77.1%的AA值位列第二梯队,而BiDist(AA=37.8%)和CLOSER(AA=22.2%)表现显著落后。会话精度曲线显示,表征驱动方法(SAVC/FACT)在前期保持高位但后期衰减明显,而稳定性导向方法(PFR/ADBS)则呈现平缓下降趋势。
4.3 结果讨论
EMDS-7数据集的细粒度特性导致明显的精度-稳定性权衡:SAVC通过虚拟类对比学习强化特征判别性,但密集的类间结构加剧了后期会话的边界拥挤;FACT的前向兼容设计虽延缓性能衰减,却难以解决长增量链下的决策边界重叠。频率域方法PFR通过纹理特征稳定化抑制漂移,但牺牲了空间判别能力。CLOSER的类间距离最小化策略在3-shot极端稀缺条件下引发原型失稳,导致性能崩溃。研究表明,针对环境微生物图像的FSCIL需平衡表征质量与可控可塑性,过度依赖几何约束或蒸馏机制可能适得其反。
5 结论与展望
EMDS-7基准的建立为环境微生物FSCIL研究提供了可复现的实验平台。当前最优方法仍面临长会话链下的性能衰减挑战,未来需结合领域先验(如微生物形态学知识)开发专用算法。该工作为生态监测场景下自适应识别系统的构建奠定了理论基础,推动微生物影像分析向动态、低资源需求方向演进。