《Frontiers in Bioinformatics》:IRMKD: an application of instance relation matrix in plant disease recognition
编辑推荐:
本文提出了一种创新的实例关系矩阵知识蒸馏(IRMKD)方法,通过建模样本间相关性、实例特征关系及跨层特征空间变换,有效压缩模型体积(平均减少92%内存占用)并提升识别速度,同时保持验证集93%以上的高准确率,为计算资源受限设备提供了高效的植物病害识别解决方案。
背景
植物病害识别对农业生产至关重要,但传统卷积神经网络存在参数量大、识别耗时长的问题。知识蒸馏(KD)作为模型压缩典型方法,可分为响应式、特征式和关系式三类。现有方法在压缩率和精度平衡方面仍有不足,且普遍忽略样本间相关性对分类的重要性。
方法
提出实例关系矩阵知识蒸馏(IRMKD),首次整合样本相关性、实例特征、实例关系及跨层特征空间变换四类知识。定义三维数组结构的实例关系矩阵IRM[i][j][k],其中i、j表示第i与第j个特征图欧氏距离,k代表批次中第k个样本。通过多损失函数监督学生网络训练,最终损失函数LMTK=αLIRM-t+(1-α)LIRM+βLlogits+γLGT,其中超参数α∈[0.5,0.9],温度参数T∈[3,5]。
实验设计
采用Plant Village数据集(包含55类作物、82,161张图像)和广西农科院提供的复杂背景数据集。通过翻转、随机裁剪等数据增强提升模型鲁棒性。以VGG16(304.0 MB)、ResNet等作为教师网络,MobileNet(28.0 MB)作为学生网络,在批量大小512、学习率0.1条件下训练200轮。
结果分析
IRMKD在VGG16→MobileNet的蒸馏中达到93.60%最高准确率,较基线91.57%提升2.03%,与教师网络精度差距仅2.25%。可视化结果显示模型能有效提取叶片病斑特征(图5)。在芒果白粉病真实场景测试中,模型收敛速度快(50轮内稳定),最高准确率达95.54%(图6)。相比GRNN(97.27%)、PNN(98.06%)等方法,IRMKD在模型参数量(19.83 MB)和识别速度(0.218 s)方面显著优于传统方案。
结论
IRMKD通过结构化压缩机制,在轻微降低验证集精度前提下,显著优化模型体积与识别速度。该方法为内存与计算资源有限设备提供了新的植物病害识别路径,其多知识类型融合框架对轻量化神经网络设计具有普适参考价值。