全球收获后的粮食损失约占总产量的10%至20%,其中由于储存管理不当造成的损失尤为严重(Flor, 2019)。储粮害虫是这些损失的主要原因。每年由储粮害虫造成的粮食损失占全球产量的10%至20%,在一些发展中国家和地区这一比例更高(Guo et al., 2026)。除了通过直接消耗粮食造成大量数量损失外,这些害虫还会产生排泄物、尸体和代谢副产物,这些物质会促进发热、霉菌生长、品质下降和霉菌毒素污染,从而直接危及消费者健康(Srivastava and Mishra, 2021)。这些损失导致资源浪费和经济损失,对全球粮食安全和可持续性努力构成了严重挑战(Keerthana et al., 2025)。传统的害虫管理主要依赖于人工检查和化学熏蒸剂(如磷化氢),但这些方法效率低下、效果延迟,并且由于长期单一使用导致害虫抗药性的增加而变得越来越无效(Yuan et al., 2024; Guo et al., 2026)。然而,不同害虫物种在取食习惯和危害程度上存在显著差异。以面粉为食的物种(如Tribolium castaneum)主要消耗粮食粉尘和碎片,常常导致隐蔽的霉菌生长,而钻孔害虫(如Sitophilus zeamais和Rhyzopertha dominica)则侵染完整的谷粒,造成更直接和严重的损害。此外,钻孔害虫的早期活动通常先于可见的侵染,是储存风险水平的关键指标。因此,准确识别害虫物种不仅对于评估粮食损害程度至关重要,也有助于实施分层的早期预警和差异化的害虫管理策略。在这种背景下,精准农业和实时害虫监测的发展变得至关重要。计算机视觉和机器学习的最新进展使得自动化害虫识别成为实时监测和针对性控制的有希望的方法(Barbedo, 2018)。然而,害虫物种的多样性及其高度的形态相似性给传统的图像处理方法带来了巨大挑战。因此,开发能够以可扩展方式准确区分形态相似害虫的智能模型在理论和实践上都具有重要的意义。
许多研究通过一系列图像处理和机器学习技术探索了害虫识别方法。早期使用人工神经网络(ANN)和支持向量机(SVM)的工作表明,ANN具有稳定性,而SVM在作物-昆虫分类方面通常具有更好的区分能力(Wang et al., 2012; Xie et al., 2015)。后续应用结合了经典纹理、颜色和形状描述符与Na?ve Bayes、K-Nearest Neighbors和SVM等分类器,在实际场景中实现了高准确率(Ebrahimi et al., 2017; Kasinathan and Uyyala, 2021; Barman et al., 2023)。随着深度学习的发展,卷积神经网络(CNN)因其端到端的特征学习而成为主流:轻量级架构和迁移学习策略在多物种数据集中表现出强大的性能(Wang et al., 2020; Jia et al., 2023; Jiang and Chen, 2024)。尽管如此,现有方法仍受到大量标记数据需求的限制,在区分形态相似的分类单元时鲁棒性有限,并且在资源有限的边缘设备上部署存在挑战(Attri et al., 2023)。此外,少量样本场景、类别不平衡以及需要可解释的、基于分类学的决策方案促使人们开发了混合策略,这些策略整合了经典纹理描述符(包括GLCM)、分层分类、迁移或元学习以及模型压缩,以实现实时、现场可部署的监测(Bjerge et al., 2023; He et al., 2025)。这些差距突显了针对储粮害虫识别的定向少量样本和纹理引导的分层框架的相关性(Su et al., 2022; Barman et al., 2023)。
在操作中的粮仓监测中,害虫出现的情况并不频繁。根据中国国家标准GB/T 29890-2013,每公斤活虫数量超过三十只的储粮被归类为严重感染,需要立即隔离和处理。这种低发生率和间歇性采样对模型开发造成了严重限制,包括有限的标记样本、明显的类别不平衡以及组装代表性训练集的实际困难。在这种数据受限的情况下,传统机器学习方法仍然具有明显优势。偏最小二乘判别分析(PLS-DA)、SVM和ANN方法仍然具有吸引力,因为它们概念上简单、在小型到中型数据集上训练效率高,并且结合工程特征时易于解释。将光谱或图像特征与这些分类器结合的实证研究报告了高识别率,这表明它们在受限应用场景中的持续相关性(Ahmad Loti et al., 2021; Mohammadi et al., 2024; Aminu et al., 2025)。
为了捕捉不同光照和方向下储粮害虫的细微周期性纹理模式,局部二值模式(LBP)对噪声敏感,方向梯度直方图(HOG)关注边缘梯度,而灰度共生矩阵(GLCM)不仅捕捉了二阶纹理统计信息,还提供了不变性、旋转不变性和低计算复杂性(Liu et al., 2023; Hallur and Gavade, 2025; Pai et al., 2026)。因此,本研究系统地比较了PLS、SVM和ANN分类器在七种储粮害虫物种上的性能,这些害虫物种在现实中的样本量少且类别不平衡。性能评估使用了基于纹理的特征集(如GLCM描述符)、标准化预处理(包括自适应缩放)和稳健的验证协议。目的是为现场部署提供实用基准,为资源受限的监测系统选择模型提供信息,并确定提高适用性的有希望的方向,包括分层分类方案、数据增强、迁移学习和少量样本适应。与使用统一分类器的现有分层方法不同,该策略避免了预设的分类器(Piedad et al., 2018; Kasani et al., 2025)。相反,它通过实验比较了不同分类器在属和物种层面的表现,以实现数据驱动的级别适应。