将纹理特征与分层机器学习分类器相结合，用于少量样本的储粮害虫识别

《Journal of Stored Products Research》：Integrating texture features with hierarchical machine learning classifiers for few shot stored grain pest identification

【字体：大中小】 时间：2026年06月06日 来源：Journal of Stored Products Research 2.8

编辑推荐：

　　余书轩|徐丽卓通|程红|陈天|杭倩宇|赵思琪|唐佩安|丁超|刘强南京财经大学食品科学与工程学院/现代粮食流通与安全协同创新中心，中国南京210023摘要准确识别储粮害虫是智能储粮的关键挑战，但由于亲缘关系密切的物种在形态上的相似性，这一任务仍然具有挑战性。本研究提出了一种分层分类

余书轩|徐丽卓通|程红|陈天|杭倩宇|赵思琪|唐佩安|丁超|刘强

南京财经大学食品科学与工程学院/现代粮食流通与安全协同创新中心，中国南京210023

摘要

准确识别储粮害虫是智能储粮的关键挑战，但由于亲缘关系密切的物种在形态上的相似性，这一任务仍然具有挑战性。本研究提出了一种分层分类策略，用于少量样本的害虫识别，通过评估纹理特征来提高在数据有限条件下的分类准确性。使用七种代表性害虫，通过灰度共生矩阵（GLCM）提取纹理和均方差异特征，并在平面和分层分类方案下开发了机器学习模型。结果表明，虽然纹理特征能有效区分大多数物种，但在对比度和能量方面观察到Oryzaephilus surinamensis与Laemophloeidae之间存在重叠，在均匀性方面观察到Tribolium castaneum与Rhyzopertha dominica之间存在重叠。在平面分类下，结合自适应缩放预处理的SVM达到了93.14%的总体准确率，尽管Cryptolestes ferrugineus的准确率仅为89%。分层分类将总体准确率提高到95.61%，相对于平面分类降低了36%的错误率，C. ferrugineus的准确率也提高到了95%。该策略增强了模型的鲁棒性和可解释性，为少量样本条件下的高精度害虫识别提供了一个可扩展的机器学习框架，对智能储粮监测具有显著潜力。

引言

全球收获后的粮食损失约占总产量的10%至20%，其中由于储存管理不当造成的损失尤为严重（Flor, 2019）。储粮害虫是这些损失的主要原因。每年由储粮害虫造成的粮食损失占全球产量的10%至20%，在一些发展中国家和地区这一比例更高（Guo et al., 2026）。除了通过直接消耗粮食造成大量数量损失外，这些害虫还会产生排泄物、尸体和代谢副产物，这些物质会促进发热、霉菌生长、品质下降和霉菌毒素污染，从而直接危及消费者健康（Srivastava and Mishra, 2021）。这些损失导致资源浪费和经济损失，对全球粮食安全和可持续性努力构成了严重挑战（Keerthana et al., 2025）。传统的害虫管理主要依赖于人工检查和化学熏蒸剂（如磷化氢），但这些方法效率低下、效果延迟，并且由于长期单一使用导致害虫抗药性的增加而变得越来越无效（Yuan et al., 2024; Guo et al., 2026）。然而，不同害虫物种在取食习惯和危害程度上存在显著差异。以面粉为食的物种（如Tribolium castaneum）主要消耗粮食粉尘和碎片，常常导致隐蔽的霉菌生长，而钻孔害虫（如Sitophilus zeamais和Rhyzopertha dominica）则侵染完整的谷粒，造成更直接和严重的损害。此外，钻孔害虫的早期活动通常先于可见的侵染，是储存风险水平的关键指标。因此，准确识别害虫物种不仅对于评估粮食损害程度至关重要，也有助于实施分层的早期预警和差异化的害虫管理策略。在这种背景下，精准农业和实时害虫监测的发展变得至关重要。计算机视觉和机器学习的最新进展使得自动化害虫识别成为实时监测和针对性控制的有希望的方法（Barbedo, 2018）。然而，害虫物种的多样性及其高度的形态相似性给传统的图像处理方法带来了巨大挑战。因此，开发能够以可扩展方式准确区分形态相似害虫的智能模型在理论和实践上都具有重要的意义。

许多研究通过一系列图像处理和机器学习技术探索了害虫识别方法。早期使用人工神经网络（ANN）和支持向量机（SVM）的工作表明，ANN具有稳定性，而SVM在作物-昆虫分类方面通常具有更好的区分能力（Wang et al., 2012; Xie et al., 2015）。后续应用结合了经典纹理、颜色和形状描述符与Na?ve Bayes、K-Nearest Neighbors和SVM等分类器，在实际场景中实现了高准确率（Ebrahimi et al., 2017; Kasinathan and Uyyala, 2021; Barman et al., 2023）。随着深度学习的发展，卷积神经网络（CNN）因其端到端的特征学习而成为主流：轻量级架构和迁移学习策略在多物种数据集中表现出强大的性能（Wang et al., 2020; Jia et al., 2023; Jiang and Chen, 2024）。尽管如此，现有方法仍受到大量标记数据需求的限制，在区分形态相似的分类单元时鲁棒性有限，并且在资源有限的边缘设备上部署存在挑战（Attri et al., 2023）。此外，少量样本场景、类别不平衡以及需要可解释的、基于分类学的决策方案促使人们开发了混合策略，这些策略整合了经典纹理描述符（包括GLCM）、分层分类、迁移或元学习以及模型压缩，以实现实时、现场可部署的监测（Bjerge et al., 2023; He et al., 2025）。这些差距突显了针对储粮害虫识别的定向少量样本和纹理引导的分层框架的相关性（Su et al., 2022; Barman et al., 2023）。

在操作中的粮仓监测中，害虫出现的情况并不频繁。根据中国国家标准GB/T 29890-2013，每公斤活虫数量超过三十只的储粮被归类为严重感染，需要立即隔离和处理。这种低发生率和间歇性采样对模型开发造成了严重限制，包括有限的标记样本、明显的类别不平衡以及组装代表性训练集的实际困难。在这种数据受限的情况下，传统机器学习方法仍然具有明显优势。偏最小二乘判别分析（PLS-DA）、SVM和ANN方法仍然具有吸引力，因为它们概念上简单、在小型到中型数据集上训练效率高，并且结合工程特征时易于解释。将光谱或图像特征与这些分类器结合的实证研究报告了高识别率，这表明它们在受限应用场景中的持续相关性（Ahmad Loti et al., 2021; Mohammadi et al., 2024; Aminu et al., 2025）。

为了捕捉不同光照和方向下储粮害虫的细微周期性纹理模式，局部二值模式（LBP）对噪声敏感，方向梯度直方图（HOG）关注边缘梯度，而灰度共生矩阵（GLCM）不仅捕捉了二阶纹理统计信息，还提供了不变性、旋转不变性和低计算复杂性（Liu et al., 2023; Hallur and Gavade, 2025; Pai et al., 2026）。因此，本研究系统地比较了PLS、SVM和ANN分类器在七种储粮害虫物种上的性能，这些害虫物种在现实中的样本量少且类别不平衡。性能评估使用了基于纹理的特征集（如GLCM描述符）、标准化预处理（包括自适应缩放）和稳健的验证协议。目的是为现场部署提供实用基准，为资源受限的监测系统选择模型提供信息，并确定提高适用性的有希望的方向，包括分层分类方案、数据增强、迁移学习和少量样本适应。与使用统一分类器的现有分层方法不同，该策略避免了预设的分类器（Piedad et al., 2018; Kasani et al., 2025）。相反，它通过实验比较了不同分类器在属和物种层面的表现，以实现数据驱动的级别适应。

章节片段

害虫样本

本研究中使用的害虫样本由南京粮食集团提供，并由国家粮食储存与运输工程技术研究中心进行了分类学验证。收集的害虫包括七种常见的储粮害虫：Tribolium castaneum、Tribolium confusum、Cryptolestes ferrugineus、Cryptolestes pusillus、Oryzaephilus surinamensis、Sitophilus zeamais和Rhyzopertha dominica。在害虫活跃期间，获得了500只健康、完整的成虫个体

纹理特征分析

为了量化七种储粮物种之间的纹理差异，对五个GLCM特征进行了单因素方差分析，随后进行了Tukey的诚实显著差异事后检验（p?）。图3中的结果表明，在评估的纹理指标上各组之间存在显著差异。C. pusillus和O. surinamensis显示出最高的对比度值，并且彼此之间没有差异；Laemophloeidae物种与O. surinamensis之间的对比度

结论

本研究提出并验证了一种机器学习方法，该方法将纹理特征与分层分类策略相结合，用于识别七种储粮害虫物种。从GLCM衍生的纹理描述符有效地捕捉了害虫体表的形态变化，在科和物种层面都实现了清晰的可区分性。在平面分类策略下，总体识别准确率为93.14%，相应的错误率为6.86%

资助

作者感谢中国国家重点研发计划（编号2023YFE0123300）和江苏省高等教育机构优先学术发展计划（PAPD）的财政支持。

CRediT作者贡献声明

余书轩：数据整理、可视化、撰写——初稿。徐丽卓通：调查、资源。程红：资源、软件。陈天：正式分析、调查。杭倩宇：正式分析、资源。赵思琪：调查、方法论。唐佩安：正式分析、方法论。丁超：资金获取、项目管理、监督。刘强：资金获取、方法论、撰写——审阅与编辑。

利益冲突声明

本手稿的提交不存在利益冲突，所有作者均同意发表。

相关新闻

摘要

引言

章节片段

害虫样本

纹理特征分析

结论

资助

CRediT作者贡献声明

利益冲突声明

热点排行