编辑推荐:
针对拟态和非刚性幼虫检测难题,提出Edge-RegNet架构,通过自适应边缘感知模块和跨尺度动态融合网络解决特征混淆与定位偏移,实现2.62M参数、220FPS实时检测。
Lijia Xu | Xiaoshi Shi | Yuchao Wang | Zhijun Wu | Yongpeng Zhao | Yong He
成都航空职业技术学院机器人学院,中国成都
摘要
在非结构化的果园环境中准确检测到Papilio xuthus幼虫仍然是一个重大挑战,因为它们具有极强的伪装能力(保护性拟态)和非刚性身体特征。为了解决一般单阶段检测器在检测“伪装”和“软体”目标时的感知瓶颈,本研究提出了Edge-RegNet,这是一种基于生物特征的轻量级检测架构。该框架构建了一个双计算机制,包括频域纹理重建和空间拓扑对齐。首先,我们引入了自适应边缘感知空间模块(AESM),它使用多尺度微分算子来增强通常被主干网络抑制的高频边界纹理,从而解决由拟态引起的特征混淆问题。其次,提出了跨尺度动态融合网络(CDFN),该网络结合了双向注入机制来处理语义和细节信息,以实现特征流的动态平衡。第三,我们整合了任务对齐动态检测头(TAD-Head),利用动态卷积算子来适应性地校准分类和回归特征的空间分布,纠正由非刚性身体变形引起的定位偏差。此外,采用了“结构化剪枝和知识蒸馏”联合优化策略来实现高维特征迁移和极端模型压缩。实验结果表明,Edge-RegNet-n模型的平均精度(mAP@0.5)达到了91.8%,实时推理速度为220 FPS,参数数量仅为262万。这项研究有效解决了复杂栖息地中的“精度-速度”权衡问题,为智能现场监控设备的低成本边缘部署提供了核心算法支持。
引言
柑橘产业是全球农业经济的支柱,其产量稳定性直接关系到种植者的生计和区域农业的可持续性(Lu等人,2024年)。然而,广泛分布于生产区域的害虫Papilio xuthus(柑橘凤蝶)对农业生产安全构成了严重威胁,这主要是由于其在幼虫阶段消耗大量生物量以及快速爆发周期,导致柑橘叶片受到严重损害(Liu等人,2025年)。历史上,害虫控制主要依赖于人工检查和广谱化学喷洒。这些方法受到高劳动力成本和时间延迟的限制,并且经常导致严重的生态问题,如环境污染和农药残留,阻碍了农业的绿色转型。随着精准农业范式的兴起,基于计算机视觉的智能害虫监测正在逐步取代传统方法,成为无人果园管理和精准施药的核心驱动力(Wang等人,2025年)。
尽管通用对象检测算法在结构化场景中表现优异,但在真实世界果园中准确识别Papilio xuthus幼虫仍然受到生物学和环境复杂性的双重限制(Haar等人,2024年)。这些限制源于害虫独特的进化特征。首先,极强的拟态(保护性颜色)导致目标与背景语义特征之间的高度混淆;早期幼虫模仿鸟粪,而晚期幼虫的颜色与柑橘叶子高度相似。其次,在整个生长周期中存在显著的大小变化,特征经常因树枝和叶子的遮挡而变得碎片化,加剧了提取难度。第三,非刚性身体结构导致了特征与空间的解耦问题。与车辆等刚性物体不同,虫类的几何中心与语义中心不对齐,表现出显著的拓扑不确定性(Yang等人,2025年)。幼虫的几何中心通常位于身体部分的连接处,那里的纹理较为稀疏,或者由于蜷缩姿势而可能偏离身体(Sun等人,2024年)。这种自然中心点与特征点之间的不对齐阻止了基于固定锚点采样的通用检测范式在复杂变形空间中建立准确的回归映射。
近年来,学术界广泛探索了智能农业害虫检测,从传统的机器学习转向深度学习范式(Ngugi等人,2024年)。早期研究,如Rahman等人提出的堆叠CNN架构(Rahman等人,2020年),在减少模型大小的同时实现了高精度的水稻害虫识别。Sarin等人(Watcharabutsarakham和Methasate,2019年)利用颜色和灰度共生矩阵特征结合支持向量机,Tsai等人(Tsai等人,2017年)使用HSV空间结合决策树进行感兴趣区域提取,在特定场景中取得了成果。随后,Tetila等人(Tetila等人,2019年)引入了简单线性迭代聚类(SLIC)与CNN结合的方法,Brahimi等人(Brahimi等人,2017年)使用AlexNet进行疾病分类,进一步验证了深度特征的有效性。然而,这些方法主要集中在图像分类上,仍有改进空间,特别是在目标定位精度和复杂场景中的实时推理方面。为了平衡效率和精度,以YOLO系列为代表的一阶段检测器成功出现。Zha等人(Zha等人,2021年)将MobileNetv2集成到林业害虫检测中,Li等人(Li等人,2023年)使用MG-YOLO实现了98.3%的黄瓜灰霉孢子识别精度。为了解决多尺度问题,Liu等人(Liu和Wang,2020年)将图像金字塔应用于YOLOv3,Soeb等人(Soeb等人,2023年)开发了YOLO-T用于茶叶病害检测,Guo等人(Guo等人,2023年)将物理采样与YOLO-SIP结合。此外,针对小目标和背景干扰的具体改进包括在YOLOv8中融合卷积块注意力模块(CBAM)与双向特征金字塔网络(BiFPN),在VGGNet16中嵌入非局部注意力,并构建了具有混合注意力机制的GC-Faster RCNN。还探索了先进的数据增强策略,如WGAN-GP和生成对抗分类网络(GACN),以减轻样本有限导致的过拟合问题。
尽管取得了这些成就,现有方法对于“拟态+非刚性”目标仍然不够有效。像AgriPest-YOLO(Zhang等人,2022年)这样的轻量级模型通常特征提取能力较弱,无法在复杂背景中捕捉到微小的害虫特征。相反,追求高精度的模型,如HCFormer(Zeng等人,2024年),在边缘设备上面临计算瓶颈。一般单阶段检测器在处理高度拟态的害虫时遇到严重的频域信息失真问题。从信号处理的角度来看,深度CNN中的连续下采样起到了高频抑制滤波器的作用(Xu等人,2020年)。对于伪装的Papilio xuthus幼虫,这种机制会平滑昆虫身体和宿主叶子之间已经很弱的纹理梯度,导致目标在特征空间中被融入背景噪声中。因此,突破性感知的关键不在于加深网络,而在于构建一个明确的纹理重建和反向补偿机制,以计算上对抗生物伪装策略(Zheng等人,2025年)。从数学上讲,极强的拟态最小化了目标与宿主植物之间的高频纹理梯度。由于标准CNN下采样起到了低通滤波器的作用,它无意中抹去了这些弱梯度。在AESM中使用多尺度微分算子的数学原理是为了引入一个局部的空间高通滤波机制。通过计算不同池化核之间的离散差异(近似于一阶或二阶空间导数),网络在数学上被迫分离并放大高频轮廓残差,在语义融合发生之前明确重建目标的边界。
为了解决这些限制,本研究提出了一个核心科学假设:在特征提取网络的浅层显式增强边缘感知,在特征融合过程中构建动态的双向信息流,并在检测端结合任务对齐策略,可以有效克服由拟态和非刚性身体引起的特征混淆和定位偏差。为了验证这一点,我们构建了Edge-RegNet,这是一个结合了自适应边缘感知和任务对齐的轻量级检测网络(Cai等人,2024年;Tan等人,2020年)。本研究的主要贡献总结如下:
- •
我们提出了Edge-RegNet,这是一种基于生物特征的轻量级检测架构,专门设计用于解决农业害虫的极端拟态和非刚性变形问题。
- •
我们设计了自适应边缘感知空间模块(AESM)和跨尺度动态融合网络(CDFN),以数学上明确重建高频边界纹理并实现特征流的动态平衡。
- •
我们引入了任务对齐动态检测头(TAD-Head)来纠正定位偏差,并采用“结构化剪枝+知识蒸馏”策略实现极端模型压缩(262万参数),从而实现实时边缘部署。
本文的其余部分组织如下:第2节详细介绍了实验数据采集标准、Edge-RegNet框架及其核心子模块的数学原理;第3节通过多维消融研究和比较测试系统评估了模型的检测效果和轻量级优势;第4节深入分析了算法在极端环境中的鲁棒性,并讨论了潜在的局限性;第5节总结了研究结果并展望了未来前景。
数据集和注释
数据集和注释
数据收集集中在真实世界的果园场景中,构建了一个涵盖Papilio xuthus完整生命周期的复杂环境数据集。如图1(a)所示,这种害虫在五个龄期表现出显著的表型差异:1-3龄期(“幼虫”)呈棕色,高度模仿鸟粪,而4-5龄期(“成虫”)转变为鲜绿色,表面光滑且具有明显的气门器。这种剧烈的表型差异要求模型具备
实验设置和评估指标
本研究的所有实验都在统一的硬件和软件环境中进行,以确保公平性和可重复性。硬件平台配备了NVIDIA GeForce RTX 4090 GPU(24 GB VRAM)和Intel Core i9-13900K CPU,软件环境基于PyTorch 2.0深度学习框架和CUDA 11.8加速库。实验使用了自构建的Papilio xuthus幼虫数据集,随机分为训练集、验证集和
讨论
本研究证明了“受生物学启发的网络架构”在解决拟态、剧烈尺寸变化和非结构化果园环境中固有的非刚性变形的感知瓶颈方面的科学有效性。与通常在下采样过程中过度平滑高频纹理的一般检测范式不同,自适应边缘感知空间模块(AESM)在特征源处显式重建了边缘梯度。
结论
为了解决真实世界果园中拟态特征混淆、尺寸变化和非刚性身体定位的复杂性,本研究开发了Edge-RegNet,这是一个基于生物视觉特征的轻量级目标检测网络。核心贡献在于验证了将生物防御机制映射到深度神经网络计算策略的科学有效性。研究表明,通过AESM显式重建高频纹理
资助
本研究得到了国家自然科学基金(NSFC)(项目编号32572215)、雅安科技项目(项目编号24CGZH0013)和四川省智能农业工程技术中心的资助。
CRediT作者贡献声明
Lijia Xu:写作——审阅与编辑,撰写——初稿,监督,软件,项目管理,方法论,调查,形式分析,概念化。Xiaoshi Shi:写作——审阅与编辑,验证,调查,形式分析,数据管理。Yuchao Wang:验证,资源,调查,数据管理。Zhijun Wu:软件,方法论,形式分析。Yongpeng Zhao:资源,项目管理,资金获取。Yong He:写作——审阅与编辑,
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。