《Smart Agricultural Technology》:Real-time monitoring of pepper harvesting loss using a lightweight vision model
编辑推荐:
工业辣椒机械化收获过程中,落果损失的实时监测是优化作业参数、降低产量损失的核心环节,但田间高尘干扰与复杂背景导致落椒精准检测面临严峻挑战。针对这一问题,研究人员提出一种融合图像增强与轻量级目标检测的鲁棒视觉监测方法:首先采用暗通道先验(Dark Channel
工业辣椒机械化收获过程中,落果损失的实时监测是优化作业参数、降低产量损失的核心环节,但田间高尘干扰与复杂背景导致落椒精准检测面临严峻挑战。针对这一问题,研究人员提出一种融合图像增强与轻量级目标检测的鲁棒视觉监测方法:首先采用暗通道先验(Dark Channel Prior,DCP)算法抑制尘雾干扰,恢复退化图像的清晰度;随后构建改进型YOLOv8n模型Pepper_YOLOv8n,通过优化Neck结构、引入SimAM注意力机制与自校准光照网络(Self-Calibrated Illumination Network,SCINet)模块,强化小目标与部分遮挡目标的特征表征能力。实验结果表明,该模型精确率达90.1%、召回率达89.7%、平均精度均值(mean Average Precision,mAP)达96.8%;与基线YOLOv8n相比,召回率与mAP@0.5分别提升4.0个百分点与2.3个百分点,工作站端单帧推理时间缩短1.5 ms。为进一步验证实用性,研究人员基于D-Robotics RDK X5平台开发实时边缘检测系统,通过训练后量化(Post-Training Quantization,PTQ)将计算量(FLOPs)降低3.6G,单帧推理速度达18.2 ms,满足田间收获作业的实时监测需求。该方法为收获损失智能监测提供了有效解决方案,可为精准农业与智慧农机装备发展提供实践支撑。
《Smart Agricultural Technology》发表的这项研究聚焦工业辣椒机械化收获的损失监测难题。我国新疆作为优质工业辣椒主产区,其种植规模大、依赖单次机械化收获,但收获过程中落椒损失率高,即便微小损失率上升也会因生产规模放大为显著经济损失,而作业参数(行驶速度、齿间距、滚筒转速等)与田间条件(株高、含水率等)的动态变化进一步要求实时监测损失以优化控制策略。现有谷物收获监测方法多针对玉米、水稻等大尺度均匀目标设计,难以适配工业辣椒小尺寸、不规则形态及田间遮挡场景,且收获过程产生的高浓度尘雾会严重退化图像质量,成为制约视觉感知的核心瓶颈。为此,研究人员开展融合图像增强与目标检测的落椒实时监测技术研究,构建了兼顾精度与效率的轻量级模型,并实现了边缘端部署,为智慧农机装备提供了可落地的技术方案。
研究采用的关键技术方法包括:在新疆焉耆县工业辣椒品种‘红龙23’的田间试验中,通过自走式辣椒收获机搭载的车载摄像头采集2000张1920×1080分辨率图像,经透视变换校正几何畸变后按8:1:1划分数据集;采用暗通道先验(DCP)算法处理尘雾退化图像,基于大气散射模型恢复清晰图像;以YOLOv8n为基线模型,通过三方面优化构建Pepper_YOLOv8n:一是引入自校准光照网络(SCINet)自适应调整亮度,二是改进Neck结构新增160×160大尺度特征层以增强浅层特征融合,三是集成无参数SimAM注意力机制抑制背景冗余;采用训练后量化(PTQ)将模型从FP32转换为INT8精度,部署于D-Robotics RDK X5边缘计算平台实现加速。
研究结果如下:
3.1 图像去尘效果对比:DCP算法在尘雾场景下可有效抑制散射干扰,恢复辣椒真实颜色与纹理细节;与CLAHE(对比度受限自适应直方图均衡化)、MSRCR(多尺度视网膜颜色恢复)相比,DCP在高尘环境中能更清晰地还原结构边界,灰度直方图与L通道分布更分散均衡,显著提升对比度与动态范围。
3.2 YOLOv8n消融试验:单独优化Neck结构可使召回率提升3.8%,是降低漏检率的核心模块;加入SimAM与SCINet后,弥补了Neck优化的精度损失,最终Pepper_YOLOv8n较基线召回率提升4.0%、mAP@0.5提升2.3%,单帧推理时间缩短1.5 ms至7.8 ms;高尘环境下,该模型较基线精确率、召回率、mAP@0.5分别提升2.7%、5.8%、5.1%,Grad-CAM热力图显示其注意力更集中于辣椒目标,背景噪声抑制能力显著增强。
3.3 模型对比试验结果:传统模型(SSD、Faster R-CNN、RetinaNet)因小目标适应性差,mAP均低于80%;YOLO系列中YOLOv8n基线表现最优(mAP@0.5为94.5%),而Pepper_YOLOv8n以90.1%精确率、89.7%召回率、96.8% mAP@0.5超越所有对比模型。
3.4 图像去尘对检测性能的影响:高尘环境下,去尘后图像可使低尘场景召回率提升2.2%、mAP@0.5提升1.6%,高尘场景精确率与召回率分别提升0.7%与1.2%,验证了预处理阶段对复杂环境的鲁棒性。
3.5 模型部署与加速:基于D-Robotics RDK X5平台的BPU(脑处理单元)加速器,经PTQ量化后模型FLOPs降低3.6 G至9.8 G,单帧推理速度从234 ms提升至18.2 ms,满足田间实时监测需求。
研究结论可总结为三点:其一,Pepper_YOLOv8n通过Neck结构优化、SimAM注意力机制与SCINet模块的集成,实现了90.1%精确率、89.7%召回率、96.8% mAP@0.5的检测性能,单帧推理时间7.8 ms,较基线显著提升小目标检测能力;其二,DCP去尘算法在高尘环境下可有效提升检测精度,低尘场景召回率提升2.2%,高尘场景精确率与召回率分别提升0.7%与1.2%,抵消环境噪声干扰;其三,经PTQ量化部署于RDK X5平台后,模型FLOPs降低3.6 G,推理速度达18.2 ms/帧,满足工业辣椒收获的实时监测要求。该研究为机械化收获损失智能监测提供了可行技术方案,未来将进一步研发落果数量与质量的关联模型以实现产量损失直接估算。