《Agriculture》:EMSC-YOLO: A Lightweight Model for Detecting Litchi Maturity in Complex Orchard Environments
Longzhen Yu,
Yusha Xie,
Kai Zhang,
Zhiwei Li,
Guogang Huang,
Junlong Li and
Changyu Liu
编辑推荐:
本研究聚焦于为复杂果园环境开发一种轻量化的荔枝成熟度检测模型。由于光照变化、果实密集簇生以及不同成熟阶段之间微妙的视觉差异,果园中的成熟度检测仍然具有挑战性。此外,现有许多方法依赖于计算成本高昂的笨重架构,限制了其在农业中资源受限的边缘设备上的部署。为了解决这
本研究聚焦于为复杂果园环境开发一种轻量化的荔枝成熟度检测模型。由于光照变化、果实密集簇生以及不同成熟阶段之间微妙的视觉差异,果园中的成熟度检测仍然具有挑战性。此外,现有许多方法依赖于计算成本高昂的笨重架构,限制了其在农业中资源受限的边缘设备上的部署。为了解决这些问题,研究人员提出了EMSC-YOLO,一种用于荔枝成熟度检测的轻量高效检测器。该模型引入了一种新颖的高效多尺度卷积(Efficient Multi-Scale Convolution, EMSConv)模块,以增强多尺度特征表示,同时减少冗余计算和参数量。此外,标准C2f模块被重新设计为C2f-EMSC,以在紧凑的架构内改善特征重用和跨通道交互,从而实现密集分布荔枝果实的有效检测。在面向复杂果园环境的荔枝成熟度(Complex Orchard Environments Oriented Litchi Maturity, COEOLM)数据集上的实验验证了所提方法的有效性。与YOLOv10n在COEOLM测试集上的结果相比,EMSC-YOLO的精确度达到87.7%,并将参数量减少了15.5%,仅为4.02 M。相较于YOLOv10n和YOLO11,EMSC-YOLO的mAP@0.5分别提高了2.81和1.48个百分点。同时,EMSC-YOLO保持了129.32 FPS的高推理速度,相较于基线模型YOLOv10n(其FPS为134.28),FPS仅相对下降了3.69%,满足了果园边缘场景的实时检测需求。总体而言,该方法为复杂果园环境下的实时荔枝成熟度检测提供了一种可部署的解决方案,并可扩展至其他簇生水果作物的成熟度检测任务。
研究背景与问题
荔枝作为一种具有高营养和经济价值的亚热带水果,在中国南方及其他热带、亚热带地区广泛种植。然而,荔枝采摘高度依赖人工,面临着强季节性和果实异步成熟(同一植株上不同成熟阶段的果实共存)带来的巨大劳动强度和选择性采收难题。近年来,基于深度学习的水果成熟度检测算法迅速发展,但现有方法在复杂果园环境中仍面临显著瓶颈:效率与精度之间的权衡突出,模型泛化能力适应性差,实用性不足,难以满足田间和产线的实际需求。尽管以YOLO系列为代表的单阶段目标检测算法在精度与计算效率间取得了平衡,但为满足农业复杂环境中实时目标检测的需求,特别是在资源受限的边缘设备上部署,亟需一种在保持高精度的同时实现轻量化的模型。现有基于YOLO的荔枝检测方法往往为了轻量化牺牲精度,或参数量和计算开销过大,无法满足果园低功耗边缘设备的实时部署要求。荔枝成熟度判定不准确,尤其是在密集种植场景下的高误检率,将导致20-30%的产量和质量损失,造成重大经济损失。因此,构建一个可在果园部署的轻量化检测模型,实现自动化、精准的荔枝成熟度检测,对提高采收效率、减少资源浪费至关重要。
研究开展与核心方法
研究人员针对上述问题,以YOLOv10n为基线模型,提出了一种名为EMSC-YOLO的轻量高效检测器。该研究构建了一个面向复杂果园环境的荔枝成熟度(COEOLM)数据集,包含1813张原始图像,并依据果皮颜色变化将成熟度精细划分为四个类别:绿色(green)、微黄(young)、半熟(half)和全红(red)。数据集通过随机种子42按约5:1:2的比例划分为训练集、验证集和测试集,并应用了对比度增强、亮度调整、高斯噪声和椒盐噪声过滤四种数据增强技术,最终将训练集图像扩充至2112张,标签总数达到20,243个。图像采集自中国浙江和广东的两个荔枝产区,品种为“妃子笑”,使用智能手机拍摄,原始高分辨率图像在预处理中被调整为640×640像素。
研究的技术核心在于一系列轻量化模块的创新设计:
- 1.
高效多尺度卷积(EMSConv)模块:受深度可分离卷积启发,该模块将输入通道对半分割,其中50%的通道依次通过一个3×3和一个5×5的深度卷积(DW Conv)提取多尺度特征,另一半通道则直接旁路。最后通过1×1点卷积(Pointwise Conv)进行通道融合与信息整合。这种设计减少了冗余计算和参数量,同时增强了多尺度特征表示能力。
- 2.
C2f-EMSC模块:将原始C2f模块中的CIB块替换为Ghost Bottlenecks,并通过堆叠K个(研究中经超参数分析确定最优数量)此类瓶颈结构,在保持特征表示能力的同时,进一步降低参数和计算复杂度,增强对密集分布荔枝目标的检测稳定性。
- 3.
PSA-EMSC模块:在极化自注意力(PSA)模块中集成EMSConv,替换原始的卷积层,并使用批量归一化(BatchNorm)替代层归一化(LayerNorm),以在轻量化框架下增强全局上下文特征建模能力。
- 4.
ScDown-EMSC模块:在空间下采样(ScDown)模块中用两个连续的EMSConv层替换原始的深度卷积,优化下采样过程中的信息保留。
这些模块被系统地集成到YOLOv10n的骨干网络(Backbone)、颈部网络(Neck)等关键位置,最终形成EMSC-YOLO模型。实验在统一硬件平台(NVIDIA RTX 4090 GPU)上进行,使用AdamW优化器,采用余弦退火学习率调度,批量大小为8,共训练100个周期。
研究结果
- •
3.1. 超参数分析实验:通过实验确定了EMSConv中前后两个深度卷积核的最优组合为3×3和5×5,该组合在精度、参数量和FPS间取得了最佳平衡。同时,确定了C2f-EMSC中Ghost Bottlenecks的堆叠数量K。
- •
3.2. 消融实验:在COEOLM验证集上进行的渐进式消融实验表明,每个提出的模块都对性能有正向贡献。逐步集成EMSConv、C2f-EMSC、PSA-EMSC和ScDown-EMSC后,最终模型相比基线YOLOv10n,mAP@0.5从86.3%提升至89.11%,参数量降至4.02 M,推理速度仍保持128.2 ± 1.8 FPS的高水平。
- •
3.3. 对比实验:在COEOLM测试集上,与YOLOv5s、YOLOv8、YOLO11和DETR等先进模型对比,EMSC-YOLO在召回率、mAP@0.5、mAP@0.95和参数量等指标上取得了最优的综合性能。其参数量仅为YOLO11的55.8%,DETR的9.7%,YOLOv8的15.5%。FPS达到129.32,分别比YOLO11和DETR高出11.58%和32.23%,仅比基线YOLOv10n(134.28 FPS)相对下降3.69%。
- •
3.4. 可视化:通过Grad-CAM类激活热图和对不同光照条件(光照充足、光照不足)及果实分布密度(独立分布、密集)场景下的检测结果可视化表明,EMSC-YOLO相比其他对比模型,能更精确地将注意力集中在果实关键区域,减少对背景的错误关注,在光照不足和果实密集等挑战性场景下表现出更强的鲁棒性和更低的误检、漏检率。然而,模型在处理图像顶部边缘被截断的果实以及极端密集场景时仍存在一定的误检风险。
讨论与结论
4.1. 优势:EMSC-YOLO的性能优势源于各模块有针对性的轻量化设计。EMSConv通过通道跳跃策略和多尺度卷积设计减少了冗余计算;C2f-EMSC通过Ghost模块增强特征复用;PSA-EMSC和ScDown-EMSC则优化了注意力机制和下采样过程。这种系统的轻量化架构在显著降低参数量的同时提升了检测精度,实现了效率与精度的良好权衡,使其特别适合于资源受限的果园边缘计算环境部署,为实时荔枝成熟度检测和选择性采收提供了可行的技术方案。
4.2. 挑战与局限性:尽管取得了显著进展,EMSC-YOLO仍存在局限。在极端天气、果实密度极高或图像边缘截断的情况下,模型偶尔会出现误检或漏检。当前性能评估主要在高端GPU平台进行,在实际边缘设备上的真实场景验证是未来部署的核心。此外,COEOLM数据集包含四种常见成熟度类别,未来可通过纳入更细粒度的成熟度子类别来增强数据集的全面性,并进一步测试模型在多光谱图像融合、极端光照及反光表面等更多场景下的鲁棒性。
5. 结论:本研究构建了包含超过2800张增强图像、分为四个成熟度类别的COEOLM数据集,为基于深度学习的荔枝成熟度检测研究提供了潜在的基准。以YOLOv10n为基线,通过系统性的轻量化设计,提出了高性能轻量化网络架构EMSC-YOLO。其核心创新包括新颖的轻量化EMSConv卷积模块,以及替代基线标准模块的轻量化优化组件C2f-EMSC、PSA-EMSC和ScDown-EMSC。在COEOLM测试集上,这些轻量化改进使mAP@0.5提升了2.81个百分点,参数量减少了15.5%,实现了参数紧凑、高速且准确的荔枝成熟度检测。评估结果表明,EMSC-YOLO在检测精度和参数量之间取得了优异的平衡,是一种高效的轻量化解决方案。所提出的轻量化EMSC-YOLO模型在密集、光照不足的荔枝成熟度检测应用中展现出巨大潜力,具备在嵌入式设备上部署的可行性。此外,基于COEOLM数据集建立的成熟度分类框架可扩展至其他簇生水果物种,从而进一步提升本工作在精准农业中的普适性和实用价值。