《Frontiers in Plant Science》:YOLO-LitchiVar: a lightweight and high-precision detection model for fine-grained litchi variety identification
编辑推荐:
本综述提出YOLO-LitchiVar模型,通过深度可分离卷积(DSC3k2)实现轻量化设计,结合跨层渐进尺度聚合(C2PSA)模块增强微纹理特征提取,并引入高效通道注意力(ECA)机制提升相似品种区分能力。在包含12个荔枝品种的11,998张图像数据集上,该模型将"冰荔"召回率提升43.5%,参数量降低14.1%,在保持94.4% mAP50-95的同时显著优化计算效率,为果蔬采后品种智能鉴别提供创新解决方案。
研究背景与意义
荔枝作为重要亚热带水果,全球有近百个品种,其市场价值差异显著。传统产后品种鉴定依赖人工经验,存在效率低、主观性强、缺乏标准化等问题。建立自动化、高精度的荔枝品种识别系统对实现"优质优价"、推动产业升级具有重要价值。
数据集构建与方法
研究采集12个主要商业荔枝品种的11,998张图像,在实验室环境下模拟产后检测场景。使用四款主流智能手机采集图像,确保设备多样性。通过LabelMe工具进行人工标注,生成JSON格式标注文件,并转换为YOLO训练所需的TXT格式。
模型架构创新
基于YOLOv12架构,提出三重模块协同优化:
- 1.
DSC3k2模块采用深度可分离卷积结构,将标准卷积解耦为空间滤波和通道融合,参数量从257万降至220万(降低14.1%),计算量从6.5G FLOPs降至5.6G FLOPs(降低13.8%)
- 2.
C2PSA模块实现跨层特征聚合,通过1×1卷积降维后对齐P3、P4、P5特征图分辨率,经3×3卷积融合多尺度特征,显著提升浅层微纹理表征能力
- 3.
ECA注意力机制通过自适应一维卷积动态校准通道权重,有效抑制背景噪声和品种间共享特征
关键品种识别优化
针对易混淆品种开展专项优化:
- •
"冰荔"(Icy-Flesh Litchi)因微凹纹理在深层特征图中丢失导致漏检,通过C2PSA模块增强浅层特征提取,召回率从0.492提升至0.706(提升43.5%)
- •
"桂味荔"(Osmanthus-Fragr Litchi)与"冰荔"的误判率从0.462降至0.340(降低19.1%),主要得益于ECA机制对判别性通道的强化
实验验证与性能
在测试集上的综合性能表现为:
- •
精确率(Precision)达93.4%,召回率(Recall)达93.5%
- •
mAP50为97.7%,mAP50-95达94.4%,较基线模型提升0.8%
- •
模型参数量220万,计算量5.6G FLOPs,模型大小4.5MB,适合移动端部署
技术比较优势
与YOLO系列模型对比显示,YOLO-LitchiVar在保持轻量化优势的同时,在相似品种区分任务上表现突出。其创新性体现在:
- 1.
通过DSC3k2实现基础轻量化,为移动部署奠定基础
- 2.
C2PSA模块解决浅层特征利用不足问题,增强微纹理捕获能力
- 3.
ECA机制优化特征判别性,有效应对品种间相似性挑战
应用前景与局限
该模型为荔枝产后品种智能识别提供高效解决方案,未来需在自然环境下验证模型鲁棒性,并扩展至其他果蔬品种的精细分类任务。研究建立的公开数据集为后续农业图像识别研究提供重要基准。
训练过程分析
损失函数包含边界框损失(Lbox)、分类损失(Lcls)和分布焦点损失(Ldfl)三个组件,权重系数分别为λbox=7.5、λcls=0.5、λdfl=1.5。训练200个epoch后,各项损失均稳定收敛,表明模型训练有效。
模块贡献分析
消融实验验证各模块的协同作用:单独使用C2PSA模块使召回率提升1.4%,ECA模块使mAP50-95提升0.4%,DSC3k2主要贡献于效率优化。三模块联合使用时达到最佳性能平衡,实现准确率与轻量化的双重突破。
研究团队信息
研究由广东石油化工学院团队完成,第一作者任鹏举来自上海海事大学,合作者包括吴先军、苏雪平等。实验在NVIDIA GeForce RTX 3060 GPU平台完成,使用PyTorch 2.7.1框架,为农业人工智能应用提供了技术示范。