《Frontiers in Plant Science》:Feature enhancement and fusion-optimized defect detection model for Sanhua plums
编辑推荐:
本研究针对三华李微小缺陷检测难题,提出融合C2fCIB与C3k2_Mambaout模块的YOLO-CMA模型。通过多天气模拟数据增强构建平衡数据集,在保持超轻量(2.43M参数/5.9 GFLOPs)的同时,将虫蛀果检测mAP50提升2.7%至0.639,精准率达0.91。该方案为农产品微缺陷检测提供了从数据构建到模型优化的完整技术路径。
引言
三华李作为粤西地区特色水果,其采后品质自动化检测对产业发展至关重要。然而虫蛀孔(≤2毫米)等微缺陷在复杂果园环境中难以识别,存在特征弱、形态多变、易与果面纹理混淆等挑战。现有检测模型在微小缺陷特征提取、环境鲁棒性及轻量化设计协同优化方面存在不足,亟需针对性解决方案。
三华李异常果数据集构建
研究团队在2024-2025年产季于广东茂名核心产区采集5,915张原始图像,涵盖病果、虫蛀果、鸟啄果、裂果和正常果五类。针对虫蛀果(788张)和鸟啄果(709张)样本稀缺问题,采用晴雨雾夜四类天气模拟增强策略,通过调节亮度(0.3-1.5)、对比度(0.6-1.4)、高斯模糊(0.5-2.0)等参数,将数据集扩充至10,000张平衡样本。专业标注团队对虫蛀孔等微缺陷进行精细化标定,经农学专家验证后按7:2:1划分训练/验证/测试集。
基线模型选择与性能瓶颈分析
通过对比YOLOv12、RT-DETR、Hyper-YOLO等5种检测模型,发现YOLOv12在召回率(0.889)和轻量化(5.17M参数)方面表现最优,但其虫蛀果检测精度(0.852)显著低于NanoDet(0.989)。深度分析表明基线模型存在微小缺陷特征提取不足(虫蛀果召回率仅0.532)和相似特征判别力弱两大瓶颈,亟需增强特征保留与融合能力。
改进YOLO-CMA模型设计
模型在YOLOv12架构基础上创新引入双模块协同机制:在骨干网络深层嵌入C3k2_Mambaout模块,通过门控卷积双路径架构增强微小缺陷语义保留;在颈部网络关键路径部署C2fCIB模块,采用紧凑逆残差块实现多尺度特征高效融合。如图4所示,C2fCIB模块通过1×1卷积通道扩展、3×3深度可分离卷积空间滤波、通道压缩激活的三级处理,在保持计算效率(复杂度由O(9/2 HWC2)降至O(2HWC2+9/2 HWC))的同时强化浅层特征提取。C3k2_Mambaout模块则通过门控机制实现特征自适应加权,其计算过程如公式(3)(4)所示,显著提升模型对微缺陷的区分能力。
实验与结果分析
在RTX 3060硬件平台开展系统验证。消融实验(表7)表明双模块协同使虫蛀果检测mAP50提升至0.639,精准率提高5.8%至0.910。对比主流YOLO系列(表8),YOLO-CMA以最低计算成本(5.9 GFLOPs)实现竞争性性能,推理速度达37.9 FPS。可视化结果(图9)证实模型对虫蛀孔的检测置信度更稳定,有效减少将果面纹理误判为缺陷的情况。多天气增强策略虽未显著提升基准指标(表6),但增强了模型环境适应性。
讨论
本研究通过"协同解耦"优化范式突破微缺陷检测瓶颈:C2fCIB模块解决"特征深度保留"问题,C3k2_Mambaout模块优化"判别性融合"能力。相比SAW-YOLO等通用小目标检测方案,YOLO-CMA针对性更强,在虫蛀果等挑战性类别上实现精度与轻量化的双重突破。未来需在跨产区泛化性、亚毫米级缺陷检测及实际边缘部署效能方面持续优化。