基于YOLOv11n-WELA的多尺度特征融合轻量化茶叶嫩芽检测算法研究

《Smart Agricultural Technology》：Tea Bud Detection in Natural Environments based on YOLOv11n-WELA

【字体：大中小】 时间：2026年02月06日 来源：Smart Agricultural Technology 5.7

编辑推荐：

　　本文针对自然环境下茶叶嫩芽目标小、分布密集、与成熟叶片颜色相似导致的检测精度下降问题，以及移动平台部署深度学习模型面临的计算与存储瓶颈，提出了一种基于YOLOv11n的改进轻量化检测算法YOLOv11n-WELA。该研究通过引入ADown模块、构建加权融合高效多尺度特征金字塔网络(WF-EMSFPN)以及采用轻量级非对称检测头(LADH)等创新设计，在自建毛尖茶芽数据集上实现了90.67%的mAP@0.5，较基线模型提升0.91%，同时模型参数量、计算量和模型大小分别降低37.98%、25.40%和32.73%。在NVIDIA Jetson Nano边缘设备上的部署验证表明，该模型可实现31 FPS的实时检测帧率，为茶叶智能采摘机器人的视觉感知系统提供了有效的技术解决方案。

茶作为全球最受欢迎的无酒精饮料之一，以其独特风味和文化内涵广受青睐。随着生物学研究的深入，茶的健康功效和药用价值不断被发掘，推动了茶产业市场经济的蓬勃发展。根据中国茶叶流通协会公布的统计数据，中国茶叶产量、种植面积和产值在过去十年呈现稳步增长态势。然而，茶叶嫩芽的采摘目前主要依赖传统的手工采摘技术。随着采茶工人数量逐年减少，具有强季节性的优质茶芽常因采摘不及时导致品质下降，进而影响茶叶产量和茶产业经济效益。

在这一背景下，茶叶嫩芽自动采摘机器人的深入研究成为必然需求。作为替代人类视觉识别的核心技术模块，机器视觉系统的检测精度决定了自动化设备的工作性能。因此，研究实时茶叶嫩芽检测技术不仅为自动采摘机器人提供可靠的感知支持，还能显著提升茶园采摘效率和产品质量，为茶市场的长远发展奠定技术基础。

当前茶叶嫩芽检测方法主要分为两类：一类基于传统图像处理结合机器学习技术，另一类依赖深度学习算法完成检测任务。然而，由于种植条件多变、茶芽尺寸小、与成熟叶片颜色相似度高，传统目标检测算法难以在真实场景中有效进行茶芽识别。近年来，深度学习技术特别是卷积神经网络(CNN)在自主特征提取方面的显著优势，为茶叶嫩芽检测带来了新的机遇。

本研究发表在《Smart Agricultural Technology》期刊上，针对自然环境中茶叶嫩芽检测存在的技术挑战，提出了一种创新的解决方案。

研究人员为开展此项研究，主要采用了以下关键技术方法：首先，在自建的数据集上进行了系统研究，该数据集包含6,050张原始图像，共有13,754个标注目标，按照8:1:1的比例随机划分为训练集、验证集和测试集。其次，研究以YOLOv11n为基础模型，进行了三项核心改进：在骨干网络中引入轻量级ADown模块替代部分标准卷积层；在颈部网络创新性地设计了加权融合高效多尺度特征金字塔网络(WF-EMSFPN)，建立跨尺度特征加权融合机制；在检测头采用轻量级非对称检测头(LADH)结构。此外，研究还引入了多尺度卷积块(MSCB)与C3k2模块结合构建复合模块，以及高效上采样卷积块(EUCB)来增强特征表示能力。

网络模型结构

基于YOLOv11n的核心架构，YOLOv11n-WELA检测模型进行了系统性优化。该模型在骨干网络的P3、P4和P5层中集成了ADown模块，取代了原始的卷积操作，其双路径下采样设计有效缓解了茶叶嫩芽特征提取过程中的细节丢失问题。

加权融合高效多尺度特征金字塔网络

研究构建了WF-EMSFPN，通过嵌入EUCB和重构的C3k2_MSCB模块，结合自适应加权融合策略，增强了茶叶嫩芽浅层和深层特征的表征能力，实现了高效的多层级特征融合。该架构采用动态权重分配算法实现跨层特征融合，有效整合了茶叶嫩芽的多层次特征，提高了复杂背景下小目标的检测性能和鲁棒性。

轻量级非对称检测头

模型采用LADH，利用三个功能互补的分支执行相关任务。在IoU分支中，使用三个3×3深度可分离卷积替代原始卷积层，显著降低了模型参数量。这种任务解耦设计有效平衡了分类和回归任务之间的冲突，同时降低了模型复杂度和计算负载。

模型训练结果分析

实验结果表明，YOLOv11n-WELA在保持检测精度的同时，显著降低了模型复杂度。优化后的轻量化架构达到了85.88%的精确率、81.47%的召回率、90.67%的mAP@0.5和73.86%的mAP@0.5:0.95，相比基线YOLOv11n分别提升了1.81、1.46、0.91和1.28个百分点。在模型复杂度方面，参数量从2.58M减少到1.6M，FLOPs从6.3G降低到4.7G，模型大小从5.5MB压缩到3.7MB。

消融实验研究

通过逐步将WF-EMSFPN、LADH和ADown模块融入YOLOv11n基础模型，研究发现这三个改进策略对茶叶嫩芽检测具有有效性、兼容性和互补性。最终模型在mAP@0.5和mAP@0.5:0.95指标上均实现稳步提升，同时模型大小和参数量持续下降。

主流检测模型对比实验

与YOLOv5n、YOLOv7-tiny、YOLOv8n、YOLOv10n、YOLOv11n和YOLOv12n等主流YOLO轻量型模型相比，YOLOv11n-WELA在综合性能上表现最优，同时具有最低的参数量和模型大小。

边缘设备模型部署实验

在NVIDIA Jetson Nano边缘部署平台上，改进后的YOLOv11n-WELA模型实现了31 FPS的稳定端到端实时检测帧率，峰值内存使用量约为3.1 GB，平均模型加载时间为1秒，满足了自然环境下茶叶嫩芽检测的基本实时性要求。

研究结论表明，YOLOv11n-WELA通过三重优化策略实现了性能提升，在保持检测精度的同时节约了超过25%的计算资源，为嵌入式移动设备提供可行的部署路径。该架构在复杂茶园场景中具有优异的识别性能，同时具有最低的参数量和模型大小，为茶叶智能采摘机器人的视觉感知系统提供了有效的技术解决方案。

研究的创新性主要体现在：提出了基于多尺度特征融合和轻量化设计的茶叶嫩芽检测算法；通过动态加权融合机制增强了模型对多尺度特征的感知能力；采用任务解耦设计平衡了分类与定位精度；在资源受限的边缘设备上实现了实时检测性能。

尽管该算法实现了准确的茶叶嫩芽检测，研究也指出了几个有待解决的局限性：数据集在构建时缺乏对应用场景的系统区分；强光照条件下茶芽表面白毫的镜面反射会导致图像模糊和散焦；数据集中严重遮挡、极端光照和天气条件下的样本覆盖不足；目前仅关注单芽检测而缺乏多级分类机制；对远距离小目标茶芽的漏检和误检问题需要进一步优化。

未来的研究方向包括：模拟实际采收设备中相机与茶树的不同距离进行针对性数据采集；引入高动态范围成像或偏振数据采集技术抑制强光照下的镜面反射；采用数据增强方法生成长距离、多遮挡和极端天气条件下的样本；建立基于芽形态和展开状态的分级标注策略；在轻量网络中探索超分辨率模块降低远距离茶芽的漏检和误检率。这些工作将进一步完善茶叶嫩芽检测技术，推动智能采茶设备的发展。