《Agriculture》:CFSS-YOLO: A Detection Method for Cotton Top Bud in Real Farmland
Xi Wu,
Tingting Zhu,
Sheng Xue,
Jian Wu,
Hongzhen Guo and
Chao Ni
编辑推荐:
为解决真实农田中棉花顶芽因目标小、背景相似而导致的检测精度低下的问题,本研究提出了一种基于YOLOv12改进的CFSS-YOLO模型。研究在颈部(Neck)引入卷积注意力模块CBAM以抑制背景干扰,并设计了新的FSSLoss损失函数以聚焦小目标和难样本。实验结果表明,该模型的精确度、召回率和mAP50分别达到87.6%、75.3%和84.8%,在棉花顶芽识别任务中展现出优异的检测性能和应用潜力。
棉花是我国重要的经济作物,打顶是棉花种植管理的关键环节。手动打顶效率低下,化学打顶存在污染风险,因此机械打顶成为兼顾效率与环保的重要发展方向。然而,机械打顶的“眼睛”——对棉花顶芽的精准识别,却面临着不小的挑战。在真实的密植棉田中,顶芽尺寸微小,在整幅图像中占比不足1.05%,且与背景极为相似,这使得传统检测方法往往“力不从心”,识别准确率和召回率难以满足实际应用需求。为了解决这一核心难题,研究人员展开了一项针对性的研究,旨在开发一个轻量、实时的模型,以提升真实密植农田场景下棉花顶芽的检测精度。这项研究成果发表在学术期刊《Agriculture》上。
为开展此项研究,研究人员主要运用了以下关键技术方法:首先,在新疆奎屯的标准棉田中使用双目相机采集动态视频数据,构建了包含1042幅真实农田图像的数据集,并利用标注工具对顶芽目标进行标注。其次,在YOLOv12s模型框架的基础上进行改进,在特征融合的颈部(Neck)结构引入卷积块注意力模块(Convolutional Block Attention Module, CBAM),以增强模型对有效特征的提取能力。最后,重新设计了模型的损失函数,采用由Focaler-IoU优化的Shape-IoU构成定位损失,并整合SlideLoss优化分类损失,构建了名为FSSLoss的新损失函数,以平衡分类与定位任务,并加速模型收敛。
2. 数据收集与处理
研究团队于2025年7月在新疆奎屯的标准棉田,使用由奥比中光生产的Gemini 335Le双目相机搭建数据采集系统,模拟机械设备的动态打顶过程进行视频拍摄。从视频流中间隔抽取帧,共获得1042幅原始图像作为实验数据集。通过标注工具对图像中的棉花顶芽(标记为“Bud”)进行位置标注,生成包含目标中心坐标及边界框宽高信息的标签文件,并按约8:1:1的比例划分为训练集、验证集和测试集。数据分析显示,标注框在图像中分布分散,顶芽尺寸大多在20×20像素到120×120像素之间,其在整图中所占面积小于1.05%,属于典型的小目标检测任务。
3. 方法
本研究提出了名为CFSS-YOLO的棉花顶芽检测模型,其以YOLOv12s为基础架构,同样包含骨干网络(Backbone)、颈部(Neck)和检测头(Detection Head)三部分。主要的改进点有两处:一是在颈部的每个A2C2f模块后添加了CBAM注意力模块,在不显著增加参数量的前提下,提升网络深度和特征提取能力,帮助模型从相似背景中提取有用的小目标信息。二是改进了损失函数,使用Focaler-ShapeIoU替代CIoU作为定位损失,以更关注小目标;同时使用SlideLoss优化传统的二元交叉熵(Binary Cross-Entropy, BCE)分类损失,使模型更关注难以识别的样本。这些改进旨在加速模型收敛速度。
4. 实验结果与分析
通过对比实验,评估了CFSS-YOLO与YOLOv12s、YOLOv5s、SSD、RT-DETR、DEIM-R18等主流目标检测模型在自有数据集上的性能。实验结果显示,CFSS-YOLO模型的精确度(Precision)、召回率(Recall)和平均精度均值mAP50分别达到了87.6%、75.3%和84.8%,其检测性能优于其他对比模型。消融实验进一步证实,单独引入CBAM模块或FSSLoss损失函数均能提升模型性能,而两者结合使用(即完整的CFSS-YOLO)获得了最佳的检测效果。这表明CBAM模块有效增强了特征提取能力,而FSSLoss则更好地平衡了分类与定位损失,并加速了收敛。
5. 讨论
本研究成功开发了CFSS-YOLO模型,用于解决真实农田环境下棉花顶芽的小目标检测难题。通过在YOLOv12s的颈部集成CBAM注意力机制,模型增强了对关键特征的关注,抑制了背景干扰。通过设计FSSLoss损失函数,模型优化了对小目标和困难样本的学习过程。综合实验表明,该模型在精度、召回率和mAP50上均取得了显著提升,且性能优于多种主流检测模型。这项工作为棉花机械打顶的自动化提供了可靠的技术方案,所提出的方法对于其他农业场景中的小目标识别任务也具有借鉴和推广价值。