面向轻量化与鲁棒小麦穗检测的耦合标注与架构裁剪:基于Segment Anything Model(SAM)生成有向边界框(Oriented Bounding Box, OBB)配合简化YOLO变体及突尼斯小麦穗数据集(Tunisian Wheat Head Dataset, TWHD)验证

《Smart Agricultural Technology》:Coupled Annotation and Architecture Tailoring for Lightweight and Robust Wheat Head Detection: SAM-Oriented Bounding Boxes with Simplified YOLO Variants Validated on a Tunisian Wheat Head Dataset

【字体: 时间:2026年05月29日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  小麦穗检测是产量估算与作物计数的核心任务。然而,密集分布、复杂背景及光照变化等挑战仍需克服以保证检测精度。本研究采用数据—模型协同优化策略提升小麦穗检测性能。首先,研究人员将Global Wheat Head Detection(GWHD)数据集的水平边界框(

  
小麦穗检测是产量估算与作物计数的核心任务。然而,密集分布、复杂背景及光照变化等挑战仍需克服以保证检测精度。本研究采用数据—模型协同优化策略提升小麦穗检测性能。首先,研究人员将Global Wheat Head Detection(GWHD)数据集的水平边界框(Horizontal Bounding Box, HBB)替换为利用Segment Anything Model(SAM)生成的有向边界框(Oriented Bounding Box, OBB),构建了Comprehensive Rotated Wheat Head Detection(C-RWHD)数据集,通过突出目标信息减少背景复杂度与重叠干扰。其次,研究人员对YOLOv11和YOLOv12架构进行裁剪(移除特定大目标检测层)以降低资源消耗。第三,研究人员引入了自建的Tunisian Wheat Head Detection(TWHD)数据集用于鲁棒性评估。结果表明,相比OBB基线,所提YOLOv12s-OBB-SM参数量减少28.4%、计算量(Giga Floating-Point Operations, GFLOPs)降低2.2,召回率(Recall)更优,mAP@0.5维持96.3%,帧率(Frames Per Second, FPS)提升28.6%;在TWHD上具强泛化能力;在全量1382张测试图计数任务中R2=0.874、Mean Absolute Error(MAE)=7.2。此外YOLOv11n-OBB-SM参数量减29.63%、GFLOPs减11.94%,计数性能R2=0.83、MAE=8.4优于其OBB基线。所提裁剪架构满足农业边缘设备实时推理与低计算需求,具田间部署潜力。
论文解读:面向轻量化与鲁棒小麦穗检测的耦合标注与架构裁剪——基于SAM有向边界框与简化YOLO变体在突尼斯小麦穗数据集上的验证(Khalil Khazmi, Zied Lachiri, SITI Laboratory, National Engineering School of Tunis, University of Tunis El Manar, Tunisia;发表于《Smart Agricultural Technology》)
研究背景与意义:
小麦为全球粮食安全之基石,准确的小麦穗检测与计数是产量预估、田间管理与育种的关键表型(Phenotyping)环节。现有挑战包括麦穗密集分布、相互遮挡重叠、背景杂乱、光照与尺度多变、品种及生长阶段差异大。Global Wheat Head Detection(GWHD-2021)数据集采用水平边界框(Horizontal Bounding Box, HBB)标注,对倾斜、弯曲麦穗引入大量背景噪声且无法表征方向信息,影响密集场景下的定位精度;传统两阶段检测器计算开销大,标准YOLO系列模型对嵌入式农业边缘设备仍有资源压力;手动标注有向边界框(Oriented Bounding Box, OBB)耗时费力且已有旋转数据集规模受限。为此,Khalil Khazmi与Zied Lachiri提出数据—模型协同优化方案:利用Segment Anything Model(SAM)自动将GWHD-2021的HBB转为OBB构建C-RWHD数据集,裁剪YOLOv11/YOLOv12的大目标检测头获得轻量化OBB-SM(Small and Medium scale)变体,并自建突尼斯小麦穗检测数据集(Tunisian Wheat Head Detection, TWHD)作域外鲁棒性测试,最终验证所提模型兼顾高精度、低算力与强泛化能力,适合无人机(Unmanned Aerial Vehicle, UAV)及农田机器人边缘端实时部署。
主要关键技术方法:
研究人员使用GWHD-2021(6515幅图像,按官方划分训练/验证/测试)为基准数据;以SAM(ViT-H预训练权重)用原HBB作提示(Prompt)获取分割掩膜,拟合最小面积旋转矩形生成四边形OBB(DOTA格式转YOLO四边形),构建C-RWHD数据集;自建TWHD采集自突尼斯10个省意大利硬粒小麦品种Saragolla和Iride,153原图经增强至459幅作域外测试集。对YOLOv11-OBB及YOLOv12-OBB移除负责大目标(面积>96像素2)的P5检测头及其上游模块得YOLOv*?OBB-SM变体。所有模型输入640×640,训练100 epoch,AdamW优化器,余弦退火学习率,Mosaic增广,评估指标含Precision、Recall、mAP@0.5、mAP@0.5:0.95、参数量(Parameters, M)、GFLOPs、FPS及计数回归指标R2、RMSE、MAE、MAPE。对照实验含Faster R-CNN、RetinaNet、SSD、DETR及原版YOLO各尺度模型。
研究结果:
3.1 Experimental setup
研究人员在NVIDIA RTX 5060 Ti 16G、Ryzen 7 5700G、Python 3.11、PyTorch 2.7.1环境下统一训练与测试,明确超参数(Batch=16,Warm-up=3 epoch,初始lr=0.002,余弦衰减等)及评价指标定义。
3.2.1 Model performance comparative experiments
在C-RWHD上YOLOv12s-OBB达mAP@0.5=96.4%、YOLOv12s-OBB-SM达96.3%,均优于YOLOv11s-OBB(96.2%)及两阶段/Transformer检测器(Faster R-CNN 88.5%、DETR 71%)。YOLOv12s-OBB-SM较YOLOv12s-OBB参数量由9.5M降至6.8M(-28.4%)、GFLOPs由22.2降至20.0(-2.2),FPS由84升至108(+28.6%),Recall略升(91.8% vs 91.7%),mAP@0.5仅降0.1%。YOLOv11n-OBB-SM较YOLOv11n-OBB参数量减29.63%、GFLOPs减11.94%,mAP@0.5略降但计数性能更优。HBB→OBB标注使平均标注面积缩减65%–70%,C-RWHD整体mAP显著高于GWHD-2021对应模型。
3.2.2 Mean Average Precision Comparative Analysis
mAP@0.5训练曲线显示各模型约65–70 epoch收敛;YOLOv12s-OBB与YOLOv12s-OBB-SM曲线几乎重合,后者部分epoch超越前者,表明裁剪未损收敛性与最终精度;YOLOv11s-OBB早期波动大但后期稳定于>96%。
3.2.3 Heatmap-based detection performance comparison
基于检测框累积高斯平滑热力图显示,YOLOv12n-OBB-SM与YOLOv12s-OBB-SM在低照/模糊/高密度区对小目标及遮挡穗具更好特征提取,YOLOv12s-OBB-SM综合表现最佳;极亮强遮挡下各模型均有假阳性,nano模型在部分遮挡案例可检出而s模型漏检属注意力过度平滑差异。
3.2.4 Robustness experiments
在未见TWHD域外测试集上,YOLOv12s-OBB mAP@0.5:0.95=53.2%、YOLOv12s-OBB-SM=53.0%、YOLOv11s-OBB=53.3%;mAP@0.5分别为72.1%、72.1%、72.0%。虽较C-RWHD内测试下降(品种、相机、环境域偏移),但YOLOv12s-OBB-SM保持与基线接近且FPS最高,证实裁剪模型跨域泛化能力。
3.2.5 Counting performance comparison
全量C-RWHD测试集1382幅图(67421个真值穗):YOLOv12s-OBB计数最优(R2=0.8856,MAE=6.9);YOLOv12s-OBB-SM次之(R2=0.8738,MAE=7.2);YOLOv11n-OBB-SM(R2=0.8331,MAE=8.4)优于YOLOv11n-OBB(R2=0.7819,MAE=9.6)。说明对小容量nano模型去除冗余P5头可重定向资源至高分辨率特征提升计数;对高容量s模型去除P5微降严格定位mAP@0.5:0.95但几无影响检测与计数主指标。
讨论与结论总结(翻译研究结论部分):
本研究通过SAM将GWHD-2021 HBB转为OBB构建C-RWHD,显著缓解背景杂波、重叠与旋转变异问题从而提升检测精度。所提YOLOv11/YOLOv12裁剪变体证明可在参数量最高减29.63%与GFLOPs大幅降低情况下不损——甚至个别指标改善——关键性能。YOLOv12s-OBB-SM尤为突出:mAP@0.5达96.3%、Recall更优、FPS较基线提升28.6%、在未见TWHD具强泛化、全量非选择性测试集计数R2=0.874、MAE=7.2。该模型适合资源受限农业平台(UAV、机器人)实时部署。研究表明任务驱动架构裁剪与OBB表示对密集非结构化农景目标检测之价值,所提轻量高精度模型可为精确产量估算、适时田间管理与可持续精准农业提供实用工具,后续将拓展多作物泛化、多模态融合及田间实测。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号