SD-MSL-YOLO:一种用于蔬菜盆栽幼苗检测和缺失幼苗定位的轻量级模型
《Computers and Electronics in Agriculture》:SD-MSL-YOLO: A lightweight model for vegetable pot seedling detection and missing seedling localization
【字体:
大
中
小
】
时间:2026年02月27日
来源:Computers and Electronics in Agriculture 8.9
编辑推荐:
蔬菜 replanting 机器人需解决缺失苗定位问题,现有方法计算成本高。本研究提出 SD-MSL-YOLO 模型,集成 PsConv、FasterNet-SimAM 等轻量化模块和 GLSA-BiFPN 多尺度特征提取,结合 TADDH 任务解耦策略,在 3202 张多光照条件下图像上实现 97.53% mAP@0.5,参数量仅 1.31M,GFLOPs 4.7,定位误差 26.19mm。
余高红|王旭|王磊|董海飞|唐涛|马亚豪|齐鹏
浙江科技大学机械工程学院,中国杭州310018
摘要
蔬菜补种机器人对于解决缺苗问题和提高作物产量至关重要。然而,当前的方法需要大量的计算资源和内存。因此,本研究介绍了一种轻量级检测模型SD-MSL-YOLO(Seedling Detection and Missing Seedling Localization-YOLO),用于检测蔬菜盆栽幼苗并定位缺失的幼苗。为此研究开发了一个包含多种光照条件下的蔬菜幼苗样本的数据集。该模型的主干网络结合了PsConv和FasterNet-SimAM模块,以提高小目标检测能力并减少计算冗余。为了通过捕捉多尺度上下文信息来增强表示能力,采用了GLSA-BiFPN结构。此外,引入了TADDH来减轻环境噪声并解决分类和定位任务之间的独立性不足问题。最终,该模型通过集成RGB-D相机来预测缺失幼苗的位置并完成定位。实验结果表明,与基线YOLOv8n相比,SD-MSL-YOLO在mAP@0.5指标上提高了1.34%,同时参数减少了56.78%,GFLOPs减少了41.97%。与主流的目标检测模型相比,SD-MSL-YOLO在检测精度和模型大小方面表现出色,平均精度(mAP@0.5)达到了97.53%,仅使用了1.31 M参数和4.7 GFLOPs。在缺失幼苗定位方面,模型与机器人的平均欧几里得距离误差为26.19毫米。这些结果表明,所提出的方法有效地实现了幼苗检测和缺失幼苗定位,为蔬菜补种机器人的实际应用提供了技术支持。
引言
蔬菜产业是中国国民经济的重要组成部分,其产量和规模位居世界首位(Wang等人,2022a)。农业劳动力的转变推动了智能机械的实施,从而实现了生产技术从手动操作向自动化操作的转变。在关键的移栽阶段,机械化移栽技术的应用显著提高了生产效率,成为蔬菜生产现代化的关键要素(Zhao,2023;Yu等人,2022)。然而,机械化蔬菜移栽机在田间作业时容易受到各种外部干扰的影响,这可能导致三种典型的移栽缺陷:裸露的幼苗(根系暴露在土壤之上)、埋得太深的幼苗(幼苗被过度掩埋)以及缺失的幼苗(在指定种植位置没有幼苗)(Cui等人,2021)。精确定位缺失的幼苗对于减少产量损失至关重要,因为移栽质量会显著影响后续的蔬菜生长和整体产量。然而,目前的田间检测和补种缺失幼苗的过程仍然主要依赖人工方法。这种方法效率低下,无法满足大规模种植的需求,从而严重限制了整体生产效率。从人工补种向机器人补种转变的一个重大挑战是开发高精度、实时的目标识别算法,以便在复杂的田间环境中感知缺失的幼苗(Liu等人,2022a)。
目前,深度学习已成为农业视觉检测和农业数字化领域的一项关键技术,在作物幼苗和杂草检测方面显示出广泛的应用价值(Dalal和Mittal,2025;Li等人,2022a)。例如,Cui等人(2024年)、Quan等人(2019年)和Yu等人(2019年)验证了Faster R-CNN在复杂环境中的高鲁棒性,某些模型的mAP@0.5指标高达97.71%。尽管像Faster R-CNN(Ren等人,2015年)这样的两阶段模型提供了更高的精度,但其计算冗余和较慢的推理速度使其不适合农业机械的实时操作需求。为了满足实时检测需求,研究越来越多地集中在单阶段检测模型上,如YOLO(Redmon等人,2016年)系列。例如,Liu等人、Dong等人和王等人通过集成注意力机制、空间金字塔池化和架构优化,有效解决了光照变化和小目标检测等问题,同时保持了高效的推理速度(Dong和Pan,2025;Liu等人,2022b;Wang等人,2022b)。Wu等人和Li等人随后将改进的YOLO算法应用于密集幼苗检测和导航线提取,验证了这些方法在复杂农业环境中的显著优势(Wu等人,2024;Li等人,2022b)。
尽管许多改进模型在作物识别应用中表现出色,但实时性能瓶颈仍然是大规模田间应用的一个限制。因此,后续研究集中在设计轻量级神经网络架构和制定边缘移动部署策略上。例如,Fan等人使用了ShuffleNet v2轻量级主干网络和并行混合注意力模块(PHAM),将模型参数减少了80%以上,推理时间减少了60%(Fan等人,2024)。Wu等人和Wu等人分别开发了针对番茄和甘蔗幼苗的轻量级模型,参数分别为2.81 M和5.33 M,实现了高效部署的同时保持了出色的精度(Wu等人,2023;Wu等人,2025)。此外,Ruan等人、Cui等人、Zhang等人 và Gong等人开发了针对特定任务的改进YOLO模型,具有低计算成本,可用于计数缺失的稻苗、评估西兰花移栽质量和提取玉米幼苗导航线(Ruan等人,2023;Cui等人,2023;Zhang等人,2024;Gong等人,2024)。Yang等人提出了一个半监督学习框架,用于检测缺失的玉米幼苗,提高了模型在数据受限环境中的适应性(Yang等人,2025a)。这些研究表明,轻量级YOLO模型已成为解决农业环境中实时感知挑战的主要方法。
有效补种缺失的幼苗不仅需要基于图像的识别(通过植株间距推断),还需要获取与机器人种植起点相关的准确实时距离和位置信息。农业机器人的环境感知和目标定位能力主要依赖于两种技术:LiDAR和RGB-D视觉。由于其出色的测距精度,LiDAR技术在早期研究中发挥了重要作用。Kang等人将激光扫描仪与RGB相机结合,用于水果的检测和定位。在0.5米、1.2米和1.8米的距离上,使用LiDAR和相机的水果定位标准偏差分别为0.253厘米、0.230厘米和0.285厘米,表明了远程苹果检测和三维定位的可行性(Kang等人,2022)。Liu等人提出了一种结合YOLOv5和LiDAR的苹果定位技术,平均定位误差为21.1毫米(Liu等人,2023)。然而,其高昂的硬件成本和复杂的数据配准过程限制了其在广泛田间作业中的应用。因此,研究人员转向了提供类似精度的更经济的RGB-D视觉技术。在RGB-D视觉定位领域,出现了许多专注于轻量化和高精度解决方案的研究,例如Ning等人、Tang等人和李等人将先进的YOLO模型与深度信息结合,实现了甜椒、山茶籽和柑橘类水果的高精度和鲁棒性定位(Ning等人,2022;Tang等人,2023a;Li等人,2023)。He等人提出了一种改进的T-Net,用于图像中的番茄检测。利用RGB相机,确定了成熟番茄的位置和估计直径,中心坐标的平均误差为8.5毫米,直径的误差为2.5毫米(He等人,2024)。除了水果收获,视觉定位技术在杂草识别和目标作物应用领域也取得了显著进展。例如,Fu等人利用改进的Transformer-YOLOv5模型结合视觉跟踪技术,实现了卷心菜的精准喷洒,平均定位误差在2.31至3.51厘米范围内(Fu等人,2022)。同样,Ulloa等人开发了一种基于CNN的目标施肥系统,通过将图像特征映射到机器人坐标系统,实现了小于3%的特征估计误差和93%的施肥效率(Ulloa等人,2022)。此外,Hu等人提出了一种用于机械激光协同除草的轻量级Multimodule-YOLOv7模型。该方法在复杂田间环境中实现了生菜和杂草的精确定位和严重程度分类,检测精度达到97.5%,mAP@0.5为97.1%(Hu等人,2024)。尽管在水果收获、目标喷洒和施肥方面取得了显著进展,但在田间检测幼苗(特别是在“补种缺失幼苗”背景下)的研究仍然较为有限。Wu等人通过用Slim-Neck架构替换Neck网络修改了YOLOv5,创建了一个用于检测甘蔗田中缺失幼苗的模型,并提出了一种预测补种位置的方法,机器人预测位置与人工预测位置之间的平均相对误差为18.7%(Wu等人,2023)。总之,当前研究主要集中在幼苗检测和水果收获定位上,而对田间缺失幼苗的定位关注较少。
本项目旨在开发一个高效、轻量级的目标检测模型,并将其与RGB-D深度感知技术相结合,以解决机器人补种中的基本感知和测距挑战。本研究的主要贡献如下:(1)构建了一个包含多种蔬菜幼苗品种、不同光照条件和不同种植密度的综合数据集,为模型在非结构化环境中的泛化能力提供了数据基础。(2)提出了一种基于YOLOv8n架构的高效轻量级SD-MSL-YOLO模型,该模型能够在显著降低计算成本的同时实现高精度的小目标检测。(3)开发了一个空间映射模型,将二维像素坐标转换为机器人基准坐标系统。使用RGB-D相机准确测量了缺失幼苗与机器人之间的欧几里得距离,从而为机器人补种操作提供了可靠的参数。
部分片段
图像采集和数据集创建
本实验的图像是在浙江省杭州市的蔬菜实验基地拍摄的。视频使用安装在蔬菜幼苗补种机器人上的ZED2 RGB-D相机(1920 × 1080像素)录制的。为了模拟真实的田间移栽场景,数据收集涵盖了不同时间、不同的光照条件和多种幼苗品种。随后,提取了视频帧,构建了一个包含3,202张图像的数据集
消融实验
该研究通过调整YOLOv8网络开发了一种用于检测田间蔬菜盆栽中幼苗的轻量级模型,该模型通过计算相邻幼苗之间的欧几里得距离来预测缺失的幼苗。进行了消融研究,以评估PsConv、FasterNet Block-SimAM、GLSA-BiFPN和TADDH在提高幼苗检测方面的有效性。表1显示,单独集成FasterNet Block-SimAM、GLSA-BiFPN和TADDH带来了显著的效果
结论
本文提出了一种精确的实时方法,用于检测蔬菜盆栽幼苗并确定田间缺失幼苗的位置。SD-MSL-YOLO模型与RGB-D相机的结合实现了准确的检测和定位。具体结论如下:
1. 开发了一种轻量级的SD-MSL-YOLO模型,用于检测蔬菜盆栽幼苗,能够在计算资源受限的复杂环境中有效运行。
CRediT作者贡献声明
余高红:撰写——审稿与编辑、监督、方法论、资金获取、概念化。王旭:撰写——审稿与编辑、原始草稿、软件、方法论、数据管理、概念化。王磊:调查。董海飞:数据管理。唐涛:数据管理。马亚豪:数据管理。齐鹏:数据管理。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
致谢
作者感谢中国国家关键研发项目(项目编号:2022YFD2001800)提供的资助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号