综述:人工智能在甘蔗育种中的应用:应用、工具及未来前景的全面综述
《Computers and Electronics in Agriculture》:Artificial intelligence in sugarcane breeding: A comprehensive review of applications, tools, and future prospects
【字体:
大
中
小
】
时间:2026年02月24日
来源:Computers and Electronics in Agriculture 8.9
编辑推荐:
蔬菜 replanting robot 需要解决缺失株识别与定位问题,当前方法计算成本高。本文提出 SD-MSL-YOLO 模型,集成 PsConv、FasterNet-SimAM 和 GLSA-BiFPN 提升小目标检测能力,结合 TADDH 优化多任务处理,使用 RGB-D 相机实现厘米级定位(平均误差26.19mm)。相比 YOLOv8n,参数减少56.78%,GFLOPs 下降41.97%,mAP@0.5 达97.53%。
余高红|王旭|王磊|董海飞|唐涛|马亚豪|齐鹏
浙江科技大学机械工程学院,中国杭州310018
摘要
蔬菜补种机器人对于解决缺苗问题和提高作物产量至关重要。然而,现有的方法需要较高的计算成本和内存需求。因此,本研究提出了一种轻量级的检测模型SD-MSL-YOLO(Seedling Detection and Missing Seedling Localization-YOLO),用于检测蔬菜盆中的幼苗并定位缺失的幼苗。为此研究开发了一个包含多种光照条件下蔬菜幼苗样本的数据集。该模型的主干网络融合了PsConv和FasterNet-SimAM模块,以改进小物体检测并减少计算冗余。为了通过捕获多尺度上下文信息来增强表示能力,采用了GLSA-BiFPN结构。此外,引入了TADDH来减轻环境噪声并解决分类与定位任务之间的依赖性问题。最终,该模型通过集成RGB-D相机预测缺失幼苗的位置并完成定位。实验结果表明,与基线YOLOv8n相比,SD-MSL-YOLO在mAP@0.5指标上提高了1.34%,同时参数减少了56.78%,GFLOPs减少了41.97%。与主流物体检测模型相比,SD-MSL-YOLO在检测准确性和模型大小方面表现出色,平均精度(mAP@0.5)达到了97.53%,仅使用了1.31 M参数和4.7 GFLOPs。在缺失幼苗定位方面,模型与机器人的平均欧几里得距离误差为26.19毫米。这些结果表明,所提出的方法能够有效实现幼苗检测和定位,为蔬菜补种机器人的实际应用提供了技术支持。
引言
蔬菜产业是中国国民经济的重要组成部分,其生产和规模位居世界首位(Wang等人,2022a)。农业劳动力的转变推动了智能机械的应用,使得生产技术从手工操作向自动化操作转变。在关键的移栽阶段,机械化移栽技术的应用显著提高了生产效率,成为蔬菜生产现代化的重要因素(Zhao,2023;Yu等人,2022)。然而,机械化蔬菜移栽机在田间作业中容易受到各种外部干扰的影响,这可能导致三种典型的移栽缺陷:暴露的幼苗(根系露出土壤)、埋藏过深的幼苗(幼苗被过度埋葬)以及缺失的幼苗(幼苗未种植在指定位置)(Cui等人,2021)。精确定位缺失的幼苗对于减少产量损失至关重要,因为移栽质量直接影响后续的蔬菜生长和整体产量。然而,目前的田间检测和补种缺失幼苗的过程主要依赖人工方法,这种方法效率低下,无法满足大规模种植的需求,从而严重限制了整体生产效率。从人工补种向机器人补种过渡的一个重大挑战是开发高精度、实时的目标识别算法,以便在复杂的田间环境中感知缺失的幼苗(Liu等人,2022a)。
目前,深度学习已成为农业视觉检测和农业数字化领域的一项关键技术,在作物幼苗和杂草检测方面显示出广泛的应用价值(Dalal和Mittal,2025;Li等人,2022a)。例如,Cui等人(2024年)、Quan等人(2019年)和Yu等人(2019年)验证了Faster R-CNN在复杂环境中检测玉米、大豆和棉花幼苗时的高鲁棒性,某些模型的mAP@0.5指标高达97.71%。尽管两阶段模型(如Faster R-CNN(Ren等人,2015年)具有更高的准确性,但其计算冗余和较慢的推理速度使其不适合农业机械的实时操作需求。为了满足实时检测需求,研究逐渐转向单阶段检测模型,如YOLO(Redmon等人,2016年)系列。例如,Liu等人、Dong等人和王等人通过集成注意力机制、空间金字塔池化和架构优化有效解决了光照变化和小物体检测问题,同时保持了高效的推理速度(Dong和Pan,2025;Liu等人,2022b;Wang等人,2022b)。Wu等人和Li等人随后将改进的YOLO算法应用于密集幼苗检测和导航线提取,验证了这些方法在复杂农业环境中的显著优势(Wu等人,2024;Li等人,2022b)。
尽管许多改进模型在作物识别应用中表现出色,但实时性能瓶颈仍然限制了大规模田间的应用。因此,后续研究集中在设计轻量级神经网络架构和制定边缘移动部署策略上。例如,Fan等人使用ShuffleNet v2轻量级主干网络和并行混合注意力模块(PHAM),将模型参数减少了80%以上,推理时间减少了60%(Fan等人,2024)。Wu等人和Wu等人分别开发了适用于番茄和甘蔗幼苗的轻量级模型,参数分别为2.81 M和5.33 M,实现了高效部署的同时保持了优异的准确性(Wu等人,2023;Wu等人,2025)。此外,Ruan等人、Cui等人、Zhang等人和Gong等人开发了针对特定任务的改进YOLO模型,具有低计算成本,可用于计数缺失的稻苗、评估西兰花移栽质量和提取玉米幼苗导航线(Ruan等人,2023;Cui等人,2023;Zhang等人,2024;Gong等人,2024)。Yang等人提出了一种半监督学习框架,用于检测缺失的玉米幼苗,提高了模型在数据受限环境中的适应性(Yang等人,2025a)。这些研究表明,轻量级YOLO模型已成为解决农业环境中实时感知挑战的主要方法。
有效补种缺失的幼苗不仅需要基于图像的识别(从植株间距推断),还需要获取与机器人种植原点相关的准确实时距离和位置信息。农业机器人的环境感知和目标定位能力主要依赖于两种技术:LiDAR和RGB-D视觉。由于其显著的测距精度,LiDAR技术在早期研究中发挥了重要作用。Kang等人将激光扫描仪与RGB相机结合,用于水果的检测和定位。在0.5米、1.2米和1.8米的距离上,使用LiDAR和相机的果实定位标准偏差分别为0.253厘米、0.230厘米和0.285厘米,表明了远程苹果检测和三维定位的可行性(Kang等人,2022)。Liu等人提出了一种结合YOLOv5和LiDAR的苹果定位技术,平均定位误差为21.1毫米(Liu等人,2023)。然而,其高昂的硬件成本和复杂的数据配准过程限制了其在大规模田间作业中的应用。因此,研究人员转向了提供类似精度的更经济的RGB-D视觉技术。在RGB-D视觉定位领域,多项研究专注于轻量级和高精度解决方案,用于水果目标(Ning等人、Tang等人和李等人结合了先进的YOLO模型和深度信息,实现了辣椒、山茶籽和柑橘类水果的高精度和鲁棒性定位(Ning等人,2022;Tang等人,2023a;Li等人,2023)。He等人提出了一种改进的T-Net用于图像中的番茄检测。利用RGB相机,确定了成熟番茄的位置和估计直径,中心坐标的平均误差为8.5毫米,直径的误差为2.5毫米(He等人,2024)。除了水果收获外,视觉定位技术在杂草识别和目标作物应用领域也取得了显著进展。例如,Fu等人利用改进的Transformer-YOLOv5模型和视觉跟踪技术实现了卷心菜的精准喷洒,平均定位误差控制在2.31至3.51厘米范围内(Fu等人,2022)。类似地,Ulloa等人开发了一种基于CNN的目标施肥系统,通过坐标变换矩阵将图像特征映射到机器人坐标系,实现了小于3%的特征估计误差和93%的施肥效率(Ulloa等人,2022)。此外,Hu等人提出了一种轻量级Multimodule-YOLOv7模型,用于机械激光协同除草,实现了复杂田间环境中生菜和杂草的精确定位和严重程度分类,检测精度为97.5%,mAP@0.5为97.1%(Hu等人,2024)。尽管在水果收获、目标喷洒和施肥方面取得了显著进展,但在田间检测幼苗(特别是“补种缺失幼苗”方面)的研究仍然有限。Wu等人通过用Slim-Neck架构替换Neck网络改进了YOLOv5,开发了一种用于甘蔗田中检测缺失幼苗的模型,并提出了一种预测补种位置的方法,机器人预测位置与人工预测位置的平均相对误差为18.7%(Wu等人,2023)。总之,当前研究主要集中在幼苗检测和水果收获定位上,而对田间缺失幼苗的定位关注较少。
本项目旨在开发一种高效、轻量级的物体检测模型,并将其与RGB-D深度感知技术结合,以解决机器人补种中的基本感知和测距挑战。本研究的主要贡献如下:(1)构建了一个包含多种蔬菜幼苗品种、不同光照条件和不同种植密度的综合数据集,为模型在非结构化环境中的泛化能力提供数据基础。(2)提出了一种基于YOLOv8n架构的高效轻量级SD-MSL-YOLO模型,该模型在显著降低计算成本的同时实现了高精度的小物体检测。(3)开发了一个空间映射模型,将二维像素坐标转换为机器人基准坐标系。使用RGB-D相机准确测量缺失幼苗与机器人的欧几里得距离,为机器人补种操作提供了可靠的参数。
部分摘录
图像采集和数据集创建
本实验的图像是在浙江省杭州的蔬菜实验基地拍摄的。视频使用安装在蔬菜幼苗补种机器人上的ZED2 RGB-D相机(1920 × 1080像素)录制的。为了模拟真实的田间移栽场景,数据收集涵盖了不同的时间、不同的光照条件和多种幼苗品种。随后,提取视频帧构建了包含3,202张图像的数据集
消融实验
本研究通过调整YOLOv8网络,开发了一种用于检测田间蔬菜盆中幼苗的轻量级模型,该模型通过计算相邻幼苗之间的欧几里得距离来预测缺失的幼苗。进行了消融实验,以评估PsConv、FasterNet Block-SimAM、GLSA-BiFPN和TADDH在提高幼苗检测方面的效果。表1显示,单独集成FasterNet Block-SimAM、GLSA-BiFPN和TADDH能够显著提高检测效果
结论
本文提出了一种精确的实时方法,用于检测蔬菜盆中的幼苗并确定田间缺失幼苗的位置。SD-MSL-YOLO模型与RGB-D相机的结合实现了准确的检测和定位。具体结论如下:
开发了一种轻量级的SD-MSL-YOLO模型,用于检测蔬菜盆中的幼苗,能够在计算资源有限的复杂环境中有效运行。
CRediT作者贡献声明
余高红:撰写 – 审稿与编辑、监督、方法论、资金获取、概念构思。王旭:撰写 – 审稿与编辑、原始草稿撰写、软件开发、方法论、数据管理、概念构思。王磊:研究工作。董海飞:数据管理。唐涛:数据管理。马亚豪:数据管理。齐鹏:数据管理。
利益冲突声明
作者声明没有已知的财务利益或个人关系可能影响本文报告的工作。
致谢
作者感谢中国国家重点研发项目(项目编号:2022YFD2001800)提供的资助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号