基于深度学习的检测与控制系统,用于实现免耕精准播种机中秸秆覆盖层的实时均匀分布
《Information Processing in Agriculture》:Deep learning-based detection and control system for real-time uniform of straw coverage in no-tillage precision planters
【字体:
大
中
小
】
时间:2026年05月16日
来源:Information Processing in Agriculture 7.4
编辑推荐:
郭新宇|史银燕|王晓婵|黄学凯|徐洪波|王磊|张小雷|高晓军|郑恩来|胡志超
南京农业大学工程学院,南京210031,中国
**摘要**
将秸秆返还到田地是一种基本的农业实践,它可以改善土壤结构、减少侵蚀、提高肥力和生产力,并支持后续作物的种植。为了解决由于现有秸秆
郭新宇|史银燕|王晓婵|黄学凯|徐洪波|王磊|张小雷|高晓军|郑恩来|胡志超
南京农业大学工程学院,南京210031,中国
**摘要**
将秸秆返还到田地是一种基本的农业实践,它可以改善土壤结构、减少侵蚀、提高肥力和生产力,并支持后续作物的种植。为了解决由于现有秸秆返还机械分布不均导致的环境失衡、生长不一致以及病虫害和杂草蔓延的问题,本研究引入了一种利用机器视觉和深度学习分割技术的均匀秸秆覆盖检测与控制系统。开发了一种优化的YOLOv11s-seg网络,用于从散落的秸秆中提取几何和位置数据。通过上位计算机,该系统可以计算秸秆中心偏差、覆盖率和预设差异。同时,设计了一种基于单片微计算机和液压系统的均匀覆盖控制系统,利用视觉检测数据实时调节秸秆的散布角度和宽度。优化后的分割模型表现出色,秸秆碎片的检测平均准确率达到96.7%。田间测试表明,在不同运行速度下,系统优化后的合格散布宽度率超过80%。此外,平均散布不均匀度低于国家标准的20%,证明了该系统具有高效的闭环控制能力。这种基于视觉的控制系统能够准确调节秸秆的散布方向和宽度,显著提高了均匀性和操作效率。这些发现为秸秆粉碎和返还机械的自动化和智能化发展提供了重要的技术支持。
**1. 引言**
中国是一个农业强国,拥有广阔的领土、丰富的耕地和多样的农作物[1]。该地区的农作物残余物主要包括玉米秸秆、水稻秸秆和小麦秸秆(WS)。近年来,由于集约化农业生产的进步和粮食产量的持续提高,秸秆产量稳步增加。2022年,玉米、水稻和小麦秸秆的产量分别为280万吨、210万吨和140万吨[2]。为了满足不断增长的生产需求,必须大幅提高农业产量[2]。与2011年的估计相比,这些数字对应的年增长率分别为2.83%、0.25%和1.47%[3]。中国大量的秸秆产量凸显了将其作为能源利用的实际重要性。特别是秸秆返还到田地的技术对于其综合利用至关重要。这种做法可以防止秸秆燃烧造成的污染,并在分解过程中释放氮、磷和钾等必需的营养元素,从而改善土壤结构,促进作物根系发育[4]。长期返还秸秆可以增强土壤肥力,优化土壤酶活性,调节真菌群落结构和功能,从而更有效地吸收养分和水分,提高整体产量[5]。
秸秆通常通过秸秆粉碎机、免耕播种机或其他专用机械返还到田地。钟等人开发了一种集成星齿刀片、自锁齿轮和螺旋线直径调节机构的装置[6]。该手动可调盘的直径为460–560毫米,这种被动结构在田间作业中表现出优异的秸秆切割和土壤穿透性能,最大秸秆切割率达到98.33%[6]。吴等人提出了一种适用于硬茬田地的清洁区播种机概念[7],该创新集成了秸秆收集和粉碎、施肥、播种、均匀覆盖和行间秸秆覆盖等多种功能[7]。顾等人基于“清洁区域播种”概念开发了一种免耕花生播种机,以解决黄淮海地区主要花生生产区的种植难题[8],这种机器可以一次完成粉碎、秸秆清除和苗床准备[8]。杨等人通过单因素和双因素分析进行了一系列田间实验,阐明了工作宽度、均匀覆盖率和秸秆粉碎体积之间的关系[9]。粉碎秸秆的均匀分布是评估机械效率的关键指标,因为它直接影响土壤养分含量、温度、湿度和作物产量[10]。当秸秆在打捆后返还时,由于其重量和较高的空气阻力,往往会积聚在行间和田地边缘,导致飞行距离较短和随机着陆点,经常在农田中形成“堆”和“暴露区域”[10]。陈等人通过加入风扇系统、粉碎刀轴、高压风扇和导向板来提高秸秆散布的均匀性[11]。张等人设计了一种新的秸秆粉碎、散布和返还机器,改善了机器内部的流动,确保了均匀分布[12]。刘等人报告称,较低的散布盘速度会集中秸秆分布,而较高的速度则会扩大散布范围,为操作性能提供了宝贵的见解[13]。
检测秸秆覆盖情况可以促进秸秆返还和免耕播种技术的智能化、绿色化和可持续发展[14]。随着深度学习在机器视觉中的成功应用,通过将这些模型与传统方法结合,农业图像处理性能得到了提升[15]。刘等人利用改进的U-Net语义分割算法检测大面积秸秆覆盖[16]。徐等人采用超绿色特征算法和最大类间方差方法分割玉米和杂草,实现了高识别率[17]。安等人提出了一种基于k-means聚类和分区优化的秸秆覆盖计算方法,能够在各种环境条件下检测和计算玉米秸秆覆盖情况[18]。杨等人利用改进的AdaBoost算法评估操作环境,并结合秸秆图像畸变校正和Otsu阈值分割来计算覆盖率[19]。尽管现有研究能够精确量化秸秆覆盖范围,但未能从主观角度解决由返还设备引起的分布不均问题。一些研究基于旋转速度和机器结构推断均匀性,但无法实时调整散布设备以解决覆盖不均、重叠区域或局部间隙问题。
尽管检测方法和设备取得了显著进展,但仍存在一些持续存在的问题。首先,秸秆覆盖的评估主要关注静态覆盖率,未能识别秸秆在空气中的动态分布,这限制了捕捉散落秸秆实时位置偏差的能力,阻碍了有效调节散布过程。其次,散布均匀性的改进主要依赖于被动方法,如优化机械设计或调整固定参数。改进通常通过风扇和导向板的修改或调节单一旋转速度来实现,而没有建立将检测与调节相结合的协调机制。为了解决这些挑战,本研究利用机器视觉和深度学习原理,采用基于分割的秸秆区域提取算法,实现散布角度和秸秆碎片宽度的二维实时定量检测。开发了一种用于均匀秸秆覆盖的闭环控制系统,包括视觉识别、数据评估和液压执行。该系统动态调节旋转机构角度和散布设备的旋转速度,标志着从被动检测向主动精确控制秸秆散布的转变。这种方法为秸秆返还设备的智能化改进提供了新的技术途径。
**2. 材料与方法**
**2.1. 整机结构**
本研究开发的免耕播种机包括一个秸秆粉碎和后投影散布装置,与后装免耕播种机集成在一起。秸秆粉碎和散布装置的主要配置如图1b所示(主要技术参数总结在表1中)。该装置前端装有减速齿轮,中间装有中央水平输送螺旋桨,侧面装有侧向传动单元,以及连接到散布管道的秸秆散布风机。在田间作业中,秸秆首先由前端秸秆粉碎单元粉碎,然后通过水平输送螺旋桨输送到秸秆散布风机,再通过管道输送到均匀散布装置,通过控制旋转实现均匀分布[20]。
**2.2. 研究方法**
本研究提出了一种根据秸秆处理装置设计图(图2)所示逻辑设计的秸秆破碎监测与控制系统。首先,在散布装置上安装了一台高速工业相机,用于采集操作区域的视频,包括秸秆粉碎、抛回和免耕播种过程。这有助于在具有不同光照和秸秆形态的代表性田间条件下生成原始数据集。使用标注工具对秸秆实体进行标记后,原始数据被增强,以开发出反映显著形态多样性和环境复杂性的高质量训练样本集。随后构建了一个秸秆识别模型,采用分割架构,并结合二维分析策略。从掩膜图中确定秸秆的几何中心,以统计分析水平坐标分布。此外,还计算了秸秆掩膜区域相对于图像视野区域的覆盖比率,以客观量化单位面积内的秸秆分布密度。结合这些先进技术,包括液压控制电路和微控制器,建立了在复杂操作条件下精确检测和实时反馈秸秆覆盖的调节系统。
秸秆散布装置通过粉碎刀轴、水平输送螺旋桨和专用散布单元实现秸秆的重新定位和分布。散布装置主要由四个部分组成:风扇、回转机构、散布管道和均匀分布装置。风扇将粉碎后的秸秆从螺旋桨推进到回转机构及散布管道中,管道根据回转机构的方向调整排放方向。回转机构主要由液压马达、蜗轮和回转轴承组成,用于调节秸秆分布。均匀散布装置由液压马达驱动,旋转叶轮以分散通过管道输送的秸秆流。在液压控制下,叶轮的旋转速度可达600–1200转/分钟,从而精确调节秸秆的分布宽度和方向。在操作过程中,实际散布位置与目标位置之间的差异用于调节回转机构和散布装置,确保田地内的均匀覆盖。
为了满足秸秆粉碎、田地返还和播种的工程和技术兼容性要求,必须解决秸秆进料过载、粉碎不足、输送堵塞以及因速度过快导致的散布轨迹延迟等问题。相反,速度过低会显著降低操作效率。为了优化机械操作的可行性和生产力,选择了1.0–1.3米/秒的前进速度范围。在测试过程中实施了梯度变化,以识别性能趋势并为后续系统优化提供定量数据。这种方法还为实际生产提供了具体的操作指导,平衡了分布均匀性和操作效率,确保研究结果可以直接提升田间作业效果。
**2.3. 评估指标**
为了评估操作效果,选择了秸秆分布不均匀性和分布宽度的合格率作为主要评估指标。分布不均匀性是国家标准规定的秸秆返还到田地的基本指标,直接反映了均匀分布的核心研究目标。分布宽度的通过率与实际农艺条件相符,反映了秸秆在指定播种区域内的分布效果。这一全面的评估框架将模型检测性能与田间操作效果联系起来,每个指标都符合核心研究要求和行业标准。(1)模型评估指标:由于所提出的模型采用了YOLOv11-seg架构,因此使用了盒级和掩码级的平均精度(mAP)来评估检测和分割性能:(1)mAP=1/N∑i=1NAPi,其中N是类别的数量,APi表示第i个类别的平均精度。具体来说,B mAP50-95和M mAP50-95分别表示盒级和掩码级的mAP50-95。此外,还使用了参数数量(Params)、浮点运算次数(FLOPs)和模型大小来评估模型复杂性和部署效率[21]。模型大小由基本网络结构决定,表示在网络训练过程中生成的模型所占用的存储空间[22]。(2)秸秆不均匀性:秸秆分布的不均匀性是评估秸秆返回和散布操作质量的一个基本指标。该指标量化了秸秆在空间分布和数量上的差异,通常表现为集中的条带、块状或不规则的覆盖[23]。根据国家农业机械标准化技术委员会[24]的规定,秸秆分布的不均匀性必须保持在25%以下,可以通过以下公式计算:(2)Mˉ=∑i=17Mzi/7 (3)F=1/Mˉ∑i=17(Mzi-Mˉ)^2/6×100%,其中Mˉ是测试区域内各点的平均秸秆质量(kg),F是散布不均匀性(%)。(3)秸秆散布宽度合格率:在测试过程中测量了散布的秸秆与有效播种宽度之间的偏差(图3)。使用上述采样方法确定了特定块内的秸秆质量。然后计算有效播种宽度内的秸秆质量,作为有效播种宽度内秸秆重量与整个工作宽度上分布的总重量的百分比(公式(4))下载:下载高分辨率图像(103KB)下载:下载全尺寸图像图3. 分布宽度图。计算公式如下:(4)r=∑i=24Mzi/∑i=17Mzi×100%,其中Mzi是第i点的总秸秆质量(kg)。田间实验旨在收集评估秸秆分布质量所需的基本数据。一旦达到稳定的操作条件,就选择了代表性的采样区域。采样点位于一个均匀的水平面上,并沿机械操作的宽度方向分成七个部分,分别标记为i=1, 2, 3, 4, 5, 6, 7。在整个采样区域内,随机分布了1m×1m的方形采样框。在采样过程中,收集了每个采样框表面所有的秸秆。去除杂质(如土壤和残茬)后,使用高精度电子秤称量秸秆的质量,并记录每个采样点的质量。为了确保数据的可靠性,每个操作条件测量了三次,平均值作为该测量点的最终质量数据。2.4. 图像数据集的构建2025年4月,在河南省驻马店市的南京农业大学保护性耕作实验基地拍摄了切碎秸秆的图像。数据收集设备使用了上述相机,以1,792×828像素的分辨率拍摄图像。相机位于种子箱和喷头之间的交点处,如图1b所示。初始数据集包含2,140张图像;经过筛选去除无效图像后,保留了1,750张图像。这些图像被分为两类,即空中图像和地面图像。为了解决自然环境中背景杂乱和颜色差异较小的问题,采用了以下方法:首先,处理收集到的秸秆图像以提高模型的泛化能力和鲁棒性;其次,处理和分析图像以增强特征提取;第三,减少训练时间;第四,提高训练效率。在采样秸秆散布图像后,使用数据增强技术扩展数据集。对图像进行了调整,包括20°旋转(图4(a))、亮度变化(图4(d, f))、引入随机颗粒噪声(图4(e))和水平翻转(图4(b))。这些增强数据使数据集总数达到8,750张。下载:下载高分辨率图像(427KB)下载:下载全尺寸图像图4. 数据图像增强。使用LabelImg软件对增强后的数据集进行了标注。为了通过图像分割提取秸秆区域,标注文件最初保存为JSON格式,然后使用Python脚本转换为TXT格式。然后根据8:1:1的比例将数据集划分为训练集、测试集和验证集。2.5. 改进模型的构建YOLOv11网络由三个主要部分组成:特征提取主干网络、特征转换颈部网络和预测输出头网络[25]。该网络实现了高精度和最佳的检测性能,相比YOLO系列的早期版本有了显著进步。通过架构优化,网络增强了图像处理和预测能力。此外,它利用了GPU的现代特性来提高训练效率。诸如混合精度训练和操作符融合等技术提高了训练效率并优化了内存使用,使得推理延迟比早期版本减少了25%。该模型旨在在不影响检测准确性的情况下最小化参数数量,采用轻量级模块设计和参数优化策略来支持多种对象类型和图像格式的多任务处理。网络采用了C3k2机制[26],在浅层将C3k设置为False以减少计算负担并保留高频图像细节。在深层,启用该机制以平衡特征抽象和计算效率。提出的C2PSA机制在C2模块中集成了多头注意力机制,增强了跨通道和空间上下文关联,从而提高了对象在复杂背景下的语义分离能力。此外,将两个DWConv层集成到解耦头的分类检测头中,加强了局部特征聚合,提高了小对象检测的准确性和类别区分能力。这些改进增强了YOLOv11在复杂场景中的鲁棒性和泛化能力,同时保持了其轻量级的特点。因此,本研究使用YOLOv11网络作为基础框架。在本研究中,秸秆散布轨迹在识别区域内表现为扇形半透明幕布,具有逐渐变化的密度梯度。传统的局部卷积方法难以捕捉这种现象的完整几何结构。此外,秸秆和土壤纹理之间的低对比度和视觉相似性使得识别过程变得复杂,光照变化和灰尘干扰进一步增加了误分类的风险。尽管高分辨率相机可以提高秸秆识别能力,但传统网络模型通常具有过多的参数数量,阻碍了部署。因此,本研究在特征提取、上下文建模和上采样优化方面进行了针对性的改进,同时采用了轻量级转换来平衡准确性和操作效率。在主干网络中,使用基于StarNet的块重建了原始的YOLOv11特征提取网络,以增强感受野建模,同时保持计算效率。这种星形拓扑在早期阶段建立了全局感受野,提高了对区域形状的整体感知。同时,稀疏连接特征显著减轻了计算负担,满足了高分辨率输入的实时处理需求。在SPP层之后,引入了C2PSA_iRMB模块;iRMB结构增强了通道间的交互和特征细化,而C2PSA机制结合了多头注意力,以模拟通道和空间维度上的长距离依赖性,从而提高了秸秆与土壤或残茬等混淆对象之间的语义区分能力。在颈部,C3k2模块通过受SegNeXt启发的多尺度卷积注意力机制得到了增强,促进了高效的多级特征融合。这一改进使模型能够有效捕捉秸秆分布过程的大尺度轮廓,同时保留了边缘细节,从而提高了计算效率和基于分割的秸秆区域提取的性能。在上采样阶段,使用了超轻量级动态上采样器DySample[27]代替了传统的nn.Upsample。与最近邻插值相比,DySample更准确地恢复了区域范围的梯度边界,减轻了棋盘效应,并提高了分割掩码的几何保真度。图5展示了改进后的YOLOv11-seg模型的整体架构。下载:下载高分辨率图像(320KB)下载:下载全尺寸图像图5. 改进的YOLOv11-seg整体结构。2.5.1. C3k2_SN模型在实际应用中,背景具有显著的复杂性,秸秆的形态和规模存在很大变化;在训练过程中改进注意力机制使网络能够更有效地关注高优先级区域[28]。为了实现准确的实时检测,本研究通过结合受SegNeXt启发的多尺度卷积注意力设计增强了C3k2模块,从而得到了C3k2_SN模块(图6)。改进后的模块首先通过卷积层处理输入特征以提取基本纹理和边缘特征。提取的特征随后分为两个分支:一个分支保留浅层信息以促进高效的特征流动,另一个分支通过堆叠的瓶颈或C3k块逐步细化,以增强秸秆幕布的表示,包括其动态形态和复杂的纹理细节。然后,这两个特征分支通过卷积层连接并压缩,以实现有效的特征融合,并结合了受SegNeXt启发的多尺度卷积注意力机制,使用深度卷积在注意力分支中减少计算开销。这种策略专注于秸秆幕布区域,同时显著降低了计算复杂性。C3k2_SN模块专门设计用于克服标准C3k2模块纯卷积结构中的语义建模限制。这种混合架构增强了模型在检测和分割任务中的泛化能力,准确捕捉了秸秆分布的动态形态和规模变化,同时平衡了识别准确性和实时性能。下载:下载高分辨率图像(90KB)下载:下载全尺寸图像图6. C3k2_SN模块。SegNeXt采用了标准的编码器-解码器结构(图7),其主要创新在于编码器的设计[29]。核心概念涉及重新设计卷积操作,并引入了一种创新的“多尺度卷积注意力”模块,基于卷积神经网络构建语义分割架构。这是通过在远低于Transformers的计算复杂度(O(n)而不是O(n^2))下操作来实现的,同时保持了Transformers的关键优势,包括强大的空间注意力建模能力和多尺度上下文理解能力。这种方法已被证明在应用于主流分割数据集时显著改善了性能和效率之间的平衡。下载:下载高分辨率图像(201KB)下载:下载全尺寸图像图7. MSCAN和MSCA模型。(a) MSCAN阶段。(b) MSCA。MSCA模块可以替代Transformers中计算成本较高的自注意力机制。这是通过利用高效的卷积操作来实现空间信息优先级建模(空间注意力)和上下文信息聚合来实现的。MSCA模块的结构设计从对输入特征的卷积处理开始,以高效捕获局部邻域信息。随后,引入了多个条带卷积分支来模拟不同尺度的感受野;具体来说,一个大的卷积核被分解为连续的不对称卷积,如1×7和7×1,以减少计算复杂性和参数数量。不同的分支使用不同的核大小,如7、11和21,以捕获多尺度上下文信息,这种设计特别适用于建模细长结构。最后,所有分支和恒等分支的输出逐元素求和,并通过1×1卷积进行特征融合和通道交互(图8)。下载:下载高分辨率图像(139KB)下载:下载全尺寸图像图8. Star-block模块。2.5.2. StarNet模型StarNet是一种围绕星形操作(逐元素乘法)设计的高效神经网络,具有四阶段层次结构,通过卷积层实现下采样[30]。核心模块是一个星形操作块,集成了深度卷积、批量归一化和其他操作,通过调整块的数量和输入嵌入通道来构建不同规模的模型(图8)。整体架构采用了四阶段层次结构。这种分层设计允许逐步提取和抽象输入数据,在每个阶段,卷积层通过滑动卷积对输入数据应用卷积核进行下采样,以降低数据分辨率,同时捕获不同尺度上的关键特征。基础StAR模块通过将多个操作集成到星形操作块中,使这种架构区别于传统的神经网络。深度卷积对这个模块至关重要,它对每个输入通道独立执行卷积操作,从而显著减少了计算开销和参数数量,与传统的卷积相比,提高了模型的特征提取能力,而不会显著增加计算负担。StarNet的核心原理是星形操作(逐元素乘法)在高维非线性特征空间中的映射能力。单层星形操作表示为(WT1X)*(WT2X),通过数学展开,生成大约(d/√2)^2个非线性项(其中d是输入维度),将输入映射到高维隐式特征空间。当多个星形操作块堆叠时,隐式维度呈指数级增加。这种独特的维度扩展方法通过在紧凑的空间内进行特征交叉乘法来实现高维映射,而不是通过增加网络宽度来实现。这使得StarNet能够在保持轻量级结构的同时具备强大的特征表达能力,特别适合高效的网络设计。
2.6. 识别和检测秸秆扩散的方法
在这项研究中,量化秸秆扩散与目标着陆点之间的偏差是必不可少的。由于单个秸秆碎片体积大且尺寸小,使用整体边缘轮廓线可能会产生不准确的结果。此外,在两侧选择参考点可能会受到动力机械振动的干扰,导致摇晃并导致标准不一致。由于分割后的秸秆区域的轮廓由离散边界点组成,这些边界点可以近似为一个封闭的多边形,因此采用了多边形质心积分方法来确定其几何质心。该分割后秸秆区域的水平坐标在图像坐标系中计算,而整个图像中秸秆分布的比例则用于确定扩散宽度。分割后秸秆区域的质心坐标使用以下公式计算:
(5) Cx = (1/6) * ∑(xi + xi+1) * (yi + yi+1 - xi+1) / (n-1)
(6) Cy = (1/6) * ∑(yi + yi+1) * (xi + xi+1 - yi+1) / (n-1)
(7) A = (1/12) * ∑(xi * yi + xi+1 - xi+1) / (n-1)
其中Cx是秸秆中心的水平坐标,Cy是垂直坐标,A是多边形的面积,xi和yi分别表示多边形顶点的水平和垂直坐标。
在这项研究中,分割后秸秆区域的质心坐标作为图像坐标系中的偏差指标,随后确定统计阈值以用于控制决策。虽然可以使用各种滤波器(如Robert、Prewitt、Sobel和Canny滤波器)来提取边缘信息[31],但由于Canny算子可以通过高斯核卷积平滑图像,有效抑制噪声,因此选择了Canny算子。因此,在确定掩膜图像后,使用Canny边缘检测来提取最终轮廓。
距离信息通过以下四个步骤获得(图9):
(1) 掩膜获取:提取并二值化掩膜区域(图9a,图9b),其中空气中的秸秆像素值为255,背景区域的像素值为0。
(2) 收集秸秆轮廓信息:使用Canny边缘检测算法获取秸秆掩膜的边缘信息(图9c)。
(3) 计算质心位置:根据提取的轮廓信息计算分割后秸秆区域的几何质心。
(4) 计算秸秆覆盖率:根据掩膜区域计算整个图像中秸秆的分布百分比。
数据清洗包括计算所有样本的质心水平像素坐标。在数据收集过程中,机器振动等因素可能导致图像坐标系中分割后秸秆区域的质心位置波动;因此,移除了异常偏差。结果如图10所示。
除了在X方向上收集数据外,还计算了整个图像中分布的秸秆的像素比例。图11显示了秸秆比例的直方图。
收集的图像数据使用上述工作流程一步处理。结果距离被汇总,并移除了冗余或错误的信息。位于预设位置左侧的检测结果被定义为正偏差,而位于预设位置右侧的结果被定义为负偏差。X轴上的距离主要集中在740到980像素之间;具体来说,800–920像素范围占总分布的60%。因此,740和980像素分别被设定为下限和上限阈值。在现场操作中调整了三个旋转角度,旋转机构默认位于0°中心位置。如果检测到的数据低于下限阈值,旋转机构向左倾斜-15°;相反,如果数据超过上限阈值,旋转机构向右倾斜+15°。
使用类似的方法,对收集的数据进行了频率计算,并移除了不适当的数据。在这个数据集中,秸秆面积比例在20%到25%之间的数据占总数的45%,而在25%到30%之间的数据占28%。由于大部分数据集中在15%–35%范围内,因此15%和35%分别被设定为下限和上限阈值。在实际操作中,叶轮在不同的速度设置下进行调整:低速、中速和高速。叶轮速度有三个设置,分别为600–800、800–1,000和1,000–1,200转/分钟。叶轮速度根据实际秸秆扩散面积与理想面积之间的差异进行调节。当测量面积小于理想面积时,叶轮设置为高速;否则,速度降低。对于较大的偏差,叶轮速度会显著调整;而对于较小的差异,则进行微调以防止过度校正并满足操作要求。这两种方法有效地调节了秸秆覆盖率。
3. 结果与讨论
3.1. 网络比较实验
对不同的骨干网络模型进行了比较实验,以确定一种在不牺牲准确性的情况下实现轻量级设计的配置。表2列出了训练平台和测试参数。
表2. 训练平台和测试参数。
训练平台 测试参数
GPU NVIDIA GeForce RTX 4090
输入尺寸 640 × 640
批量大小 16
CPU 16 vCPU Intel Xeon 8352
迭代次数 500
优化器 SGDDRAM 120 GB
工作线程数 8
结果总结在表3中,其中map B和map M分别指box (mAP50-95)和mask (mAP50-95)。YOLOv5s-seg和YOLOv8s-seg的识别结果不如YOLOv11s-seg。虽然用不同的骨干网络替换YOLOv11s-seg的初始结构会导致识别准确率略有下降,但参数数量和浮点操作次数显著减少。在改进的模型中观察到了最显著的减少。具体来说,使用其他骨干网络(如EfficientViT、MonlieNetV4和Shufflenet_v1)时,模型参数数量分别减少了31.68%、18.8%和23.76%。改进的模型在参数数量和模型大小方面显示出最大的减少,同时实现了比EfficientViT、MonlieNetV4和Shufflenet_v1网络结构更高的mAP准确率。显然,改进的模型更适合秸秆分布检测任务,并更符合实际操作要求。
表3. 不同骨干网络的比较结果。
网络 B mAP50-95 M mAP50-95
参数数量 /MF 浮点操作次数 /FLOPs 模型大小/MB
YOLOv5s-seg 0.97 30.94 39.8 3.8 × 10^10 19.8
YOLOv8s-seg 0.98 30.96 31 1.8 4.2 × 10^10 23.8
YOLOv11s-seg 0.99 20.97 10.1 3.6 × 10^10 20.6
EfficientViT 0.97 0.92 76.9 2.8 × 10^10 14.8
MonlieNetV4 0.95 0.82 78.2 2.7 × 10^10 16.9
Shufflenet_v1 0.97 10.90 97.7 2.6 × 10^10 16.0
改进的YOLOv11s-seg 0.98 0.96 76.4 3.3 × 10^10 13.1
3.2. 消融研究
通过执行包括不同版本的YOLO和改进的YOLOv11s-seg在内的消融实验,评估了基础模型和改进模型的不同效果。这些实验比较了不同策略对模型性能和数据适应性的影响。为了消除外部影响并确保结果的准确性和可靠性,所有消融实验中的模型都在相同的设备和配置环境中使用一致的数据集进行了测试。表4总结了实验结果。
表4. 消融实验比较结果。
为了直观展示模型改进的有效性,本研究评估了各种模型在数据集中关于秸秆分布运动状态的识别和检测性能(图12)。置信区域被放大并用虚线框突出显示,以强调改进模型在精确识别方面的优势,从而便于清晰地比较各模型之间的性能差异。
图12显示了消融实验的识别结果。如图12(2)所示,仅引入主导网络StarNet会导致不准确的秸秆轮廓识别;然而,改进后的配置(8)能够准确识别秸秆,同时成功过滤掉灰尘和地面秸秆。表4中的实验结果表明,使用YOLOv11-seg作为基线并将骨干网络替换为StarNet会导致特征提取和目标识别能力略有下降。尽管如此,这种配置保持了高识别准确性,同时显著降低了模型复杂性。将SegNeXt模块集成到C3k2网络结构中,并将iRMB模块插入C2PSA中,提高了推理准确性,使改进后的模型在参数数量和浮点操作较少的情况下仍保持高平均准确率、精确度和召回率。根据实验结果,最终改进的YOLOv11-seg模型参数数量减少了36.7%,而mask mAP50-95仅减少了0.3%。尽管最终改进的模型没有在所有消融配置中产生最高的绝对mask mAP,但它提供了分割准确性、参数数量、FLOPs和模型大小之间的最佳平衡。因此,它被选为后续部署和现场实验的最终模型。
3.3. 现场实验
为了评估自动秸秆分布控制系统的操作性能,以及机器在不同前进速度下保持高通过率和低秸秆不均匀性的能力,在南京农业大学的保护性耕作实验基地进行了现场测试(图13)。使用M1304-D型号拖拉机操作配备秸秆粉碎和扩散装置的花生播种机。测试场地是一个全秸秆稻茬田,使用半喂入收割机收获,稻茬保留量较高(平均超过50厘米);作物品种为Xu Rice No. 5。机器的工作宽度为2,500毫米,在四个速度下进行测试:1.0、1.1、1.2和1.3米/秒。根据之前的校准和图中测量的像素距离与实际距离的比例,在固定相机条件下,像素距离与实际距离的比例确定为1:0.244。当叶轮分散的秸秆颗粒中心超过空气中的阈值时,触发旋转机构。此外,当秸秆含量超过35%时,均匀分布装置的旋转速度降低;当秸秆含量低于15%时,旋转速度增加,以调节秸秆扩散宽度。
图13. 秸秆粉碎装置的测试图。
采用视觉识别系统动态识别并收集不同前进速度梯度下秸秆扩散的图像数据(图14)。实验设计每个速度设置进行了两次独立运行,每次运行包括两次往返操作过程,以减少操作过程中的潜在系统误差。在每次操作期间,沿操作路径建立了十个标准的1×1米测试区域。从这些采样点收集的秸秆分布数据用于使用公式(2)、(3)和(4)计算秸秆扩散宽度合格率和分布不均匀性,这两个是核心性能指标。这种测试方案具有不同的速度梯度、重复试验和多个采样点,全面反映了秸秆碎片识别和控制系统在不同操作条件下的响应特性。此外,它提供了定量评估系统动态控制准确性和适应性的必要方法论和数据支持。图15显示了测试结果。测试结果。如图14所示,无论前进速度如何变化,秸秆撒布的视觉识别效果仍然稳定,能够准确捕捉到秸秆的轮廓和位置数据。表5总结了测试验证结果,包括撒布宽度合格率(Y1)和操作后的平均不均匀度(Y2)。在系统设计层面,所有关键组件都经过了精心优化,以确保快速响应和高效协作。工业相机能够高速收集和传输与秸秆分布相关的图像数据。同时,轻量化的增强型深度学习模型能够高效检测秸秆分布特征,并快速、精确地计算控制偏差。上下计算机之间的高速串行通信促进了控制指令的即时传输。此外,由比例阀驱动的电液控制系统能够快速调整旋转机构的角度和均匀撒布装置的转速。这种优化设计有效减少了整个控制过程中的响应延迟,确保从初始识别到机械调节的无缝连接。
表5. 添加控制和测量系统前后的测试结果
| 速度/ m·s?1 | 通过率Y1 /% | 不均匀度Y2 /% |
|------------|-----------|-----------|
| 添加控制和测量系统前 | 1.018 | 2.21 | 1.12 | 78.45 | 25.16 | 1.11 | 71.14 | 20.61 | 66.62 | 27.48 | 1.21 | 69.42 | 23.41 | 27.05 | 1.31 | 74.19 |
| 添加控制和测量系统后 | 1.019 | 2.12 | 2.25 | 291.44 | 13.14 | 1.11 | 191.59 | 291.95 | 12.96 | 1.21 | 193.21 | 11.26 | 292.45 | 10.57 | 1.31 | 87.21 | 12.54 | 289.61 |
表5中的实验数据表明,在集成测量和控制系统之前,机器在不同速度下的运行稳定性较差,因此无法保证秸秆分布的均匀性和宽度的合格率。在操作过程中,秸秆撒布极易受到环境条件和机器性能的影响。如果没有该系统,当出现撒布偏差、局部堆积或区域间隙等问题时,机器无法及时进行纠正调整。平均撒布宽度波动在66.62%至82.21%之间,说明没有监控和控制系统的机器在不同操作条件下的性能变化显著。此外,在1.0 m/s和1.1 m/s的速度下,秸秆撒布的不均匀度超过了25%的标准,无法满足实际操作要求。
安装测量和控制系统后,秸秆撒布装置在各种前进速度下的宽度合规率和不均匀度方面表现出更好的性能。在所有测试的前进速度条件下,分布在有效种植宽度内的秸秆比例超过了总撒布量的80%,不均匀度指数始终保持在25%以下,从而符合国家标准。这些结果表明,控制系统显著提高了平均宽度合格率,并显著降低了平均不均匀度,使得在不同速度-行程组合下的性能指标更加稳定。具体来说,在1.2 m/s的前进速度下,秸秆撒布的均匀性和有效宽度得到了优化,撒布宽度合格率始终超过85%,不均匀度通常保持在14%以下。此外,结果还表明,过高或过低的前进速度都会对撒布宽度合格率产生负面影响。实验还表明,当撒布过程中出现干扰时,调节机制会迅速调整两个执行部件(即叶轮速度和旋转机构),以防止秸秆堆积和错位。
总之,本研究开发了一种基于视觉识别的控制装置,并对系统架构进行了精心优化,以满足秸秆粉碎和撒布操作的具体要求。在整个现场操作过程中,实时响应能力有助于精确调节关键操作参数,如分布不均匀性和撒布宽度。这有效减轻了复杂现场环境对秸秆覆盖均匀性的影响,确保操作质量符合农业生产技术标准。因此,该系统为土壤水分保持、与秸秆返还相关的养分循环以及耕作土地质量的提升提供了坚实的技术基础。该系统的运行性能充分证明了其在现场应用中的可行性和优越性,显著提高了操作质量和效率,同时为类似现场操作控制系统的设计和优化提供了有价值的技术参考。
4. 结论
(1) 开发了一种用于秸秆识别的闭环控制系统,以调节秸秆的撒布宽度和均匀性。该系统能够识别散落的秸秆碎片,分析它们在空气中的空间分布,并评估其在捕获图像中的比例。通过根据实际撒布状态建立相对位置偏差阈值,系统可以调整旋转机构和均匀撒布装置。这种方法有效控制了秸秆的分布宽度和均匀性,同时提高了设备的抗干扰能力。
(2) YOLOv11-seg算法利用视觉识别原理进行了改进。在保持识别准确性的同时,该模型进行了轻量化修改,以便于硬件部署和迁移,提高了工程鲁棒性,并确保在上层计算机的闭环控制中稳定运行。测试结果表明,秸秆识别的mAP值超过了96%,满足了识别和检测秸秆位移和覆盖的要求。
(3) 田间试验验证了秸秆识别闭环控制系统,实现了超过80%的宽度合格率和低于20%的不均匀度,从而满足了实际农业需求。该系统促进了秸秆的均匀分解,减少了病虫害的传播,提高了播种质量和发芽率,最终提高了农业生产效率。
5. 科学写作中关于生成式AI的声明
本手稿的创作、撰写或编辑过程中未使用任何生成式AI技术。全部工作均为人类作者的原创成果。
伦理声明
本研究不涉及任何伦理问题,因为它没有涉及人类或动物实验,也没有个人数据。作者声明没有利益冲突。
作者贡献声明
郭新宇:撰写——原始草稿、方法论
史茵燕:方法论、概念化、软件、数据管理
王晓婵:监督、软件、资源管理、数据管理、可视化
黄学凯:验证、软件、方法论、调查
熊宏波:可视化、验证、监督
王磊:验证、监督、概念化
张小雷:撰写——审阅与编辑、可视化、资源管理
高晓军:撰写——审阅与编辑、可视化、验证
郑恩来:撰写——审阅与编辑、数据管理、概念化
胡志超:撰写——审阅与编辑、监督
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号