水稻是一种基本的主食作物,在全球粮食安全中发挥着关键作用。随着人口持续增长和对自然资源压力的增加,提高水稻种植的效率和可持续性变得至关重要(Bouman 和 Tuong, 2001; Jat 等, 2009; Peng 等, 2009)。集成式 puddling–leveling 设备被广泛用于减少拖拉机的作业次数并改善稻田表面的平整度,从而降低土壤压实、增加水稻产量、抑制杂草生长,并提高肥料和水的利用效率(Abdullaev 等, 2007; Bueno 等, 2020; Miao 等, 2021; Quirós-Vargas 等, 2020)。传统的操作方法仍然严重依赖操作人员持续监测稻田中裸露土壤的地形状况并进行手动调整,这种方法需要较高的技能并带来沉重的劳动负担。同时,中国面临着人口老龄化和 skilled 农业劳动力短缺的挑战。鉴于这些情况,开发高效且智能的 puddling 和平整技术对于减少对人工劳动的依赖并确保稻田平整度至关重要(Chen 等, 2024)。此类技术还在推进智慧农业和实现无人驾驶农业系统方面发挥着重要作用(LUO 等, 2024)。
稻田中的集成式 puddling–leveling 操作通常在耕作(旋转耕作)和插秧之间进行,以满足水稻种植的农艺要求(Yang 等, 2019; Zhou 等, 2020a)。尽管基于激光和 GNSS 的自动平整技术已经取得了显著进展(Hu 等, 2014; Jing 等, 2023),但它们在集成式稻田 puddling–leveling 设备中的应用仍面临诸多挑战。基于激光的测量系统可以提供高精度的高程数据,但其应用受到操作范围有限和系统设置复杂的限制(Chen 等, 2024; Hu 等, 2015)。此外,与单功能平整设备不同(Jing 等, 2023),集成式 puddling–leveling 操作主要应用于初始地形相对均匀的田地,但这些田地的平整度仍无法满足插秧的要求(Zhou 等, 2020a, Zhou 等, 2020b)。RTK-GNSS 的高程测量精度会受到大范围稻田环境中多种因素的影响,包括大气波动、高压塔和风力涡轮机的电磁干扰以及水面反射引起的多路径效应。此外,与基站的距离较远和差分信号的不稳定性会进一步降低定位精度(Dai 等, 2008; Huang 等, 2005; Xia 等, 2017)。这些因素可能导致高程漂移和定位不稳定,从而降低刮板高度控制的精度和一致性。
在集成式 puddling–leveling 操作中,水面作为评估局部地形变化的关键视觉参考(Tang 等, 2018),高处的区域会暴露出水面的土壤,而低洼区域则保持淹没状态。与激光或 GNSS 提供的绝对高程信息相比,基于视觉的控制方法直接利用裸露土壤区域的语义信息来感知地形变化并指导刮板的动作。由于基于视觉的控制方法受操作范围限制或外部电磁干扰的影响较小,因此特别适用于 GNSS 信号不稳定的稻田。此外,基于视觉的稻田平整控制方法可以减少对初步地形调查的依赖,这在需要在紧迫时间限制下连续在多个田地进行自动 puddling–leveling 操作时特别有利。这种方法有助于简化操作并提高整体效率。快速准确地检测裸露土壤区域至关重要,因为它直接决定了平整过程的有效性。
计算机技术和深度学习的最新进展推动了田间表面对象的语义分割模型的发展,这些模型具有强大的特征学习能力和高分割性能。(Riegler-Nurscher 等, 2019)基于传统机器学习和 ERFNet 深度网络开发了土壤覆盖分割模型,以减轻残余物对土壤粗糙度估计的不利影响。ERFNet 模型在他们的测试中表现出色,并随后被集成到动力耙控制系统中,使土壤表面更加均匀和松散。(Azizi 等, 2020)使用带有 VGG16 主干网络的 SegNet 模型对破碎的土壤聚集体进行分割和分类,提供了关于土壤聚集体大小分布的充分信息,以便快速评估耕作质量。(Qiu 等, 2022)比较了三种语义分割模型 LinkNet、FCN 和 DeepLabV3 在检测耕作后棉花田表面残余膜方面的性能。他们的结果显示,DeepLabV3 利用孔洞卷积和多尺度上下文信息,准确识别了残余膜,同时保持了边界完整性。(YANG 等, 2024)改进了 TransUNet 架构,能够精确提取不同大小和复杂形状的梯田作业区域,从而为梯田中的覆盖路径规划提供了环境地图。尽管语义分割在土壤耕作中得到了广泛探索和应用并取得了显著成功,但这些方法在稻田中的集成式 puddling–leveling 操作中仍面临一些挑战。经典的语义分割模型通常包含大量参数,难以在资源有限的农业机械上部署。相比之下,一些轻量级模型并未针对稻田环境进行专门优化,因此检测性能不足。这些限制限制了基于视觉的稻田 puddling 和平整控制方法的发展和实际应用。
稻田中的裸露土壤区域具有不规则的形态和不同的大小,此外还受到非均匀照明和漂浮杂物的影响(He 等, 2022; Zhang 等, 2024)。考虑到图像数据的特征和几种经典语义分割模型的优势,选择了 DeepLabV3+ 作为基线架构,因为它具有较高的分割精度、强大的多尺度特征提取能力和相对简单的架构(Qi 等, 2024; Sun 等, 2023)。然而,原始的 DeepLabV3+ 模型使用 Xception 主干网络,体积庞大且参数密集,这使得在计算资源有限的平台上难以部署。
因此,本研究改进了 DeepLabV3+ 模型,以平衡稻田中裸露土壤区域的检测精度和推理速度。具体目标如下:(1)设计一个轻量级的语义分割模型 PL_DeepLabV3+_0.8,用于稻田中裸露土壤的检测,以满足 puddling 和平整操作的实际需求;(2)在常见的但具有挑战性的稻田数据集下评估该模型的检测性能;(3)将模型部署在浮动式 puddling 和平整设备上,并通过实际田间测试验证其可行性和有效性。