CCRDNet:基于中央作物行直接检测的农业通用行间导航新范式

《Frontiers in Plant Science》:Extracting the central crop row with CCRDNet for universal in-row navigation in agriculture

【字体: 时间:2026年02月02日 来源:Frontiers in Plant Science 4.8

编辑推荐:

  本综述提出了一种创新性的农业导航范式CCRDNet(Central Crop Row Detection Network),通过模拟人类驾驶员的视觉感知机制,将复杂的多阶段作物行检测流程简化为直接识别中央作物行的端到端任务。该方法采用三分类标注策略(背景、植被、中央作物行),利用植被类作为辅助监督信号增强结构约束,仅需0.033M参数即可实现95.57%的导航线准确率与1.13°平均角度误差,在RTX 3060 GPU上达到86.76 FPS的实时性能,显著提升了复杂农田环境下的零样本泛化能力与部署效率。

  

1 引言

随着人工智能技术的快速发展,智能农业机械在现代农业生产中的应用日益普及。目前田间作业主要依赖卫星定位与视觉导航两类技术,其中视觉导航通过实时感知作物分布与环境变化,具备更高的精度与可靠性。作物行作为最关键的视觉线索,其提取精度直接决定导航效果。传统方法通常依赖颜色分割、形态学去噪、特征点聚类等多阶段流程,但面临环境适应性差、参数调优繁琐、行列数变化敏感等瓶颈。近年来深度学习虽提升了作物检测鲁棒性,但多数研究仍延续复杂 pipeline,难以应对作物种类、生长期、环境干扰的多样性挑战。
本文受人类驾驶员直观追踪中央作物行的启发,提出一种革命性策略:将导航目标简化为直接检测中央作物行,并开发轻量化网络CCRDNet。通过引入植被类作为结构约束信号与固定宽度的直线标注,模型仅需400张训练图像(占全数据集5.4%)即可在8类作物、7367张测试图像上实现零样本泛化,为农业导航提供了一种高效、鲁棒且易部署的新范式。

2 材料与方法

2.1 导航线提取新范式

传统方法依赖语义分割→特征点提取→聚类→直线拟合的多阶段流程(图1),其性能受限于行列数波动、环境干扰及后处理算法的脆弱性。本文提出直接检测中央作物行的单阶段方案,通过语义分割输出背景、植被、中央作物行三类像素,仅对中央行类的最大连通区域进行最小二乘拟合生成导航线。该设计消除了多行关联误差,将导航可靠性转化为模型自身的特征学习能力。

2.2 CCRDNet网络架构

CCRDNet采用U型编码器-解码器结构(图2),以深度可分离卷积(DSC)替代标准卷积大幅降低参数量,并在跳跃连接中嵌入空洞空间金字塔池化(ASPP)模块,通过多尺度感受野增强作物行连续性感知。ASPP采用分组卷积与扩张率(2、4、6、8)的并行空洞卷积,结合低层细节与高层语义信息,精准定位中央行结构。

2.3 导航线拟合方法

为避免误分割干扰,仅对预测中央行掩码的最大连通区域应用最小二乘法拟合导航线。拟合参数通过公式(1)斜率θ与(2)截距b计算,其中xi、yi为像素坐标,x?、?为其均值。该策略显著提升了对碎片化预测的鲁棒性。

2.4 数据集描述

数据集包含7367张图像,涵盖玉米、茄子、大豆等8类作物,覆盖不同生长期、光照、杂草密度及相机视角(图3)。训练集仅包含400张图像(来自8种环境中的2类作物),其余6967张用于零样本测试,充分验证模型泛化能力。

2.5 标注策略

采用三分类标注:背景(黑色)、植被(绿色)、中央作物行(红色,固定15像素宽)(图4)。通过Lab-a通道与ExG(ExG=2G-R-B)(3)生成植被二值掩码,结合直线标注还原作物行几何结构。固定宽度标注避免了生长期形态变化引入的噪声,使模型聚焦于行结构本质特征。

2.6 评价指标

综合评估分割性能(mIoU、PA)与导航线质量(角度误差AE、线交并比L_IoU、线准确率LA、帧率FPS)。其中L_IoU>50%对应导航线中心偏移<5像素,满足实际作业容差要求。

3 实验与结果

3.1 数据增强与训练环境

训练集包含玉米(离散结构)与大豆(连续结构)在杂草、反光膜、阴影等8类环境中的图像(图5)。通过随机旋转(±40°)与横向裁剪(±60像素)模拟田间机械运动偏差,所有实验在RTX 3060 GPU与Jetson Orin NX嵌入式平台进行。

3.2 结果分析

全测试集上CCRDNet达到95.57% LA、1.13° AE、78.37% L_IoU(表1)。在训练集可见环境中性能近乎完美(AE=0.71°),未见环境中仍保持93.88% LA,证实其强泛化能力。
3.2.1 无杂草环境下的性能
在作物间隙、旋转、光照变异等场景中(图6),CCRDNet导航线(红线)与人工标注(蓝线)高度吻合,尤其适用于幼苗稀疏、地膜反光等复杂条件。
3.2.2 杂草干扰下的鲁棒性
在杂草密度高、形态近似作物的挑战性场景中(图7),模型通过植被类约束有效抑制噪声,仅依赖训练集内1例(图7b)即可准确追踪中央行。
3.2.3 弯曲作物行适应性
对外部弯曲行数据集(图8)的测试表明,CCRDNet可适应局部曲线结构,验证其超越训练数据几何局限的泛化潜力。

3.3 架构组件影响

消融实验(表2)显示:DSC降低84%参数量且保持性能,ASPP提升LA超4%(AE从1.32°降至1.09°),二者结合实现精度与效率最优平衡。

3.4 对比实验

3.4.1 与多行提取方法对比
MS_ERFNet与ENet在多行标注下出现侧行误检(图9红圈),而中央行标注策略显著提升导航指标(表3),证明任务简化对稳定性增益。
3.4.2 三分类标注优势
移除植被类后,模型在缺失作物、视角偏移等场景中失效(图10黄圈);三分类通过植被空间上下文约束(蓝圈),使LA提升至95.57%(表4)。
3.4.3 与其他模型对比
CCRDNet在参数量(0.033M)、速度(86.76 FPS)及导航精度(95.57% LA)上均优于SegNet、ResC-UNet等基线(表5),其略低的mIoU源于对非中央区域细节的合理忽略,更契合导航任务本质。

4 讨论

4.1 方法论创新与泛化性

通过任务对齐的标注设计(直线化、植被辅助监督、宽度统一),模型在极小训练集下实现强泛化,证实数据多样性优于数据量的核心原则。

4.2 局限性

密集行排列(图12a-d)与中央行大面积缺失(图12e-h)仍挑战模型性能,可通过区域裁剪或时序信息融合优化。

4.3 二值输入扩展潜力

初步实验表明,CCRDNet-Binary版本能通过形态学处理应对重叠行、抽穗期玉米等特殊场景(图13),展现结构特征驱动的泛化优势。

4.4 未来工作

可探索视频时序跟踪、Transformer长程依赖建模、神经架构搜索等技术,进一步提升对间断行、高密度环境的适应性。

5 结论

CCRDNet通过“中央作物行直接检测”范式,将农业导航流程简化为端到端任务,在极小训练成本下实现跨作物、跨环境的高精度实时导航。三分类标注策略与轻量化架构设计,为农田复杂场景下的稳健感知提供了新思路,推动视觉导航技术向实用化迈进。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号