准确的视觉目标定位和分类是计算机视觉中的基本能力,主要通过对象检测方法实现(Girshick, Donahue, Darrell, & Malik, 2014)。深度学习的快速发展极大地推动了这一领域的发展,使其成为多个领域中的关键使能技术(Weng et al., 2022)。显著的应用展示了该技术的广泛影响,包括通过机器人系统的农业自动化(De la Rosa, Miranda, Fernández, Guo, & Jiménez, 2022)和智能安全监控网络(Deng, Liu, Yang, Ramanan, & Liu, 2023)。这些应用还扩展到了计算机辅助医疗诊断(Chen, Zhang, & Shen, 2023f)和关键任务操作。这些操作包括搜救任务(Lee, Park, Kim, & Fox, 2023b)、无人机部署(Wu, Loianno, & Kumar, 2023)和应急响应协调(Garcia & Shahabi, 2023)。总体而言,这些实现突显了该技术的广泛工业影响和变革潜力。
基于CNN的对象检测的最新进展(He, Song, Meng, & Yan, 2022)使得无人机在精准农业中的自动监测成为可能(Li, Zhang, Wang, & Chen, 2023c)。这些进展通过实现自主危险检测减少了网络依赖性。然而,传统检测器(Wang, He, & Gupta, 2023g)在空中牛只监测中面临三个关键挑战(Liu, Zhang, Wang, 2023d, Wang, Kayacan, Chowdhary, 2023f):高海拔巡逻和变化的牛只形态阻碍了目标与背景的分离,而小目标尺寸限制了特征提取。无人机检测系统必须处理大规模异构数据,这增加了计算负载和延迟,同时降低了准确性,因此需要轻量级架构。快速的无人机运动和动态的牛只行为对实时检测提出了挑战,要求网络既高效又精确。精准农业中对改进的牛只检测系统的日益增长的需求(Wang, Li, Zhang, Liu, & Smith, 2023b)促使开发了一种创新的基于无人机的监测平台。该平台整合了先进的深度学习能力(Zhang, Chen, & Kumar, 2023d)以应对特定的农业挑战。基于视觉的牛只导航主要采用两种方法:基于地图的系统(Smith, Corke, & Milford, 2023)和无地图技术(Garcia, Kayacan, 2023, Lee, Gupta, Levine, 2023a)。无地图方法利用各种局部视觉特征,包括模板匹配(Chen, Zhang, & Chowdhary, 2023e)、光流分析(Huang, Li, & Ramanan, 2023)、地标跟踪(Liu, Zhang, & Ramanan, 2023c)和基于CNN的分类(Li, Han, & Wang, 2023a)。对于路径记录,我们实现了基于2D网格地图M的方法,灵感来自占用网格技术而非拓扑地图,如图1所示。这种高效的表示显著促进了牛只搜索操作(Zhang, Wang, Anderson, & Clark, 2023b)。牛只识别采用基于CNN的生物特征分析(Wang, Zhang, Clark, & Chen, 2023e),该方法通过堆叠的卷积模块处理红色感兴趣区域(ROIs)。整体架构在计算效率和检测准确性之间取得了最佳平衡,弥合了轻量级机载处理和高性能网络需求之间的差距。
基于计算机视觉的最新进展,所提出的系统结合了AKConv(Chen, Vahid, & Kumar, 2023b)来动态优化感受野。这种优化增强了牛只与背景的区分能力,同时保持了计算效率。此外,该系统实现了跨视角动态通道融合(CDCF)模块。CDCF模块通过将多视图自适应加权机制与膨胀卷积和多分支架构相结合(Liu, Wang, He, 2023a, Wei, Xiao, Shi, Jie, Feng, Huang, 2018, Zhang, Szeliski, Freeman, 2023f),显著超越了传统的特征选择方法(Chen, Wang, Zhang, Gupta, & Yang, 2022)。这种协同组合实现了全面的特征空间构建(Wang, Liu, & Zhou, 2023d),同时保留了关键的判别特性。这种方法比现有的静态维度剪枝方法有了显著改进,后者通常基于统计分析或稀疏学习技术。
AMSD-Net在YOLOv11架构(Wang, Yeh, & Liao, 2023a)的基础上进行了扩展,整合了两项关键创新:自适应核卷积(AKConv)模块和跨视角通道融合(MSRF)模块,专门用于牛只检测任务。AKConv模块动态调整感受野以捕捉更丰富的空间和上下文细节。同时,MSRF模块通过跨视角集成细化了多尺度特征表示。在相关数据集上进行的实验评估验证了该框架的总体有效性。本工作的主要贡献如下:
1)设计了一种新方法,将AKConv和MSRF集成到YOLOv11中,以实现快速牛只检测。
2)AMSD-Net专为畜牧业场景设计,结合AKConv和MSRF实现密集和小物体的高精度检测,能够在NVIDIA Jetson Nano上实现实时性能。
3)所提出的方法在真实的农场监控数据上进行了严格评估,并与YOLOv11和领先的当代检测架构进行了比较分析
本文的结构如下。第2节回顾了相关文献。第3节详细介绍了提出的方法和架构。第4节介绍了实验设置,包括数据集、增强策略和实现,并进行了结果分析。通过实验可视化评估了方法的有效性,并讨论了局限性。最后,总结了研究发现并指出了未来的研究方向。