KDYOLO-Tracker:一种用于梅花鹿行为识别与追踪的深度学习方法

《Computers and Electronics in Agriculture》:KDYOLO-Tracker: A Deep Learning Approach to Behavior Recognition and Tracking for Sika Deer

【字体: 时间:2026年05月10日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  熊海涛|肖颖|李娟|郭婷婷|王培东|李北原 中国青岛市青岛农业大学机电工程学院,266109 **摘要** 准确地识别和追踪梅花鹿的基本行为是智能健康监测的关键,尤其是在梅花鹿养殖领域。为了解决当前对象识别算法由于养殖环境多样性和梅花鹿快速移动速度导致的识别实时性低

  熊海涛|肖颖|李娟|郭婷婷|王培东|李北原
中国青岛市青岛农业大学机电工程学院,266109

**摘要**
准确地识别和追踪梅花鹿的基本行为是智能健康监测的关键,尤其是在梅花鹿养殖领域。为了解决当前对象识别算法由于养殖环境多样性和梅花鹿快速移动速度导致的识别实时性低以及身份关联准确度低的问题,本研究提出了一种高效的梅花鹿行为识别方法KDYOLO和一种跟踪方法MO-Tracking,并构建了一种多对象行为识别与跟踪方法KDYOLO-Tracker。首先,本文提出了一种稀疏训练机制,在批量归一化层中引入了缩放因子,以自适应地筛选和去除不重要的特征通道,从而有效提高了模型的计算效率。其次,将通道剪枝算法集成到KDYOLO中,进一步减小了模型规模和计算量,同时通过调整学习率和参数对剪枝后的模型进行微调,以减轻潜在的准确性损失。此外,本文还提出了一种多对象跟踪算法MO-Tracking,通过扩展检测缓冲区来增强轨迹匹配空间,以提高轨迹关联的准确性。将KDYOLO识别算法嵌入到MO-Tracking中,构建了KDYOLO-Tracker跟踪模型,进一步提升了识别和跟踪的性能。实验结果表明:与YOLOv8l相比,KDYOLO不仅提高了检测准确性,还将模型复杂度(GFLOPs、参数和规模)降低了58%以上(GFLOPs降低了71.66%);KDYOLO的mAP@0.5和mAP@0.5:0.95分别达到了97.20%和85.90%。与主流算法SSD、Faster R-CNN以及不同版本的YOLO相比,KDYOLO始终保持最高的准确性,mAP@0.5提高了17.05%,mAP@0.5:0.95提高了31.46%。在跟踪性能方面,KDYOLO-Tracker的HOTA、MOTA、MOTP和IDF1分别达到了85.70%、88.30%、93.60%和90.30%,均优于DeepSort、ByteTrack、DeepMot、BotSort和MO-Tracking等五种多对象跟踪算法。此外,KDYOLO-Tracker的检测速度达到了108FPS,比未经改进的情况提高了19FPS。本研究为监测养殖动物的健康状况和异常行为提供了技术支持。

**引言**
梅花鹿作为一种特殊的经济动物,其身体的各个部位都具有重要的医疗、食用和健康价值,因此在国内外都受到消费者的青睐(Zhang等人,2023)。随着梅花鹿养殖的信息化、自动化和精准化程度的提高,监测其站立、行走、躺下和进食等基本行为对于评估其健康状况至关重要(Gong等人,2022b)。梅花鹿的基本行为包含了与其健康相关的丰富信息,准确监测这些行为有助于早期发现疾病、心理问题和行为异常。因此,准确识别和实时监控梅花鹿的基本运动行为对于提高梅花鹿养殖效率具有重要意义。

传统的监测和管理梅花鹿行为的方法主要涉及人工观察、记录、跟踪和标记(Mattiello,2009)。这些方法不仅耗费大量人力物力,而且效率低下、反馈延迟,无法满足大规模梅花鹿养殖的实时监测需求。尽管可穿戴传感器已被用于行为监测、生理参数记录和位置跟踪,但梅花鹿的舔舐和相互碰撞等行为可能会损坏设备(Casas等人,2021)。此外,可穿戴传感器还可能引发梅花鹿的压力反应,影响其健康。因此,探索利用深度学习技术进行非接触式行为识别和跟踪的方法十分必要。

近年来,深度学习已经在多个领域得到广泛应用(Gaber等人,2025;Mohamed,2025),包括动物行为识别(Xu等人,2024)、害虫和疾病检测(Wang等人,2022;Xiong等人,2024a)、食品安全检测(Gao等人,2020)、桥梁裂缝检测(Chu等人,2024a;Chu和Chun,2024;Chu等人,2024b;Chu等人,2025;Chu等人,2026)、异常行为识别(Patwal等人,2023;Roka等人,2023)、工业(Liu等人,2020b;El-Kenawy等人,2024)、医学(Liu等人,2021;Atteia等人,2023)、农业(Cardellicchio等人,2025;Yang等人,2025)以及牲畜管理(Xiong等人,2024b)。Gong等人(2022a)提出了一种基于GoogLeNet的梅花鹿行为识别方法,结合了多尺度模块和SENet注意力机制来识别行走、躺下和站立等行为。Cheng等人(2022)提出了一种利用YOLOv5网络的羊行为识别深度学习模型,该模型根据训练数据和测试数据是否具有相似特征将其分为两组,并在羊行为识别方面取得了良好结果。Yin等人(2020)将牛的躺下、站立、行走、饮水和进食等行为输入BiLSTM模块,以准确快速地识别牛的运动行为。该模块通过时间序列整合视频帧中的注意力机制,实现了快速准确的牛运动行为识别。Gong等人(2023)提出了一种基于Vision Transformer的梅花鹿个体识别模型,该模型结合DenseNet模块提取低级特征,并使用掩蔽方法减少复杂背景干扰。实验结果表明,该模型在识别个体梅花鹿方面的准确率为97.68%。Wang等人(2023c)开发了高效3D CNN算法,该算法能够有效处理时空信息,准确识别奶牛行为,取得了有希望的结果。Zhang等人(2020)提出了一种基于深度学习的双流卷积神经网络模型,利用视频中的图像帧和光流提取时间和空间行为特征,将五种基本猪行为的识别准确率从98.12%提高到98.99%。尽管这些研究在识别个体动物行为方面取得了显著成功,但它们主要集中在单一动物行为识别上。

为了进一步推进深度学习算法在多对象动物行为检测中的应用,Wang等人(2023b)开发了一种轻量级且快速的牛交配行为检测系统,旨在提高密集环境中的检测速度。实验结果表明,该系统能够自动检测此类环境中的牛交配行为。Hao等人(2023)提出了一种新颖的双流猪行为识别方法,通过加权融合RGB和光流分支的结果来提升性能。Gu等人(2023)提出了一种基于深度学习的羊行为检测方法,通过引入多尺度特征聚合、注意力机制和深度卷积模块,平衡了检测准确性和模型规模,取得了良好的羊行为识别效果。Bai等人(2023)提出了一种高效轻量级的双路径X3DFast模型,用于识别牛的四种行为:站立、行走、躺下和攀爬。该模型通过X3D和快速路径整合空间和时间特征来利用监控视频数据,实现了这四种行为的98.49%识别准确率。Hua等人(2023)提出了一种利用牛骨骼特征的行为检测方法,将YOLOX改进为YOLOX-Pose以实现端到端骨骼信息提取,随后使用PoseC3D三维卷积网络进行运动预测。Wu等人(2023)结合YOLACT模型和双向长短期记忆(LSTM)算法,提出了一种监测多头牛呼吸行为的方法,该方法结合图像分割和状态识别,实现了93.56%的呼吸行为识别准确率。

在动物行为识别领域,准确监测个体身份信息对于进行深入分析和监控个体行为模式至关重要。这在牲畜跟踪研究中尤为重要,许多研究人员正在进行相关研究。Tu等人(2022)提出了一种改进的DeepSort算法,用于在群体喂食环境中跟踪猪的行为,该方法包括两个检测器YOLOX-S和YOLOv5s,用于识别进食、躺下和站立等行为,并通过改进的轨迹处理和数据关联提升跟踪能力。实验表明,改进后的DeepSort在商业条件下能够稳定地跟踪猪的行为并获取准确的ID值。Guo等人(2023b)结合深度学习和相机监测,提出了三种基于深度学习的多对象跟踪方法,通过加权关联算法优化了对象检测和跟踪效果。结果表明,这些方法在跟踪个体猪方面具有高准确性和鲁棒性。Zha等人(2023)提出了一种改进的轻量级多对象识别和跟踪算法,结合了优化的YOLOv5s和DeepSort,实现了高达96.6%的识别准确率和超过90%的跟踪准确率,满足了嵌入式边缘计算节点稳定实时运行的要求。Mar等人(2023)提出了一种结合深度学习和图像处理技术的新方法,图像经过数据预处理、牛检测和跟踪三个阶段处理。实例分割网络用于检测,结合位置、外观和区域的最新特征进行跟踪。实验结果表明,该系统能有效解决多对象跟踪问题,并提供可靠的性能。Zheng等人(2023)通过增强特征提取模块和优化状态参数,改进了复杂环境中的牛个体检测和跟踪性能,提出了一种名为YOLO-BYTE的多对象跟踪方法,取得了良好的性能和准确率。Guo等人(2023a)提出了一种基于YOLOv5s-CA+DeepSort-ViT的深度学习方法,通过引入坐标注意力机制和嵌入视觉变换器,提升了识别准确性和模型的跟踪性能。为了解决牛舍环境中牛与基础设施障碍物遮挡导致的漏检和误检问题,Tong等人(2024)提出了一种基于YOLOv8的多对象跟踪方法YOLO-BoT,该方法通过集成动态卷积等技术提升了复杂环境下的检测准确率。实验结果表明,YOLO-BoT在牛检测方面的平均准确率为91.70%。为了解决传统牛识别和跟踪方法耗时且劳动强度大的问题,Li等人(2024)提出了一种基于YOLOv8和DeepSort的深度学习算法,优化了卷积模块并引入了注意力机制和重新识别网络,实验表明该算法在牛行为识别方面的准确率为93.6%,多对象跟踪的准确率为92.10%。

尽管上述学者以及其他一些学者在动物识别和跟踪方面取得了一些良好研究成果,但大多数研究仅关注动物识别或位置跟踪,而没有从跟踪中提取运动行为信息。更重要的是,现有研究主要集中在家养动物的行为识别和跟踪上,而这些动物的运动速度和警觉性远低于梅花鹿。此外,现有的行为识别和跟踪研究要么通过增加参数来提高模型准确性,要么通过牺牲检测速度来提升检测速度。虽然我们进行了关于梅花鹿识别的相关研究(Xiong等人,2024b),但这仅限于识别牛的身体部位,未涉及跟踪和行为分析。目前尚未见到关于半驯养梅花鹿行为识别和跟踪的研究。受上述内容的启发,本研究重点探讨多目标行为轨迹跟踪和行为分析的方法,以实现检测速度和识别准确性的双重提升。然而,在分析和监控梅花鹿的基本运动行为时,缺乏结合实时数据与个体身份信息的方法,这严重阻碍了对梅花鹿基本行为模式的准确有效监控。因此,本研究提出了一种深度学习方法——Knowledge Distillation You Only Look Once Tracker (KDYOLO-Tracker),用于梅花鹿的多目标行为识别和跟踪。本研究的主要贡献有三个方面:(1) 为了准确识别和跟踪梅花鹿的基本行为,本研究建立了包含多种场景和规模的气象数据集。(2) 该方法首先在批量归一化层引入了一个缩放因子,以自适应地筛选和去除不重要的通道,有效提高了模型的计算效率。其次,在YOLO目标检测框架的基础上引入了通道剪枝算法,并结合知识蒸馏技术(KDYOLO)来提高模型的识别准确性,从而显著减小了模型的规模和计算量。此外,在剪枝后还对学习率和参数进行了微调,以补偿剪枝可能导致的准确性损失。同时,通过利用知识蒸馏技术,在不牺牲检测速度的情况下提升了模型的识别准确性。此外,本文还提出了多目标跟踪(MO-Tracking)技术,即在视频序列中连续跟踪多个感兴趣的目标,通过扩展检测缓冲区来增强轨迹匹配的空间,从而提高了轨迹关联的准确性。最后,将KDYOLO识别算法与MO-Tracking结合使用,进一步提升了识别和跟踪的性能。(3) 与九种典型目标跟踪和检测算法的比较分析表明,在294 FPS的梅花鹿行为识别数据集上,KDYOLO-Tracker取得了最佳性能,mAP@0.5和mAP@0.5:0.95分别达到了97.20%和85.90%。同时,在88 FPS的梅花鹿跟踪数据集上,与五种多目标跟踪算法的比较分析显示,KDYOLO-Tracker在HOTA、MOTA、MOTP和IDF1方面的得分分别为85.70%、88.30%、93.60%和90.30%,表现优异。该方法显著推进了大规模梅花鹿养殖的发展,增强了健康监测能力,并改善了梅花鹿的福利,具有重要的研究意义和实际价值。在本文中,第2节介绍了实验所需的数据集,并详细描述了所提出的模型。第3节介绍了消融实验和实验结果分析。第4节讨论了本研究的局限性及其未来工作的展望。第5节总结了本研究。

### 数据集收集
本研究使用的视频数据集拍摄于中国山东省烟台市广兴畜牧有限公司。实验围栏长18米,宽10米,休息区面积为30平方米,活动区面积为150平方米,外墙高度为2.3米。围栏内配备有喂食槽和水槽,饲养着10到30只年龄在4到6岁之间、身体状况相似的梅花鹿。梅花鹿数量的变化取决于实际训练平台和参数配置。

### 实验设备
本研究使用的实验设备包括Intel(R) Xeon(R) Silver 4316 CPU(2.30GHz)、192GB内存以及NVIDIA A40实验平台。软件环境配置为CUDA 11.7.0、PyTorch 2.0和Python 3.10。在模型训练阶段,图像被调整为640 × 640像素并输入网络进行训练。批量大小为16,加载数据的线程数为8,迭代次数为300次,优化器使用SGD。

### KDYOLO-Tracker的优势
梅花鹿的基本运动行为复杂多样,基于YOLOv8l的检测方法在识别和跟踪这些行为时存在一定的局限性。为了准确识别和跟踪梅花鹿的行为,本文在YOLOv8l框架内构建了KDYOLO-Tracker。KDYOLO-Tracker在不同环境和行为下的测试结果如图16所示。从图16可以看出:KDYOLO-Tracker能够有效地跟踪多个梅花鹿的行为。

## 结论
随着梅花鹿养殖业的集约化和大规模发展,通过行为监测和跟踪来评估梅花鹿的健康状况变得尤为重要。因此,本文提出了一种深度学习算法KDYOLO-Tracker,用于在鹿场监控场景中实现梅花鹿的行为识别和跟踪。最初,KDYOLO算法用于梅花鹿基本运动行为的对象检测。

### 作者贡献声明
熊海涛:撰写——原始草案、软件、方法论
肖英:撰写——审阅与编辑、数据整理
李 Juan:撰写——审阅与编辑、方法论、概念化、监督
郭婷婷:可视化、软件
王佩东:软件、调查
李北海:概念化

## 利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

### 致谢
本研究得到了SDARS专项基金(SDARS-22-09)、国家自然科学基金(32073029)以及山东省自然科学基金重点项目(ZR2020KC027)的财政支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号