《Contact Lens and Anterior Eye》:Optimizing two-stream asymmetric feature extraction architecture with dynamic re-parameterization for enhancing beef cattle weight estimation
编辑推荐:
本文提出基于动态重参数化(Dyrep)优化的两流不对称特征提取架构,用于非接触式肉牛体重估计。通过对比DenseNet、ShuffleNet等对称骨干网络,验证Dyrep在优化两流不对称架构中的有效性,实验表明模型MAE达16.20kg(验证集)和18.54kg(测试集),R2为0.82-0.83,并在300-399kg体重区间取得最低MAE 7.64kg,通过多维度对比证明该方法在参数量、自动化水平和实际应用中的优势。
作者:赵崇|李倩|李子若|毛天慈|田雪|宋萍|刘刚|张淼
中国农业大学智能农业系统教育部重点实验室,北京100083,中国
摘要
非接触式称重技术具有无侵入性、高效性和成本效益高的优势,适用于单视角下的肉牛体重估计。现有的端到端双流对称架构忽视了不同模态图像之间的特征表示差异,从而限制了其性能。为此,本文提出了一种基于动态重参数化(Dyrep)优化的双流非对称特征提取架构,以提高估计的准确性和稳定性。我们构建了基于DenseNet、ShuffleNet、ResNet18、ResNet34和ResNet50的双流对称主干网络进行比较,并引入了通道切换(CS)模块以实现模态间信息交互。提取的特征与随机森林、线性回归和决策树等机器学习模型结合用于体重预测。同时,Dyrep优化了最优主干网络并构建了双流非对称架构。该模型在四个体重范围内进行了评估,其有效性和稳定性得到了验证。实验结果显示,验证集和测试集上的平均绝对误差(MAE)分别为16.20公斤和18.54公斤,均方根误差(RMSE)分别为22.38公斤和21.34公斤,决定系数(R2)分别为0.82和0.83。模型参数和浮点运算次数(FLOPs)分别为45.57百万次和80.29亿次。在300–399公斤的体重范围内,我们实现了最小的MAE,为7.64公斤。通过定量和定性分析,我们从准确性、参数大小、自动化程度、实际适用性和可扩展性等方面比较了现有方法,证明了我们方法具有广泛的应用前景。
引言
过去三十年间,中国的肉牛产业快速发展,产量达到752.68万吨,成为全球第三大生产国(《中国统计年鉴2023》)。新兴的肉牛养殖业以工业化、机械化和信息化为特征,重点关注实时活体重(BW)估计(Qiao等人,2021;Ruchay等人,2022)和体重变化监测(Hossain等人,2025;García和Aguilar,2024),以优化整个生产过程并降低总体成本,这也是精准喂养规划的重要环节(Fan等人,2023;Li等人,2022)。传统的手动称重方法耗时且对牛只造成压力,导致体重和生产力下降5–10%(Hu等人,2023)。
随着计算机视觉技术的进步和深度相机价格的降低,非接触式体重估计方法在研究和农业领域越来越受到关注(Yan等人,2019;Goopy等人,2017)。许多方法通过分析肉牛的物理参数(如胸径(Hou等人,2025)、臀高(Wang等人,2024b)、体长(Alonso等人,2013;Kuzuhara等人,2015;Gomes等人,2016)和臀高(Sousa等人,2018)来估计体重)。这些方法通常从分割的RGB图像(Na等人,2022)、滤波深度图像(Li等人,2022;Jia等人,2021)、点云(Cominotte等人,2020;Hou等人,2023)或其他数据(Csóka等人,2022;Kwon和Mun,2022)中提取特征,然后基于这些特征开发回归模型。常见的分割方法包括手动分割(Wang等人,2024b)、背景减除(Zhang等人,2024)以及基于U-Net(Li和Teng,2022;Wang等人,2024)和YOLO(Kong等人,2024)系列的深度学习网络,深度图处理通常涉及异常值去除(Li等人,2025)。线性回归(Wakholi等人,2022)、支持向量回归(Alonso等人,2015)、回归树装袋(Weber等人,2020)和神经网络(He等人,2021)等回归模型基于形态测量预测体重。尽管这些方法直观易懂(Wangchuk等人,2018),但它们仅依赖于身体的关键测量数据,结果可能因特征提取方法和体重类型的不同而有所差异(Zhao等人,2023),从而影响效率和准确性(Kwon等人,2023)。回归模型的性能很大程度上取决于特征的质量和多样性(Cai等人,2018)。因此,准确自动地提取与体重密切相关的形态特征仍然是一个关键挑战。
为了克服现有方法的局限性,基于RGB或深度图像的端到端深度学习模型逐渐成为有效的解决方案。它们能够自动学习关键特征、优化表示并预测体重结果。He等人(2023a)提出了一种使用侧视图RGB-D图像的轻量级羊体重估计模型,由LiteHRNet主干网络和LEHead模块组成,平均绝对百分比误差(MAPE)为14.60%。Weber等人(2020)使用来自牛背部的2D图像和回归树装袋模型,R2达到0.75。Cang等人(2019)在Faster R-CNN框架中引入了回归分支,成功构建了一个能够识别、定位猪并估计其活重的全端网络。Jun等人(2018)通过引入背部的曲率和偏差特征解决了猪姿态的问题,使用全连接网络实现了R2为0.79。He等人(2023b)提出了一种基于Swin-Transformer的双流交叉注意力对称网络,从猪背部的RGB-D图像中提取纹理外观和空间结构信息。然而,这些网络忽略了RGB图像和深度图像特征之间的差异和协同作用。
本研究旨在通过优化基于Dyrep的双流非对称特征提取架构来提高肉牛体重估计的准确性。具体工作如下:(1)验证Dyrep在双流对称网络中的显著优化效果,确定最佳的特征提取主干网络,并确认Dyrep在优化双流非对称架构中的效率。重点评估其在准确性(MAE、RMSE、R2)、效率(FLOPs)和模型大小(Params)方面的显著改进。(2)在不同体重范围内评估基于Dyrep优化模型的性能,并通过测试数据集验证其泛化能力,以证明其有效性和稳定性。(3)通过定量和定性评估,比较以往研究方法与本文提出的方法在准确性、参数大小、自动化程度、实际适用性和可扩展性方面的差异。
数据采集
所有动物处理程序均获得了中国农业大学动物福利与伦理审查委员会的批准(批准编号:Aw52214202-6-01)。本研究开发了一个图像采集系统,包括一个3D相机和一个Jetson Nano(NVIDIA,美国华盛顿特区)可编程开发板。相机通过USB电缆连接到Jetson Nano,开发板用于开发相关的图像捕获软件。
Dyrep对双流特征提取主干网络的影响
在本节中,我们首先比较了不同特征提取主干网络的性能。然后,我们评估了基于最佳主干网络的回归模块的性能。最后,我们评估了将DyRep整合到所提出方法中所带来的优化效果。各种比较模型在训练和验证数据集上的体重估计结果和模型性能见表2。
为了确保特征提取主干网络的公平比较,我们
结论
在本研究中,我们提出了一种基于Dyrep的双流非对称特征提取架构的优化方法用于肉牛体重估计。我们验证了Dyrep在双流对称网络中的显著优化效果,确定ResNet50是最佳的特征提取主干网络。通过应用DyRep,我们确认了其在优化双流非对称架构中的效率,从而显著提高了准确性,R2为0.80,RMSE为
未来工作
本研究证明了基于Dyrep优化的双流非对称特征提取架构在估计肉牛体重方面的有效性。仍需优化几个方面以提高模型性能并扩展其适用范围。未来的研究应重点加强图像融合模块,以提高模型在低光照和极端天气条件下的鲁棒性。我们专注于西门塔尔牛品种,未来的工作应扩展到其他品种
CRediT作者贡献声明
赵崇:验证、方法论、形式分析、概念化、撰写——初稿、软件、调查、数据整理。李倩:形式分析、方法论、撰写——审阅与编辑。李子若:方法论、形式分析、撰写——审阅与编辑、调查。毛天慈:数据整理、验证。田雪:撰写——审阅与编辑、数据整理、验证。宋萍:软件、验证、形式分析。刘刚:监督、项目管理、数据
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
作者衷心感谢以下机构的支持:中国国家重点研发计划(项目编号:2024YFD1300603,2021YFD1300502-01)、中国国家自然科学基金(NSFC,项目编号:32272930)、河南省新乡市光山县富牛养殖教授工作站(项目编号:20241001)以及中国高校科学基金(项目编号:2024TC185)。