利用机器学习估算尼罗罗非鱼(Oreochromis niloticus)幼鱼的体重

《Aquaculture》:Machine learning in estimating the weight of Tilapia Oreochromis niloticus juveniles

【字体: 时间:2026年03月05日 来源:Aquaculture 3.9

编辑推荐:

  本研究利用机器学习技术,通过数字图像分析预测尼罗 tilapia 幼苗体重,比较了 SVM、决策树、KNN、XGBoost、随机森林和线性回归等模型,结果显示线性回归和随机森林模型具有最低均方误差和最高相关系数,为水产养殖中的非侵入式体重监测提供了可靠工具。

  
莱桑德罗·多·卡莫·利马(Lessandro do Carmo Lima)|阿德里亚诺·卡瓦略·科斯塔(Adriano Carvalho Costa)|海德·弗朗西埃尔·多·卡莫·弗朗萨(Heyde Francielle do Carmo Fran?a)|阿莱娜·桑托斯·索扎(Alene Santos Souza)|吉德利亚·阿劳霍·费雷拉·德·梅洛(Gidélia Araújo Ferreira de Melo)|布伦诺·穆勒·维托里诺(Brenno Muller Vitorino)|维多利亚·德·瓦斯康塞洛斯·克雷奇默(Vitória de Vasconcelos Kretschmer)|伊莎贝尔·罗德里格斯·德·雷森德(Isabel Rodrigues de Rezende)|拉斐尔·维尔埃纳·雷伊斯·内托(Rafael Vilhena Reis Neto)
戈亚斯联邦研究所 – 里奥维德校区,戈亚斯南部高速公路01公里处,里奥维德,75901-970,巴西

摘要

水产养殖已成为一种特别有前景的农业产业活动,尤其是在罗非鱼生产方面,这得益于其适应性和高营养价值。罗非鱼苗和幼鱼的养殖对于该行业的可持续性至关重要,直接影响生产力和未来的粮食安全。准确测量鱼苗和幼鱼的体重对于有效管理鱼场非常重要。然而,传统的手动称重方法可能具有侵入性,会对鱼类造成压力,并导致操作上的不准确性。利用数字图像提供了一种非侵入性的、更准确的替代方案,还可以实现自动化,从而加快流程,减少标注错误并优化测量结果。本研究的目的是评估机器学习技术在利用数字图像预测罗非鱼(Oreochromis niloticus)体重方面的有效性。实验使用了体重在10至100克之间的罗非鱼幼鱼。在受控条件下,使用iPhone 12 Pro Max收集了总共2092张图片,确保了照片的一致性和高质量。数据在Roboflow平台上进行了细致的预处理和标注,并采用了数据增强技术来提高模型的泛化能力和预测的稳健性。评估了多种机器学习算法,包括支持向量机(SVM)、决策树(Decision Tree)、K近邻(KNN)、XGBoost回归器(XGBoost Regressor)、随机森林(Random Forest)和线性回归(Linear Regression)。数据集被分为三个相等的部分:70%用于训练,20%用于验证,10%用于测试。所有模型的评估结果显示,算法估计的体重与实际观察到的体重之间存在高度相关性,决定系数也很高。这一发现证明了这些模型在预测罗非鱼苗体重方面的有效性。然而,线性回归和随机森林模型在最小均方误差方面表现更为出色,显示出更高的效率。本文证明了这两种模型在水产养殖中非侵入性监测和管理罗非鱼苗体重的有效性和实用性。研究结果表明,将高质量的数据(以标准化方式收集)与稳健的统计方法相结合,可以显著提高水产养殖系统中生物量估计的精度。研究证实了机器学习技术,特别是线性回归和随机森林,在优化和现代化水产养殖称重管理系统方面的巨大潜力,对行业的可持续性和效率有着重要影响。

引言

水产养殖是全球增长最快的农业产业之一,2020年的总产量达到了1.778亿吨,其中49.2%来自水产养殖系统(Noskoski等人,2023年)。
由于人口增长和对更健康食品需求的增加,我们预计这种增长趋势将持续下去。在水产养殖中,鱼类养殖是最重要的活动,尤其是罗非鱼、金枪鱼、鲑鱼、沙丁鱼、鲶鱼和鲭鱼等物种的产量(Siqueira,2018年)。罗非鱼在全球养殖物种中排名前五,因为它具有适应性、易于繁殖以及理想的感官和营养特性。发达国家和发展中国家都广泛养殖罗非鱼,将其作为对抗饥饿的重要工具(粮农组织,2018年)。
罗非鱼苗的生产对于水产养殖的可持续性和发展至关重要。高质量的鱼苗能确保鱼类的健康生长,从而直接提高养殖场的生产力(Araújo等人,2021年)。遗传改良计划通过培育更具抗性且生长速度更快的品种,在优化养殖场表现方面发挥着关键作用(Pant等人,2024年)。此外,罗非鱼苗的生产为未来的粮食安全提供了可持续的高质量蛋白质来源(Gao等人,2024年)。对研究的投入和创新技术的开发推动了养殖实践的进步,生产出了更强壮、更具抵抗力的鱼苗(Rohani等人,2022年)。
在放养、监测鱼类生长和收获过程中,根据体重测量或分类动物是基本要求(Gladju等人,2022年)。体重是饲料推荐表中考虑的一个特征,因为这些推荐表基于鱼类的总生物量和养殖阶段。此外,销售鱼苗的公司和屠宰场在营销时也必须考虑这一变量(Neto等人,2023年)。
大多数鱼场仍然采用手动称重方式(Wang等人,2021年)。手动称重在处理过程中可能会给鱼类带来压力,导致死亡或生产力下降,尤其是当生产者不使用麻醉剂时。此外,这种做法容易出现称重错误和数据收集错误,无论是通过间接测量还是错误标注(Raposo等人,2024年)。
也可以通过形态测量基于体型来估算鱼类的体重。然而,这种方法需要处理动物并手动记录数据,容易出错且精度有限。此外,它无法充分捕捉生物形状的复杂性。作为一种替代方案,几何形态测量法通过考虑解剖学标志点来全面描述体型,提供了更复杂的方法。不过,这种技术仍然依赖于手动标记和高度标准化的图像,限制了其在生产环境中的应用和自动化。
鉴于这些限制,基于数字图像的机器学习技术成为了一种有前景的替代方案,可以实现更快、更准确、非侵入性的分析,并且人工干预最小(Li等人,2024年)。例如,水产养殖已经使用图像来评估疾病、估算体重、识别物种和监测鱼类生长(Ramírez-Coronel等人,2024年)。这些进步有助于优化生产并提高分析的准确性,克服了传统方法的挑战。
在实现自动化的过程中,收集图像以构建数据库是有效分割的基础(Fernandes等人,2020年)。水生环境的复杂性,如水质浑浊、光照等,常常导致水下鱼类的图像颜色不均衡、对比度不均匀和模糊,从而降低了分割的准确性,并限制了现有模型的效果(Yu等人,2024年)。图像分割是计算机视觉中的一个重要概念,它能够分离和详细分析图像中的不同组成部分,允许精确识别感兴趣的区域,如鱼类(Junior等人,2021年)。
此外,由于游泳时鱼体弯曲,鱼苗的形状变化使得分割和提取精确特征变得困难,这可能会影响输入数据的质量和模型的准确性。还需要探索并比较其他深度学习架构,看看是否有更好的方法()。
先前的研究在使用深度学习技术估算Pintado Real鱼苗的生物量方面取得了有希望的结果(Pache等人,2022b)。然而,现有文献主要集中在使用回归方法预测鱼类体重上。对于罗非鱼(Oreochromis niloticus),通常是根据体长来估算体重的。然而,众所周知,随着罗非鱼(Oreochromis niloticus)的生长,仅凭体长不足以准确预测体重(Zhao等人,2023年;??güzar等人,2024年;Feng等人,2024a;Taparhudee等人,2024年)。因此,旨在评估整合深度学习和回归算法的不同预测方法的研究对于开发自动体重估算技术至关重要。
本研究基于现有文献,特别是Zhao等人(2023年)和??güzar等人(2024年)的开创性文章。前者提供了基于图像的动物体重预测方法的全面综述,强调了机器学习算法的应用以及传统和几何形态测量与不同物种体重之间的强相关性。本研究提供了坚实的概念基础,强化了使用自动提取的测量数据来预测生产变量的可行性。在2024年的论文中,??güzar等人提出了一个基于耳石图像预测鱼类年龄的框架。这种创新方法基于卷积神经网络和高斯过程回归,代表了该领域的重大进展。虽然重点在于年龄,但用于分割和自动提取形态特征的方法与本研究中使用的方法在方法上类似,即利用神经网络对图像中的鱼类进行分割并提取形态测量数据,用于训练机器学习算法进行体重预测。
本研究考察了几种机器学习算法,以确定罗非鱼(Oreochromis niloticus)幼鱼的体重。这些算法包括支持向量机(SVM)、决策树(Decision Tree)、K近邻(KNN)、XGBoost回归器(XGBoost Regressor)、随机森林(Random Forest)和线性回归(Linear Regression)。通过使用均方误差(Mean Squared Error)、平均绝对误差(Mean Absolute Error)、均方根误差(Root Mean Squared Error)、决定系数(Coefficient of Determination)、得分(Score)和相关系数(Coefficient of Correlation)等评估指标,分析了每种模型的准确性。本文旨在测试各种模型并评估结果,为水产养殖领域的未来应用提供宝贵见解,同时也为未来的学术研究和罗非鱼管理提供指导。

数据收集 – FISHIJPG - 2092SEGI

本研究使用了2092条尼罗罗非鱼(Oreochromis niloticus)样本,幼鱼体重在10至100克之间。这些样本在循环水养殖系统(RAS)中饲养,并每天喂食含有32%粗蛋白的商业饲料,共喂食三次。我们在2022年下半年至2024年前两个月期间,每周两次在位于巴西戈亚斯州里奥维德市的Alevinos Rio Verde公司收集了这些图像。
我们与计算机部门合作进行了数据收集

结果

表1显示了用于预测罗非鱼苗体重的机器学习模型的性能。随机森林模型和线性回归模型的均方误差分别为4.257和4.058,平均绝对误差分别为1.581和1.554,均方根误差分别为2.063和2.014,R2得分分别为0.992和相关系数分别为0.996。这些结果表明,随机森林和线性回归模型都表现出色

讨论

关于本研究中报告的相关系数,所有测试模型的值都高于0.984。这表明评估的形态测量变量与罗非鱼体重之间存在强烈关联,也就是说,随着形态测量值的增加,鱼的体重也趋于增加。然而,高相关性虽然表明两者之间存在强关联,但并不意味着因果关系

结论

所有评估模型都显示,算法估计的体重与实际观察到的体重之间存在强相关性,决定系数也很高,表明它们在预测罗非鱼苗体重方面表现优异。然而,线性回归和随机森林模型在均方误差方面表现最佳,显示出更高的准确性。这两种模型被证明更有效、更可靠,并且在实际应用中具有巨大潜力

CRediT作者贡献声明

莱桑德罗·多·卡莫·利马(Lessandro do Carmo Lima):撰写 – 审稿与编辑,撰写 – 原稿,项目管理,方法论,调查,数据管理,概念化。阿德里亚诺·卡瓦略·科斯塔(Adriano Carvalho Costa):撰写 – 审稿与编辑,项目管理,方法论,正式分析,数据管理,概念化。海德·弗朗西埃尔·多·卡莫·弗朗萨(Heyde Francielle do Carmo Fran?a):撰写 – 审稿与编辑,撰写 – 原稿,可视化,验证,软件,项目管理,概念化。阿莱娜·桑托斯·索扎(Alene Santos Souza):

机构审查委员会声明

本研究符合巴西戈亚斯州戈亚斯联邦研究所(Instituto Federal Goiano,CEUA/IF Goiano)采用的动物实验伦理原则(协议6002300124,2024年2月)。

资金

不适用。

未引用的参考文献

Pache等人,2022a
Parra等人,2024

利益冲突声明

作者声明没有利益冲突。

致谢

我们感谢Alevinos Rio Verde公司提供本研究使用的罗非鱼苗。同时感谢戈亚斯联邦研究所里奥维德校区、国家科学技术发展委员会(CNPq)、戈亚斯州研究支持基金会(FAPEG)和指数农业卓越中心(CEAGRE)在研究项目中的合作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号