水产养殖是全球增长最快的农业产业之一,2020年的总产量达到了1.778亿吨,其中49.2%来自水产养殖系统(Noskoski等人,2023年)。
由于人口增长和对更健康食品需求的增加,我们预计这种增长趋势将持续下去。在水产养殖中,鱼类养殖是最重要的活动,尤其是罗非鱼、金枪鱼、鲑鱼、沙丁鱼、鲶鱼和鲭鱼等物种的产量(Siqueira,2018年)。罗非鱼在全球养殖物种中排名前五,因为它具有适应性、易于繁殖以及理想的感官和营养特性。发达国家和发展中国家都广泛养殖罗非鱼,将其作为对抗饥饿的重要工具(粮农组织,2018年)。
罗非鱼苗的生产对于水产养殖的可持续性和发展至关重要。高质量的鱼苗能确保鱼类的健康生长,从而直接提高养殖场的生产力(Araújo等人,2021年)。遗传改良计划通过培育更具抗性且生长速度更快的品种,在优化养殖场表现方面发挥着关键作用(Pant等人,2024年)。此外,罗非鱼苗的生产为未来的粮食安全提供了可持续的高质量蛋白质来源(Gao等人,2024年)。对研究的投入和创新技术的开发推动了养殖实践的进步,生产出了更强壮、更具抵抗力的鱼苗(Rohani等人,2022年)。
在放养、监测鱼类生长和收获过程中,根据体重测量或分类动物是基本要求(Gladju等人,2022年)。体重是饲料推荐表中考虑的一个特征,因为这些推荐表基于鱼类的总生物量和养殖阶段。此外,销售鱼苗的公司和屠宰场在营销时也必须考虑这一变量(Neto等人,2023年)。
大多数鱼场仍然采用手动称重方式(Wang等人,2021年)。手动称重在处理过程中可能会给鱼类带来压力,导致死亡或生产力下降,尤其是当生产者不使用麻醉剂时。此外,这种做法容易出现称重错误和数据收集错误,无论是通过间接测量还是错误标注(Raposo等人,2024年)。
也可以通过形态测量基于体型来估算鱼类的体重。然而,这种方法需要处理动物并手动记录数据,容易出错且精度有限。此外,它无法充分捕捉生物形状的复杂性。作为一种替代方案,几何形态测量法通过考虑解剖学标志点来全面描述体型,提供了更复杂的方法。不过,这种技术仍然依赖于手动标记和高度标准化的图像,限制了其在生产环境中的应用和自动化。
鉴于这些限制,基于数字图像的机器学习技术成为了一种有前景的替代方案,可以实现更快、更准确、非侵入性的分析,并且人工干预最小(Li等人,2024年)。例如,水产养殖已经使用图像来评估疾病、估算体重、识别物种和监测鱼类生长(Ramírez-Coronel等人,2024年)。这些进步有助于优化生产并提高分析的准确性,克服了传统方法的挑战。
在实现自动化的过程中,收集图像以构建数据库是有效分割的基础(Fernandes等人,2020年)。水生环境的复杂性,如水质浑浊、光照等,常常导致水下鱼类的图像颜色不均衡、对比度不均匀和模糊,从而降低了分割的准确性,并限制了现有模型的效果(Yu等人,2024年)。图像分割是计算机视觉中的一个重要概念,它能够分离和详细分析图像中的不同组成部分,允许精确识别感兴趣的区域,如鱼类(Junior等人,2021年)。
此外,由于游泳时鱼体弯曲,鱼苗的形状变化使得分割和提取精确特征变得困难,这可能会影响输入数据的质量和模型的准确性。还需要探索并比较其他深度学习架构,看看是否有更好的方法()。
先前的研究在使用深度学习技术估算Pintado Real鱼苗的生物量方面取得了有希望的结果(Pache等人,2022b)。然而,现有文献主要集中在使用回归方法预测鱼类体重上。对于罗非鱼(Oreochromis niloticus),通常是根据体长来估算体重的。然而,众所周知,随着罗非鱼(Oreochromis niloticus)的生长,仅凭体长不足以准确预测体重(Zhao等人,2023年;??güzar等人,2024年;Feng等人,2024a;Taparhudee等人,2024年)。因此,旨在评估整合深度学习和回归算法的不同预测方法的研究对于开发自动体重估算技术至关重要。
本研究基于现有文献,特别是Zhao等人(2023年)和??güzar等人(2024年)的开创性文章。前者提供了基于图像的动物体重预测方法的全面综述,强调了机器学习算法的应用以及传统和几何形态测量与不同物种体重之间的强相关性。本研究提供了坚实的概念基础,强化了使用自动提取的测量数据来预测生产变量的可行性。在2024年的论文中,??güzar等人提出了一个基于耳石图像预测鱼类年龄的框架。这种创新方法基于卷积神经网络和高斯过程回归,代表了该领域的重大进展。虽然重点在于年龄,但用于分割和自动提取形态特征的方法与本研究中使用的方法在方法上类似,即利用神经网络对图像中的鱼类进行分割并提取形态测量数据,用于训练机器学习算法进行体重预测。
本研究考察了几种机器学习算法,以确定罗非鱼(Oreochromis niloticus)幼鱼的体重。这些算法包括支持向量机(SVM)、决策树(Decision Tree)、K近邻(KNN)、XGBoost回归器(XGBoost Regressor)、随机森林(Random Forest)和线性回归(Linear Regression)。通过使用均方误差(Mean Squared Error)、平均绝对误差(Mean Absolute Error)、均方根误差(Root Mean Squared Error)、决定系数(Coefficient of Determination)、得分(Score)和相关系数(Coefficient of Correlation)等评估指标,分析了每种模型的准确性。本文旨在测试各种模型并评估结果,为水产养殖领域的未来应用提供宝贵见解,同时也为未来的学术研究和罗非鱼管理提供指导。