《Tropical Animal Health and Production》:AI-Driven prediction of body weight in chicken genotypes with different growth rates
编辑推荐:
本研究针对不同生长速度鸡种的体重精准预测难题,系统评估了高斯指数回归(GER)、前馈神经网络(FFNN)、支持向量机(SVM)和决策树(DT)四种机器学习模型。研究结果表明,GER模型在慢速、中速和快速生长型鸡种中均表现出最高的预测精度和最低的误差,展现出作为精准家禽养殖高效可靠工具的潜力。该研究为根据特定鸡种生长速率选择模型提供了直接建议,对优化饲养管理、提高生产效率和促进可持续发展具有重要意义。
在追求高效、可持续和福利友好的现代家禽养殖业中,精确掌握鸡只的实时体重是优化生产管理、提高经济效益的关键。体重数据直接影响饲料配给、出栏时间规划和健康监测。传统的体重获取方式依赖于人工称重,不仅耗时耗力,还可能对鸡群造成应激。而人工智能(AI)技术,尤其是机器学习模型,为通过非接触式形态测量数据预测体重提供了革命性的可能性。尽管已有研究探索了多种模型,但一个显著的知识空白在于,缺乏在统一实验条件下,对不同固有生长速率(如慢速、中速和快速生长)的鸡种进行机器学习模型的系统基准测试。多数研究局限于单一品种或特定环境,其结论的普适性受到限制。因此,明确哪种模型最适合预测哪种生长类型的鸡的体重,对于开发可应用于实际养殖场的、自动化且可靠的智能系统至关重要。
为了填补这一空白,一项发表在《Tropical Animal Health and Production》上的研究应运而生。研究人员选取了三种具有代表性的鸡基因型:代表慢速生长的马来西亚本地适应品种SAGA、代表中速生长的法国双用途品种Sasso,以及代表快速生长的全球主导商业肉鸡品种Cobb 500。研究从14日龄开始,在受控环境下对总共300只雄性雏鸡进行了为期4周的实验,每周记录其体重和六项形态测量指标(体长、体围、大腿长、胫骨长、小腿长、翅膀长),最终获得了2160条数据记录。
本研究主要采用了数据驱动的机器学习建模方法。核心在于利用收集的形态测量数据作为输入,预测鸡的体重输出。研究人员系统评估了四种具有不同原理和优势的机器学习算法:高斯指数回归(GER)、前馈神经网络(FFNN)、支持向量机(SVM)和决策树(DT)。所有模型的超参数均通过网格搜索结合五折交叉验证进行优化,性能使用决定系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)等多个指标进行综合评估。
结果
1. 描述性统计
模型预测体重的描述性统计显示,GER模型在所有生长类型鸡种中预测的平均值最接近实验观察均值,且标准差与观测值高度一致,表现出最高的精确度和稳定性。相比之下,SVM模型表现不稳定,甚至产生了生物学上不可信的负值预测。
2. 条形图展示
通过比较不同生长类型鸡种的模型误差条形图(见图2-图4)发现,GER consistently achieved the lowest RMSE and MAE(始终取得最低的RMSE和MAE),FFNN在训练阶段表现出可比的精度,DT表现中等,而SVM consistently the weakest(始终最弱)。雷达图(见图5-图7)进一步支持了这些结果,GER的R2值在所有品种中均排名最高。
3. 模型在训练和测试数据上的预测性能
详细的性能指标评估(见表2)证实了GER的优越性。例如,对于慢速生长鸡,GER在测试集上达到了近乎完美的精度(R = 1.00, R2= 0.99)和极低的误差(MAPE = 0.10%, RMSE = 0.29 g),显著优于其他模型。SVM则表现最差,预测误差最高。在中速和快速生长鸡中,GER同样保持了最强的预测能力和最低的误差。
4. 经Bonferroni校正的配对t检验结果
统计检验(见表3)进一步证实,GER和FFNN在 all growth-rate categories(所有生长速率类别中)均显著优于SVM和DT(p < 0.001)。GER与FFNN之间的性能差距在中速和快速生长组中并不显著。
5. 赤池信息量准则(AIC)结果
AIC分析(见表4)为模型效率提供了额外证据。GER在所有品种和训练/测试阶段均 consistently shows the lowest AIC value(始终显示最低的AIC值),表明它在取得高精度的同时,模型结构最为简洁高效(仅13个参数)。FFNN虽然训练R2高,但因模型复杂而被AIC严重惩罚。
结论与讨论
本研究的核心结论是,在用于预测不同生长速率鸡种体重的四种机器学习模型中,高斯指数回归(GER) consistently performed better than other models, exhibiting the highest accuracy and lowest errors(始终优于其他模型,展现出最高的准确度和最低的误差),被证明是最准确、最普适且最有效的模型。前馈神经网络(FFNN)对于慢速和中速生长品种表现良好,但对于快速生长的Cobb 500鸡种,其预测误差显著增加,显示出对高方差生长模式可能存在的过拟合风险。支持向量机(SVM)和决策树(DT)则 consistently had the poorest results, with higher errors and poor generalizability(始终结果最差,误差更高且普适性差)。
GER的优异表现归因于其数学结构与生物生长动力学的高度契合。作为一种参数回归方法,GER将因变量表达为自变量指数函数之和,这 naturally captures the nonlinear, saturating relationships characteristic of biological growth(自然地捕捉了生物生长特有的非线性、饱和性关系),从而能够以简约的模型精准表征整个生长轨迹,并最小化过拟合风险。相比之下,FFNN作为通用函数逼近器虽然强大,但其性能高度依赖于架构和数据量;SVM对核函数选择敏感,难以拟合平滑的生物生长曲线;而DT的 piecewise-constant structure(分段常数结构)本质上不适合对体重这样的连续过程进行平滑建模。
这项研究的意义深远。它首次在 uniform conditions(统一条件)下对跨越多种生长类别的机器学习模型进行了基准测试,填补了重要的研究空白。研究结果直接为精准家禽养殖中的模型选择提供了实证依据:推荐使用GER作为通用、高效且可靠的首选预测工具。GER的 computational efficiency(计算效率)使其特别适合集成到处理能力有限的边缘设备中,这对于智慧农业应用至关重要。在实际应用中,基于GER的系统可以通过 routine morphometric measurements(常规形态测量)实现自动化生长监控,从而 facilitate adaptive feeding strategies to minimise waste(促进适应性饲养策略以减少浪费),并通过 predicted growth trajectories(预测的生长轨迹)的显著偏差触发早期健康检测警报。这为开发可扩展的、自动化的系统铺平了道路,这些系统能够支持商业养殖中的生产力、动物福利和可持续性。未来的研究应在商业农场进行大规模验证,探索将GER的预测优势与计算机视觉等自动化特征提取技术相结合的混合模型框架,以进一步提升系统的鲁棒性和实用性。