《Poultry Science》:Optimization of metabolizable energy prediction models for maize in laying hens by incorporating anti-nutritional factors
编辑推荐:
传统预测家禽饲料有效能的模型多基于常规营养成分,但忽视了抗营养因子(ANF)的影响,导致准确性受限。本研究通过建立两种自变量组合(IVC1: 仅营养成分;IVC2: 营养成分+ANF),评估了五种算法对蛋鸡玉米表观代谢能(AME)和氮校正表观代谢能(AMEn)的预测性能。结果表明,引入ANF可显著提升所有模型的预测精度,其中结合贝叶斯超参数优化的随机森林模型(RF)表现最佳,其交叉验证的决定系数(R2CV)分别从0.645(AME)和0.669(AMEn)提高至0.748和0.758。这为精准评估饲料能量价值、优化蛋鸡日粮配制提供了更可靠的模型工具。
在畜牧生产中,玉米是家禽日粮中主要的能量来源,其提供的能量占全球家禽饲料能量的很大比重。准确评估玉米中动物可利用的能量——表观代谢能(AME)和氮校正表观代谢能(AMEn),是科学配制日粮、实现最佳生产性能的关键。然而,传统测定AME和AMEn的代谢试验方法耗时、费力且成本高昂,限制了其在饲料配方评估和实时调整中的应用。长期以来,研究人员尝试通过建立预测模型来解决这一问题,但早期的模型多依赖于常规营养成分(如淀粉、粗蛋白、粗脂肪)的含量,这类模型虽然简单易用,但其预测准确性常因忽略了饲料中普遍存在的抗营养因子(Anti-nutritional factors, ANF)而大打折扣。抗营养因子,如粗纤维、总阿拉伯木聚糖、植酸等,能通过干扰蛋白质、矿物质和能量底物的消化吸收,从而影响饲料能量的实际利用率。那么,在预测玉米代谢能时,将ANF纳入考量是否会显著提升模型的预测能力?这正是由中国农业大学动物科学技术学院刘忠浩、秦劲生、黄世猛、赵丽红、马秋刚研究员团队发表在《Poultry Science》上的研究所要回答的核心问题。
为了回答这一问题,研究团队采用了严谨的建模与验证框架。首先,他们在新疆维吾尔自治区收集了247份玉米样品,并利用2,223只30周龄的健康海兰褐蛋鸡,通过全收粪法测定了每份样品的AME和AMEn值。在剔除异常值后,最终获得了包含230个完整样本的数据集用于模型构建。研究设定了两组自变量组合:IVC1仅包含常规营养成分(淀粉、粗蛋白CP、粗脂肪EE);IVC2则在IVC1的基础上,额外纳入了四种ANF(粗纤维CF、总阿拉伯木聚糖TAX、灰分、植酸PA)。研究团队使用了五种算法来建立预测模型,包括传统的线性回归、以及三种正则化回归(岭回归Ridge、最小绝对收缩和选择算子LASSO、弹性网络Elastic Net)以应对自变量间的多重共线性问题,还引入了能处理非线性关系的机器学习算法——随机森林(Random Forest, RF)。为了获得稳健、无偏的模型性能评估,研究采用了先进的贝叶斯超参数优化来寻找各算法的最佳参数,并通过3次重复的10折嵌套交叉验证来计算模型的性能指标,如交叉验证决定系数(R2CV)和均方根误差(RMSECV)。最后,通过Wilcoxon符号秩检验,统计比较了纳入ANF前后模型性能的差异。研究还利用SHAP(沙普利加性解释)值等方法,深入解读了各特征变量在最佳模型中对预测结果的影响方向和重要程度。
研究结果
- •
玉米样本的代谢能与化学成分特征及相关性
对230份玉米样本的分析显示,AME和AMEn的平均值分别为3,870.28和3,751.64 kcal/kg干物质(DM),且两者呈极强的正相关。相关性分析表明,AME和AMEn与淀粉、EE含量呈显著正相关,但与CP、CF、TAX、灰分含量呈显著负相关。有趣的是,两者与PA含量均无显著相关性。此外,预测变量之间也存在复杂的相关关系,例如淀粉与CP、CF、TAX、灰分、PA均呈显著负相关。
- •
引入ANF显著提升代谢能预测模型的性能
无论预测目标是AME还是AMEn,在所有测试的五种算法中,随机森林(RF)模型在使用任一特征集时均取得了最高的R2CV值,因此被选为最佳模型。比较IVC1和IVC2的结果显示,引入ANF带来了显著的性能提升。对于AME预测,RF模型的R2CV从0.645提高至0.748,RMSECV从22.9 kcal/kg DM降低至19.1 kcal/kg DM。对于AMEn预测,R2CV从0.669提高至0.758,RMSECV从21.3 kcal/kg DM降低至18.1 kcal/kg DM。Wilcoxon符号秩检验证实,从IVC1到IVC2,所有算法在所有预测目标上的性能提升都具有统计显著性(P< 0.001),且效应量较大。
- •
特征对代谢能预测的影响
通过偏依赖图(PDP)和SHAP分析,可以深入理解各变量如何影响预测。在仅含营养成分的IVC1-RF模型中,淀粉和EE对预测的AME和AMEn值均表现出强烈的正面影响,CP的影响则相对较弱且为正面。在加入了ANF的IVC2-RF模型中,EE和淀粉依然保持正面影响,但重要性相对下降。而新引入的ANF则显示出不同的效应:CF、TAX和灰分均表现出明确的负面影响,即它们含量的增加会降低预测的代谢能值;PA则表现出微弱的正面影响。SHAP特征重要性分析进一步揭示,在IVC2模型中,EE和淀粉仍是重要的预测因子,而TAX和灰分的重要性也显著上升,成为影响预测的关键因素。
结论与讨论
本研究的核心结论是:在预测蛋鸡玉米代谢能时,将抗营养因子作为预测变量纳入模型,能够超越仅使用常规营养成分的传统方法,显著提高预测的准确性和稳定性。在所有测试的算法中,结合贝叶斯超参数优化和重复嵌套交叉验证的随机森林模型提供了最精确、最稳健的预测结果。
这一结论具有重要的理论和实践意义。首先,它证实了ANF是解释玉米代谢能变异的重要信息来源。传统模型准确性受限的部分原因,正是忽略了CF、TAX等物质对养分消化吸收的物理阻碍和干扰作用。本研究将ANF量化并纳入模型,使预测框架更贴近生物学的真实情况。其次,尽管变量间存在复杂的多重共线性,但随机森林模型凭借其处理相关特征和非线性关系的能力,表现优于传统的线性及正则化线性回归模型,这暗示了营养成分与ANF影响代谢能的过程可能存在非线性交互作用。最后,从应用角度看,该研究建立的高精度预测模型,为饲料企业和养殖场提供了一种快速、低成本评估玉米能量价值的有力工具。相较于昂贵的动物代谢实验,利用化学成分数据通过该模型进行预测,能极大提高日粮配方设计的效率和精准度,有助于在满足蛋鸡营养需求的同时优化饲料成本,对实现精准畜牧业和可持续发展具有积极推动作用。当然,研究者也指出,由于本研究所用玉米样本均来自同一地区,未来需要在更广泛地理来源的样本中验证模型的普适性,以进一步确保其在实际生产中的广泛应用价值。