《AgriEngineering》:Machine Learning Predicts Drivers of Biochar-Diazotrophic Bacteria in Enhancing Brachiaria Growth and Soil Quality
Thallyta das Gra?as Espíndola da Silva,
Diogo Paes da Costa,
Rafaela Félix da Fran?a,
Argemiro Pereira Martins Filho,
Maria Renaí Ferreira Barbosa,
Jamilly Alves de Barros,
Gustavo Pereira Duda,
Claude Hammecker,
José Romualdo de Sousa Lima and
Erika Valente de Medeiros
+ 1 author
编辑推荐:
为解决如何优化牧草系统生物施肥策略、解析植物-土壤-微生物复杂互作的难题,本研究将机器学习算法应用于生物炭包覆固氮菌(DB)接种体系,成功识别出影响臂形草(Brachiaria brizantha)生长和土壤质量的关键功能驱动因素,揭示了生物炭丸化处理可增强固氮菌效能,并为精准农业提供了可转移的数据驱动分析框架,对可持续牧草管理具有重要决策支持意义。
在追求农业高产的道路上,人类曾长期依赖化学肥料和矿物资源。然而,这条路径也带来了沉重的环境代价:农业化学品残留、土壤酸化、水体富营养化以及磷矿等不可再生资源的枯竭,导致生态系统持续退化。为了在保障生产力的同时降低环境成本,寻找可持续的农业策略迫在眉睫。生物技术解决方案因此受到广泛关注,其中,能够进行生物固氮、溶解养分、产生植物激素的固氮菌,以及能够改良土壤性质、为微生物提供庇护所的生物炭,都展现出了巨大潜力。然而,当生物炭作为固氮菌的“运输载体”或“保护壳”时,植物、土壤、生物炭和微生物之间形成了极为复杂的多维交互网络,其内部作用机制和关键驱动因素仍如“黑箱”一般难以捉摸。传统的统计方法难以胜任这种非线性关系的解析。于是,来自巴西的研究团队在《AgriEngineering》上发表了一项研究,他们巧妙地引入机器学习(ML)这把“智能钥匙”,试图打开这个“黑箱”,预测并解释在生物炭丸化固氮菌作用下,究竟是哪些关键变量主导了臂形草的生长和土壤质量的响应。
为开展此项研究,研究人员采用了多种关键技术与方法。首先,他们从巴西伯南布哥州的高地采集了粘土样本用于盆栽实验,并利用葡萄修剪废弃物在450°C下通过热解制备了生物炭。研究团队从当地分离筛选了五株固氮菌株(OMSB04, OMSB07, OMSB21, OMSB30, OMSB53),并基于16S rRNA基因测序进行了系统发育分析以明确其分类地位。实验设计采用6(菌株)×2(有无生物炭)因子设计,外加一个干种子对照,共13个处理。在温室培养40天后,他们系统测定了包括植物鲜/干重、株高、植株数、粗蛋白含量以及土壤pH、钾(K)、磷(P)、钠(Na)含量和脲酶(URE)活性在内的共计15个植物与土壤变量。数据分析层面,研究结合了传统的单因素方差分析(ANOVA)、多变量方差分析(MANOVA)和主成分分析(PCA),并核心应用了三种机器学习算法(线性判别分析LDA、随机森林Random Forest、支持向量机SVM)来识别最能区分不同处理效果的关键变量。
3.1. 单变量分析
单变量分析揭示了实验因素对不同变量的差异化影响。在所有评估的变量中,菌株身份对三个变量(26.7%)有显著影响,生物炭对七个变量(66.7%)有显著影响。所有菌株处理(无论有无生物炭)均增加了土壤钾(K)含量,其中生物炭处理组的值最高,菌株b7处理使土壤钾含量比初始值增加了39%。土壤pH和脲酶(URE)活性受菌株身份显著调节,其中菌株b7的脲酶活性最高。叶片和根的粗蛋白(CFP, CRP)含量在添加生物炭的处理中普遍有升高趋势。生物量分配模式(如株高、鲜叶重等)在不同处理间也存在差异,例如菌株b21在株高和植株数上表现最佳。
3.2. 多变量分析
主成分分析(PCA)显示,前两个主成分解释了数据集中43.9%的总方差。菌株因子是导致多变量分化的主要原因,处理b53和b30在排序空间中距离最远。贡献最大的分离变量是株高(PH)、鲜叶重(FFW)、鲜根重(FRW)和植株数(NP)。生物炭因子的影响相对较弱。额外处理(干种子)位于原点附近,表明其对整体多变量影响贡献较低。
3.3. 相关性分析
基于标准化组均值(Z分数)的相关性分析显示了不同处理组合与因变量之间的独特响应模式。例如,b7_without(无生物炭的b7处理)与土壤磷(P)和脲酶活性(URE)呈正相关。b53_with(有生物炭的b53处理)与根粗蛋白(CRP)和鲜根重(FRW)呈正相关。b4_with(有生物炭的b4处理)与土壤pH呈负相关。b0_with(有生物炭的对照)与钠(Na)呈负相关,与干根重(DRW)呈正相关。这反映了不同菌株与生物炭组合产生了独特的生物学特征谱。
3.4. 使用机器学习识别关键变量
机器学习分析旨在识别能够区分不同处理类别的关键变量。线性判别分析(LDA)、随机森林和支持向量机(SVM)的模型表观准确率分别达到89.6%、100%和97.9%。尽管交叉验证显示预测泛化能力较低(反映了小样本数据的局限性),但结果明确揭示了处理间的结构化差异。基于标准化的LDA系数,干叶重(DFW)是最重要的判别变量(标准化重要性=1.0),其次是土壤pH(0.753)和鲜根重(FRW)(0.247)。这表明,处理间的差异主要与植物生物量发育和土壤化学条件的变化共同相关。
该研究得出结论,生物炭基丸化处理通过重组固氮菌分离株、土壤化学属性和植物生物量分配之间的功能互作,重塑了臂形草系统中的植物-土壤响应。不同菌株表现出独特的功能特性:菌株b21在促进植物活力方面最有效,而菌株b7(与生物炭联用)和b53在提升土壤钾水平方面能力更强。这表明生物施肥的效果取决于相互作用驱动的系统重构,而非菌株身份本身。更重要的是,机器学习模型揭示,干叶重、土壤pH和鲜根重是驱动系统响应的主导变量,这一关键变量组合通过传统的单变量分析难以被清晰分离。通过将多变量统计与可解释的机器学习相结合,该研究从描述性的农学评估,推进到了对生物炭-微生物-植物相互作用的机制性和预测性理解。这证实了研究假设,即生物炭丸化可增强固氮菌的功能性能,且复杂的响应可以通过一组有限的主导变量来解释。
这项研究的主要创新点在于,将基于生物炭的微生物丸化技术与可解释的机器学习相结合,以识别牧草系统中的功能驱动因子。通过将微生物生物勘探与可解释的数据驱动建模相耦合,该研究提出了一种可扩展的策略,用于在养分受限或退化的条件下改善土壤功能和牧场恢复力。这为设计优化的生物施肥策略、推动可持续农业工程中的预测性和数据驱动方法提供了高效的决策支持工具和分析框架。