可解释人工智能（XAI）驱动的大豆产量预测：基于Kolmogorov-Arnold Networks（KAN）的多国比较研究

《Scientific Reports》：From data to decisions: the use of explainable AI to forecast soybean yield in major producing countries

【字体：大中小】 时间：2026年01月14日 来源：Scientific Reports 3.9

编辑推荐：

　　本研究针对深度学习模型在作物产量预测中“黑箱”特性导致的决策信任危机，提出XAI-Crop框架，以主要大豆生产国为案例，系统比较了原生可解释神经网络KAN与多层感知机（MLP）、随机森林（RF）的性能。结果表明，在小样本条件下KAN在保持与MLP、RF相当预测精度（R2>0.8）的同时，显著提升模型可解释性；特征重要性分析揭示太阳诱导叶绿素荧光（SIF）为跨区域关键驱动因子，为将XAI模型整合至农业决策支持系统奠定基础。

在全球气候变化与粮食安全挑战日益严峻的背景下，准确预测主要作物的产量对于保障全球粮食供应、稳定贸易市场及制定农业政策具有至关重要的意义。大豆作为全球第四大作物，是蛋白质和植物油的重要来源，其产量波动对全球经济和社会稳定产生深远影响。传统上，作物产量预测依赖于基于物理过程的作物模型，例如欧盟的MARS系统、美国的DSSAT和澳大利亚的APSIM。这些模型通过模拟基因型（G）、环境（E）和管理措施（M）之间的复杂相互作用（G×E×M）来估算产量，具有较强的机理性和解释能力。然而，这类模型构建和维护需要详尽的专家知识和精细化的数据准备，包括作物品种特性、施肥灌溉等管理细节，这极大地限制了其在数据稀缺地区的广泛应用。

近年来，机器学习（ML）尤其是深度学习（DL）方法在作物产量预测领域展现出巨大潜力，其能够从海量多源数据中自动学习复杂的非线性关系。但大多数DL模型，如经典的多层感知机（MLP），因其内部运作机制不透明而被视为“黑箱”，这严重削弱了决策者和农民对其预测结果的信任。在高风险领域如农业中，模型的可解释性与预测准确性同等重要。为了破解这一困境，可解释人工智能（XAI）技术应运而生，旨在提升模型的透明度与可信度。近期提出的Kolmogorov-Arnold Networks（KAN）基于Kolmogorov-Arnold表示定理，以其内在的可解释性架构（如在网络边上使用可学习的样条激活函数）为复杂系统的建模提供了新思路，并在某些任务中显示出媲美甚至超越大型MLP的近似能力。然而，此前尚未有研究系统评估KAN在大豆产量预测，特别是跨国家尺度上的泛化性能和预测精度。

为了填补这一研究空白，来自中国农业科学院等机构的研究团队在《Scientific Reports》上发表了题为“From data to decisions: the use of explainable AI to forecast soybean yield in major producing countries”的研究论文。该研究旨在评估和比较原生可解释的DL模型KAN与传统的MLP和RF模型在预测主要大豆生产国（美国、巴西、阿根廷）大豆产量方面的性能差异，并探讨其在实际农业决策中的应用潜力。

研究人员为开展此项研究，主要应用了以下几项关键技术方法：首先，构建了一个包含气象（如ERA5-Land数据）、土壤（如OpenLandMap-soildb、SoilGrids数据）和遥感（如MODIS衍生的NDVI、LAI、FPAR以及GOSIF提供的SIF数据）等多源数据的特征集（共152维），并基于作物日历进行了生长季内的特征聚合计算；其次，采用了空间块交叉验证策略来评估模型的泛化能力，将研究区域划分为10×10的网格进行五折交叉验证，以缓解空间自相关带来的评估偏差；第三，利用Optuna结合试错法对KAN、MLP和RF模型的超参数进行优化；最后，通过RMSE、R²、MAE等指标全面评估模型预测精度，并利用特征重要性分析（KAN使用其内置的注意力机制，MLP和RF使用排列特征重要性）揭示关键驱动因子。

研究结果

3.1 特征归因分析

特征重要性比较显示，三种模型处理特征的方式存在显著差异。KAN和MLP模型在美国和阿根廷的数据中表现出更广泛的特征覆盖范围，即对大量输入特征均赋予一定权重。而在巴西，仅有少数特征被赋予较高权重。相比之下，RF模型表现出更集中的特征选择倾向，将重要性高度集中于少数强预测性特征上。一个关键的共同发现是，太阳诱导叶绿素荧光（SIF）在不同国家和模型中都 consistently 被识别为与大豆产量高度相关的特征，凸显了其在产量预测中的核心作用。然而，次要重要特征的排名在不同国家间差异很大，例如NDWI在美国表现出高敏感性，而温度和土壤水分等特征在巴西和阿根廷更为突出，这反映了不同地区环境、气候和管理条件对产量驱动因素的差异化影响。

3.2 精度验证

模型在不同国家的性能表现各异。在美国，由于年际产量分布相对稳定，时间尺度上线性相关性高，三种模型（RF > KAN > MLP）的整体性能差异在一定程度上被掩盖，RF表现最佳。在巴西，尽管年际线性关系较弱，但由于县级行政区划细密、样本量大，所有模型在验证集上均表现出色（R²> 0.9），测试集精度也较高（> 0.8），但KAN和MLP在部分折数上出现过拟合。在阿根廷，样本量最小，模型性能波动最大，RF表现相对稳健，KAN和MLP在不同折数间的性能不稳定。总体而言，在小样本农业数据集上，KAN达到了与MLP和RF相当的预测精度和泛化能力。

3.3 空间一致性

空间投影比较显示，在美国的主要大豆产区，三种模型的模拟产量与统计产量在空间分布上高度一致。在巴西，模型在中南部主产区预测一致，但在北部地区，KAN模型的预测值普遍高于统计结果。在阿根廷，三种模型在中部大豆主产区的预测表现出一致性。

结论与讨论

本研究通过系统比较KAN、MLP和RF模型在主要大豆生产国的产量预测应用，证实了可解释神经网络KAN在小样本条件下能够实现与传统高性能模型相媲美的预测精度和泛化能力，同时其内在的可解释性架构显著优于后两者。KAN能够更直观地追踪输入特征在网络层中的变换过程，为模型开发者与领域专家互动、将先验知识融入数据驱动模型提供了可能，从而有助于构建更可靠、可信的农业预测系统。

研究的局限性包括多源数据空间分辨率不一致可能引入不确定性，以及有限的五年时间序列数据难以进行更细致的时间维度分析。此外，尽管SIF被证明是跨区域的敏感预测因子，但次要重要特征的国家间差异表明，开发具有跨大陆或国家泛化能力的通用模型仍面临挑战，这源于物候、土壤、气候和管理实践等方面的差异。

展望未来，利用KAN网络在可解释性和学习物理知识方面的卓越性能，可以有效整合大量生长实验积累的先验知识，从而提升模型的预测性能和泛化能力。通过将数据驱动的神经网络与知识驱动的作物机理相结合，构建能够高效模拟和预测作物生长过程的综合模型框架，将成为未来研究的重要方向，为农业科学和可持续发展提供新的思路和解决方案。这项研究不仅推动了可解释AI在农业领域的应用，也为应对全球粮食安全挑战提供了重要的方法论支持。

热点排行

新闻专题