基于机器学习和干旱条件的美国东南部主粮作物早期产量预测框架

《Farming System》:A Framework for Early-Season Crop Yield Prediction Using Machine Learning and Drought Conditions in the Southeastern United States

【字体: 时间:2026年03月25日 来源:Farming System 8.4

编辑推荐:

  本研究针对美国东南部湿润区雨养农业面临干旱影响产量不稳的难题,提出一个利用标准化降水蒸散发指数(SPEI)和机器学习(随机森林RF、k近邻kNN)的早期季节作物产量预测框架。该框架成功预测了玉米、棉花、花生和大豆的产量等级,区域和州尺度预测准确率最高分别可达74%(RF)和77%(kNN),实现了在收获季前数月预警产量异常,为区域农业生产和供应链管理提供了重要决策支持。

  
在全球气候变化的背景下,干旱这个难以捉摸的“气象幽灵”正日益频繁地光顾世界各地的农田,成为威胁粮食安全的主要气候灾害之一。尤其在美国东南部沿海平原这样一个以雨养农业为主的湿润地区,农业高度依赖季节性降水,看似水源丰沛的背后,实则隐藏着因干旱导致的巨大产量波动风险。历史数据揭示,严重的干旱曾导致该地区玉米和大豆的产量损失分别高达-42.7%和-25.4%。然而,干旱的不可预测性与作物产量波动之间的复杂关系尚未被充分理解,这使得农民和农业决策者难以在作物生长的中早期就对收获季的产量前景做出预判。在气候变化导致干旱频率、强度和持续时间可能增加的未来,建立一套能够在生长季早期、基于可观测的干旱信号来预测最终产量的可靠方法,对于稳定区域农业经济、保障供应链和粮食安全变得至关重要。
为此,来自美国农业部农业研究局的Clement D.D. Sohoulande和C.Prakash KHEDUN开展了一项开创性研究,旨在构建一个可解释的机器学习(ML)框架,用于美国东南沿海平原地区(涵盖佐治亚州、北卡罗来纳州和南卡罗来纳州)玉米、棉花、花生和大豆的早期季节产量预测。他们的研究成果表明,利用生长季中期的干旱指数,可以提前数月以合理的准确度预测作物产量等级,为实现区域尺度的产量异常预警提供了有力工具。这项研究已发表在《Farming System》上。
为了开展这项研究,研究人员主要运用了以下几项关键技术方法:首先,他们收集了研究区域305个县1990年至2018年的县级历史数据,包括来自全球SPEI数据库的标准化降水蒸散指数(SPEI)月度时间序列,以及来自美国国家农业统计局(NASS)的玉米、棉花、花生和大豆的年产量数据。其次,他们采用了数据预处理与特征工程方法,包括对作物产量时间序列进行去趋势处理以剔除技术进步等因素的长期影响,以及利用z分数(Z-score)变换将去趋势后的产量值标准化,并进一步分类为六、三、两个有序的产量异常等级。最后,研究核心是应用了两种监督机器学习模型——随机森林(RF)和k近邻(kNN)分类器,利用相关性分析选出的关键生长月(玉米为6月和7月,其他三种作物为7月和8月)的SPEI值作为预测因子,对不同级别的产量异常进行预测和模型性能评估。
研究结果
3.1. 将SPEI与作物产量关联
通过逐月相关性分析,研究发现不同作物对其生长季中特定月份的干旱条件最为敏感。玉米产量异常与6月和7月的SPEI相关性最高,而棉花、花生和大豆的产量异常则与7月和8月的SPEI显示出更强的关联。这些月份恰好处于作物的生长发育中期,且远在收获期(9月至12月)之前,这为利用中期干旱信号进行早期预测提供了科学依据。
3.2. 随机森林模型的产量预测
随机森林模型在区域和州尺度上对产量异常等级进行了预测测试。结果表明,预测准确率因作物、空间尺度和所预测的产量等级数量而异。例如,在预测两个产量等级(即产量低于或高于平均水平)时,模型在州尺度的准确率在61%到74%之间,在区域尺度上则在58.7%到70.3%之间。预测三个等级时,准确率也维持在较高水平。模型的变异系数(CV)很低(0.6%-3.1%),表明模型具有较好的稳健性和可重复性。通过模型模拟生成的网格图清晰显示,当关键月份的SPEI值均为负值(表示干旱)时,作物产量更可能集中在“低于正常”的等级;反之,当SPEI为正值时,产量更可能“高于正常”。然而,宏观平均F1分数(maF1)值表明模型对不同产量等级的预测能力存在差异。
3.3. k近邻模型的产量预测
研究通过交叉验证为每种作物确定了kNN模型的最佳近邻数(k)。kNN模型的预测表现与RF模型相似,但整体上略有优势。在预测两个产量等级时,kNN模型在州尺度的最高准确率达77%,区域尺度最高为76.5%。这种轻微的优异性在所有四种作物和不同尺度上表现一致。与RF模型类似,kNN模型的模拟网格图也揭示了干旱条件(负SPEI)与低产等级的强关联。尽管kNN模型准确率略高,但其模型结构(需确定最佳k值)比RF模型更为复杂。
4. 综合与讨论
研究综合表明,尽管美国东南部沿海平原相对湿润,但干旱事件对农业的影响显著,因此理解干旱与作物产量的关联至关重要。本研究提出的ML框架,通过将产量数据转换为可比较的异常等级,并利用生长中期的SPEI值进行预测,证明了早期产量预测的可行性。RF和kNN模型均显示出合理的预测能力,其中kNN模型在准确性上略胜一筹,但RF模型相对更简单。研究特别指出,预测两到三个产量等级时,模型准确率显著高于预测六个等级,更具实用价值。混淆矩阵进一步直观对比了两种模型在不同作物和产量等级上的预测性能。
研究结论与意义
该研究成功构建并验证了一个基于机器学习和干旱条件(SPEI)的美国东南部主粮作物早期产量预测框架。核心结论包括:第一,该框架易于解释,它采用的基于z分数和标准差的产量分类方案易于被农业生产者理解。第二,模型的输入是生长季中期的SPEI值,这使得在作物收获期结束前数月进行产量预测成为可能,例如,利用6-7月的干旱信号预测玉米产量,可以提前2-4个月。第三,该机器学习框架能够帮助在区域尺度上预警由干旱条件可能引发的产量异常。
这项研究的意义重大。它为雨养农业区的生产者、政策制定者和供应链管理者提供了一个潜在的工具,使其能够基于生长季中期的客观气候指标,提前预判收获季的产量大势,从而更好地进行资源调配、市场规划和风险管理,增强农业系统应对气候风险的韧性。尽管模型存在不确定性,且未考虑土壤、管理等非气候因素,但其展示的预测能力为发展更精细、更集成的农业预警系统奠定了坚实基础。未来研究可通过纳入遥感水分胁迫指标等因素,进一步提升预测的准确性和实用性。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号