《Computers and Electronics in Agriculture》:Artificial intelligence-based identification of drought-resilient bean cultivars using multi-source data in the Delmarva region
编辑推荐:
本文介绍了如何利用人工智能技术解决豆类作物在气候变化下的生产稳定性问题。研究整合了美国Delmarva地区多年的田间数据和气象指标,通过随机森林和XGBoost模型,成功预测了豆类的产量并筛选出具有更强抗旱性的品种。结果显示,绿豆品种表现出了最佳的干旱恢复能力。这项研究为基于数据的耐旱作物选育提供了新方法,对提升区域农业的气候适应能力具有重要意义。
论文解读
气候变化正以前所未有的方式挑战着全球农业系统,其中干旱和降雨模式的改变已成为影响作物产量的主要限制因素之一。在美国的重要农业区——Delmarva半岛(涵盖特拉华州、马里兰州和弗吉尼亚州),豆类作物在保障食物与营养安全、改善土壤肥力方面扮演着关键角色。然而,该地区的砂质沿海土壤保水能力差,加之干旱频发,导致豆类产量在年际间剧烈波动,严重威胁着当地的生产稳定性和农民生计。传统的品种选育和田间评估方法耗时费力,难以应对复杂多变的气候条件和多样化的基因型表现,亟需更高效、精准的工具来筛选和推荐适应特定环境的抗旱品种。
在这样的背景下,由Alfadhl Y. Alkhaled等人发表于《Computers and Electronics in Agriculture》的研究,将目光投向了人工智能与机器学习。研究者们提出,整合多年的田间多源数据与AI算法,有望构建一个强大的预测框架,从而精准识别出最能抵御干旱胁迫的豆类品种。这不仅能为育种家和种植者提供数据驱动的决策支持,也是推动农业走向气候智能型、可持续发展的关键一步。那么,他们具体是如何做的?又得出了哪些具有指导意义的结论呢?
为了开展这项研究,研究人员主要采用了以下几种关键技术方法。首先,他们进行了为期多年的(2014-2020年及2023年)田间试验,地点位于美国马里兰州普林斯安娜的马里兰大学东岸分校农业研究站。试验材料涵盖了绿豆、芸豆、木豆和豇豆四个豆种下的11个栽培品种。其次,研究系统地收集了与生长和产量相关的农艺性状数据(如株高、单株荚数、单荚粒数、总生物量和籽粒产量)以及环境变量(累积降水量、生长度日°C-天,简称GDD)。为了量化干旱和热胁迫的影响,研究还计算了两个关键指数:干旱影响指数(DII,为产量与热胁迫指数HSI的比值)和干旱敏感性指数(DSI,为产量与总降水量的比值)。最后,研究的核心是构建人工智能预测模型。研究者利用Python编程环境,并基于scikit-learn和XGBoost等开源库,应用了随机森林和极端梯度提升两种集成机器学习算法。通过重复的k折交叉验证来评估模型预测籽粒产量的性能,并利用特征重要性分析来识别影响产量和抗旱性的主导因素。
研究结果
3.1. 年际天气变化
分析显示,研究期间(2014-2020年及2023年)的气温和降水存在显著的年际差异。2014年和2023年是总降水量最低(均低于300毫米)的干旱年份,而2016年则是降水量最高(超过900毫米)的湿润年份。与此同时,热胁迫指数HSI在2016、2018、2019和2020年较高,表明这些年份经历了更频繁或更长时间的高温胁迫。这种气候的波动性,特别是干旱和高温的复合胁迫,是导致豆类产量年度间大幅变化的主要环境驱动力。
3.2. 不同年份间栽培品种的农艺性状变异
对不同农艺性状的分析揭示了不同豆种和品种间的显著差异:
- •
株高:木豆品种的植株最高,常超过1.5米;绿豆品种株高中等;芸豆和豇豆品种最矮。
- •
单株荚数与单荚粒数:木豆品种的单株荚数最多,但其单荚粒数较少;而绿豆品种虽然单株荚数中等,但单荚粒数最高(通常在10-14粒之间),显示出更高的繁殖效率。
- •
总生物量与籽粒产量:木豆品种产生的总生物量最高,但其籽粒产量表现不一。绿豆品种在大多数年份都表现出了最高且最稳定的籽粒产量,尤其是在2015年。芸豆产量年际变幅大,在2017年表现优异,但在其他年份产量较低。2023年首次评估的豇豆品种也显示了较高的产量潜力。
- •
干旱指数分析:计算的DII和DSI指数进一步量化了品种的抗旱性。总体而言,绿豆品种在干旱年份(如2014年和2023年)表现出较低的DII和DSI值,意味着其产量受干旱和热胁迫的影响相对较小,显示出更强的抗旱性和水分利用效率。相比之下,芸豆和部分木豆品种的指数值更高,表明它们对水分胁迫更为敏感。
3.3. 栽培品种和年份间的平均籽粒产量
平均籽粒产量在不同年份间差异巨大,2014年最低(93.5 kg ha-1),2023年最高(6279.9 kg ha-1)。跨年份的平均数据显示,绿豆品种(如中国绿豆和萨廷斯绿豆)的生产力和稳定性最佳;而木豆品种虽在特定年份(如2023年)产量很高,但年际波动较大。
3.4. 农艺和环境变量的相关性分析
相关性分析表明,籽粒产量与大多数单一变量的相关性较弱,仅与生物量、每米植株数和每米粒数呈微弱的正相关。值得注意的是,生长度日(GDD)与热胁迫指数(HSI)之间存在强共线性(r = 0.88),说明热量累积与高温胁迫密切相关。此外,单株荚数与生物量、每米荚数呈中度正相关,表明生殖器官的发育对最终产量构成有重要贡献。
3.5. 产量决定因素的特征选择排序
特征重要性分析揭示了影响产量预测的关键变量。随机森林模型显示,热胁迫指数(HSI)、每米荚数和降水量是前三大重要预测因子。XGBoost模型则进一步强调了栽培品种(基因型)本身是预测产量的最强因子,其次是HSI和降水量。这共同印证了基因型差异、热胁迫和水分供应是决定Delmarva地区豆类产量变异的首要因素。
3.6. 不同年份籽粒产量预测的模型性能
随机森林和XGBoost模型在大多数年份都表现出了良好的预测能力。特别是在2017、2019和2023年,两个模型的预测精度(R2)都非常高(随机森林R2最高达0.98,XGBoost达0.96),预测值与观测值高度吻合。模型在2014和2015年预测性能较弱,主要归因于这些年份产量数据变异小或样本量有限。总体而言,模型能够有效捕捉基因型与环境互作对产量的复杂影响。
结论与讨论
本研究成功构建并验证了一个整合多年田间数据与人工智能的框架,用于鉴定适应Delmarva半岛多变气候条件的抗旱豆类品种。研究明确了热胁迫指数和降水量是驱动产量年际变化的主要环境因子,而基因型差异及与繁殖效率相关的农艺性状(如荚数和粒数)则决定了品种的抗旱恢复力。在评估的品种中,绿豆(如中国绿豆、萨廷斯绿豆)表现出最高的产量稳定性和最低的干旱敏感性,证实了其对水分波动环境具有优越的适应性。相比之下,木豆、豇豆和芸豆品种的产量和胁迫指数年际变异性更大。
研究所采用的随机森林和XGBoost机器学习模型,能够有效捕捉基因型、环境与管理措施之间的非线性相互作用,实现了对豆类产量的高精度预测。这一AI驱动的方法不仅能够对品种进行基于综合抗旱和耐热能力的分类,更重要的是,它将传统的田间观察提升为了具有预测能力的模型。这为育种项目提供了一种高效、低成本的高通量筛选工具,可以提前模拟不同气候情景下的品种表现,加速适合特定区域(如Delmarva)的抗逆品种选育进程。
最终,这项研究展示了一条将人工智能算法、气候数据和农学理解相结合的可行路径,以应对气候变化对农业生产的挑战。通过将数据分析转化为可用于育种和田间管理的 actionable insights(可执行见解),该框架支持农业向预测性、韧性和可持续的方向转型。随着气候变异持续威胁美国中大西洋地区乃至全球的农业生产稳定性,此类集成的、基于AI的决策支持系统,将在优化品种布局、指导灌溉与播种计划、以及实现气候智慧型农业的宏观目标中,扮演越来越关键的角色。