利用随机森林和粒子群优化算法优化精准农业中的作物产量预测:一种基于数据的可持续农业方法
《Sustainable Computing: Informatics and Systems》:Optimizing Crop Yield Prediction in Precision Agriculture Using Random Forest and Particle Swarm Optimization: A Data-Driven Approach to Sustainable Farming
【字体:
大
中
小
】
时间:2026年03月18日
来源:Sustainable Computing: Informatics and Systems 3.8
编辑推荐:
农业产量预测中传统模型存在泛化能力差和超参数调优效率低的问题,本研究提出随机森林与粒子群优化结合的RF-PSO模型,有效解决上述挑战。实验表明RF-PSO在真实农业数据集上的RMSE=0.20,MAE=0.18,R2=0.98,MAPE=3.20%,显著优于SVM、MLP和CNN-RNN等基准模型,为精准农业提供可解释、高效且可扩展的解决方案。
陈瑾
黄山大学经济与管理学院,中国黄山245021
摘要
在考虑气候变率和人口压力的情况下,作物产量预测是确保粮食安全和可持续农业的重要因素。几种回归模型,如SVM、MLP和CNN-RNN,存在泛化能力差和超参数调整不足的问题,这限制了这些模型的性能和可扩展性。为了克服这些挑战,本研究提出了一种混合模型的想法,将随机森林(Random Forest)与粒子群优化(Particle Swarm Optimization, PSO)相结合,以提高预测准确性和模型效率。该方法的独特之处在于利用PSO动态且高效地优化超参数,从而避免了耗时的网格搜索方法,并提高了收敛速度。基于作物产量预测数据集,RF-PSO模型的表现优异,其RMSE为0.20,MAE为0.18,R2为0.98,MAPE为3.20%,显著优于基线技术(如SVM的RMSE为0.37,RFXG的0.22,CNN-RNN的21.69 ± 3.10)。误差分布图、特征重要性显示和性能比较图表均证实了该模型的稳健性,降雨量、温度和土壤类型被认为是主要的预测特征。与其他现代模型不同,RF-PSO具有高泛化能力、低预测误差以及在各种农业环境中的实用价值。研究表明,RF-PSO是一种可扩展、可解释的高性能解决方案,为农学家和决策者提供了实用见解,并为通过多目标PSO、混合优化和可解释人工智能进行进一步改进铺平了道路。
引言
农业仍然是全球粮食安全和经济增长的主要贡献者,尤其是在人口密度较高的地区(Maraveas等人,2022年)。然而,传统的农业生产方法已无法满足与人口增长、气候变化和资源短缺相关的粮食需求[21]。精准农业是一场利用基于数据的技术的革命,依靠传感器、遥感卫星图像和机器学习来减少投入,同时提高产量并减少对环境的影响[7]。
精准农业的一个重要方面是作物产量预测;这有助于更好地规划灌溉、施肥、种植时间和土地使用(Peng等人,2023年)。虽然精确的作物产量评估对于田间作业和从风险缓解及政策角度预测粮食供应至关重要,但通过决策优化产量也非常重要[17]。应用于随机森林(RF)分析的机器学习显示出模拟农艺、气候和环境因素相互作用以影响作物产量的复杂模式的潜力(V. G. Nguyen等人,2024年)。然而,这些模型预测能力不理想的一个重要因素是超参数调整,这导致决策具有主观性。超参数调整是一项艰巨的任务,许多主观完成的决策可能不够理想[20]。
为了解决这个问题,基于鸟类和鱼类群体行为的元启发式算法PSO已被广泛用于多种优化问题,并在调整机器学习模型方面显示出潜力(H. D. Nguyen等人,2023年)。将PSO与RF结合可能会创建一个更有效和准确的作物产量预测框架,促进更高效的农业实践,并为可持续农业做出贡献。
尽管农业建模取得了进展,但仍存在一些挑战:
- •
影响作物生长的主要非线性及相互依赖因素包括土壤成分、温度、湿度、降雨量和施肥时间。经典模型往往无法捕捉到这些复杂的相互作用(Han等人,2024年)。
- •
农业数据集容易遇到缺失值、不同数据集的格式差异以及地区间的变异性等问题,导致预测模型失去泛化能力(Han等人,2024年)。
- •
要实现更高精度的产量预测,需要彻底的超参数调整,但这既昂贵又对模型参数非常敏感[4]。
- •
人们越来越需要能够在多样化条件下良好泛化的模型,并且这些模型能够被最终用户(如农民和农学家)理解[8]。
本研究旨在通过以下贡献弥合机器学习模型性能与实际农业需求之间的差距:
- •
开发了一个优化的作物产量预测框架,将RF与PSO相结合,以提高预测准确性和稳健性。
- •
完成了数据预处理流程,解决了缺失值、特征选择和标准化问题,确保了用于建模的干净、可用输入。
- •
使用真实农业数据集对RF-PSO模型与基线模型(例如,独立的RF、SVM或线性回归)进行了验证和比较分析。
- •
利用集成学习的见解分析特征重要性和模型可解释性,以识别影响作物产量的关键因素,支持明智的农业决策。
本文的其余部分结构如下:
- •
第2节:文献综述
- •
第3节:问题陈述
- •
第4节:方法
- •
第5节:发现与讨论
- •
第6节:结论与未来项目
相关研究
相关研究
Linaza等人(2021年)在欧洲多个农业领域和不同类型的农业条件下创建并验证了基于AI的决策支持系统[19]。所开发的方法旨在减少作物投入,以优化产量和环境影响[16]。结果显示资源利用效率提高,并报告了资源减少的情况,包括温室气体排放和用水量的降低[9]。未来的工作将探讨进一步的发展方向
问题陈述
- •
许多模型在受控或历史数据情况下显示出有希望的结果(Linaza等人,2021年;Huang等人,2023年),但大多数模型无法利用来自自主系统的实时数据和田间发生的决策,这限制了精准农业的可扩展性。
- •
一些研究(Malashin等人,2024年;Pham等人,2022年;Chen等人,2018年)报告的模型受到数据集不足、不平衡或代表性不足的挑战
提出的方法论
本文提出了一种先进的混合方法,结合了随机森林回归(Random Forest)和粒子群优化(PSO)来进行超参数调整,以确保准确的作物产量预测。包括了一些随机森林无法直接处理的预处理步骤,并以数学形式表达,以便更好地理解。
该图展示了从数据收集和预处理到使用随机森林进行建模的整个工作流程;然后通过PSO优化模型
结果与讨论
本节展示了使用建议的随机森林模型(并通过粒子群优化进行调整)进行实验的结果。采用了几种评估指标(如RMSE、MAE、决定系数和MAPE)来评估该模型的性能。实验过程旨在全面衡量RF-PSO的预测能力
结论与未来工作
本研究揭示了RF-PSO在真实农业数据集上实现精确高效作物产量预测的能力。实验结果证明了该模型的准确性高,泛化能力强。通过调整超参数,成功实现了模型的优化
伦理批准
本研究未涉及人类参与者或动物,因此不需要伦理批准。
资金声明
本研究未获得公共、商业或非营利部门的任何特定资助。
利益冲突
作者声明与本文的发表无关任何利益冲突。
参与同意
不适用。
出版同意
不适用。
未引用的参考文献
[10]
利益冲突声明
作者声明与本文的发表无关任何利益冲突。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号