基于多传感器数据融合与机器学习的玉米和棉花产量估算技术研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Agriculture and Food Research》：Investigation of Machine Learning based Techniques for Crop Yield Estimation of Corn and Cotton Using Multi-sensor Data Fusion

【字体：大中小】 时间：2026年01月28日 来源：Journal of Agriculture and Food Research 6.2

编辑推荐：

　　本研究针对精准农业中作物产量估算的挑战，利用无人机多光谱相机、LiDAR、土壤水分探头和气象站等多源传感器，采集了四年期的时间序列数据。通过特征选择优化输入变量，并系统比较了前馈神经网络(FNN)、长短期记忆网络(LSTM)和随机森林(RF)三种机器学习模型的表现。结果表明，LSTM模型在跨年度和跨田块的验证中表现最优，其平均绝对百分比误差(MAPE)可低至9-21%，为作物产量精准预测提供了有效技术方案。

在全球粮食安全挑战日益严峻的背景下，精准农业成为提升农业生产效率的关键。作物产量估算作为农业管理的核心环节，直接影响着农民的决策制定、资源优化配置以及市场供应平衡。传统的产量估算方法主要依赖田间调查和统计模型，存在耗时耗力、准确性有限等不足。特别是对于玉米和棉花这两种在密西西比地区具有重要经济价值的作物，开发高效、准确的产量预测技术显得尤为迫切。

尽管机器学习技术为作物产量估算带来了新的机遇，但现有研究仍存在明显局限。大多数研究往往局限于单一年份或较短时间窗口的数据，难以捕捉作物生长的年际变异；在特征选择上，多依赖于经验性的植被指数，未能充分利用作物形态结构的动态变化信息；此外，现有方法通常针对单一作物，缺乏跨作物、跨田块的泛化能力验证。。

为了突破这些瓶颈，密西西比州立大学的研究团队在《Journal of Agriculture and Food Research》上发表了题为"Investigation of Machine Learning based Techniques for Crop Yield Estimation of Corn and Cotton Using Multi-sensor Data Fusion"的研究论文。该研究通过整合无人机多光谱影像、LiDAR点云、土壤水分温度和气象站数据，构建了一个全面的多传感器数据集，覆盖200-2023四个生长季的玉米和棉花田块。

研究团队采用了一套系统的技术方法体系：利用搭载多光谱相机和LiDAR传感器的无人机平台进行周期性数据采集，结合田间土壤水分探头和气象站获取环境参数；通过递归分组特征选择方法从34个潜在特征中筛选出11个关键特征；采用前馈神经网络(FNN)、长短期记忆网络(LSTM)和随机森林(RF)三种机器学习模型进行产量预测，并通过网格搜索优化超参数；使用田间验证和年度交叉验证两种策略评估模型性能，以均方根误差(RMSE)、平均绝对误差(MAE)及其相对百分比指标(RRMSE和MAPE)作为评价标准。

材料与方法

研究在密西西比州立大学R.R. Foil植物科学研究中心进行，涉及2.31公顷的试验田，采用裂区设计种植玉米(杂交种DKC66-18)和棉花(品种PHY400W3FE)。数据采集包括：每周获取的多光谱影像(五个波段：蓝、绿、红、红边、近红外)和LiDAR点云数据(32光束，点密度约350点/平方米)；田间分布的土壤水分温度探头(每3小时记录)；附近气象站的环境参数(温度、湿度、降水等)。所有特征按周和田块进行平均处理，最终形成235个地面真实产量记录。

特征选择

通过递归分组包装方法从四个特征类别(多光谱植被指数、LiDAR冠层特征、土壤参数、气象因子)中筛选出11个关键特征。研究发现，玉米和棉花的最佳特征组合存在差异，反映了两种作物不同的生理特性。玉米的关键生长期为种植后第5-14周，棉花为第4.3-14.3周，这一定时窗口的确定为特征选择提供了重要依据。

机器学习模型

三种模型均采用简化架构以避免过拟合。FNN最优结构为2-3个隐藏层；LSTM采用2层结构，包含24和13个神经元(棉花)或24和5个神经元(玉米)；RF模型使用180-200棵决策树。复杂度分析表明，相对简单的模型配置反而能获得更优性能。

结果

在年度交叉验证中，LSTM模型在大多数情况下表现最佳，特别是在2020年棉花产量预测中，RRMSE和MAPE分别达到12.29%和9.89%。田间验证结果显示，所有模型对两种作物的预测精度相当(平均准确率80-85%)，但2021年由于干旱气候影响，所有模型的预测误差显著增加。LSTM模型在捕捉时间序列依赖性方面展现出优势，其MAPE误差范围在9-21%之间。

讨论

研究表明，通过系统的特征选择和模型优化，即使基于有限的地面真实数据，也能实现较高的产量预测精度。LiDAR衍生的冠层形态特征与多光谱植被指数、环境参数的结合，为产量预测提供了互补信息。研究还发现，作物特异性特征选择至关重要，因为玉米和棉花的不同生长特性需要不同的关键预测因子。

该研究的创新性在于首次将LiDAR衍生的作物形态动态与多光谱、环境特征相结合，建立了适用于两种作物的通用机器学习框架。研究提出的处理流程为精准农业中的产量预测提供了可扩展的方案，支持农民在可变环境条件下做出更明智的决策。未来通过增加地面真实数据采样密度、结合农艺管理因素，有望进一步提升模型的实用性和准确性。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号