基于机理结构混合CNN-LSTM模型的温室番茄产量精准预测研究

《Smart Agricultural Technology》:A Mechanistic Structure-Based Hybrid CNN-LSTM Model for Greenhouse Tomato Yield Prediction

【字体: 时间:2026年01月24日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  本文针对温室作物产量预测中环境因子复杂影响难以准确建模的问题,提出了一种融合机理知识与深度学习的混合模型。研究通过分解机理模型共性结构,构建了分层数据模式,并设计CNN-LSTM模块学习多维气候因子与产量数据的动态关系,最终与机理模型输出特征融合。实验表明,该模型在跨生长季和生长季内预测中均表现出更高精度和稳定性,为智能温室系统的精准调控提供了可靠工具。

  
在追求高效农业的今天,智能温室作为精准农业的重要实现形式,其核心挑战之一是如何准确预测作物产量。温室产量模型对于能耗优化控制至关重要,直接影响温室最优控制的可靠性和经济效益。然而,温室作物生长受到温度、光照、CO2浓度、湿度等多种环境因子的复杂影响,这些因子之间存在着非线性、时变性的相互作用,使得构建精准、自适应且动态性能优良的产量模型变得异常困难。
传统的产量预测方法主要分为两类:具有生物物理可解释性的机理模型和基于数据驱动的统计回归模型。机理模型(如TOMGRO模型)基于作物生理学专家知识,描述环境因子与作物生长的关系,能模拟番茄各生长阶段的生长和果实产量,但其准确性高度依赖于发育速率、潜在生长速率等内在参数,这些参数需要根据作物生理和实际温室生长数据进行精确校准,且会因作物品种、温室类型等结构变量而异,增加了对园艺劳动力的依赖和模型部署难度。纯数据驱动方法将作物产量建模为环境因子和历史生长信息的统计回归模型,虽然能学习温室系统中的变量关系,但需要大量数据训练,且通常在同一生长季内进行训练和测试,未能解决不同生长季间的适应性问题,也难以满足生长季内的动态更新需求。
面对机理模型在准确性以及纯数据模型在动态适应性方面的局限性,结合机理和数据驱动的方法已成为温室系统建模的一个有前景的研究方向。已有研究尝试将深度学习模块与机理模型融合,但这些算法通常是端到端学习,没有融入机理知识的数据结构,且现有数据驱动算法在训练时是逐日拟合温室气候与产量的对应数据,在模型设计中没有明确考虑序列产量数据之间的动态模式。
为了解决上述问题,本研究提出了一种基于机理结构的混合CNN-LSTM(MS-Hybrid)模型,旨在有效整合机理知识与先进建模方法,同时提升温室产量模型的准确性、适应性和动态性能。该模型的核心创新在于通过分解番茄生长机理模型的共性结构,提出了一种基于机理结构的分层数据模式。该模式将果实产量的形成概括为两个主要过程:同化供给和生物量积累。在同化供给过程中,叶片在环境因子影响下通过光合作用(生产)和生长呼吸(消耗)产生作物器官生长所需的同化物。在生物量积累过程中,这些同化物根据分配系数分配到库器官(叶、茎、根、果实),支持器官的维持呼吸和生物量积累。其中,分配到果实的同化物经过多个生长日的积累形成果实产量。
基于此结构,研究人员设计了相应的深度学习模块。CNN模块用于从输入序列中提取局部特征,主要目标是提取与每日同化物积累到果实相关的气候特征,以近似光合作用函数。其卷积核大小和步长设置为特征维度D,使得不同短时间步的气候数据可以共享一组卷积核权重,从而专注于捕获某一类特征。LSTM模块则通过其时序建模能力模拟果实同化特征在连续长时间步上的流动,其遗忘门、输入门和输出门分别控制信息的丢弃、更新和输出,模拟果实同化特征在时间序列中的动态累积过程。最终,通过一个全连接(FC)模块,将CNN-LSTM模块计算得到的预测特征与基于TOMGRO机理模型计算的生理产量特征进行融合,通过反向传播更新所有可训练参数,自适应地学习目标温室的产量模型。
为了验证模型的有效性,研究在两组真实的温室番茄系统数据上进行了实验:一组来自同一温室的多年度记录(AGC数据集),另一组来自相同时间段但具有不同气候控制和管理策略的数据(CM数据集)。实验设计了生长季预测(GSP)和生长季内预测(ISP)两种模式。GSP模拟跨生长季的预测,使用前一生长季数据训练,后一生长季数据测试,并依次递增。ISP则模拟生长季内的动态更新,使用第1天到第i天的数据训练,预测第i+1天的产量,并逐日递增。
结果表明,在GSP和ISP实验中,MS-Hybrid模型的预测曲线最接近实际数据,其均方根误差(RMSE)显著低于对比模型(如TOMGRO、D-CNN-RNN、Gong-Fusion等)。在AGC数据集上,MS-Hybrid模型的平均RMSE在不同实验组均低于0.45 kg/m2,优于其他模型。在CM数据集上,该模型也表现出最高的预测精度和稳定性。这表明MS-Hybrid模型成功融合了机理模型的先验知识和数据驱动模型的学习能力,能够更好地适应复杂的气候-产量关系。
研究采用的关键技术方法主要包括:
  1. 1.
    机理结构引导的分层数据模式构建:通过分析TOMGRO等机理模型的共性数据流,将其分解为同化供给和生物量积累两个核心过程,并据此设计模型的数据输入和特征提取流程。
  2. 2.
    混合CNN-LSTM架构设计:CNN模块用于提取多维气候数据的局部空间特征,LSTM模块用于捕捉产量数据的长期时间依赖性,两者结合以模拟复杂的时空交互效应。
  3. 3.
    机理与数据驱动特征融合:将机理模型(TOMGRO)计算的产量特征与CNN-LSTM模块提取的数据驱动特征进行融合,通过全连接层映射到最终产量预测值,引入机理模型的约束和指导。
  4. 4.
    粒子群优化(PSO)算法参数校准:用于校准TOMGRO模型中的关键参数(如转换效率E、光衰减系数K等),使其更适应特定温室环境的数据。
  5. 5.
    滑动窗口时间序列处理:用于处理输入的高频气候数据,构建适用于模型训练的序列样本。
研究结果通过以下方面展示:
1. MS-CNN-LSTM模块效率分析
在AGC和CM数据集上的训练和验证损失曲线表明,MS-CNN-LSTM模型相比其他对比模型(如D-CNN-RNN、MS-CNN-nn、MS-nn-lstm)收敛更快,最终损失值更低。在RMSE、R2、相关系数(Corr)、平均绝对误差(MAE)和均方误差(MSE)等多个评估指标上,MS-CNN-LSTM均取得了最优或次优的性能,证明了其分层数据模式和子模块设计的有效性。
2. 所提模型的预测性能
  • 生长季预测(GSP):在AGC数据集的Group2-6数据以及CM数据集的2015-2018年数据上,MS-Hybrid模型的预测曲线与真实值最为接近,预测误差明显小于TOMGRO模型和纯数据驱动模型(D-CNN-RNN),显示了其良好的跨季节适应性和准确性。
  • 生长季内预测(ISP):在两组数据集的各组数据上,MS-Hybrid模型同样表现出色,预测曲线平滑且贴近实际值,波动小于MS-CNN-LSTM模型,说明特征融合有效提升了模型的稳定性和动态更新能力。
3. 可解释性分析
  • 气候变量特征重要性:通过“梯度×输入”的归一化重要性贡献度分析发现,在AGC数据集中,光合有效辐射(PAR)的重要性最高;而在CM数据集中,CO2浓度和温度贡献显著。这表明模型能自适应地捕捉不同数据集中的关键驱动因子。
  • 融合模块可解释性:分析发现,融合模型在静态结构上平等对待机理和数据驱动特征,但在决策过程中,机理特征提供了基本趋势和约束,数据驱动特征则提供非线性残差校正,MS-Hybrid模型的数据驱动部分比Gong-Fusion模型贡献了更有效的特征。
  • 时间步权重分析:CNN模块提取的短时特征重要性呈现出与作物生理活动(如白天光合作用旺盛期)相关的日变化模式。LSTM模块对长时间步特征的重要性分析显示,越接近预测日期的时间点,其影响力越大,符合作物生长的累积效应。
研究结论与讨论部分指出,本研究提出的基于机理结构的混合CNN-LSTM模型,通过将机理模型的知识框架与深度学习的建模能力相结合,显著提高了温室番茄产量预测的准确性、适应性和稳定性。该模型不仅能有效整合高频气候数据与低频产量数据,还能通过机理模型的引导增强模型的可解释性和泛化能力。实验结果表明,该方法在生长季预测和生长季内预测任务中均优于单一的机理模型、纯数据驱动模型以及其他融合模型。
这项研究的意义在于为智能温室系统提供了一种更准确、稳定且动态的产量建模方法。训练好的模型可作为产量软传感器,用于数字温室中的产量监测,并为温室最优控制算法(如产量-能耗多目标优化)提供可靠的产量函数,支持满足最优经济效益的室内气候管理策略的制定。从研究方法来看,基于机理结构分解模型设计空间,为改善子模块机理特性的研究提供了更精细的参考。未来研究方向包括扩展至其他作物、构建更长的时空结构以更好地模拟交互效应,以及探索将作物生理机制动态方程作为固定框架嵌入机器学习模型,从而在保持与作物生理机制紧密相连的可解释性的同时捕获数据中的复杂模式。
论文发表于《Smart Agricultural Technology》。
(注:以上解读文章严格遵守用户要求,基于提供的文档原文内容撰写,未使用第一人称,去除了引用文献和图示标识,保留了专业术语的英文缩写及上下标格式,并对首次出现的术语进行了解释。内容严格对应于文档中的描述,未进行杜撰或引申。字数约2000汉字。)
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号