通过STL-LSTM深度学习和植物-土壤双阈值传感技术,实现温室番茄的主动灌溉时间决策 周伟 李正林 董源德 李龙杰 刘硕

《Sensors》:Proactive Irrigation Timing Decision-Making for Greenhouse Tomatoes via STL-LSTM Deep Learning and Plant–Soil Dual-Threshold Sensing Wei Zhou, Zhenglin Li, Yuande Dong, Longjie Li and Shuo Liu

【字体: 时间:2026年05月10日 来源:Sensors 3.5

编辑推荐:

  亮点 本研究首先建立了基于最大日收缩率(MDS > 70 μm)和土壤体积含水量(VWC ≤ 17%)的双阈值灌溉触发机制,确定了番茄缺水的关键生理边界。在此基础上,开发了一种混合STL-LSTM模型,实现了对茎直径的高精度24小时预测(R2 = 0.9184)。这种综合方法将被

  亮点
本研究首先建立了基于最大日收缩率(MDS > 70 μm)和土壤体积含水量(VWC ≤ 17%)的双阈值灌溉触发机制,确定了番茄缺水的关键生理边界。在此基础上,开发了一种混合STL-LSTM模型,实现了对茎直径的高精度24小时预测(R2 = 0.9184)。这种综合方法将被动土壤湿度监测转变为以植物为中心的主动精确灌溉管理,为优化干旱地区温室农业的用水效率并确保作物健康提供了可扩展的技术解决方案。

主要发现是什么?
建立了一个稳健的双阈值灌溉触发机制,确定最大日收缩率(MDS)超过70 μm且土壤湿度低于17%表示存在严重的水分胁迫。
混合STL-LSTM模型通过有效分解非平稳生理信号为季节性和趋势性成分,实现了对番茄茎直径的高精度(R2 = 0.9184)24小时预测。

主要发现的意义是什么?
将基于植物的生理传感器与深度学习相结合,实现了从传统的被动土壤湿度监测向以植物为中心的主动精确灌溉管理的转变。
所提出的框架为优化干旱地区温室农业的用水效率并确保作物健康提供了可扩展的技术解决方案,减少了经验性调度错误的风险。

摘要
目前,新疆太阳能温室中番茄的灌溉管理主要依赖于经验性手动经验和单一的土壤湿度指标,这往往导致灌溉计划缺乏针对作物的生理依据,从而影响用水效率。为了解决这些问题,本研究为干旱地区的温室番茄开发了一种智能的、以植物为中心的灌溉决策框架。该框架的核心是精确识别灌溉时机——这是实现按需灌溉的最关键第一步和基本前提。通过监测茎直径(SD)的高频动态并整合土壤湿度数据,系统地分析了番茄对水分胁迫的生理响应。构建了一种混合预测模型STL-LSTM,该模型结合了使用Loess(STL)的季节-趋势分解和长短期记忆(LSTM)网络来预测24小时内的茎直径趋势。此外,建立了一种创新的双阈值灌溉机制,利用生理触发因素(最大日收缩率,MDS > 70 μm)和土壤湿度约束(体积含水量,VWC ≤ 17%)。结果表明,番茄的茎直径具有明显的昼夜节律,MDS和每日增量(DI)被确定为植物水分状况的敏感指标。所提出的STL-LSTM模型在果实成熟高峰期表现出 superior 的预测性能,决定系数(R2)为0.9184,分别比单独使用LSTM和ARIMA模型提高了14.8%和27.56%。双阈值机制的验证证实了其能够平衡实时作物水分需求与节约要求,有效降低了传统方法中常见的过早或延迟灌溉的风险。这项研究为干旱地区温室农业向精确灌溉和优化水资源管理转型提供了科学依据和技术支持。

1. 引言
番茄是中国保护性栽培蔬菜中的主要品种之一,具有易于栽培、市场需求大和高经济效益的特点。其种植面积和产量在全国保护性农业中处于领先地位[1,2]。灌溉作为调节温室番茄生长的核心因素,通过科学精确性对发展产生了显著影响。果实形成期和果实成熟高峰期所需的水分占整个生长期的60-70%。这一阶段的水分不足会导致果实结实率降低15-20%,单果重量减少10-15%,可溶性糖含量降低8-12%[3]。然而,在北方太阳能温室广泛采用的垄式塑料覆盖滴灌模式下,当前的灌溉制度尚未建立与作物水分需求模式完全匹配的水分调节策略。因此,基于这一模型中的精确水分需求阈值进行番茄灌溉决策研究对于优化水资源管理、保障产量和质量以及提高水资源利用效率具有重要意义。

近年来,国内外在精确灌溉领域的研究主要集中在以下几个方面:基于土壤湿度的灌溉制度[4,5],这些方法主要利用多个传感器和参数建模技术来预测土壤湿度。通过比较不同生长阶段的土壤含水量并将物联网应用整合到农业中,这些方法旨在减少水分消耗并提高产量。然而,它们的缺点在于忽略了环境因素与灌溉之间的关系。相反,植物的生理变化反映了植物自身组织内的水分状况,而不是土壤湿度含量[6],因此无法准确反映作物的内在水分状况。采用作物灌溉模型的模拟研究[7,8,9]基于多年数据模拟固定时间段内的作物灌溉量。这些方法的缺点包括计算相对复杂、适用范围有限以及缺乏时效性[10]。

有许多方法可用于监测和诊断作物水分状况。从植物生理学的角度来看,植物器官(如茎、叶和果实)体积的短期动态变化与其内部水分状况密切相关。当根部吸收足够的水分时,茎会膨胀;当水分不足时,茎会收缩。这种现象使得可以利用茎直径的微小变化指标来诊断作物水分不足并指导灌溉[11,12]。系统研究通过茎直径变化监测作物水分状况始于20世纪60年代。早期研究发现,茎直径收缩和膨胀的程度与植物的内部水分状况之间存在强相关性,这一现象在棉花、大豆、卷心菜、番茄和果树等多种作物中都有观察到[13,14]。提出了适合自动灌溉控制的茎直径指标,包括最大日收缩率(MDS)、最大/最小日增量(DI)以及24小时周期内恢复最大日茎直径所需的时间(RT)[15,16]。茎直径变化方法的特点是简单、无损且能够进行连续自动监测。因此,它引起了大量研究关注,并越来越多地应用于监测和诊断作物水分状况[17,18]。Blanco等人[19]提出将最大日收缩率(MDS)作为作物水分状况的诊断指标和灌溉指导依据,在植物茎的MDS达到预设阈值时开始灌溉。Zhang Jiyang等人[20,21]观察到茎直径变化能有效反映棉花的水分状况。然而,茎直径变化受环境因素和作物生长特征的影响,因此在不同的生长阶段需要不同的指标。Wang Xiaosen等人[22]研究了温室番茄中茎直径变化的机制和模式、环境因素对茎直径变化的影响以及减轻气象干扰对MDS测量值影响的方法。Li Hui等人[23]研究了夏季玉米中茎直径的变化模式,观察到随着土壤含水量的减少,每日最大茎直径减小,两者之间存在线性相关。基于这种关系,可以利用茎直径的细微变化来诊断作物水分不足。

近年来,开发了许多建模方法来预测茎直径变化(SDV)。早期研究主要依赖于多元线性回归将环境因素与SDV联系起来,但这些模型往往难以捕捉复杂条件下的非线性生理反应[24](Wu等人,2021年)。随着机器学习的出现,随机森林(RF)和多层感知器(MLP)等算法被应用于提高预测准确性[25](Johansen等人,2020年);然而,这些方法经常忽略了植物生长的时间依赖性和顺序逻辑。为了解决这个问题,长短期记忆(LSTM)[26](An等人,2022年)和门控循环单元(GRU)[27](Li等人,2023年)等深度学习架构显示出了潜力,实现了0.87到0.90之间的R2值。

尽管现有研究已充分证明茎直径的变化是作物水分不足的有效诊断指标,大多数研究集中在分析其诊断可行性和影响因素上,但直接将其应用于指导精确灌溉决策的研究仍然相对较少。本研究重点关注太阳能温室番茄生产中精确灌溉的需求。以果实成熟高峰期的番茄植株为实验对象,我们监测了在梯度水分胁迫下最大日茎收缩率(MDS)的动态响应。虽然MDS对植物水分状况非常敏感,但其实际应用常常受到大气噪声的干扰;高蒸发需求即使在土壤湿度不受限制的情况下也会触发显著的茎收缩,导致传统单一指标系统中出现过早或“假阳性”的灌溉触发。为了解决这些限制,我们开发了一个茎直径预测模型,并提出了“植物-土壤双阈值传感”框架。与传统方法不同,该框架采用“双重保险”逻辑:它利用预测的MDS作为主要的生物触发因素来感知植物的即时水分需求,然后通过土壤体积含水量(VWC)的物理约束进行交叉验证。只有当生理和土壤阈值同时满足时,才会启动灌溉。这种协同感知方法有效地过滤掉了由大气引起的瞬态波动,克服了单一指标监测的固有盲点,为精确灌溉提供了坚实的基础。

2. 材料与方法
2.1. 实验温室和测试品种简介
试验在新疆农业大学的三坪教学实践基地(北纬43.92°,东经87.35°)进行,时间分别为2024年9月1日至2024年12月20日和2025年3月20日至2025年7月20日。试验用的太阳能温室呈南北方向,东西长度为44米,跨度为8米。温室的垄高为2.6米,后墙高度为1.9米,前墙高度为0.6米,没有后坡。前屋顶表面使用了PO塑料薄膜,并外部覆盖了隔热毯。实验温室结构如图1所示。
图1. 试验温室的横截面。
实验使用的品种是无定型番茄品种“Provence”(Solanum lycopersicum L.)。共设置了两个生长周期:第一个周期从2024年9月1日开始,在太阳能温室中进行北-南方向的垄栽培并使用塑料覆盖。植株间距为37厘米×30厘米,重点是在实际生产条件下获取生理和环境特征数据;第二个种植周期于2025年3月20日采用盆栽方式,目的是精确校准生理响应阈值。番茄种植在直径28厘米、高度30厘米的塑料盆中,每盆填充10公斤风干土壤(通过2毫米筛子筛选,初始含水量为3.8%),深度为21厘米。通过高频称重实现了对盆土重量变化的实时监测,从而能够精确控制水分梯度。
灌溉处理基于田间持水量(FC),即土壤在排掉多余重力水后的最大持水量。实验使用的土壤为沙质壤土。实验前,使用标准切割环方法(体积100立方厘米,n = 5个样本)确定了FC。将未受干扰的土壤芯样本浸泡在水中24小时,然后放在沙床上自由排水48小时直至重量稳定。随后在105°C下烘干以确定干土质量和容重。为了保持土壤物理性质与实验条件的一致性,盆栽使用来自同一来源的筛选土壤,并分层填充以匹配预定的田间容重。测得的FC为26.0%(体积含水量,单位:立方厘米/立方厘米),作为计算灌溉阈值的基准。

2.2. 实验设计与水分梯度控制
在第一个作物试验中,水分管理参考了当地传统的灌溉制度。土壤湿度传感器实时监测0-20厘米土层中的体积含水量,为STL-LSTM模型在实际生产规模上提供训练和验证数据集。
在第二个作物试验中,建立了以下水分处理措施以精确校准番茄的生理响应阈值:
恒定梯度:设置了三种处理方式:T1(对照,80-100% FC)、T2(轻度胁迫,60-80% FC)和T3(中度胁迫,40-60% FC)。每天在08:00和20:00使用电子称重方法补充水分,以保持土壤湿度在目标范围内。逐步干旱(PD)处理:选择生长均匀的植物,在果实成熟高峰期停止所有灌溉,直到达到永久萎蔫点。这种处理方法可以产生从完全水合到严重干旱胁迫条件下的连续生理响应曲线。每个处理组包含三个重复实验(每个重复实验五株植物)。利用PD组的连续监测数据,结合T1-T3阶段的稳态表现,确定了最大日茎部收缩(MDS)出现非线性变化的临界点,作为早期预警的生理阈值。MDS作为植物水分亏缺的高灵敏度“早期预警”信号,反映了当蒸腾作用超过根部吸水能力时茎部储水组织(如韧皮部和形成层)的动态脱水情况。与代表供水量的土壤湿度不同,MDS代表了植物的实际水分需求。我们利用MDS来识别“临界转变”点——即植物从奢侈生长状态转变为水分受限生长状态的点。这比单独使用土壤湿度提供了一个更符合生物学意义的灌溉触发因素,因为它直接反映了植物的内部水分状态。

为了全面理解实验设计和数据分析,整个研究框架在图2中进行了说明。本研究结合了田间规模的试验(试验1)来开发STL-LSTM土壤湿度预测模型,以及盆栽规模的对照试验(试验2)来识别番茄的生理响应阈值。这两个组成部分的协同作用使得精准灌溉早期预警成为可能。图2. 组别实验路线图。

2.3. 传感器集成与数据采集
实验数据采集平台使用了武汉新HP科技有限公司(中国武汉)生产的PH自动气象站、江苏精创公司(中国徐州)生产的空气温度和湿度计,以及浙江Top Cloud Agricultural Formula公司(中国杭州)生产的气象仪器。收集的参数包括室外温度、室外湿度、室外光照强度、室外风速、室内二氧化碳浓度、室内温度、室内湿度、室内光照强度和番茄茎径。使用高精度土壤湿度传感器(NL-GPRS-I,武汉新HP)持续监测土壤体积含水量(VWC)。在每个处理组中,三个传感器水平安装在根区中心15厘米深处,以确保对水分动态的代表性跟踪。这些基于时域反射法(TDR)技术的传感器具有±1%的测量精度。所有传感器都根据FC测定过程中获得的称重数据进行了交叉校准,以确保所有含水量数据系列的客观性和可比性。自动温室环境监控系统的结构如图3所示,番茄茎径监测情况如图4所示。具体参数详见表1。图3. 环境数据采集系统示意图。注意:示意图中的非英文文字和传感器及设备照片上的部分不清楚细节仅属于商业品牌信息,与整体系统结构和实验原理的科学理解无关。

在整个作物试验过程中,使用高精度线性位移传感器(型号:DD-S1,制造商:ECOMATIK GmbH,德国达豪)连续无损监测番茄茎径的变化。传感器安装在代表性植物主茎中段(大约离地面10-20厘米处),使用定制的不锈钢支架固定。这确保了传感器探针与茎表面保持垂直且紧密接触,同时防止了对植物组织的机械损伤。为了确保实验的可重复性,每个处理组在每次试验中部署了三个茎径传感器和三个土壤湿度传感器(每个重复实验的三株植物各一个传感器)。两个季节的监测数据均由数据记录仪(型号:DL-18)自动记录,设置为每30分钟采样并存储一次数据,从而捕捉到茎径的每日动态变化。

2.4. 数据处理与特征提取
本研究在番茄果实形成期间持续以30分钟的采样频率收集环境和生理数据。为了提高预测模型的输入数据稳健性,通过计算每个时间步的算术平均值来汇总每个处理组中三个传感器的原始测量数据。这种汇总策略用于生成每个处理组的代表性生理信号,并减少单个植物生长变异(噪声)的影响。汇总后,共积累了2928个时间序列数据集。每个数据集包含12个特征维度(包括环境参数和汇总的生理指标)。为处理原始传感器序列中的噪声和异常波动,数据清洗和标准化过程如下:
(1) 异常值处理和缺失值填补:使用箱线图识别并移除异常值。为了避免虚假的长距离插值,采用了分层策略进行缺失值恢复:稀疏的缺失点用均值插值或线性插值填补;对于较大的缺失区间,则选择具有相似气象条件(如光照强度、温度、湿度)的邻近时期的类似历史数据进行类似填补。
(2) 维度标准化:为了消除环境因素之间的数量级差异并提高模型收敛速度,输入环境因素经过标准化处理,数据被映射到0-1范围内。对于输入变量X1、X2、X3…XN,标准化公式如下:
在这个研究中,提取了茎径变化指标进行分析,每日最大值(MXSD)和每日最小值(MNSD)分别表示一天内记录的最高和最低茎径。每日最大收缩量(MDS)表示每日最大值和最小值之间的差异。每日增量(DI)计算为当前日的MXSD与前一天MXSD之间的差异。RT表示当天恢复所需的时间[28,29,30]。如图5所示,这表示茎径在24小时内随着生长而恢复的情况,以及未完全恢复的情况,RT是在24小时周期内计算的。

2.5. 基于植物传感的番茄水分胁迫阈值校准协议
通过比较完全灌溉(T1)和逐渐干旱胁迫(PD)处理下植物的生理反应,确定了番茄水分胁迫的阈值。为了确保结果适用于生产环境,校准试验是在生产温室中直接放置盆栽番茄进行的,从而匹配真实系统的大气蒸发需求(如VPD和辐射)。使用安装在茎上的DD-S1传感器获得连续的茎径变化曲线,提取最大日收缩量(MDS)、每日增量(DI)和恢复时间(RT)作为核心评估指标。校准过程基于完全灌溉组(T1)与逐渐干燥组(PD)之间的比较试验。使用盆栽栽培方式可以比开放土壤系统更精确、更均匀地控制土壤水分消耗,这对于准确捕捉生理“临界点”至关重要。使用高精度位移传感器获得连续的茎径变化信号,作物生长恢复能力作为确定水分状态的关键指标。

临界阈值的确定基于“零生长”生理框架,该框架区分了不可逆的结构膨胀和可逆的水相关波动[31](Zweifel, 2016)。根据这一概念,当夜间膨压超过特定阈值时,茎生长才会发生,使得茎径超过其之前的最大值。为了确保阈值的客观性,采用了系统化的定量协议而不是经验观察。对于PD组中的每个重复实验,确定植物未能在夜间恢复到前一天的最大茎径水平(RT = 24小时)并且表现出非正的每日增量(DI ≤ 0)的具体日期作为生理临界点。然后提取该生长停滞日对应的日循环中的具体MDS值。最终通过计算所有重复实验中这些个体MDS值的算术平均值得出早期预警的临界阈值。这种状态表明夜间补水不足,无法克服白天的水分亏缺并产生足够的膨压来驱动细胞扩展[32]。虽然根体积和土壤水分动态在不同盆栽和大型温室系统中可能会有所不同,但作为生理代理的MDS阈值反映了植物对水分不平衡的整合响应,使其成为预测不同生长尺度下水分亏缺时间的稳健且可转移的指标。从该校准协议中得出的临界MDS阈值是更广泛的“植物-土壤双重阈值传感”框架中的主要生物触发因素。为了弥合植物生理信号与实际土壤管理之间的差距,同时记录了与该生理临界点对应的土壤体积含水量(VWC)作为物理阈值。这种整合确保了校准后的MDS信号不是孤立作用的;相反,它启动了一个“双重保险”传感逻辑,只有当生物需求(MDS)与物理土壤水分消耗(VWC)相互验证时才触发灌溉。

3. 模型构建与实施
本研究提出了一个结合STL(使用Loess的季节性趋势分解)分解与多特征长短期记忆(LSTM)网络的混合预测框架。通过分解茎径序列的复杂动态特性,该方法分别建模趋势、季节性和残差成分,以捕捉作物生长的长期演变模式和短期非线性波动。为了确保模型能够捕捉茎动态对环境波动的生理响应,选择了四个外部变量作为输入特征:空气温度(T)、相对湿度(H)、光照强度(L)和土壤湿度(SM)。在模型训练之前,进行了相关性分析,以量化这些参数对茎径变化的影响程度(见图6)。皮尔逊相关性分析(图7)显示所有选定的环境因素都对MDS有显著影响(p < 0.05)。具体来说,空气温度(T)、相对湿度(H)和光照强度(L)与MDS有强相关性(∣r∣ > 0.79),表明它们是日间茎动态的主要驱动力。值得注意的是,T和H之间的相关性是中等的(r = ?0.79),避免了高多重共线的问题。此外,土壤湿度(SM)与MDS有显著的中等负相关性(r = ?0.48,p = 0.031),表明根际的水分可用性为植物的水分恢复提供了关键基准,不同于即时的大气需求。这些复杂、部分解耦的关系证明了使用先进的机器学习算法来捕捉简单线性模型可能忽视的非线性交互作用的必要性。

3.1. 基于STL的时间序列分解
为了减轻原始序列中的非平稳干扰,采用STL算法将茎径序列Yt分解为三个加性成分:
这里,Tt表示趋势项(Trend),代表作物的长期生长率;St表示季节项(Seasonal),捕捉由昼夜节律驱动的周期性波动;Rt表示剩余项(Remainder),反映了受环境波动或生理调节影响的高频随机干扰。根据数据采样频率(每测量30分钟),季节周期参数设置为48,以匹配24小时的生理周期。趋势平滑窗口设置为336(相当于七个完整周期),以确保趋势平滑性同时防止季节信息的泄漏。分解结果如图8所示。图8. 茎径时间序列的STL分解结果。

3.2. 权重预测策略与模型构建
针对不同组分的不同数学特性,本研究采用了差异化的预测策略。趋势和季节性成分的确定性预测

趋势成分预测:鉴于趋势成分在短期内的高度连续性,采用二阶多项式拟合外推方法。利用前七天的历史趋势数据构建回归模型,以捕捉增长率的微小变化。

季节性成分预测:鉴于季节性成分的严格周期性重复,采用持续性方法:St+h = St+h ? 48。该方法利用前一天对应时间点的相位信息作为预测值。

3.2.2 基于多特征融合的LSTM的残差项校正
残差项Rt包含复杂的非线性动态,对提高预测准确性至关重要。本研究构建了一个多特征输入的LSTM模型来校正残差,如图9所示。图9. 异构LSTM的示意图。输入特征构建:输入特征向量X包括:① 前24个时间步长的STL三个成分;② 多维环境因素(温度、湿度、光照和有效辐射、土壤含水量);③ 经过正弦-余弦变换的周期性时间编码。

网络架构:采用两层堆叠的LSTM结构。第一层配置128个隐藏单元以提取基本的时间特征,第二层配置64个单元进行更高层次的抽象。在每一层之后应用Dropout层(-rate = 0.2)以减少过拟合。

滑动窗口配置:回顾窗口设置为24,预测范围为48,从而满足24小时提前预警的需求。

3.3 数据集划分和超参数优化
3.3.1 时间序列划分
为了捕捉对不同水分可用性的全面生理响应,STL-LSTM开发的数据集整合了初步实验和渐进性干旱(PD)实验的数据。特别是PD实验提供了从田间持水量到严重干旱的水分状态连续梯度,包括在后续验证阶段用T1、T2和T3表示的水分胁迫水平。考虑到植物生长数据的时间相关性,数据集按时间顺序划分为训练集(3月15日至6月1日)、验证集(6月2日至7月1日)和测试集(7月2日至7月30日)。验证集约占总数的20%,用于监控训练过程中的泛化误差。

3.3.2 贝叶斯超参数优化
在验证集上使用贝叶斯优化算法进行参数搜索。所有输入特征都经过了Z分数标准化。搜索空间和最终优化结果见表2。

3.4 混合预测重建和评估指标
3.4.1 结果重建
最终茎直径预测值Yt+h是通过组合各成分预测值获得的:这种策略结合了确定性成分中统计方法的稳健性和深度学习在随机残差中的非线性拟合能力。

3.4.2 性能评估指标
使用均方根误差(RMSE)、决定系数(R2)和平均绝对百分比误差(MAPE)作为评估指标:
RMSE:衡量预测值与实际值之间的偏差程度,对较大误差非常敏感。
R2:表示模型解释原始数据变异性的能力;其越接近1,拟合效果越好。
MAPE:反映了预测结果的相对误差水平,用于评估模型的稳健性。

4. 结果
4.1 番茄茎直径变化的动态和特征分析
4.1.1 典型条件下的昼夜生长节律和生理响应
图10展示了9月30日至10月1日期间番茄茎直径的每日动态变化。在此结果阶段,植物茎已经基本成熟。9月30日至10月3日期间天气晴朗,而10月4日有降雨。研究表明,番茄茎直径表现出24小时的周期性模式。收缩从上午9:30开始,直径在下午4:00至5:00之间降至最低,随后恢复性膨胀。这种模式表明,白天的蒸腾作用导致水分损失和茎收缩,而夜间根部吸水补充了白天失去的水分,使茎直径恢复。

4.1.2 晴天和阴天的比较
在番茄结果期间,分析了连续30天收集的数据,发现环境驱动力与整个时期的茎直径动态之间存在一致且显著的相关性。为了更清楚地说明我们提出的决策框架的生理基础和逻辑必要性,选择了两天具有对比天气条件的代表性数据(10月2日:晴天;10月4日:多云)作为典型案例研究。

如图11所示,选择太阳辐射作为代表性大气变量,因为它是驱动蒸散过程(ET)的主要因素。在10月2日(晴天),茎直径表现出明显的昼夜收缩和夜间恢复模式。直径在清晨(9:00–10:00)达到日常最大值,在下午(14:00–16:00)达到最低值。这种显著的收缩反映了由高太阳辐射和增强的大气蒸发需求引起的暂时性水分不平衡。在这种条件下,即使土壤湿度相对充足,由于蒸腾作用的强度,植物也可能经历细胞膨胀力的暂时降低。因此,这种生理响应代表了对大气驱动力的敏感适应,而不一定表明长期或严重的水分胁迫状态。相比之下,在10月4日(多云),每日变化明显减少,曲线较为平坦,每日最小直径更高。这两天体现了整个30天数据集中观察到的典型极端天气驱动的生理响应。

通过比较这些对比模式,图表突出了MDS对不同天气条件的敏感性,这也揭示了仅依赖MDS进行灌溉调度的固有局限性。晴天的高大气需求可能会触发“假阳性”的水分胁迫信号(异常高的MDS),而阴天的低需求可能会掩盖实际的土壤水分短缺。为了克服这些潜在的误解,我们的研究结合了土壤含水量(SWC)作为二次验证。这种双阈值方法(MDS + SWC)确保只有在植物的生理反应和根区水分可用性都确认存在真实短缺时才触发灌溉,从而为科学决策提供更准确和可靠的灌溉依据。

4.2 基于水分胁迫诱导的MDS阈值识别和量化
在渐进性干旱实验中,前一天处理组记录的最大每日茎直径收缩(MDS)被定义为作物进入水分胁迫的潜在阈值。同时,我们记录了这一点的相应土壤含水量(SWC)。通过重复多轮这种渐进性干旱实验并分析大量数据集,本研究旨在识别稳定的和具有预测性的MDS阈值及其对应的土壤含水量,这些阈值在作物持续水分胁迫发生之前。

如表3所示,对照组的番茄植株保持了高于22%的土壤含水量(SWC),相当于孔隙体积百分比(PPV)>0.85。这一水分水平对应于所使用特定土壤质地的约80–90%的田间持水量,属于“ readily available water”(RAW)范围,此时基质势不限制根部吸收。相应地,最大每日茎直径收缩(MDS)保持在30–70 μm的稳定范围内。这种生理稳定性表明根区水分可用性足以平衡日蒸发需求,防止了显著的植物水分短缺。在此期间没有观察到生长停滞,从而验证了30–70 μm的MDS范围作为非限制水分条件下番茄植株的基准。

在渐进性干旱处理组中,随着土壤含水量(SWC)逐渐下降,最大每日收缩(MDS)表现出明显的上升趋势。当PPV降至约0.62–0.83(对应于16.2%–21.5% SWC)时,MDS值显著上升至超过84 μm(峰值达到117.17 μm)。在这个MDS水平上,所有处理组都进入了生理决定的生长停滞状态。

通过对渐进性干旱期间关键点的数据分析,当MDS值在64–75微米范围内时,植物可以保持非停滞的生长(例如,MDS 64.35 μm,SWC 20.5%,PPV 0.79;MDS 75.55 μm,SWC 18.0%,PPV 0.69)。然而,当MDS值进一步增加时,生长停止的迹象开始出现在75 μm左右(例如,MDS 79.46 μm,SWC 17.5%,PPV 0.67)。一旦MDS超过80 μm,例如MDS 90.10 μm(SWC 16.5%,PPV 0.63),就会出现生长停止的迹象。

值得注意的是,先前的研究指出,MDS是一个受土壤水分可用性和大气蒸发需求共同影响的耦合信号[33](Ortu?o等人,2010年)。极端环境因素,如高蒸汽压差(VPD),可能会在土壤水分尚未达到临界短缺之前就导致MDS值的异常增加,可能导致对作物严重水分短缺的误判[34,35](Fernández和Cuevas,2010年;De Swaef等人,2010年)。这一限制证明了本研究中提出的双阈值决策方法(MDS-PPV)的必要性。通过整合这两个指标(MDS和标准化的PPV),我们的模型有效过滤掉了大气噪声,确保了真正生理水分胁迫的可靠识别,并防止了过早的灌溉。

为了提供早期预警阈值的统计稳健基础,我们在正常生长阶段(n = 1152)对MDS数据集应用了统计过程控制(SPC)方法。如表4所示,基线MDS确定为51.5 ± 21.7 μm。采用上限控制限(UCL)原则(平均值 + 1σ),我们确定73.2 μm为正常生理波动的边界。为了确保主动干预,选择了70 μm作为灌溉触发阈值。该阈值在统计上显著,因为它捕获了超过84%的正常观测值的偏差,有效地区分了“临界过渡”阶段(SWC ≈ 17.0%,PPV ≈ 0.65)和正常生长。这种双阈值方法确保在生长不可逆限制之前触发灌溉。

4.3 模型的性能评估和误差分析
4.3.1 与基准模型的定量比较
为了客观评估STL-LSTM模型的预测性能,本研究选择了深度学习基准模型LSTM和传统时间序列表模型ARIMA作为对照。ARIMA(自动回归积分移动平均)模型是一种经典的统计方法,它依赖于时间序列的固有随机特性。其本质在于通过结合自回归(AR)过程、差分(I)实现平稳性以及过去预测误差的移动平均(MA)来捕捉线性关系和季节性模式。然而,作为一种单变量线性模型,ARIMA经常难以应对茎厚度的生理信号中的高非线性和复杂噪声。

表5总结了三种模型在验证集上的评估指标。实验结果表明,STL-LSTM模型在所有关键指标上都优于其对手,包括RMSE、MAPE和R2。虽然ARIMA为趋势提供了基本基准,但它无法追踪由快速环境波动引起的茎直径的突然变化。与只能捕捉长期依赖性的独立LSTM模型相比,STL-LSTM实现了显著更高的预测准确性。这验证了STL分解在将复杂的茎厚度信号划分为不同成分(趋势、季节性和残差)方面的有效性。通过在训练前将潜在的生长趋势与高频环境噪声解耦,LSTM能够学习更稳定和更具代表性的特征,从而在预测植物水分状态方面具有更好的稳健性。

4.3.2 水分胁迫临界阶段的性能评估和误差分析
为了评估不同模型的性能,本节比较了不同模型在茎直径动态跟踪方面的有效性。实验数据表明,STL-LSTM模型在所有评估指标上均表现出最佳性能。定量分析显示,在环境波动剧烈的果实成熟高峰期,STL-LSTM模型的R2值为0.9184,与LSTM模型相比,预测准确性提高了23.5%。如图12所示,在缺水阶段,单个LSTM模型的预测曲线存在时间滞后,难以实时响应茎干直径的快速收缩。相比之下,ARIMA模型由于无法有效处理非平稳时间序列数据,其预测残差显著高于深度学习模型。通过对原始序列进行多尺度分解,STL-LSTM模型有效捕捉到了缺水期间的微妙生理信号,从而更可靠地数字化表示了番茄的生理状态。

图12. STL-LSTM、LSTM和ARIMA模型的预测与实测茎干直径曲线比较。

4.3.2 总体拟合精度和时间序列特征分析
图13展示了独立验证集上观察到的番茄茎干直径(SD)与预测值之间的对比。结果表明,所提出的STL-LSTM模型具有出色的预测保真度,预测轨迹与实测数据高度一致(R2 = 0.9184,RMSE = 0.0085)。重要的是,该模型准确捕捉到了番茄茎干的典型“收缩-膨胀”昼夜生理节律。这种高水平的相位同步性表明,STL分解有效地分离了非平稳SD信号的多尺度特征,从而降低了LSTM网络处理非线性残差的难度。该模型不仅能够跟踪长期生长趋势,还能精确拟合由日常环境波动驱动的快速收缩和恢复过程。

图14 展示了STL-LSTM模型的时间跟踪性能,证明了其捕捉番茄茎干直径昼夜波动的能力。为了进一步量化观察值与预测值之间的一致性,并评估模型在整个测量范围内的可靠性,对测试数据集进行了散点图分析(见图12)。如图12所示,数据点密集聚集在1:1虚线周围,表明相关性很高。R2值0.9184以及与理想拟合的最小偏差进一步证实了该模型在快速收缩(白天)和恢复(夜晚)阶段均没有显著的系统偏差。

4.3.3 预测偏差和误差来源的深入讨论
尽管总体精度很高,但在极端点(如中午的最大收缩和黎明的最大扩张)观察到了一些局部偏差,具体表现为峰值剪切和轻微的相位滞后。这些偏差可以归因于以下多方面因素:
- 非线性随机环境干扰:茎干直径对微环境波动非常敏感,例如云层覆盖导致的太阳辐射突然变化。尽管STL分解提取了“剩余”成分,但高频随机噪声与植物生理反应之间的复杂非线性耦合给深度学习架构处理非平稳波动带来了泛化瓶颈。
- 生物水力惯性和相位滞后:从生理角度来看,茎干直径对环境因素的响应涉及植物内部的水力阻力。在环境快速变化期间,LSTM的门控机制可能难以完美映射由植物内部水分调节引起的动态延迟,导致峰值点的轻微时间偏移或幅度低估。
- 测量不确定性:极端湿度/温度条件下传感器的潜在漂移以及个别植物的固有生长异质性将不可建模的噪声引入输入特征,进一步加剧了残差误差。

总之,尽管在极端波动点存在轻微误差,STL-LSTM模型仍表现出足够的鲁棒性和精度,能够满足温室环境中的实时作物生理监测和精准灌溉决策需求。

5. 讨论
本研究提出了一个将生理指标预测与土壤湿度状态相结合的灌溉决策模型。该模型的核心逻辑在于利用作物生理信号对水分缺乏的高敏感性,并结合土壤湿度作为约束条件。这种方法解决了传统灌溉策略中仅依赖单一传感器或环境干扰导致的决策偏差问题。
实验结果表明,仅依赖最大日茎干收缩(MDS)容易受到非水分压力因素(如强光和高温)的干扰,产生“虚假压力”信号。本研究引入了“作物预警-土壤确认”的协同决策逻辑,将MDS ≥ 70 μm设定为生理响应触发点,同时将根区土壤体积含水量VWC ≤ 17%设定为灌溉执行的硬性约束。这种机制的优势在于其双重能力:它不仅保留了生理指标检测早期水分压力的能力,还通过土壤湿度状态验证消除了由环境波动引起的虚假触发。这确保了灌溉决策基于植物的实际水分需求。
针对茎干直径时间序列的非平稳性和多尺度特性,本研究采用的STL-LSTM模型相较于单一LSTM模型展示了更优异的预测性能。通过STL分解将原始序列分解为趋势、季节性和残差成分,该模型有效降低了深度神经网络处理复杂非线性数据时的学习复杂性。数据对比表明,该模型可以提供12小时的前瞻性预警窗口。这一时间优势具有重要的实际意义:它将灌溉管理从传统的“干旱后补救措施”转变为“干旱前预防措施”,为温室自动化系统提供了更多的响应时间。
此外,为了实现实际应用的目标,该框架设计为一个基于代表性的区域管理系统,而非需要对每株植物进行单独监测的系统。在商业温室生产中,在代表性的“哨兵植物”上部署传感器在经济和技术上都更为可行,从而捕捉特定灌溉区的 collective 生理节律。在这种操作模式下,MDS动态作为高灵敏度的触发条件——通过检测早期生理需求来决定何时灌溉。通过利用植物的内在生理反应作为“集成生物传感器”来检测大气需求,该框架减少了对密集气象数组的依赖,这些数组通常是计算参考蒸散量(ET0)所必需的。这种“传感器最小化”策略降低了维护成本和操作复杂性,为智能农业提供了更可扩展的解决方案。
同时,土壤湿度状态作为空间边界和数量控制器——决定了生物信号是否受到土壤水分耗尽的支持以及需要灌溉的量。这种分层方法——其中生理哨兵决定时机,土壤传感器控制灌溉量——既减少了传感器密度需求,又提高了灌溉精度,为智能农业提供了可扩展的解决方案。
尽管当前模型在验证集上的表现良好,但仍有三个方面需要进一步研究。首先,本研究中采用的静态阈值(70 μm和17%)在不同生长阶段或极端气候条件下的普适性尚待验证。本研究中提出的3天评估周期捕捉了最具挑战性的生理阶段——净茎干收缩的开始(DI < 0)。捕捉这一动态变化是我们的早期预警阈值的主要目标。然而,我们注意到审稿人对时间范围的担忧。更长的观察周期将提供更多关于模型如何应对与年龄相关的生理变化的见解。为解决这一问题,我们计划在后续研究中通过引入适应植物物候发展的生长校正因子来改进模型。这将确保70 μm的MDS阈值在整个生长季节内保持稳健和可靠。开发一个能够适应作物生长阶段的动态阈值模型是未来研究的关键重点。
其次,当前的决策逻辑侧重于确定“何时灌溉”;未来的工作应该将其与基于蒸散量(ET)的水分需求模型相结合,以同时解决“灌溉多少”的问题。虽然本研究中确定太阳辐射是主要驱动因素,但未来的迭代可以整合全面的ET0水分需求模型,以更精确地解决“灌溉多少”的问题。最后,在算法层面,后续工作可以探索将气象因素作为外部协变量纳入多变量预测模型(例如LSTM-X),或评估具有自注意力机制(如Transformers)的架构,以进一步增强模型在复杂场景中的可解释性。

6. 结论
为了解决传统灌溉调度在太阳能温室中的局限性——特别是过分依赖人工经验和单一土壤湿度指标的问题,本研究分析了番茄茎干直径的生理动态,并开发了一个高精度的STL-LSTM预测模型。主要发现如下:
(1) 茎干直径的昼夜动态和环境响应特征。新疆干旱地区的番茄茎干直径变化表现出明显的昼夜节奏,其特征是由于蒸腾作用引起的水分缺乏导致的夜间扩张/恢复和日间收缩。比较分析显示,晴天的最大日收缩(MDS)明显高于阴天,表明太阳辐射和高蒸气压差(VPD)是生理水分波动的主要驱动因素。MDS与日生长(DI)之间的协同变化为诊断植物的水分状态提供了可靠的生理基础。
(2) 水分压力阈值的量化以及双阈值机制。通过水分压力诱导实验,确定了灌溉的关键生理触发点。通过结合生理预警阈值(MDS > 70 μm)和土壤湿度约束(VWC ≤ 17%),建立了双阈值决策机制。这种综合方法有效减少了在波动环境条件下单指标系统固有的虚假触发风险,将灌溉管理从被动补充转变为主动的、以植物为中心的需求预测。
(3) STL-LSTM模型的预测性能和误差特征。STL-LSTM模型通过时间序列分解有效地捕捉了非平稳生理序列的多尺度特征。在全果实成熟阶段,该模型的决定系数(R2)为0.9184,分别比独立的LSTM和ARIMA模型在预测准确性上提高了14.8%和27.56%。误差分析表明,尽管预测偏差主要源于极端天气波动期间的“剩余”成分,但模型在其整体拟合趋势上依然稳健,为自动化灌溉调度提供了可靠的24小时前瞻性基础。
(4) 未来验证和实际应用的前景。基于本研究建立的生理触发和预测框架,我们后续的研究将集中于在实际的大规模灌溉场景中部署该系统。未来的工作将致力于在更广泛的土壤类型、作物品种和复杂田间环境中进一步验证和校准所提出的双阈值机制,确保智能灌溉决策模型在实际农业生产中的长期可靠性和适应性。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号