基于回归克里金法提升半干旱气候区参考蒸散 estimates

《Journal of Hydrology: Regional Studies》:Enhancing reference evapotranspiration estimate using regression kriging in semi-arid climate

【字体: 时间:2026年06月03日 来源:Journal of Hydrology: Regional Studies 4.7

编辑推荐:

  摘要:本研究利用2011–2021年间伊朗340个气象站的天气数据,开展了全国参考蒸散(ET?)的全面制图。该密集站点网络覆盖了多样化的气候和环境条件,使我们能够评估气象和地理驱动因素对伊朗各地区ET?估算精度的影响。参考蒸散(ET?)是水文学、环境学、生态学

  
摘要:本研究利用2011–2021年间伊朗340个气象站的天气数据,开展了全国参考蒸散(ET?)的全面制图。该密集站点网络覆盖了多样化的气候和环境条件,使我们能够评估气象和地理驱动因素对伊朗各地区ET?估算精度的影响。参考蒸散(ET?)是水文学、环境学、生态学及气象学建模中的关键变量,其大规模制图对于农业优化和水资源管理至关重要。尽管大多数研究基于点尺度测量进行ET?的大尺度制图,但本研究首次将回归克里金(RK)方法与气象和坐标数据相结合,以生成更精确的ET?地图。开发了三种RK变体,包括广义线性模型-普通克里金(GLM+OK)、广义加性模型-普通克里金(GAM+OK)和随机森林-普通克里金(RF+OK)。利用ReliefF算法识别有影响力的输入变量,并基于地理坐标、气象变量和点尺度ET?测量值定义了不同策略。最后,将提出的模型与独立的GLM、GAM、RF和普通克里金(OK)模型进行了比较。GAM+OK混合模型通过明确捕捉伊朗超干旱内陆、半干旱高原和湿润沿海地带 across 的非线性空间模式和残差自相关,实现了最高的精度(测试集决定系数R2 = 0.932)。ReliefF引导的特征选择表明,在受海风平流主导蒸发需求的沿海和岛屿地区,省略风速会显著降低ET?估算精度,而坐标信息(纬度和海拔)对于内陆地形梯度不可或缺。这些发现提供了一个高分辨率、不确定性量化的框架,用于完善区域水分平衡评估、优化缺水农业盆地的灌溉调度,并在气候变异下增强干旱早期预警系统,为干旱地区可持续水资源管理提供水文学见解。
本研究针对参考蒸散(ET?)在农业节水、水资源管理及气候变化评估中的关键作用,特别关注在干旱和半干旱地区因气象站数据不完整或分布不均导致的大尺度ET?估算难题。尽管FAO-56 Penman-Monteith方程(FPM-56)是估算ET?的标准模型,但在实际应用中常受限于数据缺失。现有的机器学习(ML)和地统计方法虽有所进展,但缺乏将先进ML模型与克里金插值结合的混合方法在大规模ET?制图中的应用,且缺乏系统的特征选择(FS)分析。为解决这一空白,研究人员开展了基于伊朗340个气象站(2011–2021年数据)的大规模ET?制图研究,旨在通过比较传统地统计、独立机器学习及混合回归克里金(RK)模型,评估其预测精度及特征选择的影响。研究发现,结合机器学习与地统计的混合方法能更有效地捕捉空间依赖性和非线性趋势。其中,广义加性模型-普通克里金(GAM+OK)模型表现最优,测试集决定系数(R2)达到0.932,均方根误差(RMSE)为100.128 mm/yr。研究结果表明,混合RK模型显著优于独立模型,且风速对沿海地区ET?估算至关重要,而纬度和海拔对内陆地区不可或缺。该研究发表于《Journal of Hydrology: Regional Studies》,为水资源管理和干旱预警提供了高分辨率、不确定性量化的技术框架。

研究人员采用了基于FAO-56 Penman-Monteith(FPM-56)方程计算的气象站点ET?数据作为目标变量,数据来源于伊朗340个气象站(2011–2021年)。研究构建了三种独立回归模型:广义线性模型(GLM)、广义加性模型(GAM)和随机森林(RF),以及三种对应的混合回归克里金(RK)模型:GLM+OK、GAM+OK和RF+OK。其中,普通克里金(OK)用于插值残差。研究引入了基于ReliefF算法的特征选择方法,以评估气象变量(如最高/最低温度、辐射、相对湿度、风速)和地理变量(纬度、海拔)对ET?制图的重要性,并设计了三种简化输入策略以测试变量缺失的影响。所有模型均通过10折交叉验证进行评估,评价指标包括决定系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)和散射指数(SI)。

研究结果部分:
**3.1. 相关性分析**
通过Pearson相关性分析发现,最高温度(Tmax)与ET?的相关性最强(R=0.890),其次是太阳辐射(Rs, R=0.770)和最低温度(Tmin, R=0.700)。风速(Ws)与ET?呈弱正相关(R=0.220),而相对湿度(RH)呈负相关(R=-0.570)。地理变量中,纬度(R=-0.750)和海拔(R=-0.340)均与ET?呈负相关。

**3.2. ReliefF算法特征选择(FS)**
ReliefF算法显示,Tmax的重要性最高(0.800),其次是Rs(0.700)和纬度(0.600)。风速(Ws)的重要性最低(0.110)。基于此,研究设计了三种简化策略,分别去除Ws、Ws/RH/纬度/海拔、以及大部分气象变量,仅保留纬度和海拔。

**3.3. 原始矩阵维度下的模型评估**
在使用所有输入变量的情况下,混合RK模型表现优于独立模型。GAM+OK模型在训练和测试阶段均取得最佳性能,测试集R2为0.932,RMSE为100.128 mm/yr。OK模型单独使用也表现良好(测试集R2=0.913),但GAM+OK通过捕捉非线性关系和空间残差进一步提升了精度。GLM由于假设线性关系,表现最差(测试集R2=0.632)。RF模型虽能处理非线性,但因缺乏空间依赖建模机制,性能略逊于GAM+OK。

**3.4. 简化矩阵维度下的模型评估**
在简化输入变量后,模型精度略有下降,但GAM+OK仍保持领先。去除风速(St.1策略)导致沿海和岛屿区域的估算误差显著增加,证实了风速在海风平流主导区域的关键作用。移除气象变量仅保留地理变量(St.3策略)导致精度大幅下降,表明气象数据不可或缺。平均而言,RMSE在简化策略下增加了约2.85%。

**3.5. 误差分析**
误差分布显示,GAM+OK模型的误差分布最紧凑,中位数和四分位距(IQR)最小。高误差主要出现在伊朗中部沙漠和高山区,这与站点稀疏、地形复杂及极端气候条件有关。ReliefF识别出的低重要性变量(如Ws)在全局误差分析中影响有限,但在特定区域(沿海)影响巨大。纬度低于30°和海拔低于1000米的区域散射指数(SI)较高,反映了这些区域的气候过渡性和高温高压特征。

讨论部分总结了混合模型在捕捉空间异质性和非线性方面的优势,指出ReliefF算法虽能识别全局重要变量,但特定局部过程(如沿海风速影响)仍需特定变量支持。研究局限性在于点尺度观测数据在沙漠和高海拔地区的稀疏性,未整合遥感陆面参数。

研究结论:本研究首次将机器学习-克里金混合模型(GLM+OK, GAM+OK, RF+OK)应用于伊朗大规模ET?制图。GAM+OK模型表现最佳(测试R2=0.932),证明了显式建模非线性气象-地理相互作用及残差空间自相关的有效性。关键水文学见解包括:风速主导沿海和岛屿ET?机制,纬度和海拔对内陆地形梯度至关重要。尽管移除部分变量会导致平均误差增加约5.5%,但GAM+OK在简化变量下仍具鲁棒性。未来研究可整合高分辨率卫星协变量及探索时间序列扩展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号