将LGBM机器学习方法与SHAP模型相结合,以解释不同环境因素对中国降水量的影响

《Journal of Atmospheric and Solar-Terrestrial Physics》:Integrating LGBM machine learning methods with SHAP model to explain the impact of different environmental factors on precipitation in China

【字体: 时间:2026年02月02日 来源:Journal of Atmospheric and Solar-Terrestrial Physics 1.9

编辑推荐:

  中国复杂地形区降水驱动机制及区域差异研究,利用地面观测、卫星遥感和再分析数据,结合SHAP模型与LGBM算法,揭示相对湿度(RH)、CAPE、KI和IWP为关键因素,并分析不同气候区的驱动差异。

  
刘勇|栾青祖|赵鹏国
四川省复杂地形地区气候变化与资源利用重点实验室,四川省成都平原城市气象与环境观测研究站,四川省气象灾害预测与预警工程技术研究中心,成都信息科技大学大气科学学院,中国成都610225

摘要

降水过程受到多种环境变量的影响,识别影响降雨的主要因素至关重要。中国地理环境多样,地形复杂,不同气候区域的降水形成机制存在显著差异。尽管机器学习模型效率较高,但缺乏可解释性。因此,本研究结合地面气象观测数据、卫星遥感数据和大气再分析数据,利用可解释人工智能(XAI)工具SHAP模型以及Light Gradient Boosting Machine(LGBM)机器学习框架,探讨了各种环境变量对中国及不同气候区域降水的影响,并量化了它们的贡献。结果表明,相对湿度(RH)、对流有效位能(CAPE)、K指数(KI)和冰水路径(IWP)是影响中国降水的最关键因素,在平均SHAP值排名中位列前四,且显著高于其他因素。由于中国不同气候区的差异,地表温度(LST)、风向(WD)、蒸发量(E)、液态水路径(LWP)、地面气压(SP)、云量(CFC)、气溶胶光学厚度(AOD)和相对湿度(RH)在全国范围内对降水具有最明显的正面影响,而冰水路径(IWP)、K指数(KI)、云顶高度(CTH)和对流有效位能(CAPE)则表现出更显著的负面影响——这源于各变量在不同气候区的影响差异。降水驱动因素存在显著的地域性差异:对流有效位能(CAPE)在北亚热带湿润气候区对降水影响最强,相对湿度(RH)在边缘热带湿润和温带半湿润区占主导地位;云顶高度(CTH)在高原温带半干旱区更为明显,冰水路径(IWP)在中温带半干旱气候区表现突出,K指数(KI)在中温带干旱区占优势,地表温度(LST)在暖温带半湿润气候区作用更为显著。

引言

降水作为地球气候系统中水循环的核心要素,在全球能量平衡、生态系统动态和人类社会发展方面起着极其重要的作用(Chen和Luo,2018)。它对农业生产和水资源分配具有决定性影响,其空间分布存在显著差异。这些差异的形成受多种因素调控,包括多尺度大气环流、大气热力学特性和云属性特征。在中国,众多因素影响降水。季风环流的推进、退缩和强度变化主导了水汽的输送路径和垂直运动强度,直接影响降水的时空分布(Zheng等人,2020;Du等人,2024;Zhang等人,2016;Huang等人,2013)。云层厚度、粒子相态和垂直结构调节凝结和碰撞过程,决定了降水的强度和类型(Wang等人,2024a;Wang等人,2021;Barthlott等人,2022)。地表特征(如土地覆盖类型)通过改变能量平衡和表面粗糙度间接影响局部环流和水汽供应(Chen等人,2023;Yin等人,2011;Miao等人,2011)。地形起伏通过动态抬升或阻挡机制形成地形雨和阴影效应(Gu等人,2021;Li等人,2021,2024a)。这些因素共同塑造了中国复杂多样的降水模式。
降水受到四个因素的共同调控——热条件、动态过程、云微物理特性和地表特征——每个因素通过不同的物理机制和时空相互作用产生影响。热因素与降水的相关性具有季节性差异(Zhao和Khalil,1993a;Hardwick等人,2010),这种关系通过云量、潜热交换和降水类型介导,导致显著的时空变化(Du等人,2013,2024)。对于动态因素,大尺度环流模式通过调节水汽输送路径和强度来主导降水分布(Fang等人,2023;Zhang等人,2011;Xue等人,2022;Nie和Sun,2022);而对流有效位能(CAPE)与降水强度呈幂律关系,水汽转化为降水的效率以及CAPE转化为上升动能的效率存在地理互补性,并且存在显著的时空变化(Dong等人,2019;Gizaw等人,2021;Malik等人,2021)。从云微物理特性的角度来看,低层水云有效粒子半径和总云光学厚度与降水呈正相关,而滴数与降水呈负相关(Kawamoto,2006;Fan等人,2017;Yang等人,2013;Van等人,2012)。在中国西南部,冰水路径和云顶高度与降水呈显著正相关;在青藏高原西部和东部,有效冰半径与降水呈负相关;在青藏高原东部、云贵高原和四川盆地,液态云有效半径与降水呈正相关;热湿条件(如CAPE和低层相对湿度)通过调节云属性间接影响降水(Wang等人,2024a;Mo等人,2024)。关于地表特征,季风地区的植被对降水的响应存在显著滞后效应(Schultz和Halpert,1993b;Cui和Shi,2010),不同土地利用类型对降水的影响也各不相同(Li等人,2018;Zhang等人,2021;Zhang和Ni,2025)。值得注意的是,大多数现有研究依赖于传统统计方法,这些方法存在固有局限性:它们无法完全捕捉变量与降水之间的非线性关系,只能解释单变量关联,难以揭示多个因素的协同效应。
机器学习方法已成为提取大气科学中时空特征和解释物理相关性的强大工具(Benziane,2024b;Reichstein等人,2019a;Hen等人,2022;Ham等人,2019b),应用于分析极端降水和提高预报准确性(Davenport和Diffenbaugh,2021;Wang等人,2024b;Jose等人,2022;Senocak等人,2023)。然而,传统机器学习模型存在“黑箱”局限性——难以量化特征贡献、对非线性的分析不足以及缺乏局部可解释性。相比之下,博弈论可解释性分析框架SHAP(Shapley Additive Explanations)模型有效解决了这些问题(Li,2022),已被用于识别关键驱动因素、区分正/负相关因素以及分析空间异质性(Lin等人,2023a,b;Xu等人,2025;Ma等人,2024;Patel和Shah,2024;Zeleke等人,2025;Wu等人,2025)。尽管取得了这些进展,但仍存在关键研究空白:大多数研究仅关注单一或少数变量,未能系统比较热、动态、云和相关地表因素在中国降水中的相对重要性;个别因素的正/负效应及其在不同气候区的空间变化尚未完全阐明;在不同非线性框架下,多种因素调节降水的协同作用仍缺乏量化。
基于此背景,本研究结合地面气象观测数据、卫星遥感数据和大气再分析数据,利用机器学习方法和SHAP可解释框架,探讨了中国降水与环境因素之间的复杂关系。具体目标是:识别对降水影响最大的关键变量;明确不同变量在降水过程中的正或负作用;确定不同气候区影响降水的主导因素及其各自效应。本研究通过将机器学习与SHAP框架相结合,提供了一种新的方法来揭示降水的内在机制,为理解中国降水动态提供了新的科学见解,并支持有针对性的水资源管理。

数据来源与方法

本研究聚焦中国地区(见图1)。中国地形从西向东呈三级阶梯状倾斜,具有多样的地貌和气候类型。作为世界上最典型的季风地区之一,中国降水量存在显著的空间和季节性变化,从东南向西北逐渐减少(Li和Liu,2020)。为了进一步研究不同环境变量对降水的影响

LGBM模型性能

图2展示了基于2000年至2022年日降水数据的LGBM模型模拟后的散点图和多标准评估结果。定量分析显示R2值为0.54,表明拟合效果一般,均方根误差(RMSE)为6.83毫米,平均绝对误差(MAE)为2.45毫米,偏差(Bias)为-0.01,KGE为0.50。为了全面评估模型性能,需要区分不同误差指标的固有维度:偏差(-0.01毫米)

结论

本研究基于包括地面气象观测数据、卫星遥感数据和大气再分析数据在内的多源数据集(2000–2022年),利用LGBM机器学习模型结合贝叶斯超参数优化和符合时间序列要求的十折交叉验证构建了降水预测模型。通过SHAP模型,我们不仅量化了每个因素的区域特定贡献及其非线性

CRediT作者贡献声明

刘勇:撰写——原始草稿,可视化,验证,软件,数据整理。栾青祖:撰写——审稿与编辑,监督,方法论,资金获取,正式分析,概念构思。赵鹏国:撰写——审稿与编辑,方法论,调查,资金获取,正式分析,概念构思。

利益冲突声明

作者声明他们没有已知的可能影响本文工作的财务利益或个人关系。

致谢

我们感谢国家关键研发计划(2024YFF0729002)和四川省科技计划(2025YFN0006)的支持。同时,我们也感谢CM SAF、NASA、CMA、TPDC、Figshare、Zenodo和ECMWF提供的数据支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号