利用集成机器学习方法进行多类型滑坡易发性建模:以巴基斯坦北部喀喇昆仑公路为例

《Physics and Chemistry of the Earth, Parts A/B/C》:Multi-Type Landslide Susceptibility Modeling Using Ensemble Machine Learning Approaches: A Case Study from the Karakoram Highway, Northern Pakistan

【字体: 时间:2026年01月24日 来源:Physics and Chemistry of the Earth, Parts A/B/C 3.0

编辑推荐:

  本研究采用随机森林和极端梯度提升两种集成机器学习模型,对喀喇昆仑公路沿线滑坡易发性进行评估,分析不同滑坡类型预测性能,发现XGB模型对高风险区域识别更优,RF模型分布更保守,结果为基础设施风险管理提供支持。

  
张秀平|段旭龙|乌默尔·哈利勒|穆罕默德·阿里·穆罕默迪|赫拉·埃尔曼奈|阿比尔·D·阿尔加尔尼|德米特里·E·库彻
云南开放大学城市建设工程学院,中国昆明650500

摘要

喀喇昆仑公路(KKH)是一条连接巴基斯坦北部与中国西部的重要高海拔交通走廊,由于地形陡峭、地质复杂、降雨量大以及人类活动不断增加,该地区经常发生滑坡。因此,可靠的滑坡易发性制图对于减轻灾害和增强基础设施的韧性至关重要。在本研究中,我们使用两种集成机器学习(ML)模型——随机森林(RF)和极端梯度提升(XGB)——对KKH某段区域的滑坡易发性进行了评估。共有447起滑坡事件被分类为坠落型、流动型和滑动型,并与非滑坡样本结合进行监督建模。研究使用了来自遥感、水文指数和地质数据的14个条件因子。通过方差膨胀因子分析解决了多重共线性问题。模型采用70/30的比例进行训练和验证,性能评估指标包括准确率、精确度、召回率、F1分数和AUC-ROC。这两种模型在预测滑动型滑坡方面表现优异(RF和XGB的AUC均为0.99),在预测坠落型滑坡方面也表现良好(RF的AUC为0.92,XGB的AUC为0.89)。流动型滑坡的预测能力中等(RF的AUC为0.68,XGB的AUC为0.65)。组合模型(总模型)的准确率非常高(0.95),AUC值分别为0.99(RF)和0.98(XGB)。XGB将更大比例的研究区域(281.99平方公里)归类为极高易发性区域,而RF则将更多区域归类为低至中等易发性区域。两种模型生成的易发性分布模式与KKH沿线已知的滑坡易发区一致。XGB突出了局部高风险热点,而RF则提供了更为保守的空间分布。研究结果强调了人类活动和地形因素对滑坡发生的强烈影响,并证明了集成ML方法在复杂山区环境中的适用性。

引言

滑坡是山区最常见的自然灾害之一,常常对道路、桥梁和电力线路等基础设施造成破坏,并引发土壤侵蚀和荒地形成等严重的土地退化过程(Ado等人,2022;Khan等人,2025)。岩石、土壤或碎屑的这种向下运动是由地貌、水文、地质和人为因素之间的复杂相互作用驱动的(Azarafza等人,2021)。鉴于滑坡的频繁发生及其毁灭性影响,准确且空间详细的滑坡易发性地图(LSM)是风险缓解和合理土地利用规划的重要工具(Bozzolan等人,2023)。
多种自然和人为因素,包括地震、暴雨、火山活动、海拔和坡度类型、植被覆盖情况以及人类活动(如道路和建筑建设、农业活动)都会引发滑坡(Nhu等人,2020)。滑坡易发性指的是在特定地理环境下发生滑坡的概率,有助于识别最有可能发生滑坡的热点区域。精确掌握滑坡易发区的空间分布对于操作性风险分析至关重要(Bozzolan等人,2023)。滑坡易发性制图依赖于关于斜坡运动及其根本原因的信息(Erener等人,2016;Fatemi Aghda等人,2018)。
作为中巴经济走廊(CPEC)的关键组成部分,喀喇昆仑公路的建设和持续发展加剧了该山区走廊对滑坡的脆弱性。该地区以陡峭的坡度、破碎的岩层和强烈的季节性降雨为特征,人类活动(如削坡、森林砍伐和定居点扩张)进一步加剧了滑坡的发生(Kanwal等人,2017)。大规模的滑坡多次阻塞了公路路段,导致交通延误、经济损失和人员伤亡(Kanwal等人,2017;Rahim等人,2018)。因此,理解和建模这一灾害成为当务之急。
过去几十年里,提出了许多评估滑坡易感性的方法,从确定性和统计方法到基于专家的多标准决策分析,包括层次分析法、逻辑回归和模糊逻辑(Basharat等人,2016;Kanwal等人,2017;Maqsoom等人,2022)。尽管这些传统方法有一定作用,但在捕捉大型异质景观中条件因子之间的非线性、多维相互作用方面往往存在不足(Fang等人,2020;Liu等人,2022;Shahzad等人,2022;Youssef等人,2022)。
最近,机器学习和深度学习方法已成为模拟滑坡等复杂空间现象的强大工具(Qin等人,2023;Yi等人,2020)。这些模型能够灵活整合各种地理环境变量,并从历史滑坡数据库中学习高维模式。将ML与GIS和遥感数据集相结合,大大提高了LSM的空间预测能力和客观性(Orhan等人,2022)。
以往在巴基斯坦北部进行的研究主要依赖于单一模型、定性或统计技术进行滑坡评估(Bacha等人,2018;Basharat等人,2016;Maqsoom等人,2022)。虽然这些方法提供了有价值的区域洞察,但它们很少考虑滑坡类型,也未使用统一的输入和验证指标来比较多个ML模型。此外,它们往往忽略了人为压力因素和气候相关指标在影响滑坡易感性方面的综合作用。
为此,本研究提出了一种多模型、针对不同滑坡类型的滑坡易发性制图方法。我们应用两种集成ML算法来模拟和比较三种滑坡类型(坠落型、流动型和滑动型)的易感性。研究使用了来自遥感和地理空间数据的14个条件因子来捕捉导致滑坡发生的多种过程。滑坡清单基于历史数据编制,并通过多重共线性分析进行特征选择。
通过使用统一的训练-测试划分和稳健的评估指标,本研究不仅提供了模型性能的比较评估,还生成了详细的LSM,有助于科学理解和基础设施风险规划。纳入滑坡类型以及根据KKH的地形特征定制的高分辨率预测地图,提高了结果的细节性和实用性。

研究区域

喀喇昆仑公路是一条连接巴基斯坦北部与中国西部的战略关键交通走廊,穿越高海拔的喀喇昆仑山脉。这条公路的最高海拔达到4,693米,是世界上最高的铺砌道路之一。尽管工程意义重大且风景优美,但由于地形陡峭、岩层破碎以及多样的岩石类型(变质岩、火成岩、沉积岩)等因素,该公路极易发生地质灾害,尤其是滑坡。

主题层

图6、图7和图8展示了代表所有滑坡条件因素的主题数据集。这些地图展示了研究区域内关键地形、光谱、环境和人为特征的空间变化情况。通过分析这些主题层,可以更清楚地理解各因素与滑坡发生之间的关系,为开发准确的滑坡易发性模型提供重要见解。

讨论

滑坡在全球范围内造成了重大的自然资源和经济损失以及人员伤亡(Confuorto等人,2019;Tyagi等人,2024)。因此,开发滑坡易发性地图对于识别高风险区域和实施有效的风险缓解措施至关重要。鉴于基础设施的快速扩张、极端降雨事件的增加以及喀喇昆仑地区的高地形敏感性,迫切需要更新和方法论上更为稳健的滑坡易发性评估。因此,本研究……

结论

本研究使用最先进的ML模型(随机森林RF和极端梯度提升XGB)开发并评估了喀喇昆仑公路沿线的滑坡易发性地图。研究基于447起滑坡事件(分为坠落型、流动型和滑动型)的详细清单,以及来自数字高程模型(DEM)、遥感指数、地质数据集和水文模型的14个条件因子进行了评估。RF和XGB都在一致的数据划分上进行训练和测试,评估指标包括准确率、精确度、召回率和F1分数。

资助

沙特阿拉伯利雅得努拉·宾特·阿卜杜勒拉赫曼大学研究支持项目编号(PNURSP2026R51)

作者贡献声明

乌默尔·哈利勒:撰写原始稿件、可视化处理、软件开发、方法论设计、数据分析。赫拉·埃尔曼奈:撰写原始稿件、可视化处理、验证工作、软件开发、方法论设计、数据分析。穆罕默德·阿里·穆罕默迪:撰写原始稿件、可视化处理、验证工作、数据分析、数据整理。德米特里·E·库彻:撰写原始稿件、软件开发、方法论设计、数据分析。阿比尔·D·阿尔加尔尼:撰写原始稿件、软件开发、方法论设计、数据分析。段旭龙:撰写……

数据可用性声明

数据可应第一作者的要求提供。

利益冲突声明

? 作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。

致谢

沙特阿拉伯利雅得努拉·宾特·阿卜杜勒拉赫曼大学研究支持项目编号(PNURSP2026R51)
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号