编辑推荐:
滑坡敏感性评估|机器学习模型|邻域特征聚合|CatBoost模型|县域灾害防治
沈琳娜|赵新阳|刘华军|胡胜|张驰|张驰
中国西北大学城市与环境学院
摘要
地质灾害作为威胁区域可持续发展的主要自然灾害,使得风险评估和规划治理成为全球空间安全管理的核心问题。本研究以中国典型的山区河谷型城市——石泉县为背景,开展了滑坡易发性预测。我们评估了六种机器学习模型(LR、SVC、BP神经网络、RFC、CatBoost、LGBM)在滑坡易发性制图中的表现,并提出了一种基于“邻域特征聚合(NFA)”的优化方法。其中,CatBoost模型的表现最佳。研究发现,石泉县地质灾害易发性分区比例呈现出梯度分布特征,并在空间上沿河谷呈线性分布。基于这些研究结果,从社会风险的角度提出了城市灾害预防策略,为具有类似石泉县特征的其他山区河谷型城市提供了参考。
引言
随着全球气候变化和人类活动的加剧,滑坡等地质灾害的频率和强度逐渐增加(Froude和Petley,2018)。特别是在中国陕西省南部的众多山区和河谷城市中,滑坡作为最常见且破坏性最强的灾害类型之一,不仅严重威胁居民的生命和财产安全,还对当地基础设施、经济发展和生态环境构成巨大挑战(Zhou等人,2025)。这些地区受复杂地形、集中降雨和不稳定土壤结构等因素影响,容易发生频繁的滑坡灾害,且难以准确预测(Qiu等人,2018;Zhuang,2018;Qiu,2016)。这种情况与山区和河谷城市的特征存在多重矛盾,例如居民居住空间有限和高度依赖经济。为了解决这一问题,精确进行滑坡易发性制图、探索有效利用制图结果的方法以及制定有效的灾害预防策略成为亟待研究的重点课题(Guzzetti等人,2020)。
随着遥感技术和机器学习算法的快速发展和广泛应用,滑坡易发性制图技术取得了显著进展(Yacine和Hamid,2020)。尽管传统统计方法在早期滑坡研究中取得了一定成果,并能处理简单的特征关系,但在处理复杂的多维环境因素时存在明显局限性(Steger等人,2021;Wei等人,2024;Frattini等人,2010)。近年来,基于机器学习和深度学习模型的复杂系统逐渐成为滑坡易发性制图的主流技术(Di Napoli等人,2020;Liang等人,2022)。传统的机器学习模型,如支持向量机(SVM)和决策树(DT),由于其强大的非线性拟合能力,能够有效捕捉导致滑坡的因素之间的复杂关系,并在区域滑坡预测中表现出良好性能(Wang等人,2020)。随着数据集复杂性和规模的增加,集成学习模型(如Bagging和Boosting技术)逐渐应用于滑坡易发性制图(Fan等人,2017)。研究表明,以随机森林(RF)和梯度提升决策树(GBDT)为代表的集成学习模型,相比单一模型具有更高的预测准确性和更强的泛化能力,同时在数据处理能力上也有所提升(Akinci等人,2021;Youssef和Pourghasemi,2021)。此外,深度学习模型(如卷积神经网络(CNN)通过自动学习数据中的复杂空间关系,进一步提高了滑坡易发性制图的准确性(Jia和Ye,2023)。深度学习可以直接从遥感图像中提取特征,无需过多的特征选择,能够有效捕捉特征因素的空间连续性和复杂的空间关系,非常适合处理具有高度非线性特征的大规模复杂数据集(Chen等人,2024)。
然而,在县级尺度的滑坡易发性制图中,样本量有限、滑坡影响区域小以及空间信息不足等问题依然存在,这对机器学习和深度学习模型构成了重大挑战(Kong等人,2025)。深度学习模型通常需要大量数据进行训练以提高泛化能力并避免过拟合风险。因此,在大规模研究区域中,当有大量滑坡样本支持时,它们的表现通常非常出色(Zhang等人,2024)。但在小尺度滑坡易感性分析中,深度学习的高数据需求和复杂性限制了其在数据量有限的地区中的应用,导致模型训练不稳定和过拟合风险增加(Shi等人,2024;Bostjan?i?等人,2021;Lu等人,2025)。目前,由于在样本量有限和小尺度研究区域中的强鲁棒性,传统机器学习模型和集成学习模型已成为小尺度滑坡易感性制图的主流选择(Lei等人,2025;Lu等人,2025)。尽管集成学习模型在处理复杂多维数据方面比传统机器学习模型具有更强的能力,但在捕捉空间连续性和复杂空间关系方面仍相对较弱。集成学习模型在数据处理过程中倾向于将特征变量视为独立的离散数据,更依赖结构化数据,难以捕捉数据的空间分布连续性和特征特性(Prasad等人,2022)。因此,如何在合理选择模型与有效捕捉空间特征之间取得平衡,是实现精确小尺度滑坡易感性制图的关键问题。
此外,尽管这些模型的复杂内部结构和高维参数能够有效捕捉滑坡灾害的非线性特征,但它们决策过程的缺乏透明度限制了其在实际应用中的可解释性,从而限制了其在灾害风险管理中的潜力。特别是在山区河谷城市中,由于地形复杂和水文条件多变,滑坡灾害的成因机制更加多样和复杂(Hussain等人,2022;Solanki等人,2022)。这些城市不仅面临频繁的滑坡风险,而且居民居住空间有限、经济高度依赖自然资源的特点进一步加剧了灾害的威胁。因此,如何解释这些“黑箱”模型的预测结果并将其有效应用于城市灾害预防规划和管理,也成为亟待解决的另一个关键问题。
本文旨在探讨如何在小型县级尺度上进行精确的滑坡易发性制图,以提高实用性和可解释性,从而将制图结果有效应用于城市灾害预防。本研究在具有典型山区河谷城市特征的陕西省南部石泉县进行了实证研究,提出了一种基于“邻域特征聚合(NFA)”的优化方法,并运用多种机器学习模型进行滑坡易发性预测。在探索模型合理选择的同时,还验证了邻域特征聚合方法的优化效果和泛化能力。最后,通过SHAP解释器进一步阐明了模型的可解释性,并通过整合社会经济因素生成了风险层。这些努力为城市灾害预防规划和管理提供了支持,同时探索了滑坡易感性制图结果的有效应用途径。
研究区域
石泉县位于中国陕西省南部(图1),地处秦岭山脉和汉江盆地的交汇处。该地区地形复杂,是滑坡高发区的典型代表,以山地和峡谷景观为主。石泉县北部以秦岭山脉的陡峭地形和深谷为主,而南部则地形相对平坦。
评估模型
在滑坡易感性分析中,选择合适的机器学习模型对于实现准确可靠的预测至关重要。本研究评估并比较了六种不同的机器学习模型,包括三种集成学习模型(随机森林、CatBoost、LightGBM)、一种神经网络模型(MLP-多层感知器)和两种传统分类模型(逻辑回归和支持向量机)。这些模型涵盖了从简单线性到复杂的范围。
滑坡易发性制图结果
图4展示了石泉县地质灾害易感性的多模态评估结果。从不同易感性等级区域的空间分布来看,尽管六种模型的分区结果在总体趋势上具有相似性,但在细节表现上存在明显差异。
从图形分类效果来看,CatBoost模型的预测具有最精确的划分。
地质灾害的空间发展模式和应对策略
对于以典型河谷型城市特征为特征的石泉县来说,地质灾害的频繁发生和预测精度的高挑战性与居民居住空间有限以及经济高度依赖性之间存在多重矛盾(He等人,2019)。因此,采用了多模型比较分析方法,系统地比较了六种机器学习模型(LR、SVC、BP神经网络、RFC、CatBoost和LGBM)。
结论
作为中国秦巴山脉汉江盆地中具有独特地质灾害风险特征的典型河谷型城市,石泉县的地质灾害发生特征通过其空间分布和灾害频发环境的叠加得到了突出体现。为了深入分析研究区域内的地质灾害风险的空间差异模式和形成机制,本研究进行了……
作者贡献声明
沈琳娜:撰写——初稿。赵新阳:撰写——初稿。刘华军:撰写——初稿。胡胜:指导。张驰:撰写——审阅与编辑。张驰:撰写——初稿。
利益冲突声明
作者声明没有已知的财务利益或个人关系可能影响本文的研究工作。
致谢
本工作得到了陕西省关键科学技术计划[项目编号2025JC-YBMS-444]“从街区尺度空间行为互动角度研究碳排放和低碳更新的影响效应”的资助。