混合机器学习集成技术用于预测天然滑坡坝溃决的特征变量
《Engineering Applications of Artificial Intelligence》:Hybrid machine learning ensemble techniques for predicting characteristic variables of natural landslide dam outburst
【字体:
大
中
小
】
时间:2026年02月03日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
精准预测滑坡坝溃坝特征变量对制定应急计划至关重要。本研究提出融合改进斑鸠搜索算法(ISSA)和长短期记忆网络(LSTM)的混合模型,通过混沌初始化、柯西突变和 opposition-based learning 改进SSA优化LSTM超参数,有效克服传统方法预测精度低、计算效率差的问题。实验表明,ISSA-LSTM在合成数据集上平均RMSE为827.81,R2达0.58,NSE为0.41,较基础LSTM提升32.03%、25.96%和76.15%,在非线性关系建模和特征依赖捕捉方面表现优异。
宋晨光|姚雷华|华成雅
中国地质环境监测研究院(自然资源部地质灾害防治技术指导中心),北京,100081,中国
摘要
准确预测溃坝特征变量对于制定滑坡坝失事应急计划至关重要。为克服传统方法由于滑坡坝特征参数的非线性而导致的预测精度低和计算效率低的局限性,本文提出了一种结合长短期记忆网络(LSTM)和改进的雀搜索算法(ISSA)的新型滑坡坝溃坝特征变量预测模型。首先,将几种改进策略(包括混沌初始化(CI)、柯西变异(CM)和基于对立的学习(OBL)纳入基线雀搜索算法(SSA),并使用ISSA优化LSTM的超参数。利用合成生成的溃坝特征变量数据集对改进后的ISSA-LSTM混合回归模型进行了验证。对比模型包括独立的LSTM、通过其他元启发式算法调整的LSTM、支持向量回归(SVR)和反向传播神经网络(BPNN)。结果表明,ISSA-LSTM模型有效抵抗了局部最优解,并能够捕捉非线性关系,在预测能力上优于其他模型。在测试集上,其均方根误差(RMSE)、决定系数(R2)和Nash-Sutcliffe效率系数(NSE)分别为827.81、0.58和0.41,分别比基线LSTM提高了32.03%、25.96%和76.15%。
引言
滑坡坝是由于自然因素(如地震、强降雨)引发的山体崩塌、滑坡或泥石流堵塞河道而形成的堆积体(Chen等人,2022;Fan等人,2017)。这种堵塞常常在上游形成堰塞湖,对下游的生命和财产构成严重威胁。近年来,极端气候事件的频率增加导致此类自然坝体的形成更为频繁。通过广泛的文献回顾和案例汇编(Fan等人,2020;Wu等人,2021;Zheng等人,2021),建立了一个包含1561个滑坡坝案例的大规模数据库(Song,2025),如图1所示。滑坡坝寿命短暂,容易触发沿河道的灾害链(如崩塌、滑坡、泥石流),造成大规模破坏(Peng和Zhang,2012)。这些特性使其成为一种全球性的地质灾害。因此,模拟溃坝洪水对于量化水动力参数(如峰值流量、流速和冲击力)并实施有针对性的下游应急措施至关重要,从而减轻灾害风险。
现有关于溃坝洪水特征变量计算的研究主要依赖于经验公式(Froehlich,2016)、统计分析(Shan等人,2022)和数值模拟(Mei等人,2022)。经验公式和统计方法实施相对简单,但预测精度有限,对应急响应和灾害救援的实际价值有限。此外,由于时间、气候和地质结构等不确定因素,滑坡和多级坝的参数表现出非线性关系。因此,经验和统计预测模型无法捕捉多输入的高维特征,常常忽略变量之间的相互依赖性,导致泛化能力差。
相比之下,基于数值模拟的方法通常将溃坝过程分为两个阶段:溢流引起的坝体失效和沿河道的水流路径。这两个阶段通常分别使用溃坝洪水分析模型(Chen等人,2015)和洪水路径模型(Zhang等人,2024)进行建模。溃坝分析模型的输出作为路径模型的上游边界条件,用于估计峰值流量、流速和冲击力等特征变量。这种方法需要跨学科的专业知识,涵盖水动力学和泥沙输运,并考虑坝体失效过程中的复杂水土相互作用。然而,其计算密集型特性对硬件要求很高,且效率低下,导致运行时间过长,阻碍了应急响应。
近年来,随着数据驱动方法(Comas-González等人,2024;Patricia等人,2023;Urina-Triana等人,2024)的广泛应用,全球学者越来越多地从传统的知识驱动预测方法转向数据驱动模型(Gochhait等人,2021;Li等人,2023;Lin等人,2023)。然而,在预测滑坡坝溃坝特征方面的应用仍然相对较少。作为先进的循环神经网络(RNN)架构,LSTM克服了传统RNN的梯度消失问题,在时间序列预测方面表现出色(Li等人,2022)。其超参数配置对性能至关重要(Pandey,2024),通常通过群体智能算法进行优化。其中,SSA在优化能力和计算稳定性方面表现出色(Li等人,2020)。然而,基线SSA在训练后期常常收敛到局部最优解,导致欠拟合和精度下降。为了缓解这一限制,我们将Mao和Zhang(2021)的改进策略整合到SSA中,构建了一个改进的LSTM超参数优化器。所得到的多输入单输出混合模型在有效性和对基准模型的鲁棒性方面得到了验证。
本文结构如下:“材料与方法”部分介绍了LSTM和SSA的基本原理和改进策略,以及所提出混合模型的理论架构和操作方法。“案例研究”部分描述了溃坝特征变量数据集的构建细节和模型参数的具体设置。“结果”部分展示了所提出混合模型的有效性,并进行了对比分析。“讨论”和“结论”部分涵盖了分析结果、主要发现和未来工作。
小节片段
基线模型
本小节介绍了本研究中使用的两种基本算法:LSTM和SSA。
滑坡坝溃坝特征变量数据集的构建
鉴于许多国家在滑坡坝溃坝洪水研究方面的起步较晚,中国直到2008年汶川地震后才开始进行相关研究。因此,关于滑坡坝事件的完整参数数据记录有限,缺乏全面的案例数据库。为了解决这一限制,本研究使用了记录详尽的唐家山坝体失事及其后续唐家山-北川洪水演变数据集(Cui等人,2012;Fan等人)
消融实验分析
图5(a)展示了训练过程中的误差收敛曲线,其中LSTM训练阶段的最佳MSE被用作ISSA的适应度函数。总体而言,在适应度方面,ISSA-LSTM表现最佳,其次是CM-SSA-LSTM、OBL-SSA-LSTM和CI-SSA-LSTM。ISSA-LSTM的卓越性能证明了复合改进策略的科学有效性和有效性。就单一改进策略而言,柯西变异的贡献最大
讨论
本研究检验了所提出的ISSA-LSTM混合模型在滑坡坝溃坝特征变量预测方面的有效性。测试集误差指标表明,该模型结合了改进的参数优化器和LSTM的非线性映射能力,相对于基准模型具有更高的预测精度。具体来说,与基线LSTM相比,ISSA-LSTM的误差分别降低了34.69%、32.03%
结论
高精度的滑坡坝溃坝特征变量预测可以实现快速准确的灾害风险评估,并为下游应急救援决策提供基础和数据支持。本文首先构建了溃坝洪水的特征变量数据集。其次,为了解决标准SSA在训练后期倾向于收敛到局部最优解的问题
CRediT作者贡献声明
宋晨光:撰写——审阅与编辑,撰写——初稿,方法论,数据整理,概念化。姚雷华:撰写——审阅与编辑,监督。华成雅:软件,数据整理。
利益冲突声明
作者声明他们没有已知的可能影响本文工作的竞争性财务利益或个人关系。
致谢
本工作得到了中国国家重点研发计划(项目编号2023YFC3007203)、中国地质环境监测研究院研发基金(项目编号20250104)和河北省高等教育科学基金(ZC2025097)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号