基于AI增强的火灾后土壤水力传导率建模方法:应用于不同环境梯度下的地质灾害评估

《Reliability Engineering & System Safety》:AI-Augmented Modeling of Post-Fire Soil Hydraulic Conductivity Across Environmental Gradients for Geohazard Assessment

【字体: 时间:2026年03月01日 来源:Reliability Engineering & System Safety 11

编辑推荐:

  火灾后土壤渗透率变化对地质灾害的影响及生成式AI辅助数据建模研究。摘要:通过整合多地区火灾前后土壤渗透率实测数据,构建了包含植被类型、土壤质地和燃烧强度的综合数据库。采用六种生成模型(Copula、GAN、VAE等)生成合成数据,并评估其分布保真度、跨模型预测能力及抗记忆化特性。研究表明,VAE及改进模型在保持数据分布特性的同时,能有效提升下游灾害模型(如坡面稳定性分析)的预测精度,尤其在处理稀疏样本组时表现突出。

  
杨浩清 | 法尔希德·瓦赫迪法尔德
塔夫茨大学土木与环境工程系,美国马萨诸塞州梅德福德,02155

引言

野火会深刻改变近地表土壤的水力和机械行为。土壤的水力传导性是影响火灾后地质灾害(如泥石流、浅层滑坡和山洪暴发)的最关键因素之一[[1], [2], [3]]。野火导致的土壤结构、孔隙连通性和表面封闭性的变化会显著改变水分渗透模式和径流路径[[4], [5], [6], [7]]。在燃烧过程中,挥发性有机物会在较冷的颗粒上凝结形成疏水膜;随后的降雨会引发雨滴冲击、飞溅和灰烬冲刷,从而封闭孔隙并促进结壳。这些过程降低了土壤的渗透性,增加了超量径流。而亲水区域、炭化根系形成的大孔隙或多孔灰烬则可能在局部增加渗透性,并使径流沿疏水层集中流动。因此,火灾后的土壤破坏情况受土壤水力传导性的时空变化控制,这些变化影响着降雨渗透、地表径流生成以及山坡内的孔隙压力发展[[8], [9], [10], [11]]。 大量现场调查记录了不同气候、植被类型和土壤质地条件下火灾后土壤水力特性的变化,其变化范围从显著降低到偶尔增加[[12], [13], [14], [15], [16], [17]]。以往的研究综合了这些现象以及测量尺度和方法的影响。Neary [18]研究了不同火灾严重程度下森林、林地和草地土壤的水力传导性变化范围。Ebel & Moody [19]比较了未燃烧、燃烧后及灰烬覆盖层的土壤水力特性和渗透时间尺度,展示了火灾如何改变渗透过程。Ebel [20]汇总了火灾后的现场饱和度测量数据,并强调了测量方法和尺度的影响。Acevedo等人[21]评估了数据可用性和土壤传输参数估算对火灾影响土壤中水流模拟的影响。总体而言,这些研究表明不同因素(如火灾严重程度、土壤质地)会导致水力特性的巨大差异,因此需要分层分析而非整体分析。火灾前后水力传导性的比值常被用来表征变化情况,但配对采集的火灾前后饱和度数据及其相关分类变量仍然稀缺、不均匀且不平衡。此外,获取此类数据需要大量资源。配对采样要求在火灾后迅速进行多次采样,覆盖多个季节甚至多年,同时需要考虑访问权限、安全问题以及火灾严重程度和土壤/植被层次的覆盖情况。因此,大多数记录都是特定地点的,配对观测数据较少,不同属性的覆盖也不均衡。这种数据稀缺性会反映在灾害模型中。许多研究[[22], [23], [24], [25]]指出,渗透能力和火灾后恢复的参数估计往往具有较高方差和偏差,模型校准通常受到方法选择的限制,并且对径流阈值、孔隙压力变化及安全系数的预测存在较大的不确定性。 传统的统计方法(如插补、简单汇总或基本概率建模)可能无法捕捉水力传导性与其他属性之间的高阶联合依赖性,也无法揭示分层建模所需的潜在结构。数据驱动的生成模型提供了一种补充途径[[26], [27], [28]]。它们可以通过有限观测数据生成物理上合理的合成样本,从而在实地测量数据稀缺时补充罕见的数据组合,同时保留变量间的潜在结构。实际上,真实的合成数据表有助于量化渗透和孔隙压力的不确定性,验证早期预警阈值,并进行缓解设计的敏感性分析。然而,这些方法的有效性取决于其准确性(能否再现真实分布和相关性)、实用性(在合成数据上训练并在真实数据上测试时的表现)、对罕见群体的覆盖能力,以及泛化能力(能否超越训练集)。
由于缺乏火灾前后水力传导性的配对测量数据,这成为描述不同环境梯度下火灾后变化的重要限制。本研究的主要目标是利用生成式人工智能算法和精心整理的火灾前后水力特性测量数据集,来补充稀疏的观测数据,并生成这些梯度上的真实合成水力传导性数据对。为此,评估了概率和机器学习生成器在无需记忆训练数据的情况下生成保持原始分布和变量间依赖性的合成水力传导性表格的能力。通过“在合成数据上训练/在真实数据上测试”(TSTR)实验,从分布准确性、下游预测能力、罕见群体行为和记忆风险等方面评估模型性能。最后,量化了合成样本量对结果的影响,并通过基于物理的边坡稳定性模型检验了合成水力对比对火灾后地质灾害分析的启示。
我们的工作流程如下:首先整理火灾前后水力传导性的配对数据,并将真实数据分为训练集和测试集。然后使用多种生成模型生成合成数据表,并通过TSTR协议评估其准确性、记忆性和下游实用性。最后,将合成水力对比结果应用于边坡稳定性分析,以量化其可靠性相关指标。这一流程不仅适用于火灾后的水力传导性研究,也可应用于其他具有有限且不均匀测量数据的岩土工程问题,如降雨引发的滑坡、泥石流阈值和大坝安全监测,其中基于可靠性的决策依赖于不确定性及极端情况。

火灾前后水力传导性测量数据库

为了构建用于合成数据生成的全面数据集,我们汇总了经过同行评审的研究中关于燃烧和未燃烧土壤的饱和水力传导性测量结果(表1)。大多数来源研究还报告了植被类型、土壤质地和火灾严重程度,这些信息可作为分类变量纳入模型。正如这些研究所表明的,包含这些属性对于灾害建模至关重要,因为火灾后水力传导性的变化...

合成数据生成

我们使用六种模型生成合成样本:(i) Copula模型,(ii) GAN模型,(iii) VAE模型,(iv) Copula + GAN模型,(v) 带有采样修复功能的混合VAE + GAN模型,以及(vi) 专家混合模型(MoE),后者能够为每个分类组自动选择最佳生成器。模型包含五个变量:两个数值变量(lnK_b和lnK_u)和三个分类变量(植被类型、土壤质地、火灾严重程度)。
Copula模型作为基线模型,因为它代表了经典的...

评估指标

本研究从三个与工程可靠性直接相关的维度评估合成数据的质量:(i) 准确性,即合成数据再现真实分布和依赖性的能力;(ii) 实用性,评估在合成数据上训练的模型能否泛化到真实数据;(iii) 记忆性,即相似性是源于学习到的结构还是直接复制。

数据库的描述性统计

图1总结了汇总数据集中燃烧与未燃烧土壤饱和水力传导性对数比(ln(K_b)/ln(K_u)的分布。该分布明显不对称,大部分观测值位于零以下:约70%的观测值为负,30%为正,表明火灾后的水力传导性通常降低而非增加。双组分高斯混合模型能够简洁地描述这种异质性。

合成样本量的尺度效应

图11研究了合成训练集的大小(表示为N_syn/N_real)对TSTR协议下准确性和下游实用性的影响。研究表明,当N_syn/N_real从1增加到约3时,分布相关性迅速提高,之后增长放缓。专家混合模型(MoE)达到了最高的相关性...

结论

本研究编制了一个跨站点的火灾前后水力传导性配对数据集,并评估了六种单表生成器(Copula、GAN、VAE、Copula+GAN、VAE+GAN、MoE)在准确性、合成数据训练/真实数据测试(TSTR)实用性、罕见群体行为和记忆性方面的表现。总体而言,VAE(以及当允许额外模型复杂性时的VAE+GAN/MoE)在统计准确性和下游预测性能之间取得了最佳平衡...

数据声明

数据可应要求提供。

CRediT作者声明

杨浩清:方法论、可视化、验证、正式分析、数据整理、原始草稿撰写; 法尔希德·瓦赫迪法尔德:概念构思、撰写与编辑、监督、项目管理、资金获取。

资金来源

本研究得到了美国农业部(NIFA)的支持(项目编号2021-67022-35908)。

生成式AI使用声明

作者仅使用ChatGPT-5进行语言润色。作者已审查并编辑了输出内容,对出版物的内容负全责。

CRediT作者贡献声明

杨浩清:撰写——原始草稿、可视化、方法论、数据分析、数据整理; 法尔希德·瓦赫迪法尔德:撰写与编辑、监督、项目管理、资金获取、正式分析、概念构思。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号