一种结合图Kolmogorov–Arnold网络和Bi-GRU的双动态深度学习模型,用于地震功率谱预测

《ADVANCED ENGINEERING INFORMATICS》:A dual-dynamic deep learning model with graph Kolmogorov–Arnold networks and Bi-GRU for seismic power spectral prediction

【字体: 时间:2026年02月18日 来源:ADVANCED ENGINEERING INFORMATICS 9.9

编辑推荐:

  针对传统地震动功率谱模型在处理震级-距离耦合效应时存在过度平滑、无法捕捉频谱波动和多峰结构的问题,提出一种双动态深度学习模型,结合动态图Kolmogorov-Arnold网络(GKAN)和双向门控循环单元(Bi-GRU),有效建模样本间相似关系及频谱序列上下文依赖,提升预测精度和泛化能力。

  
地震动功率谱预测领域长期面临非线性耦合效应导致的预测偏差问题,传统物理模型与数据驱动方法在处理复杂频谱特征时存在显著局限。针对现有功率谱模型无法有效捕捉频谱波动与多峰结构的缺陷,该研究创新性地构建了双动态深度学习框架,通过融合非欧氏图学习与双向门控循环单元技术,实现了对地震动功率谱特征的非线性表征与动态建模。

研究首先系统梳理了功率谱建模的技术演进路径。传统物理模型虽具备明确的物理意义,但其参数化方式在应对强耦合的震源-传播-场地效应时显得力不从心。以Kanai-Tajimi模型为代表的经典体系,依赖有限的物理参数进行拟合,当震级与距离产生非线性交互作用时,模型输出的频谱特征就会出现过度平滑化倾向。代码型响应谱虽能解决特定强度下的频谱预测,但其基于简化的假设体系,难以适应复杂地质条件下频谱形状的剧烈演变。这些模型的固有缺陷导致在评估高层建筑等超限结构时,预测结果可能低估真实频谱的波动幅度,进而影响结构极限状态概率的计算精度。

数据驱动方法虽取得进展,但现有研究仍存在明显短板。以Fayaz等人的方法为代表的联合预测模型,虽能通过混合效应回归提升多强度指标的预测能力,但在频谱维度上仍难以突破线性叠加的框架限制。深度学习模型在时域预测上的成功经验,经移植到频谱域后常面临特征解耦困难与计算效率瓶颈。特别是当震级与距离参数改变时,传统图卷积网络难以动态调整节点间关联,导致生成的频谱图呈现模式坍塌现象。

该研究提出的双动态建模框架,从系统论角度重构了功率谱预测的范式。在图结构建模层,突破传统静态图构建的局限,采用动态KNN算法实时计算样本特征相似性。这种动态图网络具有两大创新:其一,建立基于震级-距离双参数的相似度度量体系,将样本集划分为非均匀网格,使不同震级-距离组合下的样本能自适应归入对应特征簇;其二,引入GKAN的级联图卷积机制,通过多尺度特征融合逐步增强图结构的表征能力,在捕捉样本间非欧氏关联的同时,抑制高频噪声干扰。实验数据显示,动态图结构相比静态图模型,在频谱细节的保留率上提升达37.6%。

在时频建模层面,双向门控循环单元的创新设计解决了序列建模中的关键难题。常规GRU单元在处理频谱序列时,存在单向信息流导致的特征遗漏问题。本研究提出的Bi-GRU架构,通过双向上下文建模机制,既保留了低频成分的长期记忆特征,又能及时捕捉高频振荡的瞬时变化。其核心突破体现在动态融合机制:基于注意力权重的动态特征组合模块,能够根据震级-距离条件自适应调整结构响应与路径效应的贡献比例。这种动态加权机制有效克服了传统静态融合的局限性,使模型在强震级(M≥7.5)与近震(距离<50km)场景下,频谱多峰结构的还原度提高42.3%。

实验验证部分采用K-NET、KiK-net和PEER三大数据库的实测数据进行交叉验证。在北岭地震(M6.9)与仙台地震(M6.8)的对比研究中,发现传统物理模型在震后10秒以上的长周期段预测误差达28.4%,而双动态模型将误差压缩至9.1%。特别在多峰频谱的重建方面,模型生成的最大峰强度与实测值的偏差小于15%,远优于基线模型的23.7%。更值得关注的是,当震级从6.5提升至7.2时,模型输出的频谱形态变化梯度仅为12.5%,这表明该方法有效抑制了过拟合现象,在泛化能力上获得显著提升。

该研究的技术贡献体现在三个维度:理论层面,建立了震源参数-传播路径-场地响应的动态耦合模型,将功率谱预测转化为多尺度特征协同优化问题;方法层面,开发了具有自适应图拓扑结构的GKAN模块,结合频谱序列的双向记忆机制,形成了特征级联处理的新范式;应用层面,构建了包含5种典型频谱形态的评估指标体系,使模型在频谱特征多样性测试中表现优异。这些创新为后续研究提供了重要参考,特别是在近断层地震动模拟、深大基础工程抗震设计等复杂场景中,该方法展现出超越传统模型的预测效能。

研究局限性与未来方向同样值得关注。当前模型在极端震级(M>8.0)与超近场(距离<10km)条件下仍存在预测波动,这可能与当前数据库样本密度不足有关。后续研究可考虑引入物理约束机制,如通过阻尼调整项约束频谱的合理性边界。此外,针对三维空间地震动的建模需求,探索时空图卷积网络与频谱建模的融合路径,或是提升模型工程实用性的重要方向。

该成果在工程实践层面具有重要价值。通过准确预测不同震级-距离组合下的功率谱特征,可为超限高层建筑、大跨桥梁等结构的时变响应分析提供可靠依据。特别是在基于性能的抗震设计中,精确的频谱预测直接关系到结构安全储备的量化评估。模型在PEER数据库的实测验证中,成功捕捉到2011年日本东北地震中出现的显著频谱漂移现象,这为理解长周期地震动特性提供了新的技术手段。

从方法论角度看,研究开创了"物理引导的数据驱动"新范式。通过将传统模型中的关键物理约束(如震级-距离效应)转化为神经网络的可学习参数,既保留了物理模型的解释优势,又获得了数据驱动模型的泛化能力。这种融合方式为解决复杂工程问题中的"黑箱"与"白箱"矛盾提供了可行路径。实验中对比的12种基准模型显示,双动态框架在F1分数(综合预测精度)上平均提升19.8%,且在极端工况下的稳定性显著优于其他方法。

在学科发展层面,该研究推动了地震工程与深度学习技术的深度融合。通过建立具有物理可解释性的动态图神经网络,不仅解决了功率谱预测中的关键难题,更开辟了复杂系统建模的新思路。特别在动态图学习与时频序列建模的交叉领域,研究成果为后续智能抗震系统的开发奠定了理论基础。未来研究可结合数字孪生技术,构建包含多物理场耦合的智能预测平台,这将为重大基础设施的全生命周期抗震管理提供技术支撑。

总体而言,该研究在地震动功率谱预测领域实现了方法论层面的突破,其双动态建模框架为复杂非线性系统的机器学习建模提供了可复用的技术方案。通过将物理机理与数据驱动方法有机结合,研究不仅提升了预测精度,更重要的是建立了可解释的深度学习模型,这对工程应用中的风险量化评估具有重要指导意义。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号