使用动态核注意力增强型CNN-CapsNet对单通道和多通道微地震信号进行分类

《International Journal of Rock Mechanics and Mining Sciences》:Single- and multi-channel microseismic signal classification using dynamic-kernel attention-enhanced CNN-CapsNet

【字体: 时间:2026年02月21日 来源:International Journal of Rock Mechanics and Mining Sciences 7.5

编辑推荐:

  微地震信号分类中提出动态核注意力增强的CNN-CapsNet融合框架DKECAlexCapsNet,通过动态核高效通道注意力模块实现低计算复杂度下的多尺度特征增强,结合AlexNet局部特征提取和CapsNet空间语义建模,在8000个单通道波形数据(含噪声增强)上验证,单通道准确率98.81%,多通道达99.29%,显著优于基线模型且计算成本可控。

  
马凯|徐金鑫|王凯凯|刘海阳|王子明
中国辽宁省大连理工大学海岸与海洋工程国家重点实验室,116024,大连

摘要

微震(MS)监测是确保岩石工程安全的关键技术。然而,大量的噪声干扰和手动信号识别的低效率阻碍了高识别精度和实际应用。为了解决多通道、多类MS信号分类中的这些问题,我们提出了DKECAlexCapsNet:一种动态核注意力增强的CNN-CapsNet融合框架。该模型结合了AlexNet的局部特征提取能力和CapsNet的空间语义建模能力,并引入了三阶段动态核高效通道注意力(DKECA)模块以实现多尺度特征增强。DKECA模块在低计算成本下自适应生成卷积核,从而提高了多尺度感知和区分性特征表示。实验使用了8000个单通道波形数据(每类2000个),其中仅对训练子集中的MS和爆破波形应用高斯噪声增强,以实现类别平衡。所提出的模型在单通道和多通道情况下的准确率分别达到了98.81%和99.29%,在准确率、精确度、召回率和F1分数方面显著优于基线模型,同时保持了相对较低的运行时间、参数和FLOPs。单通道变体在受控合成噪声条件下表现出较强的鲁棒性,而多通道模型在高质量通道选择下有效捕捉了传感器间的依赖性并提高了识别能力。消融研究进一步检验了DKECA模块的贡献,误分类分析揭示了关键特征偏差。总体而言,所提出的模型具有高分类精度和稳定的性能,展示了其在MS信号处理和分析中的潜力。

引言

微震(MS)信号是由岩体内部应力积累和局部断裂产生的弹性波形,能够捕捉断裂传播、能量释放和应力传递过程。它们在地质勘探、深隧道和采矿安全监测、边坡稳定性评估以及水电基础设施的结构健康监测中发挥着重要作用。1, 2, 3, 4 准确且高效的MS信号识别对于评估岩体稳定性和提供早期地质灾害预警至关重要。5, 6 然而,现场环境通常会引入强噪声和非平稳特性,手动解释既耗时又不适合大规模实时监测,因此迫切需要自动化和鲁棒的分类技术。7, 8
早期关于MS事件分类的研究主要依赖于手动识别和特征工程。研究人员通常提取地震源参数(如地震矩、能量、静态应力降和表观应力)来支持信号识别任务。9, 10 然而,这些方法严重依赖专家知识,并且经常受到操作复杂性和实时性能不佳的限制,这限制了它们在需要快速、准确和自动化识别的现场场景中的应用。为了解决这些挑战,研究人员开始探索利用原始波形数据的时间频率特性进行MS信号分类。11, 12, 13 例如,Pu等人14选择了六个MS监测特征来平衡特征丰富性和参数简洁性,并系统评估了十个机器学习模型的性能。Duan等人15从原始地震信号中提取统计特征,并证明DCNN的性能优于其他机器学习模型。尽管减少了对手动分析的依赖,但这些方法在面对复杂地质环境、大规模数据集和多通道混合信号时,在特征表示的鲁棒性和模型泛化能力方面仍然有限。深度学习的最新进展确立了卷积神经网络(CNN)作为MS信号识别的主要方法,利用了它们的端到端特征学习能力。16, 17, 18 Perol等人19提出了ConvNetQuake模型,该模型检测到的地震事件数量是原始目录的17倍以上,标志着CNN在地震检测应用中的突破。随着网络架构的发展,研究人员开始结合更复杂的模型和注意力优化策略来提高分类性能。20, 21 例如,Tang等人22引入了ResSCA,这是一种结合残差连接和深度空间通道注意力模块的新架构。在这些发展的基础上,研究前沿已经扩展到多模型融合、多模态输入和抗噪声架构。23, 24 例如,He等人25提出了UACNET,这是一种无需预处理即可自动进行MS信号分类的深度模型。Zhang等人26和Jin等人27分别通过提出基于多模型融合和注意力机制优化的解决方案进一步提高了分类精度。此外,迁移学习、28 Conv-LSTM-Unet多模型融合架构、29以及自监督对比学习范式30的研究不断扩展了深度学习模型在MS信号分类中的应用范围。
尽管这些研究在准确性和鲁棒性方面取得了显著进展,但仍存在几个关键挑战需要解决。现有的基于CNN的模型依赖于固定的感受野,而广泛使用的注意力机制31, 32, 33, 34采用静态通道加权,这不适合MS波形的非平稳特性。此外,大多数研究使用单通道输入,而许多架构的计算复杂性较高,限制了它们的现场应用。36, 37 总体而言,这些限制汇聚成一个统一的研究空白:现有架构无法同时为原始MS信号提供自适应核通道注意力、多通道融合以处理传感器间的空间相关性,以及适合工程应用的多类识别。为了解决这一空白,本研究提出了一种动态核注意力增强的CNN-CapsNet融合框架,称为DKECAlexCapsNet。使用来自东庄水利工程的全面现场收集的数据集来开发和评估该模型的单通道和多通道变体。本研究的主要贡献如下:
  • (1)
    设计了一种动态核高效通道注意力(DKECA)模块,该模块在低计算成本下自适应生成动态核,提高了原始一维MS波形的多尺度感知和区分性特征表示。
  • (2)
    开发了一种混合AlexNet-CapsNet架构,并实现了单通道和多通道变体,结合了局部特征提取和空间语义建模,以明确捕捉现场应用所需的传感器间和多通道特征。
  • (3)
    通过包括针对多种基线方法的基准测试、在不同分类性能指标和计算成本指标下的鲁棒性评估、隔离DKECA模块贡献的消融研究以及误分类分析,展示了所提出框架的有效性。
  • 工程背景

    东庄水利工程位于中国陕西省咸阳市,地处泾河下游峡谷的出口段(详见图1)。这是一个国家级重点水利项目,集防洪和减少沉积物、城乡供水、水电发电和生态恢复于一体。该工程包括大规模的土石坝和复杂的地下洞室系统。

    方法

    为了解决MS监测环境中强噪声干扰、手动识别效率低下以及现有方法的局限性,提出了一种动态核注意力增强的CNN-CapsNet融合框架DKECAlexCapsNet,用于多通道和多类MS信号分类。该模型整合了AlexNet模块进行局部特征提取、CapsNet模块进行空间语义建模,以及DKECA模块来增强注意力。

    性能评估

    为了全面评估所提出的DKECAlexCapsNet的性能,首先在测试集上评估了单通道分类结果。测试集的最终混淆矩阵如图8(a)所示,相应的分类结果标签如图8(b)所示。随后,应用t分布随机邻居嵌入(t-SNE)进行降维和二维可视化。

    讨论

    本节对误分类的MS样本进行了全面分析,重点关注不同模型、不同信噪比(SNR)和时频域特征。随后进行了消融研究,以进一步检验DKECA模块对整体分类性能的贡献。最后,讨论了本研究的局限性和未来研究的方向。

    结论

    为了满足MS信号分类的工程需求并克服现有方法的局限性,本研究提出了DKECAlexCapsNet,这是一种针对单通道和多通道MS波形识别的动态核注意力增强CNN-CapsNet框架。所提出的模型在单一站点(东庄水利工程)的数据下进行了控制实验条件的评估。主要结论如下:
  • (1)
    动态核
  • CRediT作者贡献声明

    马凯:撰写——原始草稿,监督,方法论,资金获取。徐金鑫:撰写——原始草稿,软件,方法论,数据管理。王凯凯:撰写——审阅与编辑,可视化,软件,资金获取。刘海阳:撰写——审阅与编辑,可视化,软件。王子明:撰写——审阅与编辑,可视化,监督,软件。

    利益冲突声明

    作者声明他们没有已知的可能影响本文工作的竞争性财务利益或个人关系。

    致谢

    本工作得到了国家自然科学基金(项目编号:52379098)、星燎人才计划(项目编号:XLYC2203008)和辽宁省科技计划项目(项目编号:2025JH2/101900011)的支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号