基于SwinT-MSSCC特征融合的滚动轴承智能故障诊断方法——适用于小样本情况

【字体: 时间:2026年03月11日 来源:Expert Systems with Applications 7.5

编辑推荐:

  提出基于SwinT-MSSCC特征融合的小样本滚动轴承故障诊断模型,结合自适应交叉熵损失和云边协作框架,实验表明在0.1比例样本下仍保持93%以上准确率。

  
滚动轴承作为旋转机械的核心部件,其状态直接决定设备运行的安全性、稳定性和经济性。在高速持续运转过程中,轴承会因温度变化、磨损、冲击等因素导致性能逐步劣化,最终引发故障。这类故障可能造成设备非计划停机、生产损失甚至人身安全隐患,因此开发高精度、强鲁棒性的轴承故障诊断方法具有重要工程价值。当前研究面临两大核心挑战:其一,实际工况中正常状态样本易获取而故障样本稀缺,导致模型训练数据分布失衡;其二,工业现场普遍存在高强度噪声干扰,容易掩盖故障特征信号。针对这两个关键问题,本文提出一种融合全局自注意力机制与多尺度自适应卷积的特征融合诊断框架,并构建云端协同的实时诊断系统,为解决小样本高噪声场景下的轴承故障诊断难题提供了创新性方案。

研究首先系统梳理了现有技术路径的局限性。传统方法多采用单一特征提取网络,如纯CNN架构虽然具备局部特征捕捉能力,但固定卷积核难以适应不同尺度故障特征;而纯Transformer模型虽能有效建模全局依赖关系,但在小样本条件下容易因信息不足导致特征表达能力下降。针对这种结构性缺陷,本文创新性地设计双通道并行架构:SwinT分支通过动态自注意力机制提取轴承振动信号的全局时空关联特征,MSSCC分支采用多尺度可校准卷积提取局部纹理特征。这种互补式特征融合机制突破了传统单通道模型的性能瓶颈。

在SwinT分支优化方面,重点解决了Transformer模型在时频域特征提取中的效率与精度矛盾。通过引入双池化瓶颈注意力模块(DPBAM),该模块在常规的Shifted Window策略基础上,增加了对特征图进行分层次池化的预处理步骤。这种设计既保留了自注意力机制的全局建模优势,又通过多尺度特征聚合增强了弱信号提取能力。实验表明,该模块可将故障特征提取效率提升40%,同时将误报率降低至5%以下,显著优于传统Transformer架构。

多尺度自校准卷积(MSSCC)分支针对小样本条件下的特征适应性不足问题,开发了动态可调节的卷积核体系。该分支通过引入三个关键创新:首先,设计可变膨胀因子的深度可分离卷积层,在保持计算效率的同时增强对周期性故障特征(如不对中、偏心等)的捕捉能力;其次,建立基于残差校正的特征校准机制,通过自适应调整各尺度卷积核的权重系数,有效抑制工业噪声对特征空间的干扰;最后,采用动态池化策略实现多分辨率特征融合,使模型能同时捕捉高频瞬态特征和低频趋势特征。实验数据证明,该分支在噪声强度超过15dB时仍能保持92%以上的故障识别准确率。

模型架构的核心突破在于构建了全局-局部协同的特征表达体系。SwinT分支通过分层自注意力机制建立跨时间窗的全局关联,特别在轴承跑内圈、外圈复合故障场景中,能准确识别相位差异小于0.1秒的微弱信号。MSSCC分支则通过三级可扩展卷积核(3×3、5×5、7×7),实现了对局部纹理特征的渐进式细化捕捉。实际应用中,该双通道并行结构可使特征融合效率提升35%,在仅有0.1%故障样本(对应训练集占比)的情况下,仍能保持93%以上的诊断准确率。

针对小样本训练中的过拟合问题,本文创新性地设计了自适应交叉熵损失函数(ACE)。该损失函数通过动态调整不同类别样本的权重系数,重点强化对困难样本的训练力度。具体实现时,系统根据每帧信号的置信度指数(0-1连续值),对置信度低于0.7的样本自动提升权重,使模型更关注边界模糊的故障模式。实验对比显示,ACE损失函数可使模型在α=0.1(训练样本量仅为全数据集的10%)条件下的泛化误差降低28%,同时将误检率控制在3%以内。

在工程部署层面,构建的云端协同诊断框架(CEC)具有显著创新价值。边缘端部署轻量化模型版本(参数量压缩至原规模的1/5),可在200ms内完成单帧振动信号的预处理和初步诊断;云端负责模型训练、知识迁移和全局数据管理。通过动态任务卸载算法,系统可根据实时负载自动调整计算资源分配比例。实际测试表明,该框架在2000rpm转速下可实现毫秒级响应,误报率低于2%,同时满足每秒120帧的采样频率要求。

实验验证部分采用德国帕德博尔恩大学提供的标准轴承数据集(包括12种典型故障模式),结合自主搭建的故障模拟平台(可精确控制转速0-5000rpm、负载0-30%动态变化)。对比实验选取了ResNet-50、Transformer-XL、 capsNet等6种基准模型,在α=0.1、0.3、0.5三个小样本强度条件下进行测试。结果显示,当训练样本占比仅为0.1时,SwinT-MSSCC模型仍保持93.2%的平均准确率,较次优的 capsNet模型提升17.4个百分点。在噪声抑制方面,当环境噪声功率谱密度超过正常信号3倍时,该模型仍能保持85%以上的故障识别率,显著优于传统CNN基模型。

研究还特别设计了鲁棒性增强机制。在特征提取阶段,通过构建时频域联合补偿矩阵,将信号预处理阶段的信噪比提升至28dB以上;在模型训练阶段,采用迁移学习框架将工业电机数据集的预训练模型迁移到轴承诊断场景,使模型收敛速度提升60%;部署阶段则引入动态阈值调整机制,可根据实时监测的设备工况自动优化诊断参数。

该技术方案已成功应用于山西某煤矿机械制造厂的采煤机传动系统。实际运行数据显示,系统在连续2000小时的高强度工况下,故障识别准确率达94.7%,误报率仅1.2%,诊断延迟控制在150ms以内。相较于传统离线诊断系统,该方案使预防性维护周期从180天延长至450天,单台设备年维护成本降低约12万元。同时,通过建立云端诊断知识库,实现了故障模式的自动迁移和更新,系统对新出现的复合型故障(如内外圈同时磨损)的诊断准确率仍保持在89%以上。

研究工作对工业界的启示在于:小样本条件下的故障诊断需突破单一特征提取的局限性,通过融合不同层次的特征表达方式(如全局注意力与多尺度卷积)构建互补式诊断体系;同时,工程部署必须兼顾实时性和可扩展性,云端协同框架能有效平衡边缘计算资源限制与云端计算能力优势。未来研究将重点拓展多物理场耦合诊断能力,并探索在新能源发电设备(如风电主轴轴承)等领域的应用适配。

该创新方法的应用价值体现在三个方面:其一,通过双通道特征融合机制,使模型在样本量不足时仍能保持高诊断精度;其二,可校准的卷积结构有效抑制了工业噪声的干扰;其三,云端-边缘协同架构实现了实时诊断与远程管理的有机结合。这些技术突破为解决智能制造中的设备健康管理提供了新范式,特别是在轴承类旋转机械的预测性维护领域,预计可使故障平均发现时间从72小时缩短至8小时以内。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号