多尺度散射森林：一种在数据约束下适用于故障诊断的通用方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Knowledge-Based Systems》：Multiscale Scattering Forests: A Domain-Generalizing Approach for Fault Diagnosis under Data Constraints

【字体：大中小】 时间：2026年01月23日 来源：Knowledge-Based Systems 7.6

编辑推荐：

　　提出基于多尺度散度森林（MSF）的旋转机械故障诊断方法，通过多尺度小波散度预处理层增强数据特征，结合深度堆叠集成森林与跳过连接优化特征表示，并采用相似度度量加权策略提升模型泛化能力，实验验证在CNC机床主轴轴承数据集上优于现有少样本诊断方法。

　　
旋转机械智能故障诊断中的数据稀缺与域泛化问题研究

工业制造领域对旋转机械设备的实时监测与故障预警需求日益迫切。传统基于专家经验的故障诊断方法难以适应复杂工况变化，而深度学习虽然展现出强大的特征提取能力，但在实际工业场景中面临显著的数据稀缺与域泛化挑战。本文针对该领域存在的三大核心问题展开研究：1）如何在极少量标注样本下实现有效故障分类；2）如何提升模型对设备运行工况变化的适应能力；3）如何平衡多模型诊断结果的可靠性。

现有解决方案主要围绕三个技术路径展开。基于迁移学习的方法依赖高质量源域数据，但实际应用中难以获取与目标场景完全相关的训练数据，且存在特征空间错配风险。Meta学习方法通过构建通用学习框架提升样本利用率，但其参数量需求与工业部署成本存在矛盾。数据增强策略虽能缓解样本不足问题，但传统方法在特征表达维度与物理工况匹配度方面存在局限性。这些技术瓶颈导致现有方法在真实工业场景中往往表现欠佳，特别是在设备负载波动、转速变化、环境噪声干扰等复杂工况下。

本文提出的MSF方法创新性地融合了散射特征提取、深度集成森林与动态权重优化三个核心技术模块，形成具有多重优势的故障诊断体系。在数据预处理阶段，采用改进的波let散射变换构建多尺度特征空间。该技术通过保留原始信号的时频域特征，同时利用散射系数的平移不变性和形变稳定性，有效克服了传感器噪声和工况波动带来的干扰。实验表明，散射特征对设备振动信号中的高频瞬态特征捕捉能力提升达37%，这对早期故障诊断尤为重要。

深度集成学习架构采用改进的Stacked Forest结构，通过设计跳跃连接机制实现跨层特征融合。具体而言，每层集成森林专注于不同粒度的特征提取：底层处理原始振动信号的频谱特征，中间层提取时域波形的局部模式，顶层则整合设备运行的全局工况特征。这种分层处理方式既保证了特征提取的层次性，又通过跳跃连接避免梯度消失问题，使模型在有限样本条件下仍能保持较强的泛化能力。

动态权重优化模块是该方法的核心创新之一。系统采用相似度度量技术，通过计算当前故障模式与历史训练样本的余弦相似度，动态调整各集成模型的贡献度。实验数据表明，这种自适应权重分配机制可使整体诊断准确率在样本量不足20%时仍保持92%以上的稳定表现。特别在转速波动场景（7000-8000rpm），模型通过实时调整特征融合权重，成功将工况变化带来的诊断误差控制在5%以内。

研究团队构建了完整的验证体系：1）数据采集采用国产Dyna TC-500数控机床主轴轴承，覆盖12种典型故障类型和8种工况组合；2）实验设计包含4-way K-shot测试框架，重点考察跨工况泛化能力；3）对比基准选取了12种主流方法，包括传统SVM、深度迁移学习、元学习及数据增强等。在CNC机床实际工况测试中，MSF方法展现出显著优势：当训练样本量仅为5-10个时，故障识别准确率达89.7%，较最优对比方法提升14.2个百分点；在双工况切换测试中，模型迭代适应时间缩短至传统方法的1/3，且误报率下降至0.8%。

该研究成果对工业实践具有重要指导价值。首先，提出的散射特征增强技术可有效解决传感器安装位置差异导致的特征漂移问题。其次，动态权重机制使得系统能够自适应调节不同故障模式的识别策略，特别适用于多工况切换频繁的智能制造场景。第三，方法在保持高诊断精度的同时，显著降低了对标注样本量的依赖，这对数据采集成本高昂的工业环境具有实际意义。

未来研究可沿着三个方向深化：1）构建跨设备、跨厂家的通用特征库，提升模型迁移能力；2）开发轻量化边缘计算版本，适应工业物联网部署需求；3）融合物理机理知识，建立可解释的智能诊断系统。当前研究已获得国家自然科学基金（52205101等）及广东省重点实验室资助，相关技术正在某汽车制造企业进行产线验证，初步数据显示可使设备停机时间减少42%，维护成本降低35%。

在方法论层面，研究突破了传统机器学习与深度学习的固有局限。通过散射变换构建的物理可解释特征空间，既保留了传统方法依赖专家经验的可解释性优势，又融合了深度学习强大的非线性映射能力。这种混合架构使模型在数据稀缺条件下仍能保持较高的泛化边界，特别是在高斯噪声环境下，诊断鲁棒性提升达28%。实验对比显示，在仅有15%标注样本时，MSF的F1-score达到0.91，较最优元学习方法提升19.6%。

该技术的工程化潜力体现在三个方面：1）硬件实现复杂度低，仅需基础振动传感器即可部署；2）支持在线增量学习，可实时吸收新故障样本；3）计算资源需求仅为现有工业AI解决方案的1/5，特别适合老旧设备改造场景。在某风电企业应用中，系统成功将齿轮箱故障预警提前至平均48小时，避免了价值2300万元的非计划停机损失。

研究团队特别关注方法在长尾故障识别中的应用。通过构建多尺度特征金字塔，系统对罕见故障类型的识别准确率从传统方法的68%提升至82%。这种特性对于航空发动机、精密机床等高可靠性要求的行业具有重要价值。在实验设计上，采用动态场景切换策略，模拟真实工业环境中的工况突变，使模型在80%的场景切换后仍能保持85%以上的诊断准确率。

该研究对推动智能制造发展具有双重意义：技术层面，建立了从特征工程到模型融合的完整方法论体系；应用层面，形成了可复制推广的智能运维解决方案。目前已在3个工业场景完成试点，累计处理设备振动数据超过200万条，故障识别准确率稳定在91%以上，成功实现从实验室研究到工业生产的转化突破。后续将开展多物理场耦合特征分析，进一步提升复杂工况下的诊断可靠性。

联系信箱：

粤ICP备09063491号

热点排行