利用异常检测和故障聚类技术实现无标记的螺丝驱动过程监控

《CIRP Annals》:Label-free monitoring of screw driving using anomaly detection and fault clustering

【字体: 时间:2026年05月11日 来源:CIRP Annals 3.6

编辑推荐:

  尼古拉·韦斯特(Nikolai West)|约亨·德乌斯(Jochen Deuse)|萨米·卡拉(Sami Kara)多特蒙德工业大学生产系统研究所(Institute of Production Systems, IPS),德国多特蒙德摘要工业螺丝驱动过程的质量控制通常依赖于监

  
尼古拉·韦斯特(Nikolai West)|约亨·德乌斯(Jochen Deuse)|萨米·卡拉(Sami Kara)
多特蒙德工业大学生产系统研究所(Institute of Production Systems, IPS),德国多特蒙德

摘要

工业螺丝驱动过程的质量控制通常依赖于监督式机器学习,这需要为每个过程变体提供标记好的故障示例,从而给实际应用带来高昂的成本障碍。本文提出了一种两阶段的无监督框架,能够在无需标记训练数据的情况下检测和分类故障。第一阶段采用过度敏感的异常检测方法以最大化召回率;第二阶段则利用已知正常参考样本进行时间序列聚类:仅包含故障的簇表示真实缺陷,而含有参考样本的簇则用于过滤误报。在涵盖5种故障类型的1457个工业操作中的验证实验中,该框架获得了82.3%的F1分数(77%的召回率、89%的精确度),这一性能接近监督式分类(86.6–88.7%),同时实现了无需标签即可部署并进行未知故障检测的目标。

章节摘录

背景

螺丝驱动过程中的质量控制有助于防止大批量生产中出现缺陷产品。传统的过程窗口方法需要丰富的校准知识,并且会在正常操作和故障操作之间产生重叠的边界,从而限制了检测的灵敏度。当有足够的标记训练数据时,机器学习(ML)方法能够实现超过95%的分类准确率[[1], [2], [3], [4]]。
然而,监督式ML方法面临三个主要挑战...

研究空白

现有的用于螺丝驱动质量控制的ML方法在标记数据集上表现出较高的准确率,但在跨不同变体应用及检测未知故障方面存在局限性。
在全面的标记数据集上进行训练时,监督式分类方法能够取得近乎最优的结果。支持向量机[1]、卷积神经网络[2]以及最近的研究对比[3], [4], [5]都成功地在受控实验中区分了已知的故障类型。

方法论

该框架通过顺序处理将召回率最大化与精确度恢复分开(见图1)。第一阶段使用过度敏感的异常检测方法将操作分为标记为异常的操作(NOK)和预测为正常的操作(OK);第二阶段对NOK子集进行聚类,并加入OK参考样本作为验证依据,通过二进制纯度规则过滤误报。这种设计体现了工业生产的优先考量:确保没有故障产品流入客户手中(第一阶段)...

验证

验证使用了PyScrew S04数据集,这是一个在真实生产系统中使用的工业螺丝驱动设备上记录的开源基准数据集,其公开发布旨在降低该领域研究的门槛[14]。

结论

本文提出了一种无需标记即可检测故障的两阶段框架,有效解决了监督式质量控制在实际应用中的部署难题。这种顺序架构通过过度敏感的异常检测实现召回率最大化,并通过基于参考的聚类来恢复精确度,从而避免了单阶段方法中固有的参数估计问题[5,9,10]。
在PyScrew基准测试中的验证结果显示,该框架在无需标记训练数据的情况下获得了82.3%的F1分数,优于...

数据可用性

支持本研究的相关代码和实现细节可在项目仓库中公开获取:https://github.com/nikolaiwest/2026-fault-detection-cirp。验证过程中使用了公开可用的PyScrew S04数据集[14]。

CRediT作者贡献声明

尼古拉·韦斯特(Nikolai West):撰写 – 审稿与编辑、撰写初稿、数据可视化、验证、软件开发、项目管理、方法论设计、概念构建。约亨·德乌斯(Jochen Deuse):撰写初稿、监督研究、资源协调、概念构思。萨米·卡拉(Sami Kara):撰写 – 审稿与编辑、撰写初稿、项目管理。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号