具有频率感知能力的全球-局部选择性注意力网络,用于激光焊接点检测

《Neurocomputing》:Frequency-aware and global-local selective attention network for laser welding spot detection

【字体: 时间:2026年03月02日 来源:Neurocomputing 6.5

编辑推荐:

  激光焊接点检测中,针对小尺寸焊点、模糊边界和复杂光照问题,提出FGSNet框架。该框架通过通道 shuffle卷积保留浅层纹理,全局-局部门控注意力平衡语义与局部结构,自适应多尺度特征融合对齐表征,结合小波自注意力模块增强高频边缘细节,最终实现高效精确的分割检测。实验表明其IoU达84.19%,F-score91.41%,优于传统方法。

  
龚玲|张帆|段连|赵玉倩|段建
中南大学精密制造极端服役性能国家重点实验室自动化学院,中国长沙410083

摘要

激光焊接技术在高精度制造中起着关键作用,然而,微小的焊点尺寸、模糊的边界以及剧烈的光照变化等问题始终影响着检测的可靠性。为了解决这些问题,本研究提出了FGSNet,这是一种高效的分割框架,旨在通过统一的特征交互策略来提升激光焊接点的识别能力。FGSNet将五个互补的组件整合到一个连贯的流程中。在特征编码阶段,通道混合卷积模块被用来有效保留细粒度的浅层纹理,而全局-局部门控注意力模块则通过平衡全局语义和局部结构线索来协同过滤背景干扰。为了缓解尺度变化,自适应多尺度特征融合模块执行强大的跨层交互,以保持结构的一致性。为了解决边界模糊的问题,引入了频率感知的细化策略通道混合注意力融合模块,在解码器中加入小波自注意力模块,明确利用小波变换来强化高频边缘细节。通过这种协调机制,FGSNet逐步细化了不规则焊接点的纹理、语义、多尺度和频率信息。在工业激光焊接数据集上的实验表明,FGSNet的IoU达到了84.19%,F分数达到了91.41%,在复杂光照条件下的边缘保留和鲁棒性方面优于主流方法。

引言

激光焊接技术以其高精度、高效性和适应性而闻名,广泛应用于航空航天、汽车和电子等行业[1]。与传统的方法(如电弧焊或电子束焊)相比,激光焊接具有精确的热控制能力,减少了缺陷。然而,焊接点通常很小、形状不规则,并且容易受到复杂成像条件的影响[2],这使得自动检测变得具有挑战性。缺陷如弱焊点、气孔、裂纹和穿透不足[3],[4]会显著影响部件的机械强度。传统的检测方法(如机器视觉[5]、声发射和红外热成像[6])在速度、准确性和对复杂环境的鲁棒性方面存在局限性。来自照明变化和反射表面的不均匀照明进一步降低了检测精度。
深度学习的快速发展为激光焊接点检测带来了有希望的解决方案。卷积神经网络(CNN)以其强大的特征提取能力而闻名,在这一领域取得了显著的成功[7]。UNet架构通过其多尺度特征融合机制,在检测小尺度激光焊接点方面表现出高精度[8]。CycleGAN通过生成器和判别器之间的对抗训练,即使在没有配对数据的情况下也能生成与真实图像风格相似的伪样本,从而丰富了数据集的多样性并提高了模型的泛化能力[9]。ResNet通过利用残差连接进一步增强了网络的稳定性,并有效地捕捉了激光焊接点区域的边缘和纹理细节[10]。
尽管CNN在焊接点识别方面取得了进展,但仍存在关键挑战。由不同照明条件和反射表面引起的不均匀照明会掩盖焊点特征并降低精度,而焊接点的小尺寸和不规则形态以及在杂乱背景中的存在使得精确定位变得困难。解决这些问题需要提高模型对照明变化的鲁棒性,并加强细尺度特征表示,以满足工业检测的精度要求。最近的研究展示了频域分析[11]和协同注意力机制[13]、[14]在解析高度变化场景中的潜力。
为了解决这些问题,本研究提出了FGSNet,这是一个针对激光焊接点检测设计的频率感知的全局-局部选择性注意力网络。FGSNet结合了五个互补模块:通道混合卷积(CSC)、全局-局部门控注意力(GLGA)、自适应多尺度特征融合(AMFF)、小波自注意力模块(WSAM)和通道混合注意力融合(CHAF),这些模块共同增强了浅层纹理、加强了多尺度特征交互,并细化了语义表示。如图1所示,与仅在空间域操作的常规架构不同,FGSNet明确将高频小波组件整合到注意力机制中,使网络能够恢复细边缘、抑制照明引起的伪影,并实现更具区分性的特征聚焦。在工业数据集上的全面实验表明,FGSNet在复杂成像条件下的准确性和鲁棒性明显优于现有方法。
与现有的分割模型相比,主要贡献如下:
  • (1)
    FGSNet旨在通过建立分层特征交互流程来处理小目标和弱边缘。我们整合了五个专用模块,逐步增强浅层纹理,对齐多尺度特征,并细化频率感知边界。
  • (2)
    CSC通过分组卷积和通道混合有效地增强了浅层纹理,而GLGA通过门控融合将全局语义与局部细节相结合,以抑制背景干扰。AMFF随后执行自适应跨尺度对齐和融合,减少空间错位并减轻小目标的消失。
  • (3)
    CHAF注入拉普拉斯金字塔频率注意力以增强对细微边界敏感的线索,而WSAM在解码器中执行小波域分解和基于注意力的高频边缘细节重建。这些频率感知组件共同改善了低对比度和不均匀照明条件下的轮廓描绘,这是其与仅基于空间增强的流程的关键区别。
  • (4)
    所提出的方法在激光焊接点检测数据集上进行了验证。实验结果表明,在背景复杂性和激光焊接点尺寸较小的挑战性条件下,其具有高准确性和稳定性。
  • 相关工作

    相关研究

    目前,基于机器视觉的表面激光焊接点检测方法大致可以分为两类:传统的基于视觉的方法和基于深度学习的方法。

    整体架构

    算法1

    FGSNet协同特征增强过程
    FGSNet建立了一个统一的特征增强框架,该框架整合了纹理保留、语义整合和频率感知的细化。该架构的结构确保了模块之间的逻辑依赖性,使浅层细节和深层语义逐步得到细化和有效融合,如图2和算法1所示。编码过程从CSC模块开始,该模块提取

    数据集

    本研究使用的数据集是从实际工业生产线收集的,用于激光焊接过程中的光学组件(25 Gbps TOSA)[40]。图8展示了真实的激光焊接系统和组件的结构,包括激光焊接设备、光学组件本身以及焊接点的示意图。图像采集使用了高分辨率的工业相机

    与现有方法的比较

    我们将所提出的方法与几种经典和最先进的语义分割方法在之前描述的激光焊接点检测数据集上进行了比较。为了确保公平性,所有方法都在相同的设置和策略下进行了训练。我们选择了一组代表性的基线模型进行比较,包括UNet [18]、PSPNet [19]、DeepLabV3+ [20]、HRNet [21]、FastFCN [22]、CAWANet [23]、BiSeNetV2 [24]、SegFormer [41]、PIDNet [42] 和 SeaFormer [43]。所提出的FGSNet

    局限性

    尽管FGSNet在整体性能上表现出色,但在复杂场景中仍存在挑战。当原始图像受到严重照明伪影的影响时,基于GAN的预处理模块可能无法保留精细的结构细节,从而影响后续的分割。如图17所示,失败主要是由于强烈的背景伪影导致检测遗漏,以及多个焊接点的干扰降低了分割效果

    结论

    本研究提出了FGSNet,这是一个旨在解决实际激光焊接点检测中精度与速度之间权衡的高效分割网络。该架构的卓越性能归功于五个核心模块的协同整合,它们形成了一个连贯的处理流程。具体来说,通道混合卷积(CSC)作为轻量级的骨干,最小化了参数冗余,同时确保了高效的特征提取。为了应对

    CRediT作者贡献声明

    赵玉倩:可视化。段连:资源获取。段建:资金筹集。张帆:写作 – 审稿与编辑。龚玲:写作 – 原始草稿。

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

    致谢

    本研究由中南大学精密制造极端服役性能国家重点实验室项目资助(项目编号ZZYJKT2024-09)。

    利益冲突声明

    作者表示他们与本工作没有利益冲突。
    龚玲目前正在中南大学攻读硕士学位。他的研究兴趣包括图像处理、计算机视觉和模式识别。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号