晶圆是芯片制造的核心材料,其表面图案的质量直接决定了后续芯片产品的可靠性和性能(Jiao, Yang, Wu, Li, & Xue (2025))。因此,准确分类晶圆表面缺陷对于推动现代半导体制造的智能化发展具有重要意义(Kim & Behdinan (2023))。随着晶圆生产的持续扩大,基于图像处理的自动化缺陷检测和分类技术已成为行业向智能制造转型的关键步骤(Shin, Kim, & Lee (2025b))。
近年来,深度学习作为图像和视觉识别领域备受关注的前沿技术而兴起,其快速发展对学术研究和工业应用产生了深远影响(Edozie, Shuaibu, John, & Sadiq (2025))。已经提出了许多先进的网络框架,例如Zhang等人提出的结合变形自编码器和视觉变换器的框架(Zhang et al. (2024)),以及Chen等人提出的基于多尺度特征融合和基于注意力的空间金字塔池化的晶圆图像检测方法(Chen, Huang, Wang, Hou, & Ma (2025))。Xu等人(Xu, Yu, & Hasan (2023)利用混合不确定性量化了深度卷积神经网络在晶圆图缺陷模式识别中的参数演化不确定性,提高了决策可靠性并显著提升了识别准确性。Kang等人(Kang, Shin, & Lee (2024)提出了一种无监督方法,通过评估形状、位置和大小相似性来识别新的晶圆箱图缺陷模式,超越了现有的监督方法在定义和诊断缺陷方面的能力。这些方法在晶圆缺陷检测方面取得了显著成果。
在实际工程场景中,理想的网络训练数据很少存在。因此,仅仅提高网络处理能力并不能从根本上克服数据限制,这些限制主要包括样本量不足、类别分布不平衡以及在不同操作条件下的显著变化。如图1(a)所示,在一个大型晶圆数据集WM-811K(Shin, Kim, Kim, & Lee (2025a)中,该数据集来自真实制造过程,包含正常晶圆和八种类型的缺陷晶圆。在超过80万张图像中,只有大约21%是手动标记的。在标记的数据中,正常晶圆占18%,而缺陷样本仅占3%,不同类型样本的数量存在显著差异(见图1(b))。
在晶圆缺陷检测中,数据分布往往高度不平衡,这严重影响了分类模型的准确性和泛化能力。传统的增强技术,如图像翻转、旋转、平移和过采样(de la Rosa, Gómez-Sirvent, Morales, Sánchez-Reolid, & Fernández-Caballero (2023); Zhang & Mahmoud (2025)),可以在一定程度上缓解样本稀缺问题,但无法引入新的判别特征,因此改进效果有限。为了解决这个问题,Siyamalan等人(Manivannan (2024)提出了一种结合伪标签的双头卷积神经网络,以在半监督环境下提升分类性能;而Thuan等人(Thuan (2025)使用自注意力卷积神经网络从单缺陷热图中合成混合缺陷样本,从而在未标记场景下提高检测准确性和鲁棒性。然而,这些方法在特征生成方面仍然存在局限性,无法完全弥补少数类别样本的稀缺问题。
为了进一步改善样本分布,生成模型和注意力机制已被广泛用于数据增强。Tsai等人(Tsai & Wang (2025)引入了一种全局到局部的生成对抗网络(G2LGAN),结合随机下采样来优化不平衡数据集。Li等人(Li et al. (2024)开发了一种辅助分类器增强的去噪扩散模型,以生成合成晶圆图,从而加强少数类别的学习。Fan等人(Fan & Chiu (2024)利用视觉变换器的多头注意力生成热图,增强了少数缺陷模式的识别能力。这些方法在一定程度上缓解了晶圆缺陷检测中的数据不平衡问题。然而,生成模型在生成过程中可能会丢失细微的缺陷细节。
基于上述分析,现有的晶圆样本增强和分类方法面临以下关键挑战:
•长尾分布和样本多样性有限:传统的数据增强方法生成的样本具有重复特征。因此,它们无法捕捉到罕见缺陷的多样性,导致分类器在高度不平衡的数据场景中过拟合,并显著限制了对少数缺陷类别的泛化能力。
•细粒度特征和空间上下文的整合不足:传统的生成模型通常会丢失低分辨率晶圆图像中与边缘相关的或小缺陷的详细特征,并且对复杂噪声敏感。这阻碍了细粒度特征与全局空间上下文的有效整合,从而限制了生成样本的全面表达能力。
•关键特征整合有限:现有的分类器主要关注空间特征,忽略了通道信息的深度整合。这限制了生成样本中复杂缺陷特征的精确提取,从而影响了分类性能和鲁棒性。
在实际应用中,晶圆缺陷图表现出强烈的结构稀疏性和长距离空间依赖性,现有方法(如G2LGAN (Tsai & Wang (2025)和ACDDPM (Li et al. (2024))在严重数据不平衡的情况下无法充分捕捉这些特性。为了解决这个问题,我们提出了一个双流融合Unet去噪扩散框架(DSF-Unet)。该框架采用Mamba增强的Unet架构,利用多模态条件嵌入和双向状态空间模型(SSM)来处理不同缺陷密度的特征。核心组件是Attention-Mamba(Att-Mamba)模块,它通过双向Mamba(Bi-Mamba)和自适应多尺度注意力(Am-att)子模块动态捕获晶圆图像的全局和局部特征。Bi-Mamba有效建模长距离空间依赖性,而Am-att通过通道级自适应校准优化特征表示。通过双向交叉门控机制,这两个分支协同抑制冗余背景信息,同时增强稀疏缺陷响应,从而在不平衡条件下提高去噪质量和样本多样性。此外,改进的通道-空间残差网络(CS-ResNet)对生成的平衡数据集进行分类,显著提高了不同缺陷类型的识别准确性,特别是在复杂噪声条件下的鲁棒性。本文的贡献总结如下:
•本文提出了一种创新的双流融合Unet去噪扩散框架(DSF-Unet),该框架利用随机噪声生成高保真的合成晶圆样本。通过有效的去噪和数据增强,DSF-Unet有效缓解了分类器训练中的长尾偏差,确保了生成数据集的平衡性和鲁棒性。
•本文提出了一种自适应多尺度注意力机制(Am-att),它补充了双向Mamba(Bi-Mamba)模块的长距离依赖性建模。该机制动态捕获细粒度的局部特征和空间关系,并通过双向交叉门控策略将它们与全局上下文整合,实现了局部细节和整体表示之间的稳健平衡。
•本文提出了一种基于ResNet18架构的改进型CS-ResNet分类器,结合了双通道-空间注意力机制,精确突出空间和通道维度中的关键缺陷特征,显著提高了晶圆缺陷识别的分类准确性和鲁棒性。
本文的结构如下:第2节概述了晶圆检测及相关扩散模型。第3节详细介绍了所提出方法的工作流程和理论算法。第4节介绍了数据集及相关实验分析。第5节总结了研究结果,并探讨了未来工作的潜在方向。