编辑推荐:
光伏板积尘与表面故障检测中,针对类别严重失衡问题,提出DiToS框架:通过Stable Diffusion生成高质合成图像增强样本多样性,结合Tomek链接消除边界噪声数据,再用SMOTE在特征空间 oversampling。实验验证在三种失衡场景下,DiToS使准确率提升至98.5%,F1-score达0.99,κ系数0.93,且适用于多类故障检测和多种分类器,支持实时监控与可持续能源生产。
Raj Kumar|Yong-Woon Kim|Yung-Cheol Byun
电子工程系,信息科学技术研究所,济州国立大学,济州市63243,韩国
摘要
准确检测光伏(PV)模块上的灰尘积聚和表面故障对于维持发电效率和系统的长期可靠性至关重要。然而,基于图像的PV故障检测面临着严重的类别不平衡问题,即干净模块占多数,而故障样本稀少且具有异质性。本研究提出了DiToS,这是一种混合的多层次数据增强和平衡框架,它结合了Stable Diffusion进行真实的图像级合成、Tomek Link进行边界去杂以及SMOTE进行特征空间过采样。该方法在三种不平衡情况下的精心策划的PV图像语料库上进行了验证(案例1:150个有灰尘的模块对比1493个干净的模块;案例2:500个有灰尘的模块对比1493个干净的模块;案例3:800个有灰尘的模块对比1493个干净的模块),涵盖了从严重到轻微的类别偏斜情况。DenseNet嵌入为传统学习器提供了统一的特征空间,而Vision Transformer(ViT-Head)在像素空间中端到端运行。使用10折交叉验证的评估显示,在准确性、精确度、召回率、F1分数和AUC方面都有统计学上的显著提升,这些提升得到了Wilcoxon符号秩检验的支持。DiToS的准确率达到了98.5%(F1 = 0.99),可靠性很高(κ = 0.93,MCC = 0.95),表明其一致性几乎完美,超出了偶然性。在六类太阳能板故障检测数据集上的扩展验证进一步证明了DiToS的有效性,在三种不平衡配置(IR=10:1、3:1和1.9:1)和三种分类器架构(ViT-Head、XGBoost、SVM)下,F1分数提高了4.0%到6.9%,证实了其在训练样本有限的多类别不平衡场景中的泛化能力。基于扩散的合成在消费级GPU上是计算上可行的,推理过程保持轻量级,可以集成到实时监控工作流中。通过提高在极端不平衡条件下的诊断鲁棒性,DiToS支持更可靠的维护调度和通过减少功率损失和提高PV运行效率来实现可持续的太阳能发电。
引言
全球向可再生能源的转变加速了光伏(PV)系统的部署,使太阳能成为全球能源结构的主要组成部分[1]。确保这些安装的可靠性和效率至关重要,因为PV模块容易出现裂纹、热点、分层和蜗牛轨迹等故障,这些故障会降低性能并导致系统故障。手动检查方法成本高昂且容易出错,因此需要使用机器学习(ML)和深度学习(DL)模型进行自动化的基于图像的故障检测。这些模型能够有效地从RGB、电致发光(EL)或红外(IR)图像中提取特征[2],但它们的成功在很大程度上取决于大型、平衡且多样化的数据集的可用性。在现实世界的PV检查中,有缺陷的样本严重不足,导致类别不平衡和多样性有限,特别是对于罕见的故障类型。因此,模型倾向于偏向主导(干净)类别,无法在不同照明或环境条件下进行泛化。解决这种不平衡对于可靠和可持续的PV运行至关重要。所提出的混合增强和平衡框架(DiToS)旨在在这些条件下提高诊断鲁棒性并提高系统的长期效率。为了清晰易懂,本研究中使用的所有缩写和符号在表S1中进行了总结。
现有的增强和平衡技术仍然不足以完全克服数据稀缺和不平衡的问题。传统的过采样方法,如合成少数样本过采样技术(SMOTE)可以改善类别表示,但往往引入噪声或冗余样本,无法反映真实的缺陷模式[3]。相反,像Tomek Link这样的欠采样方法会移除重叠样本,但可能会丢弃有信息的数据,从而减少多样性。生成对抗网络(GANs)在创建真实合成数据方面显示出潜力,但受到模式崩溃、训练不稳定和多样性控制不佳的限制。最近,扩散模型作为一种强大的替代方案出现,能够通过迭代去噪生成高保真度的多样化图像。然而,它们集成到PV数据平衡流程中的程度仍然很大程度上未被探索。虽然之前的框架已经将基于扩散的合成与SMOTE过采样结合[4],但它直接将SMOTE应用于增强后的数据集,而没有解决边界污染问题。当合成图像被添加到不平衡的数据集中时,靠近决策边界的大部分类别样本仍可能与少数样本重叠,导致SMOTE生成模糊的插值。DiToS通过一个中间的Tomek Link清洗阶段解决了这一限制,该阶段移除了与少数实例形成Tomek对的大部分样本,确保SMOTE在分离良好的特征流形上操作。这种三层顺序集成——像素级合成、边界去杂和特征空间密集化——代表了这项工作的核心方法论贡献。
本研究解决了光伏(PV)系统监控中最关键的挑战之一:缺乏用于基于深度学习的故障检测模型的平衡和代表性训练数据。通过提出一种混合多层次数据增强(DiToS)和平衡框架,本研究引入了一种新的范式,统一了生成建模和统计平衡的优势。该框架增强了训练数据的多样性和数量,同时确保生成的合成样本是真实的、相关的且没有冗余。其重要性体现在三个主要方面:从科学角度来看,它开创了使用基于扩散的生成增强进行太阳能板故障检测的方法,架起了尖端计算机视觉模型和可再生能源诊断之间的桥梁;从工业角度来看,它提供了一个可扩展和适应性强的PV监控解决方案,可以应用于多种成像模式,如电致发光(EL)、红外(IR)和RGB图像,确保准确和一致的故障识别;从社会和环境角度来看,它通过减少维护成本、最小化能源损失以及通过及时和可靠的故障检测延长PV模块的运行寿命,为可持续能源生产做出了贡献。
本研究的主要目标是开发一种混合多层次数据增强和平衡框架,以增强在现实世界数据不平衡条件下基于图像的光伏(PV)故障检测系统的可靠性和鲁棒性。具体来说,该研究旨在将扩散模型、Tomek Link和SMOTE技术整合到一个统一的流程中,该流程(i)生成多样化和高质量的合成故障图像,(ii)消除噪声或重叠样本以改善分类器的泛化能力,(iii)通过智能过采样平衡类别分布。通过实现这些目标,所提出的框架旨在减轻现有增强和平衡方法的局限性,并能够在不同的太阳能板缺陷类别和环境条件下实现准确的、数据高效的故障检测。本研究的主要贡献可以总结如下:
- •
混合多层次DiToS框架:提出了一种新的三阶段混合框架,依次集成扩散模型、SMOTE和Tomek Link技术,以互补的方式实现数据增强、过采样和噪声减少。这种集成确保了数据集的多样性,同时保持了类别平衡并最小化了重叠。
- •
真实的基于扩散的合成:扩散模型生成了具有高视觉真实感和结构多样性的PV故障图像。生成的图像捕捉到了微裂纹和热点等细微的故障纹理,这是传统GAN或几何增强无法再现的。
- •
平衡的数据集形成和清洗:该框架应用SMOTE来加强潜在特征空间中的少数类表示,然后通过Tomek Link清洗去除边界或模糊的样本。这种多层次的细化提高了训练数据集的区分能力。
- •
全面的验证和能源影响:广泛的实验确认了在模型上的准确性和可靠性方面的显著提升,通过更高效的PV维护和减少功率损失支持了可持续的太阳能生产。
本文分为几个部分,全面介绍了关于太阳能板灰尘检测的研究。第“背景”部分提供了关于灰尘检测和数据平衡技术的文献综述,主要关注我们研究的基础。第“方法论”部分描述了本研究中应用的方法论。第“实验设置”部分讨论了计算环境和资源。第“结果和讨论”部分展示了实验结果以及对发现和评估的全面讨论。第“结论和未来方向”部分讨论了最终的成就和研究的未来方向。为了清晰易懂,本研究中使用的所有缩写和符号在补充材料中的表S1中进行了总结。
章节片段
通过成像进行PV/太阳能板的故障检测
近年来,使用成像模式(如红外(IR)、电致发光(EL)、热成像、多光谱或RGB)进行太阳能光伏(PV)故障检测的研究非常广泛。最近的研究强调了深度学习检测和分类局部缺陷的高准确性。Ledmaoui等人(2024年)提出了一种可解释的卷积神经网络模型来检测PV面板中的异常,结合了显著性图和标准CNN架构来突出显示
方法论
本节总结了端到端的工作流程(图1)。我们策划并预处理PV图像,通过Stable Diffusion生成少数样本,然后使用Tomek Links和SMOTE在特征空间中重新平衡,然后再进行模型训练。最后,使用ViT-Head、XGBoost和SVM进行交叉验证和标准指标评估,以及鲁棒性和可靠性测试。
计算环境和资源
所有实验都在一个64位系统上进行,配备了Intel Core i7-13700(24个CPU,2.1 GHz)、NVIDIA GeForce RTX 4060 GPU和16 GB RAM(表S6)。软件堆栈包括Python 3.9.19、Keras 2.7.0和TensorFlow 2.7.0,以及在Visual Studio中进行开发。GPU加速用于Stable Diffusion生成、特征提取和模型训练,而预处理和评估则在CPU上进行。使用相同的随机种子、分层分割和固定的库版本确保了完整性
结果和讨论
本节展示了在不平衡和平衡数据集(SMOTE和Stable Diffusion)上提出的模型的实验结果和讨论。结果重点关注不同数据平衡策略和模型架构之间的定量比较,提供了每种方法在太阳能板灰尘检测方面的有效性评估。
结论
本研究提出了一种混合多层次框架(DiToS),该框架整合了Stable Diffusion、Tomek Link清洗和SMOTE,以减轻基于图像的太阳能板灰尘检测中的类别不平衡。除了提高分类准确性外,DiToS还通过减少未检测到的故障和维护延迟来提高运行效率,从而支持更高的能源产量和系统可靠性。从精心策划的Kaggle数据集开始,该流程扩展了少数(有灰尘的)类别
CRediT作者贡献声明
Raj Kumar:撰写——原始草稿、可视化、验证、软件、方法论、调查、形式分析、数据策划、概念化。Yong-Woon Kim:撰写——审阅与编辑、验证、资源管理、数据策划、概念化。Yung-Cheol Byun:撰写——审阅与编辑、验证、监督、项目管理、资金获取。
代码可用性
本研究的数据预处理、模型训练、评估和实现代码将在公共GitHub仓库[54]上发布,待接受后。伦理批准
本研究没有涉及人类参与者或动物实验;因此,不需要伦理批准。
写作过程中生成式AI和AI辅助技术的声明
在准备这项工作时,作者使用了Grammarly和LLM来检查语法和句子改进。使用这些工具后,作者根据需要审查和编辑了内容,并对发表文章的内容负全责。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。
致谢
资金来源:这项工作得到了韩国国家研究基金会(NRF)的支持,该基金会由韩国政府(MSIT)资助(编号:RS-2024-00405278)。这项研究还得到了区域创新系统与教育(RISE)计划的支持,通过济州RISE中心实施,该计划由教育部(MOE)和济州特别自治省(2025-RISE-17-001)资助。