
-
生物通官微
陪你抓住生命科技
跳动的脉搏
用于解决AlGaN深紫外(DUV)激光二极管数据稀缺问题的生成模型:一项开创性的研究
《Journal of Computational Electronics》:Generative models for data-scarcity challenges in AlGaN DUV laser diodes: a first-of-its-kind study
【字体: 大 中 小 】 时间:2026年02月22日 来源:Journal of Computational Electronics 2.5
编辑推荐:
本研究提出基于CGAN、TVAE等四类生成模型的自增强数据合成策略,有效缓解AlGaN基深紫外激光二极管设计中的数据稀缺问题。通过光学功率评估指标,CGAN在数据保真度(r=0.0202)上最优,TVAE在模型实用性(MAE=0.73)上表现最佳,并验证了混合数据集的增强效果。
机器学习(ML)在优化光子器件建模方面发挥着越来越重要的作用。基于AlGaN的深紫外(DUV)激光二极管(LDs)已成为一类关键的光子器件,其应用范围从消毒到光通信都非常广泛。虽然ML模型为这些器件的设计提供了强大的解决方案,但这些模型的有效性在很大程度上取决于可用数据的质量和数量。对于DUV LDs而言,由于数值模拟和器件制造的复杂性、高成本以及巨大的计算需求,获取高质量的数据集具有挑战性。为了解决这些挑战,提出了一种自增强策略,该策略利用了四种生成模型:条件生成对抗网络(CGAN)、表格变分自编码器(TVAE)、贝叶斯网络和高斯copula,从有限的样本中合成数据。光功率被用作评估模型性能的主要参数。我们分别使用平均绝对相关系数(r)和平均绝对误差(MAE)来评估生成数据集的保真度和实用性,并在多种数据增强场景下评估其鲁棒性。在测试的模型中,CGAN实现了最高的数据保真度,其r值为0.0202,与实际数据(r = 0.0266)非常接近。TVAE则提供了最佳的模型实用性,将MAE降低了8%,降至0.73,且在所有增强场景下均表现出稳定的性能。我们使用五层深度神经网络(DNN)对实际数据集和增强数据集的混合数据集进行模型实用性评估。我们认为,所提出的框架提供了一种可扩展且适应性强的方法,能够加速下一代DUV LDs的设计,同时支持循环内数据增强以应对数据稀缺的问题。这项工作是该领域的首次全面研究。
机器学习(ML)在优化光子器件建模方面发挥着越来越重要的作用。基于AlGaN的深紫外(DUV)激光二极管(LDs)已成为一类关键的光子器件,其应用范围从消毒到光通信都非常广泛。虽然ML模型为这些器件的设计提供了强大的解决方案,但这些模型的有效性在很大程度上取决于可用数据的质量和数量。对于DUV LDs而言,由于数值模拟和器件制造的复杂性、高成本以及巨大的计算需求,获取高质量的数据集具有挑战性。为了解决这些挑战,提出了一种自增强策略,该策略利用了四种生成模型:条件生成对抗网络(CGAN)、表格变分自编码器(TVAE)、贝叶斯网络和高斯copula,从有限的样本中合成数据。光功率被用作评估模型性能的主要参数。我们分别使用平均绝对相关系数(r)和平均绝对误差(MAE)来评估生成数据集的保真度和实用性,并在多种数据增强场景下评估其鲁棒性。在测试的模型中,CGAN实现了最高的数据保真度,其r值为0.0202,与实际数据(r = 0.0266)非常接近。TVAE则提供了最佳的模型实用性,将MAE降低了8%,降至0.73,并且在所有增强场景下均表现出稳定的性能。我们使用五层深度神经网络(DNN)对实际数据集和增强数据集的混合数据集进行模型实用性评估。我们认为,所提出的框架提供了一种可扩展且适应性强的方法,能够加速下一代DUV LDs的设计,同时支持循环内数据增强以应对数据稀缺的问题。这项工作是该领域的首次全面研究。
生物通微信公众号
知名企业招聘