基于物理知识的深度学习方法在太赫兹波段用于设计等离子体诱导透明性超表面(plasmon-induced-transparency metasurfaces)以实现慢光效应

【字体: 时间:2026年03月04日 来源:Optics & Laser Technology 4.6

编辑推荐:

  太赫兹波段慢光超表面设计通过物理信息驱动的深度学习框架实现高效逆设计,结合耦合模理论(CMT)模块和Kolmogorov-Arnold网络(KAN),有效解决传统方法计算成本高、多解问题及泛化能力差的问题,验证了多波长延迟线、高延迟带宽积光学缓冲器等应用场景,模型验证损失低至7.9×10?2,逆设计损失3.9×10?3,设计效率提升至秒级。

  
刘晓军|耿家乐|于成龙|夏峰|王梅|董立峰|董丽|云茂进
青岛大学物理学院,中国青岛266071

摘要

慢光可以增强光与物质的相互作用,实现紧凑型缓冲器、延迟线和高容量信号处理。等离子体诱导透明(PIT)超表面是这类设备的有效平台,但其设计仍依赖于复杂的全波仿真来探索几何形状与光谱之间的非线性映射。我们提出了一种基于物理信息的深度学习框架,用于高效且可解释的太赫兹慢光PIT超表面设计。在正向任务中,自适应损失加权策略平衡了数据拟合和物理约束,其中物理约束基于耦合模式理论(CMT)。训练后模型的验证损失达到7.9 × 10-2,该模型比纯数据驱动或固定权重模型具有更好的泛化能力。对于逆向设计,将Kolmogorov-Arnold网络(KAN)与冻结的正向模型级联,并在仅使用光谱重建误差的自监督端到端框架中进行训练。这一逆向分支的损失为3.9 × 10-3,比类似的多层感知器低一到两个数量级。它将设计时间从几小时缩短到几秒,并有效缓解了从光谱到结构的多对一不确定性。我们通过数值实验展示了多波长延迟线、高延迟带宽积光学缓冲器(群速度指数约为1.4 × 103,延迟带宽积约为33.2)和宽带脉冲延迟,表明所提出的框架是实现基于物理信息的PIT超表面及相关纳米光子设备设计的一般方法。

引言

慢光是指光脉冲的群速度显著降低[1],它在许多光子功能中非常有用。它可以增强光与物质的相互作用,增加传感和非线性过程的有效相互作用长度,并为高速通信提供片上缓冲器和延迟线[1]、[2]、[3]、[4]。在太赫兹(THz)频段,慢光设备也适用于紧凑型信号处理和集成无线系统[5]。等离子体诱导透明(PIT)超表面为这类设备提供了便利的平台[6],因为它们的窄透明窗口自然会产生陡峭的相位色散和高群速度指数。
为特定目标设计PIT超表面仍然具有挑战性。从几何形状到传输光谱的映射是高维且高度非线性的。传统的基于全波仿真的“暴力搜索和优化”工作流程(如有限元方法(FEM)或时域有限差分(FDTD)计算成本高昂,且严重依赖设计者的专业知识,不适合快速设计迭代[7]、[8],这限制了快速原型制作和大规模优化。
因此,深度学习已成为光子设备设计的重要工具。通过从数据中学习结构到光谱的映射,神经网络可以比直接数值仿真快几个数量级地加速正向预测和逆向设计[9]、[10]、[11]、[12]。在典型的工作流程中,正向任务根据给定的几何形状预测光谱响应,逆向任务为目标光谱检索候选几何形状[13]、[14]、[15]、[16]、[17]。最近的研究将全连接网络、卷积网络、生成模型和强化学习应用于超表面[14]、[18]、[19]。这些模型已经展示了复杂的多共振响应的快速设计,这些响应通常源于PIT超表面中的多模干涉,包括在以往研究中广泛研究的双PIT和多窗口PIT现象[20]、[21]。然而,大多数现有的深度学习模型仍然是“黑箱”,它们的可解释性通常有限,且在训练领域之外应用时可能会失败。在逆向设计中,从光谱到结构的固有多对一映射引入了非唯一解和不稳定的梯度。这些问题在PIT超表面中尤为严重,因为响应来自亮模式和暗模式之间的微妙干涉。
基于物理信息或物理引导的神经网络试图通过在学习过程中嵌入分析模型或物理约束来解决这些问题[22]、[23]。在人工电磁材料中,这种方法已被证明可以提高泛化能力并提供更清晰的物理洞察。同时,Kolmogorov-Arnold网络(KAN)已被提出作为多层感知器(MLP)的替代方案。KAN使用可学习的一维基函数代替固定的激活函数,可以用相对较少的参数近似复杂的非线性映射和微分算子[22]、[24]、[25]、[26]、[27]、[28]、[29]、[30]、[31]。它们在纳米光子逆向设计中的应用,特别是在具有高度非唯一光谱到几何映射的PIT超表面中,仍处于早期阶段。
在这项工作中,我们提出了一种用于太赫兹慢光PIT超表面设计的基于物理信息的深度学习框架。我们做出了三个主要贡献。首先,我们构建了一个可微分的耦合模式理论(CMT)模块,并将其作为物理分支嵌入到全连接的前向预测网络中。自适应损失加权策略平衡了数据驱动和基于物理的项,使得与纯数据驱动和固定权重模型相比,收敛更快且泛化能力更强。其次,我们通过将KAN与训练好的正向模型级联来开发了一个自监督的逆向设计框架。逆向分支仅通过光谱重建损失进行训练,不需要额外的几何-光谱配对标签,这缓解了光谱到结构的非唯一性,并允许使用合成光谱和测量光谱作为设计目标。第三,我们展示了该框架可以在几秒钟内为几种代表性的太赫兹慢光场景检索出几何形状,包括多波长延迟线、高延迟带宽积光学缓冲器和宽带脉冲延迟线。所提出的“数据-物理表示”架构与制造公差和实验数据兼容,并为基于物理信息的PIT超表面及相关光子设备的智能设计提供了可扩展的途径。

结构与耦合模式理论

PIT超表面的结构如图1(a)所示,单元格由交叉排列的方形石墨烯椭圆(QGEC)组成,旁边有两对垂直(VDGS)和水平(HDGS)排列的双层石墨烯条。该设备可以通过化学气相沉积(CVD)生长单层石墨烯,然后将其转移到相对介电常数为11.9的Si基底上。随后将石墨烯层图案化为周期性结构

数据准备和环境设置

几何参数的采样范围如下:a ∈ [1.9, 2.2] μm,b ∈ [0.8, 1.2] μm,L1 ∈ [4.6, 5.2] μm,L2 ∈ [1.8, 2.2] μm,P ∈ [5.8, 6.2] μm。使用MATLAB随机数生成器均匀生成了3,500组参数。对于每个几何形状,进行FEM仿真以获得复数传输系数,透射率计算为T = |t|2。光谱采样范围为2至6 THz,步长为0.05 THz,共得到81个点

KAN端到端框架

KAN端到端系统(图8)串联了两个神经网络:(1)逆向设计网络。给定目标传输光谱,该网络预测相应的几何参数(a, b, L1, L2, P)。KAN在线性混合层和一维可学习基函数层之间交替[22]、[25]、[26]、[27]、[28]、[29]、[30]、[31]、[40]、[41]。每条路径学习一个非线性函数φi,稀疏权重矩阵将各路径耦合起来[42]、[43]、[44]、[45]。

结论

本研究提出了一个完整的、可微分的PIT超表面设计框架。一个基于物理信息的正向预测器,在可微分的CMT模块和自适应权重的指导下,30 ± 5个周期内的验证损失为7.9 × 10-2-3

CRediT作者贡献声明

刘晓军:撰写——原始草稿,软件,方法论,数据管理,概念化。耿家乐:验证,方法论,数据管理。于成龙:验证,方法论,数据管理。夏峰:验证。王梅:验证。董立峰:撰写——审阅与编辑,验证。董丽:撰写——审阅与编辑,验证。云茂进:撰写——审阅与编辑,验证,监督,资金获取。

资助

本研究得到了山东省自然科学基金(编号ZR2024QF074、ZR2019MF022、ZR2020MF108);国家自然科学基金(编号11144007、11274188、62405164、61933004);青岛光电智库基金;以及Hamline大学的Malmstrom捐赠基金的支持。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号