用于多模态基准测试和光纤通道建模的光学变压器
《Optics & Laser Technology》:Optical transformer for multi-modal benchmarks and fiber channel modeling
【字体:
大
中
小
】
时间:2026年05月10日
来源:Optics & Laser Technology 4.6
编辑推荐:
邵豪伟|刘航|余欣欣|陈一帆|赵健|徐天华
天津大学精密仪器与光电工程学院,天津,中国
**摘要**
对光纤通道的精确建模对于优化高速通信系统至关重要,然而传统的分割步长傅里叶方法(SSFM)存在计算复杂度较高的问题。为了解决这一问题,我们提出了一种基于级联马赫-曾
邵豪伟|刘航|余欣欣|陈一帆|赵健|徐天华
天津大学精密仪器与光电工程学院,天津,中国
**摘要**
对光纤通道的精确建模对于优化高速通信系统至关重要,然而传统的分割步长傅里叶方法(SSFM)存在计算复杂度较高的问题。为了解决这一问题,我们提出了一种基于级联马赫-曾德尔干涉仪(MZI)网格的新型光变压器架构,该架构利用了光子计算的高速性和能效优势。为了验证该架构在特征提取和序列建模方面的通用性,我们首先在计算机视觉(MNIST)和自然语言处理(SST-2)任务上对其进行了基准测试,分别取得了96.12%和85.2%的准确率。在此基础上,我们实现了一种用于1200公里DP-16QAM传输系统的线性-非线性特征解耦分布(FDD)方案,其中光变压器专门用于非线性损伤建模。仿真结果表明,与SSFM基线相比,所提出的模型具有低于0.02的归一化均方误差(NMSE)和小于0.25分贝的Q因子偏差,从而实现了高保真重建。此外,鲁棒性和复杂性分析证实了该方案在硬件缺陷下的稳定性,即使在相位误差达到0.08弧度的情况下仍能保持可接受的准确率,并且与SSFM相比计算复杂度降低了87.6%,与双LSTM相比降低了71.4%,同时保持了高建模精度。本工作验证了光变压器作为一种强大的通用光子计算引擎在复杂信号处理任务中的有效性。
**引言**
作为主流通信手段之一,光纤通信系统承担了超过90%的数据传输任务。对其的研究基于探索光纤维中信号的传输过程。光纤通道的精确建模可以模拟信号在传输过程中的演变,不仅有助于深入研究光纤的容量限制[1],还对光纤通信系统的性能评估和优化[2]、[3]、[4]、通信算法评估[5]等具有重要意义。光纤中信号的演变过程由非线性薛定谔方程(NLSE)[6]描述,因此传统的建模方案是通过数值近似NLSE来实现的。一种常见的建模方法是分割步长傅里叶方法(SSFM),该方法假设在光纤的每个小步骤中线性和非线性效应分别发生[7]。然而,由于SSFM需要将整个传输链路划分为多个步骤,并在每个步骤中依次执行复杂的傅里叶变换和逆傅里叶变换,因此长距离信道建模通常需要大量时间和较高的计算成本。
随着机器学习技术的发展,神经网络被广泛应用于光纤通信领域,如调制格式识别[8]、光性能监控[9]、非线性补偿[10]等。如今,神经网络也被用于执行光纤通道建模任务,学习发送端和接收端符号之间的复杂映射关系。2010年,王等人提出使用双LSTM网络快速实现数据驱动的光纤通道建模,与SSFM相比,在OOK和PAM4信号的建模中取得了显著的计算时间优势[11]。2021年,杨等人提出了一种基于生成对抗网络(GAN)的光纤通道建模方案,实现了衰减、色散、自相位调制(SPM)和放大自发辐射(ASE)噪声的建模[12]。2022年,杨等人提出了另一种线性-非线性特征解耦分布(FDD)波形建模方案,其中信道的线性效应由NLSE模型实现,而非线性效应由数据驱动的神经网络实现[13]。在此基础上,2025年的最新研究转向了更通用和更高容量的建模框架。例如,史等人引入了序列到序列(Seq2Seq)框架[14]和参数编码结构[15],以提高波形级建模的准确性和多通道传输场景下的泛化能力。同时,新的数学方法也被整合到神经网络中,如Koopman神经算子[16]、基于UVL的混合模型[17]和Volterra级数传递函数[18]的使用,这些方法显著提高了WDM和相干光通信系统中非线性效应的表征能力。
光子神经网络(PNN)可以通过使用光子进行信息传输和处理,在仿真域直接执行神经网络操作,具有计算速度快和能耗低的优点,有望为人工智能模型提供更强大的计算能力支持[19]。实现PNN的一种常见方法是使用级联马赫-曾德尔干涉仪(MZI)网格来构建神经网络中的权重矩阵,输入数据和权重矩阵通过MZI网格中的光信号传输进行相乘。这种PNN方案利用光信号的传输来进行数据处理,可以避免电子硬件面临的冯·诺伊曼瓶颈,为人工智能模型的实现提供了光学思路。
在这项工作中,我们提出了一种基于级联MZI网格的光变压器模型。为了初步验证所提出架构的有效性和通用计算能力,我们首先在标准计算机视觉(CV)和自然语言处理(NLP)任务上对其进行了评估。仿真结果分别显示出96.12%和85.2%的准确率,证实了其在处理复杂多模态数据方面的鲁棒能力。在此基础上,我们将该模型应用于本研究的核心任务:高效的光纤通道建模。采用FDD架构,我们利用物理定律对线性效应进行建模,并使用光变压器处理计算密集型的非线性效应。该方法结合了Transformer的序列建模能力和光学的能效优势。在DP-16QAM系统中,所提出的方案实现了1200公里传输的精确建模,证明了其可行性和效率。
**工作原理**
光纤通道建模是指建立模型来模拟光信号在光纤中的传输演变过程。当信号在光纤通道中传输时,会受到色散和非线性效应的影响,导致信号损伤。对于偏振复用光系统,当忽略损耗时,包络演变可以用以下公式表示:
$$
-\frac{\partial E(x,y)}{\partial z} + j\beta \frac{\partial^2 E(x,y)}{\partial t^2} + \frac{8\gamma}{|E(x,y)|^2 + |E(y,x)|^2} = 0
$$
其中 $ E(x,y) $ 表示信号幅度。
**架构**
我们提出了一种光变压器架构,旨在展示其在传统人工智能任务(如计算机视觉和自然语言处理)中的通用性,同时高效执行光纤通道建模所需的复杂非线性特征提取。所提出的光变压器遵循标准的仅编码器范式。该系统包括四个核心模块,如图3所示:(1)输入嵌入层,负责对多模态数据进行映射;
**在AI基准测试上的验证**
为了评估所提出的光变压器架构在特征提取和序列建模方面的通用性,我们在两个经典领域进行了基准测试:计算机视觉(CV)和自然语言处理(NLP),然后处理复杂的光纤通道建模。在预处理阶段,MNIST图像从其原始像素值进行归一化以提高训练稳定性。对于SST-2数据集,使用BERT分词器对原始文本进行分词处理。
**基于验证的通用性和序列建模能力**
在验证了通用性和一般AI任务中的序列建模能力后,我们现在关注所提出架构在光纤通信中的核心应用。构建了一个双偏振相干光传输系统,并分别使用SSFM和基于光变压器的FDD进行信道建模。其传输架构如图6所示。在发送端,偏振分束器(PBS)将信号分成两部分。
**建模准确性**
首先,我们从多个维度(包括时域波形和频谱)对单跨段建模准确性进行了全面评估,提供了对模型有效性的直观和质量评估。图7比较了SSFM基线和所提出的光变压器在标准80公里单跨段传输条件下的信号输出。结果表明,它们的时间包络和频谱细节几乎完全重叠。
**结论**
在这项工作中,我们提出了一种基于级联MZI网格的光变压器架构,以解决传统光纤通道建模的计算瓶颈。该模型在标准AI基准测试中得到了验证,分别在MNIST上取得了96.12%和SST-2上取得了85.2%的准确率,展示了其在多模态特征提取和序列建模方面的通用性。在此基础上,我们将该架构应用于1200公里DP-16QAM传输系统的建模。
**作者贡献声明**
邵豪伟:撰写——原始草稿、可视化、软件、方法论、研究、数据管理、概念化。
刘航:撰写——原始草稿、可视化、软件、方法论、研究、数据管理、概念化。
余欣欣:可视化、研究。
陈一帆:可视化、研究。
赵健:撰写——审核与编辑、监督、软件、项目管理、方法论、资金获取。
徐天华:撰写——审核与编辑、项目管理。
**利益冲突声明**
作者声明没有已知的利益冲突或个人关系可能影响本文报道的工作。
**致谢**
本工作得到了中国国家重点研发计划(项目编号2022YFE0202100)、天津大学科学计算中心、欧盟地平线2020计划(项目编号101008280(DIOR)和欧盟地平线欧洲计划(项目编号101236637(SPAR)以及欧盟地平线欧洲计划(项目编号101300012(SMART))的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号