基于物理增强深度神经网络的多图像光学加密

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Optics & Laser Technology》：Multi-image optical encryption based on physics-enhanced deep neural network

【字体：大中小】 时间：2026年02月18日 来源：Optics & Laser Technology 4.6

编辑推荐：

　　多图像光学加密技术基于物理增强的深度神经网络（PhysenNet-MOE），通过几何形状点扩散函数（G-PSF）对每帧明文进行编码并叠加压缩成单帧密文，结合物理模型与梯度下降优化实现无需预训练的高效解密，实验验证其在4倍压缩比下有效。

王志勇|徐宁|齐大龙|张宪

中国电子科技大学数学科学学院，成都611731，中国

摘要

多图像光加密在数据保护方面展现了巨大的潜力，这得益于其并行处理能力和丰富的自由度。然而，现有方法面临一些挑战，如严格的实验条件、较低的泛化能力以及对手动选择参数的依赖。本文提出了一种基于物理增强型深度神经网络（PhysenNet-MOE）的多图像光加密技术，旨在解决这些挑战。首先，在加密过程中，每张明文图像使用由相位恢复算法生成的几何形状的点扩散函数进行编码。然后将得到的多帧密文叠加在一起形成压缩密文。最后，采用一种结合压缩加密物理模型和深度神经网络的迭代优化方法从压缩密文中解密多帧明文，无需预先信息或预训练的网络。仿真和实验均证明了PhysenNet-MOE的可行性。此外，由于其简化了光学设置，该方法有望为光加密技术的深度集成提供有效的解决方案。

引言

随着对安全数据传输和存储空间需求的迅速增加，在军事和医疗等领域的加密过程中压缩数据变得越来越重要[1]。尽管数字加密技术在安全性能和算法复杂性方面表现出显著的潜力[2]、[3]、[4]、[5]、[6]，但其加密和解密速度受到电子硬件和顺序计算架构的根本限制，无法达到光速。随着数据维度和吞吐量需求的不断增加，特别是在大规模二维成像场景中，这种硬件限制变得更加明显。光加密（OE）技术作为一种强大的解决方案应运而生，因为它们具有并行数据处理能力和多维加密特性，如波长[7]、相位[8]、振幅[9]和偏振[10]。这些特性使OE在大规模2D成像中具有天然优势，相比传统数字加密技术提供了更高的安全性能。自从引入双随机相位调制加密[11]以来，单图像OE技术得到了广泛研究[12]、[13]。然而，随着数据吞吐量的爆炸性增长，能够将多张明文图像压缩成单一密文并实现高保真解密的多图像OE（MOE）技术已成为一个重要的研究领域。

目前，有几种方法用于MOE，其中物理参数复用是最常见的策略之一。物理参数复用技术通过重用多个光学自由度（如波长[14]、距离[15]和方位角[16]）来实现多帧明文压缩加密。这些自由度可以携带多张图像的信息，从而在保持高安全性的同时实现数据的压缩和加密。使用相位调制器设备对光场进行随机调制是加密的关键方法。这种方法在空间域或频率域引入随机相位，使加密图像表现为随机噪声，只能通过特定的解密过程恢复为原始图像。然而，相位调制器设备通常需要纳米级的定位精度，这对光学系统的设计和实现提出了极高的要求[17]。在实际应用中，由于所需的高精度，相位调制器设备的制造和调整具有挑战性，这限制了物理参数复用方法的适用性，通常将其限制在仿真阶段[18]、[19]、[20]、[21]，从而无法充分利用光学系统的并行调制优势。此外，实际环境中的噪声、温度变化和光学组件老化等因素会影响加密过程的稳定性和解密的准确性，从而限制了基于复用的MOE方法在实际应用中的可靠性。

超表面是一种新兴的加密方法，主要利用其多自由度能力来操控光波，从而实现信息加密[22]、[23]。超表面由亚波长尺度的结构元素组成，通常是纳米级的金属或介电结构，可以精确控制光在多个自由度上的传播，如波长[24]和动量[25]。由于超表面可以操控多个光学自由度并通过精细设计增加加密复杂性，因此与传统加密方法相比提供了更高的安全性。例如，通过使用多种OAM模式，信息可以隐藏在多个维度中，使得攻击者难以解密[26]。尽管超表面技术在实验室环境中展示了巨大的潜力，但其广泛应用仍受到成本、制造难度和设备复杂性等因素的限制。

深度学习作为一种新兴的加密方法，由于近年来计算能力的飞速增长，已成为解决光加密中复杂解密问题的强大工具[27]、[28]。通过使用大量训练数据，深度神经网络可以进行端到端的预训练，以学习从密文到明文的非线性映射关系。最终，训练好的神经网络被用作解密的“黑盒”，将加密图像恢复为其原始明文。这种方法不仅显著提高了解密过程的效率，而且在高压缩比下也能保持良好的解密质量。然而，尽管深度学习提供了强大的解密能力和更高的压缩比，但也面临一些挑战。深度神经网络的训练过程通常需要较长的计算时间和大量数据，导致较高的计算成本和数据需求。此外，深度神经网络的泛化能力有限，尤其是在面对与训练数据不同的新加密数据时，这可能会影响解密性能。

作者之前提出了一种压缩MOE技术[29]，通过引入基于压缩感知[31]的两步迭代阈值算法[30]，成功实现了多帧图像的高保真解密。在这种方法中，通过建模加密过程推导出了压缩MOE的物理模型。在此基础上，利用了自然图像在特定变换域中的稀疏性，并添加了一个正则化项。目标函数被分解为几个子问题，通过逐步迭代优化来解决，克服了严格的实验条件和较低的泛化能力等挑战，最终实现了高保真解密。然而，多个子问题的迭代引入了选择多个参数最优值的问题，参数的选择对解密质量有显著影响。例如，正则化参数、阈值和迭代次数的设置直接决定了图像重建的准确性和保真度。

基于物理参数复用的现有方法通常会导致解密质量下降，并需要精确的相位校准，这限制了它们的鲁棒性和实际应用。基于超表面的方法虽然强大，但通常需要极高的制造精度，使得大规模和成本效益高的实现变得具有挑战性。基于深度学习的方案通常依赖于大量的配对训练数据，并且在光学配置或加密参数发生变化时往往表现出有限的泛化能力。此外，基于优化的方法（如TwIST）需要手动选择最优参数。为了提高压缩解密的总体性能，本文提出了一种基于物理增强型深度神经网络的MOE技术。在加密过程中，每张明文图像使用具有几何图案分布的点扩散函数（G-PSF）进行编码。然后将得到的多帧加密图像叠加在一起生成压缩密文。随后，将压缩加密的物理模型与深度神经网络结合，直接使用梯度下降优化深度神经网络的超参数，实现了无需数据预训练和逐步迭代的高保真解密。数值仿真结果验证了该方法的可行性、强安全性和抗噪声能力。在实验中，该方法在实际应用中的有效性得到了验证，压缩比为4。

PhysenNet–MOE原理

PhysenNet–MOE是一种典型的计算光学处理方法，主要包括两部分：数据加密和解密。图1(a)显示了前向数据加密的数据流图。c帧明文与其相应的G-PSF进行卷积（

?

），得到多帧密文，其中c表示明文中的帧数。然后将这些密文叠加在一起形成压缩密文。这种前向压缩数据加密可以

使用PhysenNet-MOE的多图像解密结果

为了验证PhysenNet–MOE的可行性，使用7帧二进制对象进行了仿真。图2(a)的第一行显示了原始的7帧明文，分别对应英文字母‘O’、‘P’、‘T’、‘I’、‘C’、‘A’和‘L’。第二行显示了相应的G-PSF，每个G-PSF包含随机分布和大小的圆圈、矩形和三角形。这设置为使用不同的PSF对明文进行编码，以便测量矩阵A满足

实验结果

为了验证PhysenNet–MOE的实际可行性，构建了一个无透镜的多图像光加密实验系统，如图6(a)所示。光源是一个空间非相干发光二极管（LED）（M470l5，Thorlabs），产生的光中心波长为532 nm。光线通过窄带滤波器（

Δ [GSLL]=3 nm

（FBH473-3，Thorlabs）后，照射到明文上。来自明文的衍射光被分束器（BS）分离

讨论与结论

从理论角度来看，深度神经网络的训练由损失函数的优化决定，该优化决定了网络参数的更新。传统的端到端学习方法通常依赖于配对训练数据来构建损失函数，从而将光加密-解密过程视为一个黑盒。在提出的PhysenNet框架中，损失函数是基于MOE的物理前向模型明确制定的。

CRediT作者贡献声明

王志勇：资金获取、概念化。徐宁：撰写——原始草案、可视化、软件、形式分析、数据整理。齐大龙：撰写——审阅与编辑、验证。张宪：监督、项目管理。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

这项工作部分得到了国家自然科学基金（12471368、12274139、12574323、12325408）和上海市教育委员会（2024AI01007）的支持。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号