FreqMambaMark：基于小波-Mamba技术的鲁棒医学图像水印算法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Knowledge-Based Systems》：FreqMambaMark: Wavelet-Mamba-Driven Robust Medical Image Watermarking

【字体：大中小】 时间：2026年01月22日 来源：Knowledge-Based Systems 7.6

编辑推荐：

　　数字水印技术通过嵌入认证信息保障医学图像的数据真实性、完整性和可追溯性，但水印嵌入可能干扰细微纹理和灰度差异，影响诊断准确性，且现有方法难以平衡水印不可感知性与抗复合攻击能力。本文提出基于小波Mamba架构的FreqMambaMark框架，通过Haar小波分解图像频率域，采用自适应残差隐藏策略嵌入水印至中高频子带，结合CNN精细捕捉局部纹理，并引入动态复合攻击训练范式提升鲁棒性，实验表明其PSNR达43.8 dB，SSIM为0.971，抗复合攻击能力提升10.8%，在NIH胸片、脑肿瘤MRI及COVID-19 CT数据集上验证有效。

何中祥|陈玉玲|杨一贤|欧阳志|罗云|陈龙

贵州大学公共大数据国家重点实验室，中国贵州，550025

摘要

数字水印技术将认证信息嵌入医学图像中，以确保数据的真实性、完整性和可追溯性。然而，医学图像中的细微纹理和灰度变化对诊断至关重要。不适当的水印嵌入可能会干扰临床解读，从而对诊断准确性构成潜在风险。同时，现有方法在平衡水印的不可察觉性和对抗复合攻击的鲁棒性方面存在困难。

为了解决这些挑战，我们提出了基于小波域Mamba架构的医学图像鲁棒水印框架FreqMambaMark。该框架使用Haar小波分解图像频带，采用自适应残差隐藏策略，并利用卷积神经网络（CNN）进行细粒度水印嵌入，实现了高保真度结果（PSNR：43.8 dB，SSIM：0.971）。在水印提取过程中，Mamba状态空间模型的长距离建模增强了低频成分的恢复能力，在复杂失真情况下将水印鲁棒性提高了10.8%。此外，我们引入了动态复合攻击训练范式，并在NIH胸部X光、脑肿瘤MRI和COVID-19 CT-3数据集上验证了该框架的泛化能力，为医学图像安全提供了一种有效解决方案。

引言

人工智能（AI）在医疗领域的深度融合从根本上将医学图像管理从被动存储转变为积极的高频流通[1]。在多学科远程咨询、跨机构研究合作和AI辅助转诊等关键场景中，必须快速交换大量成像数据以支持临床决策。

然而，这种开放的生态系统引入了严重的安全漏洞。敏感患者数据在复杂网络中的传输不可避免地使其面临未经授权的重新分发和恶意篡改，可能导致严重的医疗错误或隐私泄露。虽然传统加密技术可以确保传输过程中的保密性，但一旦数据被解密用于查看或处理，就无法提供保护。因此，建立一种持久的保护机制，以确保医学图像在其整个生命周期内的真实性、完整性和可追溯性——同时不损害诊断准确性——已成为当务之急[2]，[3]。

数字水印通过将不可察觉的认证信息嵌入医学图像中，提供了一种轻量级且非侵入性的数据保护解决方案[4]。与传统加密方法不同，水印技术即使在解密后也能保持验证数据完整性的能力，允许授权用户通过隐藏的标记追踪数据来源并检测篡改[5]。最近，基于深度学习的端到端水印方法在嵌入能力和视觉不可察觉性方面取得了显著进展[6]。然而，将这些为自然图像设计的通用模型直接应用于医学图像仍面临几个关键挑战[7]：

挑战1：诊断准确性要求。医学图像（例如X光、CT扫描）包含重要的病理信息。水印嵌入技术必须满足极高的视觉透明度要求，完全不可察觉且不会引入任何视觉干扰，以避免影响临床医生的解读和AI辅助诊断[8]。在实现数据可追溯性的同时，水印系统不得影响诊断准确性。它必须在像素和感知层面保留关键图像特征，确保诊断完整性，防止因水印而导致潜在的误诊或漏诊[9]。

挑战2：现有架构的建模缺陷。主流水印框架在应用于医学图像时存在特定任务的局限性[10]，[11]。由于卷积神经网络（CNN）的固有局部感受野，这些方法往往无法捕捉全局同步特征。因此，当带水印的图像发生全局几何变形（例如在临床查看过程中的旋转或缩放）时，CNN难以重新同步信号，导致严重的解码失败[12]。相反，尽管Transformer提供了全局上下文建模，但其二次计算复杂性对高分辨率医学扫描构成了重大瓶颈。为了减轻计算开销，现有方法通常采用基于补丁的处理或下采样，这不可避免地牺牲了细粒度的局部纹理细节。这种损失在水印中尤为关键，因为它不仅降低了高频嵌入的不可察觉性，还降低了隐藏在细微组织纹理中的比特的恢复准确性[13]，[14]。

挑战3：现实世界复合攻击的复杂性。大多数现有方法在孤立和简单的攻击下评估性能，这与实际临床工作流程有很大差异。实际上，医学图像经常经历多种顺序操作——如有损压缩、网络传输噪声、放射科医生的窗口级调整以及归档系统中的规范化[15]。这些失真过程以非线性方式相互作用，对水印完整性造成更严重的破坏，需要更高的长期鲁棒性[16]。

为了解决这些挑战，本文提出了基于小波Mamba的医学图像鲁棒水印框架FreqMambaMark。该框架结合了基于离散小波变换（DWT）的频域分解和混合Mamba-CNN架构。它采用差异化的建模策略来共同处理多尺度频率成分，从而克服了单一架构在全局-局部表示方面的局限性。此外，引入了动态复合攻击训练范式，随机组合不同类型、序列和强度的攻击来模拟真实的临床失真链，使模型能够学习具有强泛化能力的水印特征，以对抗复合失真。

本研究的主要贡献总结如下：

(i)

跨域集成：我们提出了FreqMambaMark框架，将状态空间模型（SSM）引入数字水印领域。通过将DWT的频域分解与Mamba架构相结合，实现了频域和序列特征的协同建模。这为医学图像水印的高保真度和高鲁棒性提供了一种新的方法论方法。

(ii)

频域协作：基于DWT的自适应残差隐藏机制被设计用于将水印精确嵌入中间和高频子带。通过CNN捕获局部纹理特征，以保持高保真度和不可察觉性。同时，提出了一种频域双路径协作架构：低频路径利用Mamba SSM捕获全局诊断结构，而高频路径采用多尺度卷积网络保留局部纹理细节。这实现了层次化的自适应融合和全局-局部信息的协同优化。

(iii)

动态鲁棒训练：构建了一种复合攻击训练范式。通过模拟具有随机失真链（类型、顺序和强度各异）的复杂临床失真场景，显著提高了模型的鲁棒性和泛化能力。在多个公共医学数据集（NIH胸部X光、脑MRI和COVID-19 CT）上的系统验证证明了我们方法的有效性。结果表明FreqMambaMark保持了高视觉质量。与复合攻击下的最佳基线相比，水印的鲁棒性提高了10.8%，显著优于现有的最先进方法。

本文的其余部分组织如下：第2节回顾相关工作；第3节介绍提出的FreqMambaMark框架；第4节描述实验设置；第5节讨论结果并提供进一步分析；第6节总结本文。

章节片段

医学图像的数字水印

医学图像的数字水印旨在通过将不可见的认证信息嵌入医学图像来实现版权保护、完整性验证和可追溯性[17]。与自然图像的水印相比，医学图像水印面临更严格的约束。任何不适当的水印嵌入都可能影响诊断准确性；因此，该领域已经开发了专门的技术方法[18]。

优先考虑诊断准确性，基于ROI的

方法论

本文提出了基于小波Mamba的端到端医学图像水印框架FreqMambaMark

实验设置

数据集。我们在三个代表性的医学成像数据集上评估了所提出的方法：（1）NIH胸部X光[53]：8,000张涵盖14种常见胸部病理的正面胸部X光片。（2）脑肿瘤MRI[54]：4,000张具有不同类型和解剖位置的脑肿瘤T1加权MRI切片。（3）COVID-19 CT-3[55]：4,000张与COVID-19肺部感染相关的胸部CT扫描，展示了广泛的病变纹理和范围。请注意，所有数据集都是经过充分了解后收集的

理论基础

本文提出的频率自适应双路径架构基于信号处理的多分辨率分析理论。通过小波变换，图像被分解为包含不同空间尺度信息的多个子带。低频近似子带保留了全局轮廓和平滑过渡，而高频细节子带捕获了局部边缘和纹理模式。

我们的双路径框架选择了最佳建模

结论

在本文中，我们提出了FreqMambaMark，这是一种端到端的医学图像水印框架，结合了频域多分辨率分解和混合Mamba-CNN架构。通过采用针对低频全局结构和高频局部纹理的差异化建模策略，该框架在诊断准确性和水印鲁棒性之间实现了有效的平衡。动态复合攻击训练范式系统地模拟了顺序

CRediT作者贡献声明

何中祥：撰写 – 审稿与编辑，撰写 – 原稿，方法论，概念化。陈玉玲：撰写 – 审稿与编辑，监督，项目管理，资金获取。杨一贤：监督，项目管理。欧阳志：资金获取，数据管理。罗云：软件，调查，概念化。陈龙：软件，调查，概念化。

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

联系信箱：

粤ICP备09063491号

摘要

引言