通过受限莫比乌斯攻击提升异构模型迁移能力

【字体: 时间:2026年02月13日 来源:Pattern Recognition 7.6

编辑推荐:

  针对深度神经网络在异构架构间对抗样本转移性不足的问题,提出约束M?bius攻击(CMA),通过几何变换生成多样化对抗样本并保持语义一致性,显著提升跨架构攻击效果。

  
强婉|曾慧|彭安杰

摘要

深度神经网络(DNNs)对对抗性样本非常脆弱,这严重影响了它们在安全关键应用中的可靠性。在各种攻击策略中,基于输入转换的方法在增强对抗性迁移能力方面尤为有效。然而,尽管这些方法在同类架构中取得了成功,但它们在异构架构(如CNN和Transformer之间的攻击迁移)中的性能仍然有限。这种限制源于它们无法捕捉不同架构所共有的更通用和不变的特征。为了弥合这一差距,我们提出了一种新颖且通用的攻击策略——受限莫比乌斯攻击(Constrained M?bius Attack,简称CMA),以提高异构架构间的迁移能力。具体来说,CMA利用莫比乌斯变换对输入样本进行几何增强,生成结构一致但视角多样的样本。我们进一步引入了一组约束来控制变形程度并保持语义一致性。广泛的实验表明,CMA在各种异构黑盒攻击场景中的表现显著优于当前领先方法。代码可在以下链接获取:https://github.com/britney-code/CMA

引言

深度神经网络(DNNs),特别是卷积神经网络(CNNs)和视觉变换器(ViTs),在图像识别和视频分析等关键视觉任务中取得了显著成功[1],[2]。然而,这些模型的广泛采用也暴露了它们的内在安全风险。它们对精心设计的对抗性样本(AEs)[3],[4],[5],[6]具有极高的脆弱性,这可能导致模型在安全关键场景中做出灾难性的错误分类。因此,深入理解和评估这些先进模型的内在脆弱性已成为学术研究和实际应用中的紧迫问题。
在各种攻击方式中,基于迁移的攻击[7],[8],[9]因其实际威胁性而受到广泛关注,因为它们可以在不接触目标模型的情况下实施有效攻击。尽管现有工作在提高AEs的迁移能力方面取得了显著进展,但这些研究主要局限于同类架构。一部分研究专注于提高CNN模型之间的迁移能力[7],[9],而另一项新兴研究领域则集中在ViTs之间的迁移攻击[10],[11]。然而,一个长期且更具挑战性的问题是异构架构之间的迁移问题。在本文中,我们将异构迁移能力定义为在一种架构家族的替代模型上制作的AEs成功欺骗另一种架构家族的目标模型的能力(例如,CNN → ViT)。实际上,这种异构迁移的成功率明显低于同家族内的迁移,这阻碍了我们对不同架构是否具有可利用的、与模型无关的弱点的理解。
据我们所知,针对异构模型的攻击研究仍然不足。尽管模型增强[9]可以通过输入转换模拟相似架构的决策空间,但现有的基于输入转换的攻击方法未能有效提高异构模型之间的迁移能力。一个核心原因是异构架构编码了不同的归纳偏见,因此依赖于不同的视觉线索:CNN由于局部卷积而更倾向于纹理偏见,而ViT由于全局自注意力而更倾向于形状/结构偏见[12],[13]。因此,在替代模型上优化的扰动容易过度适应替代模型特定的线索,导致跨架构迁移时的泛化能力较弱[14]。如图1所示,基于自然先验的传统变换(如裁剪、平移和缩放)仅对图像进行简单调整,无法迫使具有不同架构的模型放弃其固有的识别逻辑。特别是像平移[8]和缩放[9]这样的方法是基于卷积操作的平移和尺度不变性设计的。因此,它们对跨异构架构的泛化帮助有限。较新的基于几何的变换(如BSR [15],DeCoWA [14])仍然主要在2D欧几里得先验下操作,难以模拟由3D相机或物体运动引起的真实世界视觉感知中的视角变化。这种视角限制了增强样本的多样性,从而限制了跨架构不变线索的发现。此外,某些变换可能会破坏物体的完整性(例如,破坏全局拓扑[15]),这会使攻击偏向于分散的局部伪影,而不是语义上有意义的结构,进一步削弱了异构迁移能力。基于上述分析,从输入转换的角度来看,我们观察到莫比乌斯变换[16]可以在温和地变形物体部分的粗略全局布局的同时生成多样的视角变化。这种近似保持结构的视角增强鼓励攻击捕捉更深层次的、视角不变的对象结构特征,从而可能提高跨异构架构的迁移能力。如图2所示,异构模型的梯度显著性图可视化揭示了一个关键现象:尽管架构不同,模型在关注对象的高级语义特征方面表现出高度的一致性。这一观察进一步支持了我们的假设,即视角不变的结构线索可以作为跨架构迁移攻击的桥梁。
因此,我们引入了一种新颖且通用的输入转换方法,称为受限莫比乌斯变换,即一类作为可控视角类非线性变形的共形映射,用于探测和攻击异构模型在视角不变性方面的共同弱点。在连续域中,莫比乌斯变换是保持拓扑的同胚映射,可以在不撕裂或折叠底层物体的情况下生成丰富的视角多样性。然而,在实际实现中,它们是通过插值和填充在有限像素网格上实现的离散图像变形,因此严格的拓扑不变性(例如,细结构的精确连通性)不再得到理论保证。鉴于此,CMA限制了变换参数,以引入足够改变局部外观和背景上下文的视角变化,同时在目标分辨率下尽可能保持物体核心部分的感知组织。在这种受限变换下,核心组成部分及其相对排列通常保持稳定,这鼓励攻击超越表面的、可变的线索,利用跨架构的更深层次的、共享的结构不变性。由于不受限制的莫比乌斯映射可能会引入过度变形和语义不一致性,我们进一步施加了明确的变形约束,以平衡视角多样性和标签保留。
  • 据我们所知,这是旨在提高跨异构模型迁移能力的开创性工作之一。
  • 我们对异构模型攻击任务进行了系统分析,发现先前方法中的AEs未能解决视角依赖性问题,限制了它们挖掘通用结构特征的能力,从而限制了迁移能力。
  • 受限莫比乌斯攻击(CMA)通过将莫比乌斯变换集成到基于梯度的攻击方法中来提出。据我们所知,这是首次利用莫比乌斯变换进行对抗性攻击的工作,其核心目标是针对异构模型在视角不变性方面的共同弱点。
  • 广泛的实验表明,CMA在多种异构黑盒迁移场景中始终优于领先的基线方法。
  • 部分片段

    CNN和Transformer的固有属性

    DNN的架构对其特征提取方法和归纳偏见有着深远的影响。CNN基于卷积层构建,由于局部感受野和权重共享机制,擅长捕捉图像的高频成分,如纹理。研究表明,卷积操作在功能上类似于一系列高通滤波器,这为CNN对细节的敏感度提供了原理上的解释

    初步介绍

    给定一个具有参数?的图像分类器f?,它将输入样本xRH×W×C映射到其真实标签y?∈?{1, 2, ..., K,其中K表示类别总数。无目标对抗性攻击的目标是对原始样本x引入一个微小且人类无法察觉的扰动δ,从而生成一个AE xadv=x+δ。这样做是为了诱导分类器做出错误预测,即f?(xadv)?≠?y。为了限制扰动的幅度,xadv

    实验设置

    数据集和基线。遵循之前的研究[14],[15],我们在ImageNet兼容的数据集1上评估了我们提出的方法,该数据集包含1000张图像,曾用于NIPS 2017年的对抗性竞赛。为了进行全面性能评估,我们在几个类别中对CMA和最先进的攻击方法进行了广泛的比较。首先,我们选择

    讨论

    本文的核心贡献是提出了CMA,实验表明它能够提高异构模型架构之间对抗性攻击的迁移能力。
    CMA的有效性源于其通过从视角角度增强输入多样性来捕捉视角不变的结构特征的能力。莫比乌斯变换的一个关键属性是它能够近似保持物体的全局空间结构

    结论

    在这项研究中,我们提出了一种新颖的CMA方法来提高AEs在异构模型之间的迁移能力。我们的方法将莫比乌斯变换引入到2D图像平面上的可控视角类非线性变形中,用于探测和利用异构模型在识别物体结构不变性方面的共同弱点。广泛的实验结果有力地证明了CMA优于当前的最先进方法

    CRediT作者贡献声明

    强婉:撰写——原始草稿、可视化、验证、软件、方法论、调查、形式分析。曾慧:撰写——审稿与编辑、资金获取。彭安杰:撰写——审稿与编辑。

    利益冲突声明

    作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

    致谢

    本工作得到了广东省信息安全技术重点实验室(编号2023B1212060026)的开办项目支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号