针对非独立同分布数据下联邦学习的后门攻击：基于梯度信任与无数据蒸馏的可扩展防御框架SHIELD-FL

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Egyptian Informatics Journal》：SHIELD-FL: Scalable backdoor defense in federated learning via gradient trust and data-free distillation under non-IID data

【字体：大中小】 时间：2026年02月16日 来源：Egyptian Informatics Journal 4.3

编辑推荐：

　　本文聚焦联邦学习（FL）在敏感领域部署时面临的后门攻击威胁，尤其是在高恶意客户端比例和非独立同分布（non-IID）数据场景下。研究人员提出了一种名为SHIELD-FL的新型防御框架，该框架无需外部干净数据集，通过整合梯度信任索引、自适应聚类（基于HDBSCAN）和鲁棒知识蒸馏（结合温度缩放与随机权重平均）三大模块，动态评估客户端可靠性、隔离良性更新并安全聚合知识。实验表明，SHIELD-FL在CIFAR-10、EMNIST和Fashion-MNIST数据集上，面对五种自适应后门攻击，即使恶意客户端比例高达60%，仍能保持最高92.5%的主任务准确率，并将攻击成功率降至3.6%，其性能优于FLTrust等依赖数据的防御方法，且运行速度比集成方法快3–4倍。这项工作为资源受限、隐私敏感的分布式学习环境（如新兴的MENA地区应用）提供了高效、可扩展且与攻击无关的安全解决方案。

在金融预测、移动系统和医学影像等敏感领域，联邦学习（Federated Learning, FL）通过在分散的设备上协作训练模型而无需共享用户原始数据，成为保护隐私的关键技术。然而，这种分布式特性也使其暴露在新的安全威胁之下——后门攻击。恶意客户端可以通过上传被“投毒”的模型更新，在保持模型对正常输入准确性的同时，暗中植入特定“触发器”，使得部署的全局模型在面对带有该触发器的输入时，执行攻击者预设的错误行为。这种风险在需要强安全框架的分布式系统（如远程手术）中尤为致命。

问题的复杂性因两大挑战而加剧：一是自适应攻击者能够动态规避现有防御机制；二是客户端间普遍存在的非独立同分布数据，这会掩盖恶意更新的统计偏差，使传统异常检测方法失效。现有防御方案，如FLTrust需要一小部分可信数据集进行客户端归一化，在隐私敏感场景中可用性受限；而FLAC等多粒度聚类方法虽有效但计算开销较大。因此，亟需一种无需外部数据、可扩展且能抵御高比例恶意客户端与复杂数据分布的防御方案。

为此，来自埃及曼苏拉大学信息技术系的研究团队在《Egyptian Informatics Journal》上提出了SHIELD-FL框架。该框架的核心在于构建一个三层闭环防御管道：首先通过梯度信任索引动态量化每个客户端的可靠性，分析其对对抗性扰动的敏感性；随后利用自适应模型聚类，在参数空间中使用余弦相似度和HDBSCAN算法，将行为一致的良性客户端聚集起来；最后通过鲁棒知识蒸馏，聚合可信客户端的知识，利用温度缩放的软标签和随机权重平均来更新全局模型，同时向可疑客户端发送混淆后的更新以迷惑攻击者。

本研究主要采用了以下关键技术方法：1. 梯度信任评分：通过计算客户端梯度与队列平均方向的余弦相似度进行离群点检测，并结合对抗性扰动敏感度分析（计算扰动下模型输出的方差）来量化客户端可靠性。2. 自适应HDBSCAN聚类：利用余弦相似度衡量客户端模型参数与全局模型的对齐程度，并采用基于密度的HDBSCAN算法自动识别良性集群，其最小簇大小随训练轮次自适应调整。3. 鲁棒知识蒸馏：对筛选出的良性客户端模型进行logit（逻辑值）平均，通过温度缩放（T=5）软化预测分布，并以KL散度作为损失函数指导全局模型更新，同时引入随机权重平均来稳定训练并收敛至更平坦的损失区域。

研究结果表明，SHIELD-FL在多种严苛条件下均表现出色：

•
高效的后门防御：在CIFAR-10、EMNIST和Fashion-MNIST三个数据集上，针对ASFL、DBA、F3BA、ADBA、TSBA五种自适应后门攻击进行评估。即使在恶意客户端比例高达60%、数据呈现严重非独立同分布的情况下，SHIELD-FL能将攻击成功率（ASR）大幅降低至3.6%，同时保持主任务准确率（MTA）高达92.5%。
•
超越现有方法：与需要干净数据集的FLTrust相比，SHIELD-FL在无外部数据的前提下实现了同等甚至更优的防御效果，尤其是在高恶意比例和非独立同分布场景下优势明显。其运行速度比基于集成的方法快3至4倍，通信开销低。
•
模块有效性验证：消融实验证实，梯度信任索引能有效识别出输出方差显著较低的恶意模型；自适应聚类在非独立同分布数据中能稳健地分离出良性客户端群体；温度缩放的知识蒸馏能显著抑制残留的后门信号。
•
理论鲁棒性分析：论文从恶意检测概率、聚类分离性以及收敛鲁棒性三个方面进行了理论分析，为SHIELD-FL在极端对抗条件下的有效性提供了理论支撑。

结论与讨论部分指出，SHIELD-FL是一个与攻击类型无关、无需外部数据且可扩展的防御框架，成功解决了在高对抗比例和非独立同分布数据下联邦学习的后门威胁问题。其方法论灵感来源于更广泛的机器学习范式：信任评分与高斯过程回归中的不确定性量化原理相通；自适应聚类利用了图学习和密度聚类在处理分布式系统复杂关系时的优势；知识蒸馏则融合了集成学习与复合学习的思想以提升泛化能力。该框架特别适用于数据监管严格（如中东和北非地区）、无法获取干净参考数据的隐私敏感应用场景，例如跨境医疗诊断、智慧城市管理和农业物联网监测。未来的工作可以探索将SHIELD-FL与安全多方计算或同态加密相结合，以提供端到端的隐私与安全保证，并进一步优化其在超大规模客户端场景下的计算效率。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号