FedNLU:一种在存在噪声标签的情况下依然稳健的联邦学习方法

《Neurocomputing》:FedNLU: Robust federated learning with noisy label unlearning

【字体: 时间:2026年05月10日 来源:Neurocomputing 6.5

编辑推荐:

  钟进|陈思光|黄胜军南京航空航天大学,南京,210016,中国摘要联邦学习(FL)是一种去中心化的训练范式,它允许在不需要共享原始数据的情况下进行协作式模型开发,在对隐私敏感的场景中引起了越来越多的关注。然而,大多数现有的FL研究假设所有训练样本都被正确标记,这与现实世界的情景常

  
钟进|陈思光|黄胜军
南京航空航天大学,南京,210016,中国

摘要

联邦学习(FL)是一种去中心化的训练范式,它允许在不需要共享原始数据的情况下进行协作式模型开发,在对隐私敏感的场景中引起了越来越多的关注。然而,大多数现有的FL研究假设所有训练样本都被正确标记,这与现实世界的情景常常相矛盾,因为在现实世界中,由于人为错误或自动标记的原因,标签噪声是很常见的。这种噪声监督会显著影响模型性能并阻碍收敛。为了解决这一挑战,我们提出了FedNLU,一个具有噪声标签去学习功能的强大联邦学习框架。具体来说,FedNLU首先使用小损失标准识别干净样本,并将模型优化限制在这些样本上,以减轻标签噪声的不利影响。与那些需要从头开始重新训练的方法不同,FedNLU引入了一种基于噪声去学习的连续训练策略。通过在噪声识别阶段明确移除记忆中的噪声标签的影响,并从未学习的模型状态恢复训练,FedNLU提高了预测准确性和训练效率。在五个基准数据集上的广泛实验表明,FedNLU在合成和真实世界的标签噪声下都能保持竞争力的准确性,其准确性与最强基线相比提高了多达13.29%。此外,与从头开始重新训练的策略相比,FedNLU分别将所需的通信轮次和计算FLOPs减少了58.3%和47.1%,从而验证了其有效性、鲁棒性和效率。

引言

医疗物联网(IoMT)的快速发展通过实现从边缘设备自动收集和处理医疗数据,显著改变了医疗行业[16],[44]。这种范式减少了与手动数据处理相关的错误,提高了诊断准确性,并降低了运营成本[17],[22],[46]。此外,人工智能(AI)的集成正在加速这一转变。特别是,深度学习技术在疾病诊断任务中展示了显著的潜力[30]。尽管有这些进步,传统的智能医疗系统通常依赖于集中式架构,其中从地理分布式的IoMT设备(例如可穿戴传感器)收集的数据被传输到中央服务器进行分析。这样的架构存在几个固有的局限性,包括过多的通信开销、延迟增加以及对单点故障的脆弱性。更重要的是,将原始患者数据传输到外部服务器会带来重大的隐私风险,使得集中式解决方案越来越不符合严格的数据保护法规[45]。
为了解决上述挑战,联邦学习(FL)作为一种有吸引力的分布式学习范式应运而生[7],[24],[35],[43],[58]。通过交换本地模型更新而不是原始数据来实现协作式模型训练,FL有效地保护了数据隐私,同时减少了通信开销[39]。这些特性使FL特别适合于各种对隐私敏感的应用,如医疗保健、智能交通和数字银行[4],[5],[12],[51]。然而,在医疗保健场景中,现有FL研究中一个关键但尚未充分探索的局限性在于假设训练标签总是可靠的,而在现实世界的医疗应用中这一假设很少成立。实际上,不同机构的医疗注释质量差异很大。例如,由经验丰富的专业人士组成的皮肤病中心使用先进的诊断工具,往往能够生成比资源有限的普通医院更准确的标签。因此,在去中心化的医疗数据集中,标签噪声是不可避免的。这种噪声监督不仅降低了FL模型的预测性能,还对其收敛行为产生了不利影响,这对医疗保健环境中的联邦学习提出了一个根本性的挑战。
为了减轻噪声标签的影响,在集中式深度学习中已经开发了多种方法[23],[36],[54],[55]。然而,这些方法大多依赖于与FL设置不兼容的假设,例如需要访问整个数据集或全局分布统计信息,这直接违反了FL所固有的隐私限制。最近的努力尝试在FL框架内处理噪声标签,利用干净的参考数据集来识别和重新加权噪声样本或纠正错误标记的样本[10],[56],[69]。尽管如此,在实际应用中获取高质量、干净的数据集往往是不切实际的。另一条研究路线采用小损失标准来识别干净样本,然后仅使用过滤后的数据从头开始重新训练(图1(a))。虽然这在某些情况下有效,但这种方法引入了大量的计算和通信开销。更重要的是,如图1(c)所示,丢弃先前训练的模型不仅浪费了大量计算资源,还会由于擦除从干净样本中学到的有价值表示而导致性能下降。这些局限性自然引出了一个重要问题:如何在识别出干净样本后继续训练,同时减轻先前学习到的噪声标签的负面影响,而无需从头开始重新训练过程?最近的几项工作尝试通过专门的架构或强大的损失函数来解决噪声监督问题[6],[34]。然而,由于对高噪声的容忍度低,它们的有效性仍然有限。
为了解决上述局限性,我们提出了一个名为Federated Learning with Noisy Label Unlearning(FedNLU)的新框架。FedNLU引入了一种参数级的去学习策略,允许在不需要从头开始的情况下继续模型训练,从而在存在噪声标签的FL场景中提高了鲁棒性和效率。主要贡献总结如下:
  • 我们基于小损失标准提出了一种强大的噪声标签识别机制,可以有效区分干净样本和噪声样本。通过将模型优化限制在识别出的干净数据上,显著减轻了标签噪声的不利影响。
  • 我们没有丢弃用噪声标签训练的模型(图1(a)),而是设计了一种参数级的去学习机制(图1(b)),选择性地移除噪声监督的影响,同时保留从干净样本中学到的有用表示。这使得无需重新开始即可高效地继续训练,从而加快了收敛速度并提高了性能(图1(c))。据我们所知,这是首次将去学习的概念集成到联邦噪声标签学习中。
  • 在CIFAR-10/100、ISIC 2018皮肤病变数据集以及真实世界的噪声数据集(CIFAR-10N/100N)上的广泛实验表明,FedNLU在模型准确性和计算效率方面都优于现有方法。
本文的其余部分组织如下。第2节涵盖了相关工作。第3节介绍了提出的方法。然后,第4节展示了实验结果。最后,第5节总结了本文。

节片段

联邦学习

联邦学习(FL)是一种分布式训练范式,它允许多个客户端在保留数据隐私的同时协作优化共享模型[8],[9],[43],[70],[77]。参与者客户端定期将本地模型更新传输到中央服务器进行聚合,而不是交换原始数据。这种去中心化的学习方案有效地缓解了隐私问题,并促进了跨客户端协作,使得FL特别适合对隐私敏感的应用

提出的方法

在本节中,我们首先正式阐述了联邦学习(FL)设置中带有噪声标签的学习问题,然后介绍了我们提出的框架Federated Learning with Noisy Label Unlearning(FedNLU)。FedNLU通过结合噪声样本识别和基于噪声去学习的连续训练来解决这一挑战,以减轻噪声标签对FL训练的负面影响。

实验设置

数据集。我们在合成和真实世界的噪声标签数据集上评估了FedNLU。对于合成噪声,我们使用了CIFAR-10 [29]、CIFAR-100 [29]和ISIC 2018 [11],[53]。具体来说,CIFAR-10CIFAR-100是广泛用于图像分类的基准数据集。这两个数据集各包含60k张彩色图像,CIFAR-10涵盖了10个对象类别,而CIFAR-100将任务扩展到了100个细粒度类别。此外,CIFAR-100被组织成20个超类,每个超类包含

结论

在这项工作中,我们提出了FedNLU,一个具有噪声标签去学习功能的强大联邦学习框架。具体来说,FedNLU首先引入了一种有效的噪声标签识别机制,允许模型在识别出的干净样本上进行训练。为了避免从头开始重新训练的高成本,我们进一步设计了一种基于噪声去学习的连续训练策略,以消除记忆中噪声标签的影响,而无需重新开始整个训练过程。

CRediT作者贡献声明

钟进:撰写 – 原始草稿、可视化、方法论、调查、形式分析、数据管理、概念化。陈思光:撰写 – 审稿与编辑、监督、资金获取。黄胜军:撰写 – 审稿与编辑、监督、资金获取。

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系可能会影响本文报告的工作。

致谢

本项工作得到了国家自然科学基金(U2441285)、中央高校基本科研业务费(B250201047)和江苏省333高层次人才培训计划的支持。
钟进于2021年在中国南京邮电大学获得物联网工程学士学位。她目前正在南京航空航天大学攻读计算机科学与技术博士学位。她的研究兴趣主要在机器学习领域,特别是在联邦学习、多标签学习和噪声标签学习方面。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号