适用于动态和异构环境的鲁棒联邦学习:一种自适应客户端选择方法

《Expert Systems with Applications》:Robust Federated Learning for Dynamic and Heterogeneous Environments: An Adaptive Client Selection Approach

【字体: 时间:2026年03月14日 来源:Expert Systems with Applications 7.5

编辑推荐:

  联邦学习客户端选择优化框架 FedTD-HMM 融合真相发现(TD)与隐马尔可夫模型(HMM),解决客户端价值评估偏差和静态选择策略缺陷问题。TD 模块通过多维度指标迭代优化客户端可靠性权重与理想聚合更新,HMM 模块基于Viterbi算法实时推断训练阶段并动态调整选择权重,有效提升系统鲁棒性和收敛效率。实验表明其准确率最高提升3.11%,通信轮次减少31.4%。

  
陈瑞|鲍东阳|卢宁|赵静
大连理工大学软件技术学院,中国大连,116024

摘要

尽管联邦学习(FL)为协作训练提供了一个保护隐私的框架,但选择哪些客户端参与的过程是决定系统处理现实世界动态和异质性的关键因素。然而,现有方法存在两个严重限制,这些限制降低了选择的可靠性:无法在复杂的多方面错误中准确估计客户价值,以及过度依赖缺乏理论保证的次优启发式策略,这可能导致关键信息丢失。为了解决这些问题,我们提出了FedTD-HMM,这是一个将真理发现(TD)与隐马尔可夫模型(HMM)相结合的自适应客户端选择框架,以系统地解决异构FL中的双重挑战,即客户端质量评估和动态策略调整。首先,我们使用TD通过迭代估计客户端质量和理想的聚合更新来对抗有偏估计,利用余弦相似度来估计多维客户端更新之间的方向一致性。随后,我们使用具有四种操作状态的HMM对训练过程进行建模,并应用Viterbi算法进行实时推理当前训练状态和自适应调整选择权重。这使得选择策略能够针对当前的训练状态进行优化,将过程从静态配置转变为动态的、状态感知的优化,显著提高了系统的鲁棒性和收敛性。最后,在真实世界数据集上的实验表明,FedTD-HMM在具有50%低质量客户的情况下,测试准确率提高了3.11%,同时减少了31.4%的通信轮次。代码可在https://github.com/NihaoRay/FedTD-HMM获取。

引言

联邦学习(FL)(Seo, Kim, Kim, & Han (2024); Tang (2024))允许多个客户端在分布式数据上协作训练模型,同时确保数据保持本地存储并私密访问(You, Guo, Yuen, Chen, Zhang, & Poor (2025))。与传统分布式优化相比,FL在隐私保护和通信效率方面具有明显优势,使其非常适合从敏感数据中提取知识(Zhang, Hong, Deng, Mahdavi, & Zhou (2023); Gao, Zhang, Guo, Zhang, Xiang, Qiu, Wen, & Liu (2023); Li, Zhu, Liu, Tang, & Ren (2024))。因此,FL已广泛应用于智能家居、金融服务和医疗保健等数据敏感领域(Kashyap, Geenjaar, Bey, Dhindsa, Glomb, Plis, Keilholz, & Ritter (2025); Moorthy (2023); Wu, Chen, Wen, Xu, Zhang, & Zhu (2024); Xue, Yan, Tang, Yu, Luo, Cai, Nie, Wu, Gu, & Wang (2024))。然而,当FL扩展到大量客户端时,协调过程的中央服务器面临重大挑战,包括通信瓶颈和高延迟,需要有效的客户端选择机制(Chen, Zhou, Zhang, Sun, & Poor (2024); Trindade, da Fonseca (2024))。
有效的客户端选择对于缓解这些问题至关重要,可以防止落后者降低性能,并确保模型准确性(You, Liu, Wang, Zuo, Chang, & Yuen (2023); Hu, Lu, Han, Cao, Liu, & Fu (2025); Cai, Zhao, Liu, Fu, Li, & Yu (2025))。由于FL数据本身的系统异质性(非独立同分布,Non-IID)(Wang, Kaplan, Niu, & Li (2020),这项任务的复杂性进一步增加。此外,在车辆网络等动态环境中,不同的通信能力和间歇性连接引入了时空动态,阻碍了稳定更新(Wang, Chen, Li, Liao, Jin, & Li (2023); Luo, Xiao, Wang, Huang, & Tassiulas (2022))。客户端参与的异步性质进一步加剧了这些问题,导致数据丰富度和更新滞后性的差异,从而可能导致聚合效率低下和模型过拟合(Zhang, Liu, Lin, Wu, Zhou, Jiang, & Ji (2023); Sun, Sun, Pan, Fu, & Guo (2025))。
在这种异构和动态的环境中,选择最优的客户端子集面临两个基本挑战,现有方法未能充分解决。首先,客户端价值评估模型存在系统性偏差。当前方法,从随机抽样(Liang, Lin, Fu, Zhu, & Li (2022); Liang, Zhang, Qu, & Wang (2025)到基本的真理发现(TD)策略(Xu, Jia, Zhu, Zhang, Jin, & Sharif (2022); Li, Liu, Ling, Du, & Ren (2025)),难以准确估计客户端贡献的质量。它们通常将客户端上传中的错误视为一个整体,未能捕捉其复杂的来源。实际上,这些错误源于多种重叠因素:数据质量或计算限制导致的内在随机错误,以及网络抖动或位置变化等环境因素引起的外在不确定性(You et al. (2023); Xu et al. (2022); Wang, Jia, Zhang, Hu, Ren, Sun, Wen, & Zhang (2024); Vono, Plassier, Durmus, Dieuleveut, & Moulines (2022))。这种相互作用从根本上削弱了现有估计模型的可靠性。
其次,选择策略过度依赖僵化的启发式规则,而没有理论上的最优性保证。常见的贪婪算法根据单一质量指标对客户端进行排名并淘汰固定比例的客户端(Ma, Xu, Xu, Jiang, Huang, & Huang (2021); Lin, Gao, Du, Niyato, Kang, & Liu (2024))。这些方法缺乏根据不同训练阶段调整选择规模的灵活性。更严重的是,它们僵化的淘汰标准可能导致“任务覆盖不完整”。具体来说,拥有罕见但关键数据的客户端(即“长尾”客户端)可能因整体质量排名较低而被集体排除,从而导致不可逆的信息丢失,并使全局模型变得次优(Hu et al. (2025); Manzoor, Khan, Khan, Ayaz, Flynn, Imran, & Zoha (2022))。这些启发式方法并未针对与全局模型性能相关的明确目标函数进行优化,因此其结果本质上是不够理想的。
为了解决这两个核心挑战,我们提出了FedTD-HMM(如图1所示),这是一个将真理发现(TD)(Xu et al. (2022)与隐马尔可夫模型(HMM)(Hu et al. (2025))相结合的自适应客户端选择框架。我们的框架采用两阶段优化方法。在第一阶段,为了对抗有偏评估,我们基于真理发现理论构建了一个质量评估机制。它不是将客户端错误视为一个整体,而是迭代估计客户端可靠性权重和理想的“真实”聚合更新。通过使用改进的余弦相似度来衡量每个客户端更新与这一不断发展的共识之间的方向一致性,该机制能够稳健地识别出真正的贡献。通过整合多维指标(例如,准确性、网络质量)(You et al. (2023); Hu et al. (2025)来产生每个客户端的全面可靠的质量分数。
在第二阶段,为了取代次优的启发式方法,我们引入了一种基于模型的动态方法,使用HMM。这直接解决了适应性和任务覆盖不完整的问题。我们将FL训练过程建模为一个在隐藏状态之间转换的随机系统(Hu et al. (2025)(探索、稳定收敛、微调和振荡恢复)。利用实时训练动态作为观察结果,Viterbi算法(Forney (2005)推断当前训练阶段。这种推理使系统能够调整其选择策略——例如,在早期探索期间优先考虑基础设施可靠性,以建立稳定的训练基线。这将客户端选择从一个静态程序转变为一个与阶段依赖的目标相一致的自适应优化过程,提供了理论上的可解释性并确保了鲁棒性。
总之,本工作的主要贡献如下:
  • 我们提出了FedTD-HMM,这是一个自适应客户端选择框架,它将真理发现与隐马尔可夫模型相结合,以解决异构FL环境中的客户端质量评估和动态策略调整问题。
  • 我们设计了一种基于真理发现的质量评估机制,通过迭代优化同时估计客户端可靠性权重和真实聚合更新。该机制使用余弦相似度来衡量更新一致性,并结合多维指标(准确性、网络质量、计算效率)来生成全面的客户端重要性分数。
  • 我们将FL训练过程建模为一个随机状态转换系统,并使用Viterbi算法进行阶段推理。这使得我们的框架能够根据当前的训练动态动态调整选择策略,防止过早排除拥有罕见但关键数据的客户端。
  • 在涵盖图像、音频和文本模态的六个数据集(MNIST、Fashion-MNIST、CIFAR-10、CIFAR-100、语音命令和莎士比亚)上的广泛实验表明,FedTD-HMM的准确率提高了0.49%-3.11%,同时将通信轮次减少了13.5%-31.4%,验证了其在具有挑战性的联邦场景中的有效性。
  • 相关工作

    相关工作

    客户端选择是联邦学习的关键组成部分。现有策略大致可以分为两类:基于启发式的方法,使用简单的预定义规则;以及基于学习的方法,将选择问题表述为序列决策问题。在本节中,我们回顾了这两类的最新进展,以定位我们的工作并突出FedTD-HMM所解决的未解决问题。
    (1) 基于启发式的选择方法。这些方法进行选择

    初步

    为了便于理解数学公式,我们在表1中总结了本文中使用的所有关键符号。

    FedTD-HMM的设计

    为了解决由于错误来源混合导致的有偏客户端评估和任务覆盖不完整的次优选择策略这两个挑战,我们的框架直接将两个协同模块与这些目标对齐(图2,算法1)。第一个模块使用真理发现(TD)(Xu et al. (2022)将内在质量与外在不确定性(例如,滞后性)分离,确保公平评估。第二个模块使用隐马尔可夫模型(HMM)(Hu et al. (2025)

    性能评估

    为了全面评估我们提出的FedTD-HMM框架的有效性和效率,我们将实验与引言中建立的理论前提对齐:系统能否有效地将内在数据保真度与外在环境不确定性分离? 完整实现可在https://github.com/NihaoRay/FedTD-HMM获取。我们设计了一系列实验来回答以下五个核心研究问题(RQs):
    RQ1(通过……实现收敛效率)

    局限性和未来工作

    尽管FedTD-HMM在处理数据和系统异质性方面表现出色,但我们公开承认我们工作的当前局限性,特别是在异步验证、可扩展性和模型敏感性方面。这些局限性为未来的研究指明了关键方向。
    (a) 异步FL的验证范围:尽管我们在5.2.10节提供了一个试点研究,证明FedTD-HMM可以扩展到异步环境(实现了……

    结论

    在本文中,我们提出了FedTD-HMM,这是一个自适应客户端选择框架,它将真理发现(TD)和隐马尔可夫模型(HMM)相结合,以解决异构联邦学习中的双重挑战:准确的客户端质量评估和动态策略调整。我们的方法克服了先前工作的两个关键限制:(1) 在复杂错误中无法准确估计客户端价值;(2) 依赖缺乏理论保证的启发式策略。通过TD模块,我们

    CRediT作者贡献声明

    陈瑞:概念化、方法论、软件、调查、形式分析、写作——原始草稿。鲍东阳:方法论、软件、调查、数据策划、写作——原始草稿。卢宁:调查、数据策划、写作——原始草稿。赵静:概念化、监督。

    利益冲突声明

    作者声明没有利益冲突。这项工作是原创的、未发表的,且未在其他地方考虑。所有作者均已批准最终稿件。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号