FedHMed：自适应渐进式损失函数与KL散度正则化在联邦异构医学图像分类任务中的应用

《Knowledge-Based Systems》：FedHMed: Adaptive progressive loss and KL-divergence regularization for federated heterogeneous medical image classification tasks

【字体：大中小】 时间：2026年05月04日 来源：Knowledge-Based Systems 7.6

编辑推荐：

印度拉贾斯坦邦斋浦尔Malaviya国家理工学院计算机科学与工程系，302017

摘要

联邦学习（FL）在保护数据隐私的同时，为协作式医学图像分析带来了潜力。然而，在客户（医院）参与不同分类任务的异构临床环境中，其有效性会降低。任务差异以及数据分布不一致和成像方式的变化引入了诸如灾难性遗忘、噪声优化和模型收敛不稳定性等重大挑战。这些问题限制了全局模型的鲁棒性和泛化能力，限制了FL在现实世界精准医学中的应用。为了解决这些挑战，我们提出了FedHMed，这是一种新颖的多任务FL框架，旨在支持客户之间的多样化医学成像任务。FedHMed采用了一种序列模型传输机制，该机制利用动态的、基于任务复杂性的调度策略来适应异构客户任务。此外，FedHMed引入了一种新的自适应渐进式损失函数，根据每个客户任务的复杂性调整学习动态，通过减轻噪声优化和不稳定现象来促进模型更新。这种方法防止了过拟合，并促进了具有不同数据特征的客户端之间的有效知识共享。此外，我们整合了Kullback–Leibler（KL）散度正则化来对抗灾难性遗忘，并稳定全局模型的序列学习过程。同时，我们还加入了标签平滑处理以支持服务器端的损失计算，从而通过减少对全局模型预测的过度依赖来提高泛化和预测准确性。在视网膜成像、组织病理切片和肝脏肿瘤扫描等基准数据集上的实验结果表明，FedHMed在多种深度学习架构中的表现均优于现有的FL基线，实现了更高的准确性、稳定性和临床诊断场景中的适应性。

引言

FL是一种分布式方法，它使客户能够在维护本地数据隐私的同时协作开发全局模型，从而确保数据保密性和安全性 [1]、[2]、[3]。通过在本地进行数据处理并消除将原始信息传输到中央服务器的需求，FL减少了通信成本并提高了用户隐私 [4]、[5]。与传统集中式学习技术不同，FL直接在数据源处（例如分散在医院网络中）进行处理。尽管最初的FL研究主要集中在单任务学习上 [1]、[6]、[7]，但在将其应用于多样化的现实世界场景时可能会出现多个挑战。其中一个问题是数据异质性，即单一全局模型难以有效泛化到所有客户端，导致某些数据集上的性能不佳。另一个挑战是统计偏差，因为在组合数据上训练单一模型可能会使其偏向多数类分布 [8]。最近的进展将其应用扩展到了联邦多任务学习（FMTL）[8]、[9]，以解决这些问题。

FMTL已成为在联邦环境中开发个性化模型的有前景的方法，它能够在利用各任务之间的共享模式的同时处理多个相关任务。例如，[8] 将FMTL概念化为一个带有惩罚的优化问题，其中惩罚组件捕捉了任务（客户端）之间的关系 [10]。尽管传统的FMTL方法主要关注统计挑战 [8]、[10]，但当前的研究 [11]、[12]、[13] 强调了任务异质性的重要性，特别是对于语义分割和深度估计等密集预测任务 [14]、[15]。FMTL还应用于各种领域，包括医疗保健 [16]、[17]、[18]、[19]、[20]、金融预测 [21]、能源需求预测 [22]、[23] 和物联网（IoT）系统 [24]、[25]、[26]。

尽管FL在医疗保健等领域具有广阔的应用前景，但仍存在几个关键挑战，限制了其广泛而有效的采用。多任务复杂性：:医院通常需要多个特定于任务的模型，但由于部署和管理的复杂性，为每个任务维护单独的模型是不切实际的 [27]。高通信成本：:客户端与中央服务器之间频繁交换模型权重更新会增加通信开销，导致客户端之间的收敛率和性能不一致 [27]。数据和任务异质性：:由于患者人口统计特征、设备和临床实践的差异，客户端往往拥有非独立同分布（non-IID）数据。这导致训练不平衡和模型贡献不均。当客户端在没有协调的情况下处理多样化任务时，学习过程会进一步分化，需要根据任务复杂性调整更新率 [27]。统计偏差和局部变异性：:某些医疗状况在某些机构中可能很普遍，但在其他机构中则较为罕见，这会影响模型的泛化能力和性能 [28]。为了解决这些问题，一些开创性的研究 [29]、[30] 因其在保护数据隐私的同时能够个性化模型而受到关注，使其特别适合医疗保健场景，如定制诊断和治疗计划。Jia等人 [31] 提出了FedLPS，通过将本地模型划分为共享编码器和特定于任务的预测器来降低边缘设备上的训练成本。然而，这些方法仅关注减少客户端与服务器之间的全局通信开销。此外，Hassani等人 [27] 提出了UniFed，这是一种基于客户端不同贡献的动态客户端更新的FL框架。他们的方法还旨在通过动态序列联邦学习来优化多任务场景中的资源使用。然而，UniFed并未全面解决数据和任务异质性、统计偏差和局部变异性等持续性问题。这些问题，再加上数据分布不一致和不同的成像方式，导致了灾难性遗忘、噪声优化和模型收敛不稳定等问题。特别是在全局-本地模型适应过程中，批次级数据分布的变化可能导致全局模型出现灾难性遗忘，从而降低其鲁棒性和泛化能力 [10]。这些因素削弱了FL在现实世界精准医学应用中的有效性。

为了克服这些限制，我们提出了FedHMed，这是一种适用于多样化医学成像分类任务的新颖多任务FL框架。FedHMed结合了序列模型传输策略和动态的、基于任务复杂性的调度机制。这种方法旨在更有效地处理异构客户端任务，减轻灾难性遗忘、过拟合、欠拟合和优化不稳定等问题。通过在成本高效的多任务学习环境中解决这些挑战，FedHMed提高了模型的可靠性和在精准医疗中的适用性。本工作的主要贡献包括：

•
我们提出了一个针对高度异构医学图像分类任务的新颖多任务FedHMed框架。该框架引入了基于自适应渐进式损失的任务复杂性评分机制和KL散度正则化引导的动态序列学习机制，以促进本地客户端与中央服务器之间的模型参数交换。
•
我们设计了一个自适应渐进式损失函数，根据每个客户端任务的复杂性动态调整学习过程。这促进了模型更新的平衡，防止了过拟合、噪声优化和不稳定，并促进了具有不同数据特征的客户端之间的有效知识共享。
•
我们整合了KL散度正则化来减轻灾难性遗忘并稳定全局模型的序列学习过程，同时优化资源利用。此外，还在训练过程中加入了标签平滑处理，以通过减少对全局模型预测的过度依赖来提高泛化和预测准确性。
•
我们通过在多个医学成像数据集（包括OCTMNIST、OrganAMNIST 和 TissueMNIST）上与最先进基准进行比较，证明了所提出的FedHMed框架的有效性，这些数据集在强和非独立同分布（strong and moderately non-IID）条件下都表现优异。

部分摘录

方法论

我们提出了一种多任务FedHMed FL框架，用于高效训练异构医学图像分类任务。提出的FedHMed概述如图1所示。FedHMed还包括一种创新的客户端调度技术和新颖的自适应渐进式损失机制，取代了传统的随机顺序选择 [49]、[50]，从而促进了更加结构化和高效的学习过程。此外，我们还提出了一种复杂的动态更新

数据集

在这项工作中，我们考虑了医疗机构进行图像分类任务的协作学习场景。这些医疗机构网络协作开发了一个模型FedHMed，该模型可以处理网络中的所有分类任务。我们在综合模拟实验中使用了三个公开可用的数据集OCTMNIST、OrganAMNIST和TissueMNIST [60]，这些数据集具有不同的成像方式。这些数据集的详细信息见表1。

不同医院执行

结论

我们提出了FedHMed，这是一种新颖的多任务联邦学习框架，旨在整合多样化的医学图像分类任务、数据集和成像方式。FedHMed采用了联邦序列学习和动态更新机制，根据每个任务的复杂性进行本地模型调整。所提出的FedHMed引入了自适应渐进式损失，使医院能够动态训练其本地模型并实现最佳收敛。而在服务器端训练

CRediT作者贡献声明

Kushall Pal Singh：撰写——原始草稿、可视化、方法论、数据分析、概念化。Monu Verma：撰写——审阅与编辑、撰写——原始草稿、可视化、验证、方法论。Dinesh Kumar Tyagi：撰写——审阅与编辑、监督、资源管理。Santosh Kumar Vipparthi：撰写——审阅与编辑、验证、监督。Subrahmanyam Murala：撰写——审阅与编辑、监督。Mohamed Saeed Abdel-Mottaleb：撰写——审阅与编辑

摘要

引言

部分摘录

相关工作

方法论

数据集

结论

CRediT作者贡献声明

表2

作者声明不存在利益冲突。

热点排行