分散式多模态原型联邦学习：面向异构数据协同AI的高效稳健新范式

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Information Fusion》：Decentralized Federated Learning with Multimodal Prototypes for Heterogeneous Data

【字体：大中小】 时间：2026年02月22日 来源：Information Fusion 15.5

编辑推荐：

　　为解决分散式联邦学习在现实多模态数据场景下面临的数据异构、模态缺失、通信成本高和性能低下等挑战，研究人员提出了Modalis框架。该框架开创性地采用原型中心通信协议，结合情境感知空嵌入、自适应门控和掩码多路Transformer等先进架构，实现了高效稳健的多模态知识融合。在标准基准测试中，Modalis在高异质性下F1分数提升达4%，同时通信开销降低超过40倍，为资源受限环境下的协作式AI提供了高效的解决方案。

在人工智能快速发展的今天，协作式机器学习已成为释放海量分布式数据潜力的关键。联邦学习（FL）应运而生，它允许大量设备协同训练模型，同时将敏感的用户数据保留在本地，有效保护了隐私。这一特性使其在医疗健康、金融和个人设备等领域展现出巨大的应用前景。然而，传统的集中式联邦学习架构依赖于一个中心服务器进行协调和模型聚合，这引入了潜在的瓶颈和单点故障风险。为了解决这些问题，研究人员提出了分散式联邦学习（DFL），它允许客户端之间直接进行点对点通信和模型聚合，从而增强了系统的鲁棒性、可扩展性，并消除了对中心可信实体的依赖。尽管优势明显，但在实际应用中，高效的知识聚合和稳定的收敛性依然面临严峻挑战，尤其是在处理复杂的真实世界数据分布时。

现实世界的应用很少依赖于单一数据源，它们通常涉及多样化的模态，如图像、文本、音频和结构化传感器读数。在分散式网络中，客户端常常面临模态缺失（例如，一个客户端只有文本数据而缺少对应的图像）以及高度偏斜的非独立同分布类数据分布。这种多方面的异质性给现有联邦学习范式带来了根本性的挑战。传统的参数平均法对缺失模态导致的未训练子网络参数非常敏感，这种参数会污染聚合模型，抵消同伴的贡献。虽然一些先进的框架通过交换紧凑的类别级特征嵌入（即原型）来解决非独立同分布数据问题，但这些方法主要是为单模态任务设计的，缺乏原生多模态融合机制。此外，少数解决多模态异质性的方案几乎都依赖于集中式拓扑进行复杂操作（如融合或插补），这反而重新引入了DFL旨在消除的瓶颈和单点故障。为了填补这一关键空白，研究者们提出了Modalis，一个为异构、分散式环境中的高效、稳健多模态学习而设计的新框架。

这项研究发表在《Information Fusion》期刊上。

为了构建Modalis框架，研究人员整合了多项关键技术：1. 原型中心通信协议：核心创新在于客户端之间交换的是低维的类原型，而非高维的模型参数或梯度，这显著降低了通信开销。每个客户端维护一套包含模态特定原型和融合原型的库。2. 上下文空嵌入：这是一个智能化的模态插补模块。当某个模态缺失时，该模块基于同一数据样本中其他可用模态的特征嵌入，通过一个多层感知机来动态生成该缺失模态的上下文感知嵌入，而非使用固定的零向量。3. 自适应门控机制：该机制为每个模态嵌入计算一个可学习的置信度权重，允许模型在学习过程中动态调整不同模态的贡献度，对于低质量或预测性弱的模态自动赋予较低权重。4. 掩码多路Transformer融合模块：利用一个经过改造的Transformer架构，将加权的模态嵌入作为序列令牌进行融合。它根据模态可用性掩码来屏蔽缺失模态的注意力交互，从而稳健地生成统一的多模态表征。5. 多目标损失函数：训练过程由三项损失联合指导：标准的交叉熵任务损失、原型对比损失以及跨模态一致性损失。后两者旨在对齐来自不同客户端和不同模态的原型表示，促进有效的知识融合。

研究通过理论分析和大量实验验证了Modalis框架的有效性。主要结果体现在以下几个方面：

•
系统性实验验证：研究在四个广泛认可的多模态数据集（AVMNIST， CREMA-D， UCI-HAR， CRISIS-MMD）上进行了评估。为了模拟真实场景，研究系统性地改变了两个关键参数：通过狄利克雷参数β ∈ {1.0， 0.5， 0.1}控制非独立同分布类偏斜的程度，以及通过p_m∈ {0.0, 0.25, 0.5}控制跨客户端的模态缺失比例。
•
性能优势显著：实验结果表明，Modalis在多种异质性条件下持续优于现有的联邦学习和分散式联邦学习基线方法。在高异质性设置下（β=0.1），与次优的基线方法相比，其相对F1分数增益最高可达约4.0%。这证明了其在严重数据偏斜和模态缺失情况下的卓越鲁棒性。
•
通信效率大幅提升：得益于原型交换策略，Modalis的网络开销相比交换完整模型参数的方法降低了超过40倍。此外，每轮通信仅进行一轮本地训练的策略有效减轻了客户端的计算负担，并缓解了模型漂移问题。
•
理论收敛保障：研究为Modalis提供了严格的理论分析，包括一个正式的收敛性证明（定理1）。该定理表明，在所提出的假设下，Modalis可以保证收敛到最优解的平稳邻域。此外，一个详细的引理（引理1）量化了该框架相比传统模型传递的分散式联邦学习方法在通信成本上的显著降低，从理论上支持了其高效性。
•
组件有效性分析：通过消融研究，研究验证了框架中各个核心组件（如原型对比损失、自适应门控、上下文空嵌入等）对最终性能的贡献，证实了其设计的必要性。

研究结论表明，Modalis框架成功地为分散式、多模态、高度异构的学习环境提供了一个高效且稳健的解决方案。其核心贡献在于将通信高效的原型交换与先进的多模态处理架构（如上下文感知的缺失模态处理、自适应门控和掩码Transformer融合）相结合。这不仅在严重的数据偏斜和模态缺失情况下实现了卓越的性能，还通过原型传输策略将通信开销降低了数个数量级。理论分析为其收敛性提供了保证。这项研究的意义在于，它弥合了分散式学习协议与复杂多模态数据需求之间的关键鸿沟，为资源受限的边缘计算环境（如物联网设备、移动终端）中部署协作式人工智能应用铺平了道路，使得在保护数据隐私的同时，利用多样化的跨设备多模态数据进行高效、准确的模型训练成为可能。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号