基于MODPSO-SO的多智能体系统领导者选择优化系统误差与收敛率研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Computational Science》：Leader selection in multi-agent systems for optimizing system error and convergence rate via MODPSO-SO

【字体：大中小】 时间：2026年05月22日 来源：Journal of Computational Science 3.7

编辑推荐：

　　本研究提出了一种基于集合运算的多目标离散粒子群优化算法（Multi-Objective Discrete Particle Swarm Optimization based on Set Operations, MODPSO-SO），用于在具有链路噪声的一阶多

本研究提出了一种基于集合运算的多目标离散粒子群优化算法（Multi-Objective Discrete Particle Swarm Optimization based on Set Operations, MODPSO-SO），用于在具有链路噪声的一阶多智能体系统（Multi-Agent Systems, MASs）中最小化系统误差并最大化收敛速率。该算法整合了三重引导机制与群体交互策略以生成高质量候选领导者集合。这些候选集合进一步通过Z-score标准化和Pareto支配筛选对Pareto解进行显式处理而得到精炼。在具有三种不同拓扑结构的多智能体系统上的实验结果验证了MODPSO-SO相对于基线方法的优越性。

本研究聚焦于领导者-跟随者多智能体系统（Leader-Follower Multi-Agent Systems）中的领导者选择问题。多智能体系统基于分布式通信框架构建，其中每个智能体（agent）从邻居智能体接收信息、更新内部状态并随后广播更新后的数据。该类系统已广泛应用于智能交通系统、无线传感器网络、移动机器人、工业自动化及物联网等诸多领域。领导者-跟随者框架构成了一种基础的分布式控制范式，其中领导者智能体注入控制输入以调控跟随者智能体的动力学行为；跟随者智能体则基于领导者智能体及邻近跟随者的状态通过公共信息更新机制调整自身状态，以实现一致性（consensus）。在此设定下，领导者作为参考输入引导系统趋向期望的一致状态。由于智能体在多智能体系统拓扑中扮演不同角色，选择合适的智能体作为领导者对于高效可靠地引导系统实现一致至关重要。

在诸如编队控制等应用中，适当选择的领导者不仅能够抑制链路噪声、减小稳态误差，还能加速信息扩散从而提升渐近收敛速率，进而实现更高精度的同步与更稳健的决策。为准确量化这些优势，大量研究提出了可测量的评价标准，将领导者集合的属性与整体系统性能相关联。Clark通过超模优化（supermodular optimization）框架刻画了由链路噪声引起的系统误差（跟随者状态的总均方误差），证明选择合适的领导者智能体能够有效降低该误差；降低系统误差直接提升了系统的鲁棒性。除系统误差外，渐近收敛速率是领导者-跟随者系统的另一关键性能指标，Pirani基于 grounded Laplacian 矩阵的最小特征值提出了领导者选择的理论框架。然而，现有领导者选择研究大多聚焦于优化单一性能指标，鲜有研究关注平衡不同指标的多目标框架；这种对单指标优化的有限关注可能限制了领导者选择策略在复杂多智能体系统中的应用，而此类系统中收敛速度与鲁棒性之间的固有权衡必须被审慎考量。

同时，专门针对领导者选择的算法设计研究亦相对匮乏。具体而言，在有限领导者数量约束下优化预定义目标构成一个NP-hard问题，寻找最优解需要指数时间且无法扩展至大规模网络。为应对这一计算挑战，部分研究人员采用基于节点特征的方法，通过将领导者选择与直观的节点特征相关联以链接个体属性与系统性能，但其有效性高度依赖于目标指标与所选特征之间的相关性强弱；当相关性较弱时，这类方法往往产生次优结果。鉴于基于节点特征方法的局限性，其他学者从不同角度探索启发式算法并设计了基于贪婪算法的领导者选择方案。Patterson率先提出了基于贪婪算法的领导者选择方法以增强网络一致性；后续研究在贪婪算法框架下逐步推进以应对更复杂的网络场景。然而，贪婪策略固有的收敛至局部最优的倾向常使算法陷入全局次优解，使其在复杂场景下的领导者选择中效果不佳。

为此，研究人员转向元启发式算法，其在节点选择等相关问题中展现出强大的全局搜索能力，代表性方法包括蚁群优化算法、蝙蝠算法、模拟退火算法、遗传算法、人工蜂群算法以及粒子群优化（Particle Swarm Optimization, PSO）算法等。其中，PSO算法作为一种自然启发的元启发式，与其他群智能算法相比具有控制参数更少、搜索效率更高及计算复杂度更低的优势，并已被扩展至离散空间且进一步发展为多目标变体。Gong重新定义了粒子更新规则并引入网络感知的局部搜索策略以高效解决社交网络中的影响力最大化问题。然而，将PSO应用于多智能体系统的领导者选择仍面临多重根本挑战：算法更新规则依赖于速度和位置等具有物理意义的变量，而领导者选择是一个缺乏此类物理解释的离散组合问题；现有研究中通常采用阈值函数和Sigmoid函数在粒子更新过程中将精确集合信息压缩为二进制变量以供决策或计算，该压缩过程易导致信息损失，直接削弱最优个体集合（Personal Best, PBest）和最优全局集合（Global Best, GBest）对领导者选择的指导能力，最终降低算法整体搜索效率；所产生的二进制变量高度依赖于预定义阈值，而合适阈值的选择本身也是一个难题。

针对领导者选择过程中对多样化候选领导者集合的关键需求，基于分组的PSO被引入作为针对性解决方案，通过种群分割与差异化协同搜索实现，非常适应领导者集合多样性至关重要的场景。Shi提出了双指标群组学习PSO算法，基于目标值和潜在值将种群分为四类子种群，指定固定学习对象，以GBest和群内精英个体为核心指导优化节点选择。Sun提出了具有环形拓扑的PSO算法，采用基于动态半径的分组形成环形拓扑，利用与GBest信息关联的子种群中心和PBest的双重指导，并通过邻居学习适应多模态多目标问题的Pareto最优节点选择。Zhu提出了群体合并PSO算法，在预设时间点成对合并子种群，引入扰动项，通过GBest整合跨子种群全局信息，经由群体合并优化节点选择。但这些方法仍有改进空间：其分组规则或交互对象多为固定设计，缺乏适应多样领导者选择场景的灵活性；信息传输过度依赖GBest或精英个体，易导致种群同质化，从而无法充分满足多目标领导者选择的需求。

本研究中，研究人员提出MODPSO-SO，一种基于集合运算的多目标离散粒子群优化算法，用于同时最小化具有链路噪声的一阶多智能体系统的系统误差并最大化收敛速率。该算法应对两个关键挑战：离散空间中有意义粒子更新定义困难，以及多目标优化中探索与开发的不平衡问题。为此，研究人员引入三重引导机制和群体交互策略。

主要技术方法包括以下核心组成部分：

第一，三重引导机制。基于前期关于离散PSO的基础研究，研究人员提出利用纯集合论运算重新定义粒子更新，摒弃传统的速度向量和基于阈值的二进制映射。该机制直接利用PBest、GBest和邻域节点通过策略性节点替换引导领导者集合演化，避免信息损失并保留解的完整结构。

第二，群体交互策略。为应对多目标优化中的探索-开发不平衡问题，研究人员提出群体交互策略。利用三重引导机制中每个粒子保留部分GBest或PBest信息的事实，该策略实现随机配对子群中非常规GBest粒子的针对性交换。与现有具有固定交互模式和过度依赖精英个体的分组PSO方法不同，该策略缓解种群同质化，丰富候选多样性，增强多目标权衡平衡能力。

第三，Pareto解显式处理机制。通过Z-score标准化和Pareto支配筛选对候选领导者集合进行精炼，实现Pareto解的显式处理。

本研究样本队列来源包括三种典型复杂网络模型：Watts-Strogatz（WS）小世界网络、以及另外两种未具体命名的代表性网络拓扑结构。

研究结果部分依据论文结构整理如下：

**参数敏感性分析**：为评估随机触发概率r₁、r₂和r₃对MODPSO-SO性能的影响，研究人员开展了参数敏感性分析。这些参数控制算法中三种引导源的激活频率，在平衡优化过程中的探索与开发方面起关键作用。参数敏感性分析在三种代表性网络模型上进行：Watts-Strogatz（WS）小世界网络（样本队列来源之一），结果表明所提出算法对参数变化具有合理鲁棒性，参数设置在不同网络结构下能够保持稳定性能。

**算法更新规则收敛性测试**：研究人员对算法更新规则的收敛特性进行了测试验证，证实所设计的基于集合运算的更新机制能够有效收敛。

**算法对比实验**：在多种网络拓扑下，研究人员将MODPSO-SO与三种加权贪婪算法、文献[31]中的DPSO方法以及NSGA-II进行了对比。实验从系统误差、收敛速率和计算运行时间等方面进行了全面评估。结果表明，MODPSO-SO在系统误差最小化和收敛速率最大化方面均表现出优于基线方法的性能，充分展示了其有效性和稳定性。三种不同拓扑结构的实验验证了MODPSO-SO的优越性。

**讨论部分总结**：本研究提出的MODPSO-SO专门针对具有链路噪声的一阶多智能体系统，旨在同时优化系统误差和收敛速率这两个存在冲突的性能指标。算法通过三重引导机制和群体交互策略有效解决了离散空间粒子更新定义困难及多目标优化中探索-开发不平衡的问题。与现有方法相比，MODPSO-SO避免了基于阈值二进制映射导致的信息损失，并通过灵活的子群交互缓解了种群同质化现象。实验结果一致性表明，该算法在不同网络拓扑下均能实现Pareto前沿的有效逼近，为多智能体系统的领导者选择问题提供了可靠的优化工具。研究的局限性可能在于算法参数（随机触发概率）的调优仍需经验指导，且当前验证主要集中于一阶系统，高阶多智能体系统的扩展有待未来研究。

**研究结论翻译**：本工作提出了MODPSO-SO，一种基于集合运算的多目标离散粒子群优化算法，专门设计用于具有链路噪声的一阶多智能体系统。主要目标是同时最小化系统误差并最大化收敛速率，解决复杂分布式控制场景中这两个冲突性能指标之间的关键权衡问题。为此，该算法整合了三个核心组件，即基于集合的三重引导机制、用于子群协作的群体交互策略以及对Pareto解的显式处理框架。在三种典型复杂网络模型上的大量对比实验验证了MODPSO-SO相对于加权贪婪方法、DPSO和NSGA-II的优越性，在系统误差、收敛速率和计算效率方面展现出更优的综合性能。

联系信箱：

粤ICP备09063491号

热点排行