编辑推荐:
控制理论与群体机器人学面临一个公开挑战:如何有效控制具有随机、不可预测交互的动态时变网络。为此,研究人员从牧羊犬控制小规模、行为摇摆不定的羊群这一经典“牧羊竞赛”中获得启发。他们建立了一个刻画“犹豫不决”个体行为切换的随机选择模型,揭示了牧羊犬如何将这种不确定性转化为控制工具。基于此,研究者开发了仿生的“优柔寡断群体算法”,并与传统“均值算法”和“领导者-跟随者算法”进行对比,证明在轨迹跟踪等任务中,新算法能在噪声条件下以更低的控制能量实现高效控制。这项研究为管理随机时变网络(如群体机器人、意见动力学等)提供了新框架。
想象一下,在广阔的牧场上,一只牧羊犬正试图将一小群羊赶进羊圈。与我们所想的不同,管理少数几只惊慌失措、行为反复的羊,有时比控制一大群协同行动的羊群还要困难。这正是“牧羊竞赛”这项有百年历史的运动所考验的核心技能。为何如此?因为在小群体中,每只羊都在个体逃亡和群体跟随这两种求生策略之间摇摆不定,形成了一个随机、不可预测的动态网络,这给传统的控制方法带来了巨大挑战。
在更广阔的背景下,从蜂拥的机器人、动物集群,到人类社会中的意见传播和交通流,许多系统都呈现出简单的个体互动产生复杂群体行为的“涌现”现象。控制这些系统本就充满挑战,而当系统中的个体(节点)能够在不同的互动规则间随机切换,导致网络结构和群体行为随时间动态变化时,问题就变得更加棘手。尽管研究表明,当网络未来的拓扑变化可预测时,利用时变性(Temporality)可以降低控制成本;但在现实世界中,许多系统的切换动态是随机的、不可预测的,这时时变性反而可能让控制过程耗费更多能量。因此,如何控制这种“随机时态网络”,特别是当其中的个体行为“优柔寡断”时,成为了控制理论和群体智能领域一个悬而未决的开放性问题。
这项发表在《SCIENCE ADVANCES》的研究,正是从牧羊犬与羊群这一经典的捕食者-被捕食者系统中寻找灵感。研究人员深入分析了牧羊犬在竞赛中控制小型羊群(通常不超过5只)的机制。他们发现,训练有素的牧羊犬及其操纵者,能够巧妙地利用羊群“优柔寡断”的特性——羊在“逃离狗”和“跟随同伴”之间随机切换——不仅将羊群作为整体驱赶(herding),还能按需求将其分割成子群(shedding)。这种将通常被视为障碍的不确定性转化为控制工具的能力,为设计人工系统的控制策略提供了宝贵的生物学启示。
关键技术方法
为开展研究,作者综合运用了多学科方法。首先,他们通过对21段真实牧羊竞赛视频进行实证分析,量化了羊在不同方向(东、西、南、北)上的方向转换 动态,提取了“轻”(light)羊和“重”(heavy)羊在驱赶和分割任务中的行为差异。其次,基于这些观测,研究者构建了一个随机选择模型 和相应的主方程 来刻画羊的“优柔寡断”行为,该模型考虑了自发转向、社会影响(模仿同伴)和外部刺激(狗/人的威胁)三种规则。模型的核心是定义了“压力”(Pressure, P)和“轻重度”(Lightness, L)两个量化参数,将牧羊人的定性经验转化为可计算的框架。模型模拟使用了吉莱斯皮算法。最后,他们将生物学原理算法化,提出了优柔寡断群体算法,并与均值算法 和领导者-跟随者算法 在轨迹跟踪 任务上进行了性能基准测试,以评估控制能量和准确性。
研究结果
- •
牧羊竞赛中的术语与观察:研究首先界定了牧羊竞赛中的关键概念。羊感知到的威胁称为“压力”,而羊对压力的反应性称为“轻重度”。“轻”羊对微小压力即有反应但易恐慌,“重”羊则需要从正面施加高压力才会移动。经验表明,驱赶“轻”羊更容易,而分割“重”羊相对容易。
- •
实证分析为建模提供信息:通过分析视频数据,研究者将羊的方向简化为四个,并观察到“轻”“重”羊在驱赶和分割任务中表现出明显不同的方向转换模式,这为后续的随机模型参数设定提供了依据。
- •
对“优柔寡断”羊行为的建模:研究建立了一个随机模型,羊根据三个规则改变方向:自发转向(噪声ε)、社会影响(模仿率γ)和对外部刺激的反应(反应率αij)。其中,外部刺激的影响取决于羊的当前朝向和威胁来源的方向。这个模型与传统的对所有影响求平均的“平均智能体”模型不同,它允许智能体每次只受一个因素影响,从而能更好地模拟小群体中观察到的随机切换动态。
- •
驱赶与分割羊群的动力学:使用该模型进行模拟发现,在驱赶任务中,“轻”羊能快速达到并维持朝向目标,而“重”羊则表现出间歇性的驱赶状态,并经常同步地垂直于狗的方向排列。在分割任务中,“轻”羊因恐慌而无规律地转向,而“重”羊则倾向于同步地在与狗和牧羊人垂直的两个方向之间切换,这为分割创造了机会窗口。定量分析“达到时间”(τreach)和“停留时间”(τstay)定义的“任务难易度”证实:驱赶“轻”羊更容易,而分割具有中等“轻重度”的羊(L≈0.1)更容易。
- •
“优柔寡断”是否能改善控制?:研究者将“优柔寡断”智能体与标准的“平均”智能体在二维空间中进行比较。在低噪声条件下,“平均”智能体表现更好;但在高噪声条件下,“平均”智能体因噪声干扰而失败,而“优柔寡断”智能体虽然速度较慢,却能成功完成任务。更重要的是,在分割任务中,“平均”智能体完全无法分割群体,而“优柔寡断”智能体在各种噪声水平下都能成功。这表明,引入行为切换的“优柔寡断”特性,特别是在嘈杂环境中,能够提升对复杂任务的控制能力。
- •
开发“优柔寡断群体算法”:受生物学启发,研究者为人工多智能体系统开发了“优柔寡断群体算法”。在该算法中,每个智能体随机地将其输入在控制器和单个邻居之间切换。他们将其与标准的“均值算法”(每个智能体平均所有输入)和“领导者-跟随者算法”(每个智能体在初始化时固定地跟随控制器或一个邻居)进行了对比。在经典的轨迹跟踪任务中,当控制器刺激强度(I)较低时,ISA能够紧密跟随预定路径,而ASA和LFSA则严重偏离,表明ISA能以更低的控制努力实现有效控制。
- •
以“时变性”作为统一框架:研究最后提出了一个统一框架,将三种算法视为随机非互惠时态网络的极限情况。定义“时变性”T = τd/ τn,其中τd是状态更新时间尺度,τn是网络重组时间尺度。当T > 1时,网络重组快于状态更新,智能体在更新前聚合多个来源的信息,趋近于ASA。当T < 1时,状态更新快于网络重组,智能体每次只从一个来源采样,趋近于LFSA。当T = 1时,网络与状态同步更新,这正是ISA的机制。理论分析表明,在轨迹跟踪任务中,当T = 1时,即使不了解未来的网络拓扑,也能最小化控制能量,这为ISA的优越性能提供了理论解释。
结论与意义
这项研究通过深入剖析牧羊犬控制“优柔寡断”羊群这一自然实例,成功地将一个复杂的生物控制问题转化为一个可计算、可推广的理论与算法框架。核心结论是:个体行为的随机切换(“优柔寡断”)并非总是控制的障碍,在特定条件下(如T=1),它可以被利用为一种有效的控制工具,帮助实现如驱赶、分割等复杂任务,尤其在噪声环境下表现更稳健。
其重要意义在于多个层面:在理论层面,它为解决“随机时态网络”的控制这一开放挑战提供了新思路,建立了一个连接生物学观察、随机过程建模和控制理论分析的统一框架。在算法与应用层面,所提出的“优柔寡断群体算法”为群体机器人、无人机编队等需要高效、低能耗轨迹跟踪的领域提供了新的仿生算法选择。该研究也表明,将网络重组与状态更新的时间尺度同步,是优化控制能量的一种有效策略。此外,该框架还可应用于对“优柔寡断”群体(如意见摇摆的公众、行为模式切换的动物集群等)的理解与调控。总之,这项工作架起了一座连接自然界精妙控制策略与人工系统智能算法设计的桥梁,展示了跨学科研究在解决复杂系统控制问题上的巨大潜力。