一种考虑流体动力特性的分层路径规划框架,用于现实海洋流环境中的多自主水下航行器(AUV)系统

《Applied Ocean Research》:A hydrodynamic-aware hierarchical path planning framework for multi-AUV systems in realistic ocean currents

【字体: 时间:2026年05月10日 来源:Applied Ocean Research 4.4

编辑推荐:

  向高|窦伟佳|刘星光|肖高曦|文世平|康宇|陈思宇西安工业大学电气工程学院,中国西安710048摘要在具有强烈且空间异质水流的海洋环境中,多自主水下航行器(AUV)系统的节能和无碰撞导航仍是一个重大挑战。为了解决这个问题,本文提出了一种具有流体动力学意识的层次化路径规划框架,旨在

  向高|窦伟佳|刘星光|肖高曦|文世平|康宇|陈思宇西安工业大学电气工程学院,中国西安710048摘要在具有强烈且空间异质水流的海洋环境中,多自主水下航行器(AUV)系统的节能和无碰撞导航仍是一个重大挑战。为了解决这个问题,本文提出了一种具有流体动力学意识的层次化路径规划框架,旨在利用环境流场特征。首先,使用混合坐标海洋模型(HYCOM)的经验数据构建了一个真实的3D环境,以模拟真实的水动力阻力。鉴于标准算法在这种复杂的矢量场中常常遇到困难,本文引入了一种层次化细化策略,系统地解耦了优化过程。初始化阶段采用拉丁超立方采样(LHS)以确保广泛的搜索覆盖范围。随后,应用了从粗到细的进化机制。具体来说,使用一种 Flow-Aware 2-opt 运算符来纠正由水流漂移引起的拓扑纠缠,而结合螺旋扰动和模拟退火的混合逃逸机制有助于从涡流引起的局部最小值中逃脱。此外,采用梯度自适应域缩放技术在高剪切区域进行精确的轨迹优化。最终的轨迹通过三次B样条插值进行严格验证。在真实海洋流场环境中的仿真结果表明,与选定的基线方法相比,所提出的框架在路径效率、能量相关成本和安全性方面取得了良好的平衡。

1. 引言
自主水下航行器(AUV)已成为现代海洋工程中的重要工具,支持从资源探索和环境监测到海底考古和紧急救援等任务(Fan和Chen,2022)。它们能够自主在复杂的水下环境中导航,因此非常适合执行对人类潜水员来说危险或无法进入的任务(Li等人,2025)。与单AUV部署相比,多AUV系统具有明显的战略优势,包括并行任务执行、更广的空间覆盖范围以及内在的系统冗余(Shen等人,2025;Wang等人,2023)。通过利用空间分布和信息共享,这样的协作系统可以显著缩短任务时间,同时提高对单个单元故障的鲁棒性。然而,在复杂的三维海洋环境中为多个AUV实现高效路径规划仍然是一个重大挑战。海底地形的复杂性和海洋流的随机性引入了非平稳的非线性扰动(Chen等人,2025)。此外,机载计算资源受到有限能量储备的严格限制,而水下声学通信则受到带宽低和延迟高的影响(Krell等人,2022;Zhong等人,2025;Yuan等人,2025)。这些因素使得实时全局协调变得复杂。因此,同时满足多个目标(如避碰、能源效率和编队维护)变成了一个高维优化问题,难以在线计算解决(Wang等人,2024)。为了解决这些挑战,研究人员开发了结合全局优化和局部适应的各种策略(Aggarwal和Kumar,2020;Wen等人,2021)。传统的确定性算法,如A*和Dijkstra(Sánchez-Ibá?ez等人,2021;Nazarahari等人,2019;Liu等人,2023),通常缺乏适应动态环境所需的灵活性。这一限制促使人们采用了基于采样的方法;例如,Dai等人(2025)通过结合动态窗口方法(DWA)(Ou等人,2023)展示了改进的可行性。强化学习也受到了越来越多的关注,Raoufi等人(2025)和Yu等人(2025)将自适应规划应用于动态场景。最近,还包括改进的Firefly算法(Patle等人,2018)、PSO–ACO混合算法(Oleiwi等人,2014)和AP-JPS(Tu等人,2024)在内的元启发式算法被引入以加快收敛速度。尽管最近的研究越来越多地考虑了能源意识策略(Chen和Liu,2024),但许多现有的元启发式算法仍然主要优化几何距离。因此,它们往往难以在全局探索和利用有利水动力梯度所需的精细局部调整之间找到平衡(例如,“利用水流”)。此外,明确整合真实海洋动力学仍然是必不可少的。尽管取得了这些进展,但仍需要能够有效解耦几何规划和水动力扰动的优化框架。最近的研究还在杂乱环境中操作的异构海洋和水陆两用无人系统的协作路径规划方面报告了令人鼓舞的进展(Xie等人,2025;Zhang等人,2024)。例如,已经研究了在障碍物密集环境中受能量限制的异构水陆两用无人水面车辆的协作规划(Yin和Xiang,2025);为多个水空无人车辆在拥挤环境中开发了多目标协作路由(Yin等人,2025);最近还研究了在拥挤的水下条件下异构AUV的协作路径规划(Yin和Xiang,2026)。这些研究为将路径规划从单车辆设置扩展到在时间、风险和能源等竞争目标下的多智能体协调提供了有价值的参考(Tan等人,2025)。然而,当这些方法应用于海洋任务时,仍然存在一些限制。首先,许多现有研究主要强调几何障碍物避让或通用多目标优化,而没有始终明确利用真实海洋流结构在塑造路径效率中的作用。其次,能源目标通常被简化,并没有总是与直接影响远程AUV部署的硬件相关因素(如推进效率、电池负载和电池可用性限制)联系起来(Chai等人,2024)。第三,尽管文献越来越关注多智能体或异构系统,但一些公式仍然更接近于松散耦合的独立规划,而不是在共享导航资源上的明确协调,这使得在多个车辆竞争相同的有利水流辅助走廊或终端区域时难以解决拥塞和冲突问题。受到上述缺点的启发,本研究为真实海洋流中的多AUV系统开发了一个具有流体动力学意识的层次化路径规划框架。核心思想是将数据驱动的海洋环境与计算上可行的层次化规划策略相结合,从而以协调的方式解决几何可行性、水流利用和任务级效率问题。与主要在静态地图中追求最短路径行为的方法不同,所提出的框架旨在识别和利用有利的水流辅助走廊,同时抑制高拖曳绕行和由流动引起的拓扑伪影。此外,与需要更丰富通信和更紧密的车辆间动态的完全耦合协同控制方案不同,本研究专注于基于协同分配和冲突解决的轻量级规划级协调机制,更适合在真实水下约束下进行重复重规划。所提出的框架结合了数据驱动的环境模型和逻辑驱动的层次化策略,以应对强流和变流中的特定导航挑战。主要贡献如下:

1. 为了提高规划框架的工程相关性,将HYCOM衍生的海洋流数据与硬件感知的任务成本公式相结合,并引入了轻量级的协同分配和冲突解决层,以表示在有限通信条件下的共享导航资源。通过真实流验证、动态强涡流在线重规划、容量限制下的协作拥塞分析和参数敏感性测试,进一步评估了所提出的框架。

我们提出了一种分层初始化机制,以克服标准元启发式算法中常见的随机采样限制(Patle等人,2018;Oleiwi等人,2014)。通过结合拉丁超立方采样(LHS)和自适应参数机制,这种方法确保了对高维解空间的广泛覆盖。这种方法有效缓解了过早收敛问题,从而使算法能够识别出传统随机初始化可能错过的有利水流走廊。

为了解决强流中标准优化器的不稳定性,我们引入了一种“从粗到细”的层次化策略,系统地解决水动力伪影。特别设计了一种Flow-Aware 2-opt运算符来修复由水流漂移引起的拓扑纠缠。为了从涡流引起的局部最小值中逃脱,我们实现了一种结合螺旋扰动和模拟退火的混合逃逸机制。此外,应用了梯度自适应域缩放技术在高剪切区域进行精确的轨迹调整。

为了确保运动可行性,与仅关注离散航点的方法不同,本研究结合了三次B样条平滑来保证轨迹连续性。所提出的框架使用真实世界的HYCOM数据与标准PSO(Li等人,2025)、A*(Zhang等人,2023)和ICFPSO(Li和Yu,2023)等基准进行了严格验证,证明了其在海洋测量任务中的良好能源效率和运动稳定性。

本文的其余部分组织如下。第2节介绍了环境模型和多AUV规划模型,包括真实的海洋流表示和硬件感知的能源公式。第3节详细介绍了所提出的具有流体动力学意识的层次化框架及其协同分配机制。第4节报告了仿真实验和分析,包括在真实海洋流环境中的验证、动态在线重规划、协作拥塞测试和参数敏感性结果。最后,第5节总结了本文,并讨论了限制和未来工作。

2. 环境模型和多AUV模型
2.1. 障碍物建模
三维水下环境被表示为一个离散的空间域,用于路径规划和碰撞检查。为了平衡计算效率和环境真实性,连续的工作空间被划分为根据AUV尺寸和机动要求选择的细网格单元。环境沿x、y和z轴组织成3D数组,其中x–y平面描述了水平布局,z轴对应于深度层。建模的环境如图1所示。该图没有采用简单的二进制块抽象,而是展示了规划器使用的计算网格覆盖的连续海底地形。高地形区域被视为需要避开的障碍物,而网格代表用于路径生成和可行性评估的离散搜索空间。为了实现,每个网格单元都被赋予一个唯一的顺序索引,从左到右、从上到下、逐层递增。这种索引方案为节点存储、邻域搜索和后续规划过程中的距离评估提供了紧凑的表示方式。根据这个索引方案,可以恢复每个单元中心的笛卡尔坐标,用于几何计算。坐标表示为:
(x = N%(sizea × sizeb) % sizeb + 0.5
y = (N%(sizea × sizeb) / sizeb + 0.5
z = sizec ? N(sizea × sizeb) + 0.5
其中N是单元索引,sizeb表示每层的列数,sizea表示每层的行数,sizec是深度层的总数。

给定两个节点的坐标(x1, y1, z1)和(x2, y2, z2),它们的欧几里得距离计算为:
d = (x2 ? x1)2 + (y2 ? y1)2 + (z2 ? z1)2
这个距离在将与水流相关的成本纳入后续规划模型之前,作为离散搜索空间中的基本几何度量。

2.2. 海洋流建模
本研究使用HYCOM数据集,并使用实时的水平和垂直流速数据。为了关注特定的海域,我们选择了印度洋的一个代表性区域(经度45°E–90°E,纬度15°S–10°N)作为数据源进行真实验证。离散数据通过逆距离加权空间插值转换为连续场:
Cp = vx + vy + vz
= ∑_i=1^4 wi Cp_i
= ∑_i=1^4 wi, wi=1/d(Pt, Pti) + ?
其中Cp表示目标位置Pt处的流速向量,包括三个分量(vxp, vy, vz)。Cpi表示第i个邻近点Pti处的流速向量,d(Pt, Pti)是目标位置与该邻近点之间的欧几里得距离。插值使用了四个最近的邻近点,权重wi由逆距离定义,以便较近的点对插值流场有更大的贡献。引入了一个小常数?>0,以避免当目标位置非常接近采样网格点时的数值奇异性。除了空间变化外,Pt处的流速随时间也会变化(Ren等人,2025)。为了真实模拟AUV的运动,方程(4)包括了时间变化项:
Lp(t) = vx(t) + vy(t) + vz(t) = Cp + ΔC(t)
其中Lp(t)是时间t的最终速度向量,Cp是空间插值速度,ΔC(t)是时间变化分量。尽管所提出的模型支持时变流(方程(4)),但后续的实验验证主要使用冻结场快照(静态矢量场)来隔离和严格评估算法在特定拓扑约束下的性能。

为了更有效地可视化这些方程描述的复杂水动力环境,图2展示了3D海洋流矢量场的概念结构。与简化的2D平面模型不同,我们的框架捕捉了多个深度层(表面、中间和深处)的垂直速度变化。这种结构能力使算法能够处理复杂的流动动力学,包括在后续实验中检查的以涡流为主导的场。

2.3.在海洋流场下的能耗
在水下环境中,流体动力阻力是自动水下航行器(AUV)运动的主要阻碍。与陆地机器人不同,AUV的能耗主要由克服流体阻力所需的推进力决定,而机载电子设备则引入了持续的辅助功率需求。因此,本工作中采用的能量模型是以硬件感知的方式制定的。具体来说,首先根据流体动力原理推导出推进功率,然后通过推进效率和工作负载进行修正,以便在物理建模和轨迹优化中一致使用该能量表达式。
AUV的运动受矢量三角形规则控制,涉及三个关键组成部分:地面速度(v→s,在图3中标记为vs),表示相对于海底的目标速度; Current Velocity(v→c,标记为vc),表示海洋流速;以及相对速度(v→AUV,标记为vAUV),即AUV相对于水的速度。
为了在流速v→c的影响下保持预定路径v→s,AUV必须产生一个特定的相对速度。这种关系表示为 (5)v→AUV = v→s - v→c
这个相对速度的大小 ‖v→AUV‖ 直接决定了推进功率。我们分析了两种影响该速度的情况。
**情况1:海洋流速方向的变化**。在这种情况下,AUV在海洋流速变化的网格节点之间移动,如图3所示。AUV沿着节点之间的直线路径段保持恒定的地面速度向量vs。为了抵消流速并保持这种目标运动,AUV调整其相对速度向量(从vAUV1变为vAUV2)。红色箭头(Δv→)表示这种调整。
流体动力阻力D与相对速度的平方成正比。克服这种阻力所需的推进功率P与相对速度的立方成正比 (6)D = 1/2ρCdA‖v→AUV‖^2,其中ρ是海水密度,Cd是阻力系数,A是横截面积。这些恒定的流体参数被合并为一个单独的系数k = 1/2ρCdA。为了克服流体阻力所需的路径段持续时间t的理想化流体动力能耗为 (7)Eideal = P?t = k?‖v→s - v→c‖^3?t,其中v→s表示相对于海底的地面速度,v→c表示局部流速,t是路径段的穿越时间。
然而,仅依赖于理想化的流体动力模型不足以进行实际的任务级评估,因为AUV的实际电池消耗还受到推进损失和机载电子设备基础功耗的影响。为了提高模型的工程相关性,我们引入了一个考虑硬件的总功率公式。
设 ??p∈(0,1) 表示总体推进效率,它涵盖了从电池到推进器的电气和机械损失。设 Photel 表示恒定的辅助功耗,包括控制计算机、导航传感器和声学通信单元所需的功率。那么,总功率消耗 Ptotal 表示为 (8)??Ptotal = P?p + Photel = k?‖v→s - v→c‖^3?p + Photel,其中第一项表示经过效率修正后的推进功率,第二项表示非推进的工作负载。
因此,穿越持续时间t的直线路径段的总能耗 E 更新为 (9)?E = Ptotal?t = k?‖v→s - v→c‖^3?p + Photel?t
这个表达式揭示了一个重要的工程权衡。逆流而行可能会增加立方级的推进成本,而过低的地面速度则会延长穿越时间并积累额外的工作负载能耗。
为了确保在硬件限制下仍能执行预定任务,第i个AUV的累积能耗必须满足电池容量约束 (10)∑Ei ≤ Cbat?Vnom?(1?DoDmax),其中Cbat是电池容量,Vnom是标称系统电压,DoDmax是为保持电池健康而采用的最大允许放电深度。违反方程(10)的轨迹虽然运动上可行,但在硬件上是不可行的。
**情况2:AUV航向的变化**。在这里,AUV在网格单元内或沿曲线轨迹转弯,如图4所示。即使流速在局部保持不变,目标地面速度方向也会连续变化,这反过来又改变了所需的相对速度的大小和方向。
为了估计在同一硬件感知模型下转弯机动的能量消耗,我们将转弯间隔内的瞬时总功率积分。通过将机动分解为M个小时间步长,转弯能耗 Wturn 可以近似为 (11)?Wturn = ∫0?TPtotal(t)dt ≈ ∑j=1?k?‖v→sj?v→c‖^3?p + Photel?Δt,其中T是转弯机动的持续时间,M是离散化步数,v→sj是第j步的瞬时地面速度,Δt是局部时间增量。这个转弯能量模型后来在规划框架的轨迹能量评估中得到一致使用。
2.4 多AUV路径规划模型
多AUV路径规划旨在引导多个AUV在相同环境中行驶,同时避免碰撞并在海洋流场的影响下优化任务效率。每个AUV i都有一个状态空间,定义为 si=(ηi,φi,oci),其中位置向量是 ηi=[xi,yi,zi,θi,ψi]T(xi,yi,zi表示坐标,θi和ψi表示俯仰和偏航角),速度向量是 φi=[ui,0,0,qi,ri]T(ui是恒定的前进速度,qi和ri是横滚和俯仰速率),海洋流速是 oci=[vc(Pi,t),0,0,0]T。注意,尽管环境模型支持3D流速,但在目标海域中垂直分量远小于水平分量,因此在运动学更新中忽略了垂直分量,以提高计算效率。
动作空间是 ai=[0,0,0,Δqi,Δri]T,共有um=2个自由度(横滚和俯仰),受约束 Δqi,Δri∈[?π/6,π/6],以确保机动的可行性和安全性。
运动学状态更新方程表示为 (12)ηi′ = ηi + J(ηi)φiΔt + ociΔt, φi′ = φi + ai,其中J(ηi)是运动学变换矩阵,Δt是模拟时间步长。
对于N个AUV的系统,全球优化目标是最小化总成本函数 (13)Jtotal = ∑i=1NJi(pathi) + ∑i≠jΨcol(Pi,Pj),其中Ji表示单个路径成本,综合考虑能耗和路径长度,Ψcol是碰撞惩罚函数。这个惩罚项通过在车辆间距低于安全阈值dsafe时施加较高成本来强制执行基本的安全要求 ‖Pi?Pj‖>dsafe。
值得注意的是,方程(13)主要通过成对碰撞避免惩罚来耦合不同的AUV,这保证了安全性,但在多个AUV争夺相同的有利流动结构(如低阻力走廊或尾流“冲浪”区域)时,仍可能导致独立的目标或走廊选择以及潜在的拥堵。
2.5 协作分配和冲突解决
尽管方程(13)确保了无碰撞操作,但在实际流场中的多AUV系统经常面临资源竞争,即多个车辆同时偏好相同的流体动力学有利走廊或区域,导致拥堵、不必要的绕行或重复的局部避让。因此,本工作中的合作定义为多个AUV通过分布式通信和冲突解决来协调导航资源(Poudel和Moh, 2023)的分配过程(例如,目标、走廊或航点包),从而在能量、时间和安全性方面提高整体团队效率。
2.5.1 互斥分配变量
设 G 表示一组候选导航资源,可以是替代的终端走廊、通过采样生成的中间航点包或在复杂环境中的多个同伦不同通道。每个AUV i精确选择一个元素 g∈G,用二进制决策变量表示 (14)xi,g∈{0,1},∑g∈Gxi,g=1,其中xi,g=1表示AUV i被分配到资源 g。
为了捕捉某些资源容量有限的事实(例如狭窄的走廊或低风险的对接通道),每个候选资源 g 都关联有一个容量 cg∈Z+,并且分配必须满足 (15)∑i=1Nxi,g≤cg,?g∈G。当 cg=1 时,方程(15)成为一个互斥约束,确保最多只有一个AUV可以占据相应的走廊或目标选择。
2.5.2 意识到拥堵的协作成本
鉴于二进制分配 {xi,g},我们引入了一个意识到拥堵的协作项来惩罚容量违规行为,并阻止多个AUV选择相同的有限资源 (16)Jcoop(x) = ∑g∈G?∑i=1Nxi,g?cg,其中 ?(?) 是一个非负惩罚函数。在本文中,采用了一个简单的二次惩罚函数:(17)?(ξ)=max(0,ξ)^2,当容量约束得到满足时成本为零,当 ∑ixi,g 超过 cg 时成本迅速增加。
与 Ψcol(Pi,Pj) 相比,后者在轨迹层面强制执行短距离安全,Jcoop 在分配/协调层面发挥作用,旨在在运动规划之前减少团队层面的拥堵。
2.5.3 基于分布式拍卖/共识的冲突解决
为了在有限的水下通信下实现协作分配,我们采用了一种分布式拍卖/共识机制。每个AUV i 评估选择资源 g 的本地预测成本 (18)J?i(g) = Ji(pathi∣g),其中 J?i(g) 是使用本地信息和共享的环境数据(包括流速和障碍物)运行单AUV规划器(HA-TOC)得到的。直观地说,J?i(g) 总结了如果AUV i 承诺使用 g 所需的能量和时间。
然后定义一个本地出价(效用)作为带有拥堵价格的负成本 (19)bi,g = ?J?i(g)?pg,其中 pg≥0 是资源 g 的当前价格。当多个AUV竞争相同资源时,价格 pg 会增加,促使一些AUV切换到具有相似流体动力优势的替代候选资源。
在迭代 r 时,每个AUV 选择其最佳候选资源 (20)gi(r) = argmaxg∈Gbi,g,并将其 (gi(r),bi,gi(r)) 广播给其邻居集合 Ni。根据收到的消息,每个AUV 检测相对于 Ni 是否违反了方程(15)中的容量约束。如果检测到某些 g 的冲突,价格更新为 (21)pg(r+1) = pg(r)+?pmax0,ng(r),其中 ng(r) 是在通信邻域内迭代 r 选择 g 的AUV 数量,?p>0 是一个小的价格步长。这种价格更新规则防止了进一步选择过度订阅的资源,并通过重复的最佳响应更新促进了冲突解决。
当所有本地容量约束都得到满足时,即没有检测到冲突或达到最大迭代次数时,分布式分配过程终止。AUV i 的最终分配资源由 gi? 表示,然后将其作为输入传递给 HA-TOC 运动规划器以生成相应的路径 pathi。
2.5.4 与碰撞避免的关系
在协作分配之后,生成的预定轨迹仍然受方程(13)中 Ψcol(Pi,Pj) 强加的安全约束。换句话说,所提出的协作层主要缓解了上游拥堵和资源冲突,例如多个AUV争夺相同的有利走廊或终端区域,而 Ψcol 仍然负责下游轨迹层面的碰撞避免。因此,本工作中考虑的协作机制应被视为资源分配和冲突缓解的规划层协调层,而不是一个具有连续车辆间反馈的完全耦合的协作控制架构。这种两级设计使多AUV系统在现实海洋流场中实现了提高的团队效率和安全性。
算法1概述了分布式协作分配层,它在容量约束 ∑i=1Nxi,g≤cg 下为每个AUV 生成资源选择 gi?。为了在有限的水下通信下实现有效的竞标,每个AUV i 为每个候选资源 g 评估一个轻量级的预测成本 J?i(g)。具体来说,J?i(g) 是基于 g 条件运行的简化迭代版本的HA-TOC规划器(算法2),使用较小的预算(Tmaxpred,Spred)?(Tmax,S),并可选地跳过最后的平滑阶段,以便提供快速且一致的候选资源排名。在分配收敛到 {gi?}i=1N 之后,每个AUV 调用算法2中的完整单AUV HA-TOC规划器来生成其优化轨迹。实际上,这种设计保留了重复单AUV重新规划的计算简洁性,同时在团队层面引入了轻量级协调机制。在实践中,Decode(?∣g) 表示解码过程受到所选资源 g 的指导或约束,例如通过强制执行指定的终端走廊、中间航点包或同伦不同通道,而其余的解码步骤遵循与原始 Decode(?) 相同的程序。
3. 考虑流体动力学的层次化路径规划框架
为了解决在现实模拟海洋环境(例如基于HYCOM的矢量场)中的路径规划挑战,本文提出了一个考虑流体动力学的层次化框架。尽管标准的随机优化算法具有强大的全局搜索能力,但它们在复杂的水动力环境中的性能往往有所下降,尤其是在拓扑复杂性和局部细化精度方面。因此,我们引入了一种分层细化策略,该策略以逻辑驱动的顺序整合了三种互补机制:(1)LHS用于分层初始化,以促进搜索覆盖;(2)自适应参数机制,用于动态平衡探索和利用;以及(3)“粗到细”的细化策略,旨在使轨迹与环境梯度对齐。

3.1 通过LHS进行分层种群初始化
在高维搜索空间中,标准的随机初始化可能导致候选解分布不均。这种不均匀性可能导致算法错过有希望的低能量路径。为了解决这个问题,我们使用LHS生成一个分层的初始种群,从而实现更均匀的解决方案空间覆盖。考虑一个有N个自主水下航行器(AUV)的系统。第i个AUV的状态由一个8维向量表示:(xi0, yi0, zi0, θi0, ψi0, ui0, qi0, ri0)。将所有AUV的状态连接起来得到全局状态向量x(0)∈RD,其中D=8N。LHS将D维空间的每个维度划分为S个等概率的不重叠区间(层)。通过确保每个维度中的每个层都恰好选择一个样本,生成一个采样矩阵U∈[0,1]S×D。然后结合随机排列来减少相关性:uk,j=πj(k)?ξk,j,ξk,j~U(0,1),j=1,…,D,其中πj(?)表示第j维的随机排列,ξk,j表示层内的抖动。最后,将样本映射到物理范围[lj, hj]:xk,j=lj+(hj?lj),k=1,…,S。这种初始化提供了一组多样的路径点Pi,为后续的进化过程奠定了坚实的基础。

3.2 自适应螺旋进化机制
本研究采用Tornado Optimization(TOC)算法(Braik等人,2025年)作为全局搜索的支柱。在优化背景下,每个搜索代理代表一个候选路径。这些解决方案的进化由一个双向量机制控制:一个全局吸引向量,引导解决方案朝向当前最佳个体;以及一个随机扰动向量,模拟环境波动性。在动态海洋流中,静态控制参数常常导致过早收敛或振荡。因此,引入了一种自适应参数调整策略,以动态调节搜索行为。吸引系数α(t)呈指数衰减,以在早期阶段优先进行全局探索,在后期阶段优先进行局部利用:α(t)=αmin+(αmax?αmin)e?κt。螺旋扰动系数β(t)遵循多项式衰减,在早期阶段保持多样性,而在接近收敛时稳定解决方案:β(t)=βmax?(βmax?βmin)t^(Tmax/p),p>1。第i个个体的位置更新方程表示为:xi(t+1)=xi(t)+α(t)(xg(t)?xi(t))+β(t)ri(t),其中xg(t)是当前的全局最佳解决方案,ri(t)∈[?1,1]D是一个表示螺旋扰动的随机向量。

3.3 水动力感知的适应度评估
适应度函数作为指导进化过程的关键标准,综合考虑了时间效率、水动力能量和安全性。特别是,能量项遵循在方程(5)–(6)中建立的相关水动力模型,使得规划器明确偏好与周围水流合作的轨迹,并避免高阻力操作。

3.3.1 时间成本
对于AUV i,考虑一个离散化的轨迹{pi(k)},k=1,M,其中pi(k)∈R2表示水平平面上的第k个路径点。设vc(p)为位置p处的局部海洋流速度,vi>0为AUV i相对于水体的标称指令速度。段落k的穿越时间通过将段落长度除以地面速度大小(即指令速度加上局部流速)来计算:Ti(k)=‖pi(k+1)?pi(k)‖/‖vipi(k+1)?pi(k)‖+vcpi(k)‖。任务级时间目标是最小化总行程时间,即所有AUV之间的最大旅行时间:ftime=max1≤i≤N∑k=1,M?1Ti(k)。

3.3.2 能量消耗
与在方程(8)–(9)中建立的硬件感知能量模型一致,规划器中的轨迹能量通过考虑海洋流下的段落推进需求和由方向变化引起的机动成本来评估。对于一个由N个AUV组成的团队和一个有M个路径点的离散化轨迹,总能量相关成本定义为:?fenergy=∑i=1N∑j=1,M?1k‖vr,i(j)‖3?p+PhotelΔti(j)+∑j=2M?1Wturn,i(j),其中第一次求和代表硬件感知的段落能量,第二次求和代表额外的转向相关机动成本。在方程(32)中,vr,i(j)表示AUV i与位置j处的周围水流的相对速度,定义为:vr,i(j)=vi(j)?vcpi(j),其中vi(j)是AUV i在段落j上的指令平移速度,vc(pi(j))是在位置pi(j)处评估的局部流速度,‖vr,i(j)‖决定了维持所需地面运动所需的推进努力。系数k>0是从方程(5)–(6)继承的集总水动力参数,??p∈(0,1)表示整体推进效率,Photel是常数酒店负载。段落持续时间Δti(j)与方程(30)中的时间模型一致计算。转向项Wturn,i(j)模拟了围绕路径点j的方向变化引起的额外机动支出。为了实现方便,它被表示为一个加权方向增量:Wturn,i(j)=kψ|Δψi(j)|,其中kψ>0是转向能量权重,Δψi(j)表示路径点j附近的方向变化。这种公式一致地惩罚了(i)需要对抗不利水流的较大相对速度的轨迹,(ii)延长旅行时间从而累积更多酒店负载能量的轨迹,或(iii)涉及频繁和剧烈重新定向的轨迹。因此,规划器能量项直接与第2.3节中引入的硬件感知功率模型对齐,而不是与理想化的仅阻力替代模型对齐。

3.3.3 安全约束
为了促进安全,我们使用人工势场来构建惩罚项。障碍物避免惩罚Φobs鼓励AUVs与静态障碍物保持安全距离:Φobs=∑i=1N∑k=1Mobs?(dik),其中Mobs是障碍物的数量,dik是AUV i到障碍物k的最短欧几里得距离,排斥势定义为:?(d)=1/d?1,d<γ0,否则。结合上述组件,复合适应度定义为:fitness=wt×ftime+wefenergy+wobsφobs+wcolφcol,其中wt、we、wobs和wcol分别是平衡旅行时间、硬件感知能量消耗、障碍物避免和auv间碰撞避免的非负权重。特别是,fenergy根据方程(32)计算,这与方程(8)–(9)中的硬件感知功率模型一致。优化目标是最小化适应度值,因为较小的适应度值表示具有更好效率和安全的解决方案。 3.4 环境适应的分层细化策略 在由真实世界海洋数据(例如hycom)驱动的模拟中,环境矢量场可能表现出强烈的非线性和空间变性。在这些环境中,随机求解器可能生成由流动漂移或围绕局部有利但全局次优区域的停滞引起的冗余循环等伪影(li等人,2022年)。为了解决这些问题,引入了一种从粗到细的分层细化策略,以明确地将细化操作与水动力目标相结合。 下载:下载高分辨率图片(347kb) 下载:下载全尺寸图片 图5. 从离散控制多边形到连续b样条轨迹的转换。 3.4.1 拓扑重构:流动性感知的2-opt 在粗略搜索过程中,随机更新结合当前引起的漂移可能会生成具有冗余交叉点或流动驱动的绕行的轨迹,这会增加(32)中的fenergy。为了纠正这种结构异常,使用了流动性感知的2-opt操作符。对于任何一对非相邻的路径点pi(k1)和pi(k2),操作符评估重新连接路径拓扑是否可以降低(32)中定义的能量成本:δe=fenergy(Pnew)?fenergy(Pold),其中Pold和Pnew分别表示重新连接前后的路径点序列。如果ΔE<0,则接受重新连接。这一步作为拓扑级别的优化,消除了由流动引起的冗余循环,并在同一水动力目标下提高了几何效率。 3.4.2 随机逃逸:涡流逃避机制(sa) 复杂的水流场可能包含旋涡或局部吸引流等水动力陷阱,导致停滞。为了增强全局探索,我们通过应用随机位移到选定的路径点来整合模拟退火扰动:pi(k)←pi(k)+δ,δ~u(?ru,ru),并根据metropolis准则接受扰动:psa=exp?ΔFitness/TSA(t),这允许求解器暂时接受更高成本的候选路径,从而在多模态流场中逃离局部吸引盆地。 3.4.3 水动力微调:梯度适应的域缩放 为了使细化精度适应局部环境复杂性,我们将扰动半径与流速梯度的大小耦合。路径点pi(k)处的局部梯度指标定义为:ηi(k)=‖?vcpi(k)‖,扰动半径反向缩放为:ri(k)=r01+ληi(k),其中λ>0是灵敏度因子。这种设计在高剪切或湍流区域(η大)产生更精细的调整,而在层流区域(η小)允许更大的探索步骤,从而提高解决方案质量和数值稳定性。

3.5 精英保留和种群进化
为了增强进化过程的稳定性,采用了精英保留策略。父种群{P}和精细后代{P′}合并成一个统一的池。具有最低水动力成本的顶级Se个体会被保留为精英。其余个体使用二进制比赛选择进行再生,这有助于高质量遗传物质的传播。

3.6 运动学平滑:三次B样条插值
优化阶段生成的轨迹由离散的线性段组成。在现实的水动力建模中,路径点处的刚性转弯意味着瞬时加速度无限大,会导致执行器饱和和跟踪误差。为了弥合离散优化模型和连续运动学现实之间的差距,我们应用三次B样条插值。三次B样条曲线确保了C2连续性,即位置、速度和加速度的连续性,这对于稳定的AUV导航至关重要(Wang等人,2026年)。曲线C(t)由一组控制点P0,P1,…,Pn和基函数Ni,3(t)定义:C(t)=∑i=0nPiNi,3(t),t∈[t0,tn+3]。基函数是递归定义的。对于三次样条(k=3),基函数Ni,3(t)构造为:Ni,3(t)=t?titi+3?tiNi,2(t)+ti+4?tti+4?ti+1Ni+1,2(t),其中Ni,2(t)表示从结点向量派生的低阶基函数。这种递归结构确保了局部控制,即调整一个控制点只影响局部路径而不扭曲整个路径。平滑效果在图5中展示,其中控制多边形(即优化的离散路径)被转换为动态可行的曲线。为了获得节能且动态可行的路径,使用算法2解决分配的规划任务。尽管方程(39)定义了多AUV合作规划问题的总体目标,但算法2应用于在资源约束gi?下的相应单AUV子问题,其中排除了AUV间碰撞项。然后通过基于种群的全局探索以及三个顺序细化程序(即流动性感知的2-opt修复、基于模拟退火的涡流逃避和梯度适应的域缩放)来最小化单AUV的适应度。最后,通过B样条平滑将优化的离散路径点序列转换为连续轨迹。

3.7 复杂性和计算负载分析
为了评估所提出的HA-TOC框架在大规模多AUV规划中的可扩展性及其在资源受限的机载处理器上的适用性(Ji等人,2025年),我们从运行时间和内存占用两个方面分析了其计算复杂性。设N为AUV的数量,K为用于表示每个AUV轨迹的离散路径点数量。在我们的实现中,决策变量是所有AUV的内部路径点,不包括固定的起始和目标点。用dp表示每个路径点的维度(例如,在3-D中dp=3)。那么,优化维度为:D?N?(K?2)?dp,S和Tmax分别表示种群大小和最大迭代次数。总计算成本主要由三个阶段决定:初始化、迭代进化和分层细化。基于LHS的 初始化在D维空间构建S个候选解,需要O(SD)操作。在迭代进化过程中,每次迭代更新种群并评估所有个体的水动力感知适应度。由于适应度评估沿着轨迹遍历路径点,其主导成本与所有AUV的段数成正比,导致每次迭代O(S?N?K)。在“粗到细”细化阶段,Flow-Aware 2-opt操作符检查非相邻段之间的重新连接;在最坏的情况下,其复杂性为O(NK^2)。涡流逃避的模拟退火扰动和梯度适应的域缩放沿路径点局部操作,因此规模为O(NK)。重要的是,细化阶段仅应用于全局最佳个体P?,而不是所有S个个体,这大大限制了其对总体运行时间的贡献。因此,总时间复杂度可以限制为:Otime=O(SD)+O(Tmax?S?N?K)+O(Tmax?N?K^2)。在S适中且细化仅应用于P?的典型设置中,主导项是种群级别的适应度评估(Gao等人,2025年),实际运行时间可以很好地用O(TmaxSNK)来近似。在内存占用方面,算法存储当前种群及其适应度值。种群矩阵需要O(SD)内存。额外的缓冲区用于轨迹表示、平滑处理(例如,B样条或移动窗口滤波)和细化,存储所有自主水下航行器(AUVs)的航点级数据,这需要O(NK)的空间复杂度。因此,总体空间复杂度为O(Space=O(SD+NK)。与基于网格的确定性规划器(例如,标准A*)相比,其内存随离散化的3D工作区域大小O(XYZ)增长,而HA-TOC保持了紧凑的轨迹参数化表示,因此其复杂度与群体大小和航点分辨率成线性增长。从部署的角度来看,机载计算资源通常受到电源和硬件限制的影响,例如基于ARM的工业单板计算机。上述复杂度特征,加上第4.4节(表1)中报告的运行时间,表明HA-TOC可以在MATLAB中实现亚秒级规划复杂的3D涡流场,同时保持较低的内存占用。这种计算效率使得可以频繁进行在线重新规划,而不会造成过高的CPU负载或电池消耗,从而满足动态海洋任务的实际需求。

为了验证所提出的考虑流体动力学的层次化框架的有效性,我们使用真实的海洋数据进行了一系列模拟实验。实验重点关注三个关键方面:(1)基于LHS的初始化在复杂流场中的鲁棒性;(2)每个层次化细化操作符的贡献(消融研究);以及(3)在真实的HYCOM驱动环境中与代表性最先进算法的对比性能。为了清晰地进行比较分析,所提出的考虑流体动力学的层次化路径规划框架在以下图表和表格中被称为HA-TOC。所有模拟都在配备有Intel(R) Core(TM) i7-8565U CPU @ 1.80 GHz和8 GB RAM的计算平台上使用MATLAB R2023b进行。运动学更新遵循方程(45)中定义的连续B样条轨迹模型,这支持了生成路径的动态可行性。

4.1 分层初始化(LHS)的评估
标准随机初始化在包含复杂流体动力陷阱的海洋环境中通常表现不佳。它倾向于随机聚集粒子,留下大量未探索的空缺。为了严格评估我们初始化策略的鲁棒性,我们构建了一个20 × 20 × 10的3D网格环境。这个环境包含一个被高能量逆流包围的“狭窄有利走廊”。这样的设置代表了一个挑战性案例,算法必须识别一个特定的低能量通道以避免过度消耗能量。初始种群的空间分布如图6所示。标准随机采样(左)表现出随机聚集,导致大量未探索的空缺,走廊命中率仅为7.0%。相比之下,LHS方法(右)促进了搜索空间的分层和更均匀的覆盖。即使在这种受限的环境中,LHS也成功地捕获了可行区域,命中率为14.0%。这有效地将识别低能量通道的概率提高了一倍。这种均匀的空间覆盖至关重要,因为它有助于防止算法过早地收敛到由逆流引起的高成本局部最小值。

表1. 动态强涡流在线重新规划实验中的定量比较(平均值 ± 标准差,n=3)。
方法 能量(J) 长度(m) CPU/重新规划(秒) 平滑度 重新规划次数 到达百分比
AStar 57 86 7.89 ± 0.00 196.21 ± 0.00 0.025 ± 0.03 14.63 ± 0.00 6.00 ± 0.00
PSO 43 88 9.26 ± 12 0.33 132.40 ± 47.70 0.11 0.02 47.42 ± 3.55 5.11 ± 1.02 33.3
ICFPSO 14 31 0.09 ± 43 0.99 56.24 ± 2.14 0.13 8 ± 0.03 212.46 ± 0.78 4.56 ± 0.19 77.8
HA-TOC 27 5.66 ± 12 7.66 44.30 ± 0.01 0.08 5 ± 0.02 44.18 ± 0.05 3.00 ± 0.00 100.0

为了量化初始化对优化性能的影响,我们进行了50次独立的模拟运行。图7(a)展示了收敛行为。LHS提供了一个优越的起点,初始能量成本明显低于随机方法。插图放大视图突出显示LHS使种群在最初的几次迭代中稳定在高质量解决方案区域内。相比之下,随机初始化由于初始多样性较差,需要更多代次才能收敛。

图7(b)进一步分析了最终能量成本的统计分布。LHS策略一致地实现了比随机初始化更低的中位能量成本,如箱图中的较低位置所示。此外,LHS结果的四分位数范围位于随机方法的下方。没有极端高成本的异常值表明分层初始化有效地提高了解决方案的稳定性。尽管LHS涉及额外的矩阵操作,但计算开销仍然可以忽略不计。这使其成为提高复杂流体动力学场中AUV路径规划鲁棒性的有效策略。

4.2 消融研究:层次化操作符的有效性
为了验证所提出的细化策略的必要性并量化每种机制的贡献,我们进行了消融研究。该实验的目标是展示最终性能来自于一个逻辑上的“粗到细”的优化过程。我们将完整的HA-TOC框架与基线和几个单操作符变体进行了比较。这些变体定义如下:基线表示没有细化的初始路径;+2-Opt引入了拓扑修复操作符;+SA应用了涡流逃避机制;+DS使用直接搜索策略进行局部微调;HA-TOC表示整合了所有操作符的提议框架。图8(a)中的收敛分析展示了每种变体的优化行为。基线(灰色虚线)在高能量成本上停滞不前,表明标准初始化单独无法有效导航复杂的水流场。+2-Opt(青色)和+SA(橙色)变体显示出能量成本的快速初始下降,但在第10次迭代左右迅速趋于平稳。这表明,尽管这些操作符可以纠正主要的结构错误,但它们缺乏接近完整框架找到的最佳解决方案所需的精度。相比之下,+DS变体(紫色)达到了更低的能量状态,但仍比完整方法更早出现停滞。所提出的HA-TOC(绿色)在整个迭代过程中保持了持续下降的趋势。图8(a)的放大视图进一步显示出,即使在第30次迭代后,组合方法仍然在积极改进。它有效地利用了所有操作符的优势,避免了单个操作符变体陷入的局部最小值。

图8(b)提供了最终能量成本的定量比较。基线产生了不可行的高成本1162.0 J,这在实际部署中是不现实的。引入单个操作符显著降低了能量消耗。具体来说,+2-Opt和+SA分别将成本降低到113.0 J和118.2 J。值得注意的是,+DS取得了更好的结果61.5 J,证实了其在局部梯度利用方面的有效性。然而,完整的HA-TOC框架实现了最低的平均能量成本31.4 J,与最佳单个操作符变体(+DS)相比进一步降低了49%。这些结果表明,这些操作符并不冗余;相反,它们解决了轨迹优化问题的不同方面。拓扑修复和涡流逃避机制解决了大规模的路径缺陷,从而为直接搜索操作符执行局部细化提供了高质量的基础。这种层次化合作使求解器能够达到单个组件无法单独实现的接近最优的解决方案。

4.3 在不同电流强度下的鲁棒性分析
为了评估所提出的HA-TOC算法在不同流体动力学条件下的适应性,我们在图9中模拟了两种场景:场景I(层流),代表稳定的海洋电流,以及场景II(湍流),其特征是复杂的非线性涡流场。图10和图11展示了在变化拓扑任务约束下多AUV协调的模拟结果。在场景I中,流场表现出一致的单向速度模式和低空间梯度。如图10所示,收敛(图10(a))、发散(图10(b))和平行(图10(c))任务的规划轨迹相对线性。这种行为在物理上与环境一致,因为均匀的流动提供了通过空间机动捕获能量的有限机会。因此,优化算法优先考虑路径缩短,同时积极补偿背景电流引起的漂移角度。轨迹的平滑度进一步表明,即使在穿越不同地形高度时,也保持了AUV的运动学约束。

图9. 全局流场概览和场景分类。
在选择性II中更严格地检验了框架的鲁棒性,该场景具有高涡度的Rankine涡流模型。图11展示了在这些强电流干扰下的规划结果。与层流场景中观察到的相对线性路径相比,湍流场中的轨迹表现出适应局部流向的明显曲线特性。具体来说,在图11(a)中展示的收敛任务中,AUV-3的轨迹展示了明显的“S形”机动。规划器没有直接穿过高速涡流核心,而是利用切向流动,并使用电流辅助推进,然后平滑地转向目的地。同样,在发散任务(图11(b))中,轨迹更显著地分叉以利用特定于扇区的流动分量。例如,橙色轨迹跟随向下流动的分量,而绿色轨迹利用了中心流动梯度。在平行任务(图11(c))中,算法在导航地形鞍状区域时保持了多个代理之间的安全分离。

这些比较结果验证了所提出的能量成本函数的有效性。由于功耗被建模为相对速度的立方(P∝‖v→s?v→c‖3),算法明确惩罚了高阻力路径,因此在欧几里得距离和流体动力学效率之间进行了权衡。生成无碰撞且能源效率高的冲浪路径的能力证明了所提方法在真实海洋流环境中的代表性任务拓扑下的鲁棒性。

第4.3节验证了所提出框架在真实电流场中的整体有效性。然而,真实的海洋数据涉及多个耦合因素,局部路径适应机制并不总是可以从这些情况中直接识别出来。为了进一步解决审稿人对动态流场、长范围规划和在时变干扰下的鲁棒性的担忧,本节引入了一个在动态强涡流环境中的额外在线重新规划实验(Lim等人,2022)。这个实验并不是为了替代第4.3节中使用真实海洋电流数据的验证。相反,它提供了一个受控但动态性强的案例,在其中可以更清楚地检查路径演化、能量积累和走廊选择的效果。在这个测试中,一个合成的强涡流场被叠加在地形图上,涡流中心和流动强度随时间变化。任务范围被扩展,并在执行过程中重复触发在线重新规划。在相同的设置下比较了四种方法:A*、PSO、ICFPSO和所提出的HA-TOC。评估的指标包括累积能量、行进路径长度、平均重新规划时间、路径平滑度、重新规划频率和到达成功率。以下图表中显示的路线是从模拟轨迹中简化而来的,以保持每种方法的整体运动趋势的视觉清晰度。本节报告的所有定量值都是从原始模拟结果计算得出的,而不是从简化的显示路径中得出的。

表1显示,在这种情况下,HA-TOC实现了最低的平均累积能量和最短的平均路径长度。它还需要最少的重新规划事件,并且在所有运行中都达到了目标。ICFPSO明显优于PSO和A*,但其能量消耗和路径长度仍高于HA-TOC。PSO在平均能量方面表现优于A*,但其方差相对较大,表明在时变涡流场中的稳定性较低。A*表现出最大的能量消耗和最长的行进路径,并且在测试的运行中未能成功完成任务。就每次重新规划的CPU时间而言,A*仍然是最轻的基线,因为它执行的是确定性的图搜索,没有种群演化或层次化细化。然而,这种较低的单步计算成本并没有转化为在当前动态涡流情况下更好的任务级适用性,这从HA-TOC失败到达和更高的累积能量中可以反映出来。相比之下,HA-TOC的计算范围保持在适度范围内,并且平均而言低于ICFPSO。总体而言,这些结果表明,所提出的分层策略在任务完成、路线效率和重新规划负担之间提供了良好的平衡。图12中的累积能量曲线进一步说明了四种方法的时间行为。A*和PSO的能量在大部分任务时间内持续增加,表明它们暴露在不太有利的流场区域的时间更长。与PSO相比,ICFPSO降低了增长速度,但其曲线在收敛之前仍然显著上升。相比之下,HA-TOC曲线在早期阶段的增长较慢,并且比其他方法更早达到接近平稳的状态。这一趋势与其较短的路径长度、较少的重新规划事件以及表1中的完全到达成功率一致。这表明所提出的方法可以更早进入更有利的通道,并在这种动态环境中保持更稳定的进展。

下载:下载高分辨率图像(178KB)
下载:下载全尺寸图像

图12. 动态强涡流在线重新规划下的累积能量演变。

图13(a)显示了A*和PSO的路线趋势。这两种方法都生成了可行的路径,但它们仍然经过了提供有限流动支持的区域。这导致它们暴露在不利水动力条件下的时间更长,累积能量增长也更大。A*受到几何可行性的更强约束,因此显示出更明显的避免通过不利流动区域的趋势。PSO在一定程度上调整了路线形状,但由于没有分层的水动力通道机制,它在这种情况下仍然积累了相对较高的能量成本。

下载:下载高分辨率图像(820KB)
下载:下载全尺寸图像

图13. 动态强涡流环境中的轨迹比较。

图13(b)显示ICFPSO避开了大部分最不利的区域,并产生了比A*和PSO更合理的大规模绕行。这解释了其相对较短的路径长度和较低的能量成本。然而,该路线仍然反映了基于快照的局部偏好,其大规模通道不如HA-TOC紧凑。因此,在这种动态场景下,ICFPSO仍然需要更多的重新规划操作,并保持了较高的总能量。

图13(c)显示HA-TOC围绕时变涡流结构形成了更平滑的大规模通道,并以较少的方向 corrections 达到了目标。这并不意味着该方法在所有动态流场实现中总是产生全局最优路径。在这种情况下,分层的水动力引导有助于路线保持更接近有利的流场辅助通道,减少了不必要的绕行,并限制了与推进相关的能量增长的增加。这次实验中相对较大的能量差距也与采用的推进模型有关,在该模型中,推进成本取决于相对于周围流动的相对速度。在这种模型下,一旦方法保持在有利的通道附近,累积能量可以显著减少。因此,这一部分应被视为用于机制分析的动态强涡流案例,而不是适用于所有环境的通用性能范围。结合第4.3节在真实海洋流场中的验证,该实验提供了补充证据,证明所提出的框架在强烈时变流动条件下仍然有效,其中在线通道适应非常重要。

4.5. 在容量限制下的合作拥堵测试(多对一)

在4.4节对强涡流的受控分析之后,我们进一步在故意拥挤的多AUV设置中验证了所提出的分布式合作层。该实验旨在检验该框架是否可以在多个AUV在同一流场中操作并尝试到达共同目的地时减轻资源争夺,而这不能仅通过独立的单智能体规划来解决。

我们考虑了一个多对一的任务,其中有N=3个AUV在同一海洋流场中导航,朝向一个共同的目标。环境包含多个候选通道G,其中一个被故意设置为容量有限,以引发拥堵。基线方法(No-Coop)为每个AUV独立规划,并仅根据其自身预测的成本选择通道。所提出的Scheme-A应用分布式分配层(拍卖/共识与容量限制)来生成通道选择,然后调用单AUV的HA-TOC规划器进行运动执行。为了公平起见,两种方法使用相同的本地规划器和相同的安全意识执行/修复程序;唯一的区别是是否启用了基于合作容量的分配。

为了评估鲁棒性,我们进行了20次运行的蒙特卡洛研究,种子值为1-20。在每次运行中,场景中注入了小的扰动,包括起始位置和流场参数,以模拟实际变异性,同时保持任务结构不变。我们报告了四个规划质量指标和一个与能量相关的代理指标:最小AUV间距离(minDist)、冲突率(任何车辆间距离违反安全阈值的时间步比例)、总路径长度(totalLen)和从相对于局部流动的相对速度计算出的能量代理。在这种故意拥挤的设置中,安全性被视为主要目标:减少车辆间冲突优先于旅行效率,因为独立规划可能会产生在团队层面不可行的局部短路径。因此,冲突率是合作有效性的主要指标,而totalLen、makespan和energyProxy被解释为实现更安全的团队执行所付出的代价。统计结果(平均值±标准差)总结在表2中。

与安全相关的结果在图14的箱形图中最为明显。图14(a)显示,独立规划导致在共享目标附近持续拥堵,平均冲突率为53.6%。相比之下,Scheme-A通过在分配阶段明确执行通道容量限制,将冲突率降低到5.0%,从而避免了在执行过程中的拥挤和重复的近距离相遇。这代表了在高度拥挤的任务中碰撞风险事件的显著减少。图14(b)报告了能量代理的分布。尽管Scheme-A的平均能量代理较高,但这种增加与预期的平衡一致:协调的基于容量的路由可能会引入绕行或不太有利的水动力选择,以在拥堵情况下保持安全分离。

表2. 多对一拥堵情况下的蒙特卡洛结果(N=3, 20次运行)。值以平均值±标准差的形式报告。

指标 No-Coop Scheme-A
minDist (m) 0.2572±0.1543 0.2366±0.1884
conflictRate (%) 53.625±4.65 35.000 ± 0.000
totalLen (m) 75.963±1.382 84.052±5.243
makespan (s) 21.764±0.436 25.124±1.759
energyProxy (a.u.) 41.109±4.763 68.113±10.319

图15展示了一个代表性的运行(种子=1),比较了在相同流场和地形下的No-Coop和Scheme-A的轨迹。在No-Coop情况下,多个AUV被吸引到同一个有利的通道,并在狭窄区域内聚集,这解释了较高的冲突率。使用Scheme-A时,合作层在调用HA-TOC规划器之前多样化了通道选择,从而减少了目标区域附近的拥挤。因此,生成的轨迹可能看起来比独立基线的轨迹更曲折,因为团队必须同时满足容量和分离约束;然而,这种行为正是抑制了拥堵多AUV操作中的碰撞风险事件。

下载:下载高分辨率图像(182KB)
下载:下载全尺寸图像

图14. 多对一情况下冲突率和能量代理的蒙特卡洛比较(N=3, 种子1-20)。

总体而言,这种合作拥堵测试通过表明所提出的框架可以扩展到纯独立规划之外,补充了第4.4节中的单AUV机制分析。分布式分配层在共享资源有限的情况下提供了明确的规划级协调机制,而底层的HA-TOC规划器仍然负责在实际流动中生成可行的单AUV运动。从这个意义上说,所提出的框架改进了团队级别的冲突缓解,而无需引入完全耦合的合作控制架构。

下载:下载高分辨率图像(631KB)
下载:下载全尺寸图像

图15. 多对一情况下的代表性轨迹(种子=1):No-Coop与Scheme-A。

4.6. 参数敏感性分析

为了进一步解决审稿人对参数敏感性的担忧,本节评估了所提出框架在不同参数设置下的鲁棒性。分析重点关注该方法的主要组成部分,包括LHS初始化、TOC演化机制和三个细化操作符,即Flow-Aware 2-opt、Simulated Annealing(SA)和Gradient-Adaptive Domain Scaling(DS)。对于每个参数组,其余设置保持其默认值,以便隔离测试参数的效果。评估在具有代表性的流限制规划场景中进行,并从初始化质量、候选集质量和计算成本方面分析结果。这项分析旨在验证所采用的参数配置在解决方案质量和计算效率之间提供了合理的平衡。

首先,检查了LHS初始化对样本大小的敏感性。由于LHS的作用是为后续的分层优化提供分布良好且质量高的初始种群,因此分析重点关注初始样本数量如何影响初始化候选集的质量。考虑了两个互补的指标:最佳初始成本,反映了单个最佳初始化候选的质量;以及Top-10平均初始成本,反映了高质量候选子集的整体质量和稳定性。较低的值表示更好的初始化质量。

图16(a)显示,增加初始样本数量通常会降低随机采样和基于LHS的采样的最佳初始成本,因为较大的候选池提高了覆盖有利区域的概率。然而,在大多数测试范围内,LHS实现了较低或可比的最佳初始成本,尤其是在中等样本大小范围内,这种优势更加明显。这一结果表明,LHS可以用较少的无效样本来提供更好的初始化精英候选。

下载:下载高分辨率图像(390KB)
下载:下载全尺寸图像

图16. LHS初始化质量对样本大小的敏感性。

下载:下载高分辨率图像(336KB)
下载:下载全尺寸图像

图17. HA-TOC性能对细化预算的敏感性。

下载:下载高分辨率图像(333KB)
下载:下载全尺寸图像

图18. 2-opt操作符对其应用概率的敏感性。

下载:下载高分辨率图像(314KB)
下载:下载全尺寸图像

图19. SA操作符对其衰减率的敏感性。

下载:下载高分辨率图像(336KB)
下载:下载全尺寸图像

图20. DS操作符对其最大收缩因子的敏感性。

图16(b)进一步显示了Top-10平均初始成本随样本大小的变化。与单个最佳值相比,这个指标更加稳定,更好地反映了高质量候选子集的整体质量。可以看出,LHS始终产生较低或可比的Top-10平均成本,特别是在样本大小较小或中等的情况下。这表明LHS的好处不仅限于单个有利的候选,而是扩展到随后优化过程中使用的更广泛的精英子集。

另一个重要的观察结果是,随着样本大小的增加,获得的改进逐渐饱和。当样本大小变得足够大时,LHS和随机采样之间的差距变小。这表明收益递减效应:一旦初始种群达到足够的覆盖水平,进一步扩大样本大小在初始化质量上的收益仅是有限的。因此,从质量和效率的角度来看,适中的样本大小对于所提出的框架是足够的。基于上述结果,本工作中使用的LHS初始化采用了适中的样本大小,作为候选质量和计算开销之间的实际折中。

接下来,在动态强涡流在线重新规划场景中分析了关键HA-TOC规划参数的敏感性。在当前实现中,细化预算Nref决定了HA-TOC规划器中的本地通道细化尝试次数。较大的Nref允许规划器更彻底地探索本地改进的控制点配置,但这也增加了每个重新规划阶段所需的计算工作量。为了评估这种权衡,在保持所有其他参数不变的情况下改变了细化预算。考虑了两个代表性的指标:平均能量消耗,反映了动态流感知规划的有效性;以及每次重新规划步骤的CPU时间,反映了在线计算负担。

图17(a)显示,增加HA-TOC细化预算通常会提高能量性能,因为更多的细化尝试使规划器能够更好地利用时变涡流场中的有利通道。当细化预算从低水平增加到中等水平时,能量减少的现象更加明显。然而,当Nref变得足够大时,改进效果逐渐饱和,能量增益变得微不足道。这表明过大的细化预算并不会持续转化为与规划效益成比例的效果。图17(b)显示了相应的计算成本。总体而言,每次重新规划步骤的CPU时间保持在较窄的范围内,并且在较大的细化预算下略有增加,因为每次在线更新时需要评估更多的局部细化尝试。尽管在测试范围内总体增加量保持适度,但结果清楚地反映了优化深度与在线效率之间的预期权衡。因此,从实际部署的角度来看,选择细化预算时不应仅仅为了最小化能量值,而应在性能提升和重新规划成本之间做出平衡。

综合上述观察结果可以得出结论:适度的HA-TOC细化预算足以提供大部分可实现的能量效益,同时将在线计算负担保持在可接受的水平。这一结果与所提出框架的参数设计目标一致,即在动态海洋流情况下保持良好的能源效率,而不增加过多的重新规划开销。

最后,在相同的规划设置下,研究了三种细化操作器的敏感性。在此部分中,其他参数保持默认值不变,每次只改变一个与操作器相关的参数。分析重点是最终最佳成本及其相应的计算成本。这种设计使得可以评估局部路径重连强度、随机探索计划和精英引导的收缩强度如何影响所提出框架的整体优化行为。

首先考察的是Flow-Aware 2-opt操作器。在当前实现中,其贡献由应用概率控制。较高的概率意味着在迭代细化过程中更频繁地进行局部段重连。如图18所示,增加2-opt应用概率通常会降低最终最佳成本,表明更频繁的局部重构有助于消除无效的路径段并提高局部路径质量。同时,计算成本呈现出适度的上升趋势,这与局部细化尝试次数的增加是一致的。因此,相对较高的2-opt应用概率有利于解决方案质量,尽管它引入了额外的计算工作量。

第二个考察的是SA操作器,其敏感参数是衰减率。该参数控制着在迭代搜索过程中扰动强度减少的速度。如图19所示,所提出的框架对SA衰减率表现出明显的敏感性。当衰减率太小时,扰动持续时间过长,从而减弱了收敛性并导致最终成本相对较高;当衰减率太大时,探索强度过早减弱,也会降低最终解决方案的质量。相反,适度的衰减率会产生最低的最终成本和相对较低的计算负担。这一结果表明,当探索和收敛适当平衡时,SA操作器最为有效,而不是当任一行为过度主导时。

第三个考察的是DS操作器,其贡献由最大收缩因子控制。该参数决定了细化过程中精英引导的收缩强度的上限。如图20所示,过小的收缩因子会导致最终成本显著增加,表明对精英解的吸引力太弱,无法支持有效的细化。一旦收缩因子达到适度水平,最终成本会显著下降,并在测试范围内保持相对稳定。相应的计算成本仅有适度变化,表明DS操作器主要影响细化效果,而不是导致运行时间的大幅增加。因此,适度的收缩因子足以实现稳定的性能提升。

综上所述,这三种细化操作器表现出不同的敏感特性:2-opt操作器主要通过更频繁的结构调整来提高局部路径质量;SA操作器在适度的探索-收敛计划下最为有效;DS操作器需要足够但不过度的收缩强度来维持稳定的细化性能。这一观察结果与所提出框架的层次化设计一致,在该设计中,确定性的局部重构、随机逃逸和精英引导的收缩在最终优化阶段起到互补作用。

5. 结论

本文提出了一种考虑流体力学的层次化路径规划框架,用于现实海洋流环境中的多AUV任务。所提出的方法结合了硬件感知的能量公式、层次化细化策略和轻量级的协同分配层,旨在在海洋流干扰下提高路线质量,同时保持重复重新规划的计算可行性。结果表明,所提出的框架在多种互补测试中都显示出一致的优势。在现实的HYCOM驱动环境中,该方法生成了无碰撞且符合流体力学特性的路线。在动态强涡流情况下,它保持了稳定的在线适应能力,并在路线效率、能源相关成本和重新规划负担之间实现了更好的平衡。在拥挤的多对一场景中,添加的协同层在容量限制下降低了团队层面的冲突风险,表明该框架能够解决独立规划无法解决的资源竞争问题。敏感性分析进一步表明,主要细化操作器发挥着不同但互补的作用,并且在适当的参数范围内可以实现满意的性能。从应用海洋研究的角度来看,这些发现表明,所提出的框架对于需要综合考虑能源效率、安全性和有限机载计算能力的远程水下作业任务规划具有价值。该方法不仅依赖几何最短路径行为,还明确利用了有利的流结构,因此为多AUV任务(如海洋观测、环境监测和在受流扰动的水域中的重复调查任务)提供了实用的路线规划选项。

同时,也应承认一些局限性。首先,尽管采用了真实的海洋流数据,但目前的研究仍基于仿真,尚未进行全面的物理验证。其次,本研究中的协同组件被设计为一个分布式资源分配和冲突解决层,而不是一个具有详细通信和车辆级交互动态的完全耦合的协同控制方案。第三,能量模型更符合工程实际,而不是理想化的仅基于阻力的公式,但它仍然没有捕捉到现场部署中可能出现的所有硬件效应。

未来的工作将集中在实时约束下的执行验证上,包括半物理或硬件在环测试,以及在条件允许的情况下进行水池或海试验证。此外,还有兴趣将更详细的车辆动态、电池放电特性和水下通信限制纳入考虑,并将当前框架扩展到更大规模和更不确定的海洋环境中的多AUV协同规划和控制。

作者贡献声明:
高翔:撰写——审阅与编辑、监督、方法论、调查
贾道德伟:撰写——初稿、验证、软件、形式分析
刘星光:撰写——审阅与编辑、监督、项目管理、方法论、概念化
肖高喜:撰写——审阅与编辑、方法论、数据管理
文世平:撰写——审阅与编辑、调查、数据管理
康宇:撰写——审阅与编辑、可视化、资金获取
陈思宇:撰写——审阅与编辑、软件、形式分析
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号