深海物理探索:利用物理信息网络(PINNs)估算水下航行器的运动特性

《Ocean Engineering》:Deep physics for deep seas: Estimating underwater vehicle dynamics with PINNs

【字体: 时间:2026年05月10日 来源:Ocean Engineering 5.5

编辑推荐:

  米科·万吉(Mirco Vangi)|亚历山德罗·布奇(Alessandro Bucci)|盖拉尔多·利维拉尼(Gherardo Liverani)|达维德·科拉斯安托(Davide Colasanto)|亚历山德罗·里多尔菲(Alessandro Ridolfi)|贝内代托·阿

  米科·万吉(Mirco Vangi)|亚历山德罗·布奇(Alessandro Bucci)|盖拉尔多·利维拉尼(Gherardo Liverani)|达维德·科拉斯安托(Davide Colasanto)|亚历山德罗·里多尔菲(Alessandro Ridolfi)|贝内代托·阿洛塔(Benedetto Allotta)
佛罗伦萨大学工业工程系,意大利佛罗伦萨,圣玛尔塔路3号(via di Santa Marta 3),邮编50139

**摘要**
RUVIFIST(用于检测、自由漂浮干预和调查任务的可重构水下航行器)平台旨在结合自主水下航行器(AUVs)的长续航能力和遥控潜水器(ROVs)的精确性与机动性。其可重构设计使该航行器既适用于高效的“调查”模式,也适用于紧凑的“悬停”模式,以完成检测和干预任务。本文的主要贡献在于开发了一种基于物理信息的人工神经网络(PINN),该网络能够直接从现场数据中估计关键流体动力学参数(包括附加质量和线性阻尼系数),从而提高航行器动态模型的准确性,并实现前馈控制器与PID控制的结合。实验重点评估了激荡、横摇和偏航参数的估计效果。通过将前馈控制的效果与基线PID控制的效果进行比较,验证了其性能。在“调查”模式下,该方法表现出高精度,恒速激荡时的力误差低于5牛顿,航向旋转时的力误差低于2牛顿;在“悬停”模式下,单独使用前馈控制器时,恒速激荡和横摇运动的速度误差约为0.03米/秒。

**1. 引言**
RUVIFIST项目旨在开发一种兼具自主水下航行器和遥控潜水器功能的水下航行器。例如,该航行器具备自主水下航行器的长时间导航调查能力,以及遥控潜水器的近距离检测(或干预)能力。图1综合展示了这种可重构水下航行器的概念。其核心理念是拥有多种配置,并能根据当前任务自主切换配置。不同的机器人配置会导致不同的整体流体动力力和附加质量分布。特别是,这种自主重构水下航行器(AURV)可以在两种配置之间切换:一种是适用于干预操作的等向行为模式(称为“悬停/开启”模式,见图2(b)),另一种是适用于长时间调查任务的、能够最小化纵向流体阻力的细长形态(称为“调查/关闭”模式,见图2(a))。需要说明的是,“悬停”状态意味着航行器具备六个自由度(DOFs),而在“调查”模式下,航行器失去了横向运动的能力(即无法沿横摇方向移动)。

由于两种极端配置的动力学特性因质量分布差异而显著不同,因此需要精确的控制策略来确保稳定可靠的性能。此前已有研究在Vangi等人(2025年)的论文中实现了基于增益调度的PID控制架构。然而,采用基于模型的控制方法有望进一步提升系统整体性能。要实施此类控制器,首先需要进行系统识别过程。

**2. 系统识别**
系统识别是动态系统建模和控制的基础步骤,它能够推导出系统的数学表达式。这些模型对于预测水下航行器的行为以及设计在恶劣海洋环境中可靠运行的鲁棒控制策略至关重要。基于模型的控制方法能够让控制器提前预测所需动作,而不仅仅是被动响应错误。例如,在Chen等人(2025年)的研究中,为USV-UAV异构系统建立了一个优化性能的控制框架,以应对三维海空环境的复杂性。作者通过结合预定性能控制(PPC)和最优控制方法来应对动态不稳定的挑战。

传统的系统识别方法主要分为两大类:基于物理的建模方法和纯数据驱动的方法。基于物理的方法依赖流体动力学和刚体力学的定律来构建解析模型,虽然这些方法提供了易于解释的结构并保持了物理一致性,但常常面临参数估计误差、未建模的动态行为以及计算复杂性高的问题。相比之下,数据驱动模型仅利用测量数据,通常不依赖明确的物理公式。基于这些考虑,我们选择结合数据驱动和基于物理的方法,通过实施基于物理信息的人工神经网络(PINN)来进行系统识别。PINN是一类将系统物理定律融入学习过程的人工神经网络,有效结合了物理知识和数据驱动建模。与传统的深度学习技术不同,PINN将系统控制方程直接纳入损失函数中,使模型能够在相对较小的数据集下进行学习,同时保证预测结果的物理一致性。

本文的主要创新在于开发并实验验证了基于PINN的框架,用于识别RUVIFIST航行器的流体动力学参数。与传统识别方法不同,所提出的方法将水下航行器的非线性动力学直接纳入损失函数中,从而能够从闭环条件下收集的现场数据中同时估计附加质量和线性阻尼系数。此外,通过实现前馈控制器并将其集成到增益调度-PID控制架构中,对两种极端配置下的动态参数进行了数值比较,从数学角度展示了每种配置的主要优势。

**3. RUVIFIST平台**
RUVIFIST平台的目标是开发一种兼具自主水下航行器和遥控潜水器功能的水下航行器。它结合了AUV的长航程能力和ROV的高精度与机动性。该平台的设计使其能够在“调查”模式下高效工作,同时在“悬停”模式下进行精确检测和干预。本文的主要贡献在于开发了基于物理信息的人工神经网络(PINN),用于直接从现场数据中估计流体动力学参数,提高了航行器动态模型的准确性,并实现了前馈控制与PID控制的结合。实验表明,该方法在恒速激荡和航向旋转时的控制精度均优于基线PID控制器。

**4. 结论**
本文总结了RUVIFIST平台的设计理念、工作流程及其优势,并指出了未来研究的方向。第2节详细回顾了基于PINN和传统方法的系统识别现状;第3节描述了系统模型和问题表述,并介绍了用于参数估计的简单前馈控制系统;第4节报告了使用所提出的PINN进行的动态参数估计结果;第5节总结了本文的主要结论及未来研究方向。该研究表明,基于PINN的替代模型能够有效填补复杂机械系统中数据驱动建模与物理基于控制之间的差距。刘等人(2024年)将PINN技术应用于Franka Emika Panda机器人的建模和控制。结果表明,与黑箱方法相比,所提出的基于PINN的模型在预测准确性和鲁棒性方面表现出更高的性能,从而有效地将数据驱动学习与基于模型的控制联系起来。在自动驾驶车辆控制领域,顾等人(2024年)提出了一个PINN框架,用于精确且可解释的四旋翼动力学建模。为了解决基于模型和纯数据驱动方法的局限性,作者将动量守恒定律嵌入到损失函数中作为软物理约束,确保了学习过程的物理一致性。该网络充当逆动力学模型,根据系统状态和加速度预测电机输入。结果显示,即使在数据有限的情况下,所提出的PINN在泛化能力、准确性和物理一致性方面也显著优于线性化和传统的深度学习(DL)方法。

在海洋机器人学背景下,PINN已被成功用于识别流体动力学参数。例如,在Mishra等人(2024年)的研究中,PINN被用来估计与水下车辆起伏运动相关的动态系数,其均方误差(MSE)方面的估计误差达到了10^-2的数量级。使用基于PINN的框架识别了无人水面航行器(USV)的动力学模型。与传统的神经网络(NN)相比,PINN在预测摇摆、纵摇和横摇动态方面表现更优,尤其是在训练数据仅有4000个样本的情况下(Xu等人,2022年)。这些发现表明,PINN不仅减少了数据需求,还提供了更好的泛化能力,暗示其作为水下车辆系统识别的可行替代技术的潜力。

**3. 材料与方法**
**3.1. 问题表述**
在这项工作中,我们遵循了Fossen和Sagatun(1991年)以及Antonelli和Antonelli(2014年)提出的水下车辆动力学模型:**
$$ M_{\nu\dot{}} + C(\nu)\nu + D(\nu)\nu + g(\eta) = \tau $$
其中:
- **M** 是质量和惯性矩阵
- **C(\nu)** 是科里奥利力和向心力的矩阵
- **D(\nu)** 是阻尼矩阵
- **g(\eta)** 是重力和浮力及其力矩的向量
- **τ** 是控制输入的向量

当刚体在流体中移动时,还必须考虑由刚体运动引起的周围流体的额外惯性。流体随着刚体的运动而加速,因此需要一个额外的力来实现这种加速。结果,流体对刚体施加一个大小相等但方向相反的反作用力,这种反作用力被称为附加质量贡献,它显著影响了水下车辆的动力学特性,使得它们的运动比在空气中运行的机器人更为复杂(Antonelli和Antonelli,2014年)。

我们可以区分质量和惯性矩阵的两个组成部分:一个与刚体动力学(MRB)相关,另一个与附加质量(MA)相关。
$$ M = MRB + MA $$

假设车辆具有三个对称平面,我们简化了MRB和MA矩阵的结构,并将其近似为对角矩阵:
$$ MRB = \text{diag}m_{mm}, m_{iq}, mr $$
$$ MA = \text{diag}Xu_{\dot{}}, Yv_{\dot{}}, Zw_{\dot{}}, Kp_{\dot{}}, Mr_{\dot{}} $$

附加质量系数可以通过利用刚体的几何形状及其对称性,应用条带理论和计算流体动力学(CFD)分析来理论推导(Lambert等人,2022年)。然而,这些方法通常需要大量的计算资源和专业技能。

对于质量和惯性矩阵,向心力和科里奥利力矩阵也可以区分两个组成部分:
$$ C(\nu) = CRB(\nu) + CA(\nu) $$
其中CRB包括刚体效应,CA与车辆在流体中的运动相关。与质量矩阵M不同,C(ν)没有唯一的表示形式。

流体的粘性还会导致阻尼力和升力的产生。一种常见的简化方法是只考虑与速度成线性关系的阻尼项以及与速度平方成二次方关系的阻尼项,并将这些项组合在一个矩阵D(ν)中:
$$ D(\nu) > 0 \forall \nu \in \mathbb{R}^{6} $$

在对方程(4)和(3)相同的假设下,我们通过将其近似为对角矩阵来简化矩阵结构:
$$ D(\nu) = D_{l} + D_{q}(\nu) $$
$$ D_{l} = \text{diag}Du, Dv, Dw, Dp, Dq, Dr $$
$$ D_{q}(\nu) = \text{diag}\frac{Du}{|u|}, Dv}{|v|}, Dw}{|w|}, Dp}{|p|}, Dq}{|q|}, Dr}{|r|} $$

鉴于AUV通常以相对较低的速度行驶,可以忽略阻尼矩阵的二次项,只考虑作用在车辆上的线性项。实际上,线性阻尼主要来自粘性摩擦和表面摩擦。在非常低的速度下,流体周围的流动通常是层流的,阻力主要由流体中的剪切应力决定(Fossen,1994年)。出于安全考虑以及为了保护安装在RUVIFIST首个原型上的电池寿命,已将自主运行期间的最大允许速度设定为0.5 m/s。通过在车辆控制系统中设置这一限制,可以忽略阻尼矩阵D(ν)的二次项。仅使用阻尼矩阵的线性项也大大简化了动力学模型,因为阻尼矩阵不再依赖于ν。
$$ D(\nu) = D_{l} = \text{diag}\{Du, Dv, Dw, Dp, Dq, Dr\} $$

**3.2. 参数估计**
在这项工作中,我们专注于估计RUVIFIST水下车辆的动态参数,特别关注阻尼矩阵和附加质量项。

对于优化问题,我们可以定义成本函数为:
$$ f = \|\mathbf{M}_{\nu\dot{}} + C(\nu)\nu + D_{l}\nu + g(\eta) - \tau\|^2 $$
需要注意的是,M和C(ν)也包括附加质量项。优化问题可以表述为:
$$ \min_{MA, D_{l}}(|MA|, |D_{l}|, M_RB, M_A, CRB, CA, D_{l}, \nu\dot{}, \nu, \eta, \tau) $$
其中,我们约束附加质量矩阵MA和阻尼矩阵D_{l}为正定矩阵。

所提出的解决方案结合了长短期记忆(LSTM)层和全连接(FC)层,如图3所示。LSTM层的目的是捕捉输入数据的时间特征,因为仅凭瞬时数据不足以表示我们旨在估计的系统参数。接下来,使用了两个阶段的FC线性网络,中间通过一个Tanh激活层引入非线性行为。

该网络架构接受一个时间向量作为输入,表示两个连续样本之间的时间间隔,以及车辆的线性和角速度向量。网络的目标是近似底层系统动力学,使网络输出ν?,对应于估计的车辆线性和角速度。除了标准的NN权重外,该模型还明确包含了一组与车辆动态行为相关的可学习物理参数。具体来说,这些参数对应于附加质量矩阵MA和线性阻尼矩阵Dl的元素。通过将这些物理量定义为网络参数对象,它们在架构中成为可训练的实体,并且在反向传播过程中与NN权重一起更新。

物理约束通过损失函数参与到训练过程中。特别是非负约束是通过PyTorch中的softplus(?)函数实现的(Paszke等人,2019年)。损失函数由两部分组成:一部分与车辆的动力学模型相关(根据方程(11)),另一部分与实际速度和预测速度之间的均方误差(MSE)相关。
$$ J(MA, D_{l}) = \|(\mathbf{MRB} + MA)\nu\dot{} + (CRB(\nu) + CA(\nu))\nu + D_{l}\nu + g(\eta) - \tau\|^2 + \|\nu^{\hat{}} - \nu\|^2 $$

值得注意的是,神经网络的输入与损失函数中使用的量不同。LSTM模型只接收时间和速度测量值,如图3所示。然而,加速度ν?包含在数据集中,并在基于物理的损失函数中得到明确使用(方程(11))。因此,尽管ν?不是网络输入的一部分,但它对于评估成本函数和确保方程(12)要求的动态一致性至关重要。

在我们的案例中,我们决定仅估计车辆的部分动力学,仅考虑纵摇、摇摆和横摇运动。这一决定的原因是,在典型的AUV任务中,这些自由度(DOF)是由引导系统动态激发的。相反,除了对期望设定点的调节外,很少对车辆的滚转和俯仰进行动态控制,通常俯仰和滚转设置为零。

测试了不同配置的PINN层,以确定最准确的模型。由于车辆的真实参数未知,估计器是使用模拟数据开发和验证的,这些数据提供了附加质量和阻尼矩阵的已知值。结果表明,表1中列出的特性网络的估计更为准确。算法1报告了使用PINN网络进行的估计过程的伪代码。

**表1. 网络参数**
| 层 | 特性 | |
|------|-------------------|----------------------|
| | 20个样本时间窗口 | |
| | 5层LSTM | |
| | 隐藏节点大小 | 1024 |
| | 输入节点大小 | 1024 |
| | 第一阶段FC线性层 | 5 |
| | 输出节点大小 | 0.2 |
| | 网络dropout | 5 |
| | 第二阶段FC线性层 | 6 |
| | 输出节点大小 | 0.2 |
| | dropout | 5 |

**4. 结果**
第4节将展示训练和实际实验的结果。为了验证对真实车辆的估计效果,我们在车辆上实现了与已安装的GS-PID控制器并行的FF控制系统。然后使用比例-积分-微分(PID)控制器的剩余效果来评估估计质量:在估计完美的情况下,PID的贡献应理想地为零。

重要的是要明确区分参数估计阶段及其后续部署。基于PINN的估计过程完全在线下进行,使用在代表性操作条件下收集的数据来准确识别模型参数。一旦这个阶段完成,仅将最终估计的参数值传输到车辆上,在那里它们仅用于计算FF项。因此,估计算法并不在系统上实时执行,而是通过先前识别的参数间接影响控制器的性能。

**3.3. 前馈控制系统**
FF控制系统是最简单的基于模型的控制系统,可用于控制系统。在FF控制系统中,控制信号是通过反转描述系统演变的数学模型获得的。如果我们想通过纯FF控制系统控制AUV,我们可以使用(1)来描述系统,并根据所需的车辆速度ν和加速度计算所需的τd:
$$ \tau_{ff,x} = X^{\hat{u}}\nu_{\dot{}}d,x + D^{\hat{u}}\nu_{d,x} $$
$$ \tau_{ff,y} = X^{\hat{v}}\nu_{\dot{}}d,y + D^{\hat{v}}\nu_{d,y} $$
$$ \tau_{ff,r} = D^{\hat{r}}\nu_{d,r} $$

在FF系统中,控制变量的调整不是基于误差的,而是基于对过程的数学模型的知识以及对过程扰动的了解或测量。因此,通常FF控制系统由反馈控制器支持(Guzmán等人,2012年;Visioli,2004年)(图4)。一个简单的解决方案是将FF与PID结合使用,在这种情况下,FF项允许系统提高PID控制器的性能,例如通过减少上升时间(Visioli,2006年)。

为了准确计算FF项,需要精确测量和估计方程(14)-(16)中的量。在水下机器人学中,车辆通常配备有多个导航传感器,能够在水下测量线性和角速度,即使忽略了全球导航卫星系统(GNSS)的数据。特别是,RUVIFIST车辆配备了多普勒测速仪(DVL),它可以提供相对于海底的车辆线速度的准确测量,以及惯性测量单元(IMU),它可以测量线性和角加速度(Vangi等人,2025年)。因此,νd,x和νd,y直接从DVL测量中获得,而ν?d,x、ν?d,y和νd,r是从IMU数据中推导出来的。RUVIFIST上使用的导航设备详细列表见表2。

FF项独立于反馈回路,这意味着它可以提前预测所需的控制动作,而不是等待误差出现,这导致系统响应更快,并减少了PID控制器的贡献。在没有FF的情况下,PID增益通常需要很高才能达到可接受的性能。通过将部分控制工作转移到前馈(FF)因素上,可以使用较低的PID增益,从而减少超调和振荡等潜在问题。表2列出了RUVIFIST车辆中使用的机载传感器。

| 传感器 | 描述 |
|----------------|-----------------------------------------------------|
| KVH DSP 1750 | 单轴光纤陀螺仪(FOG) |
| Teledyne Wayfinder DVL | 多普勒测速仪(DVL) |
| Xsens MTi-300 | 惯性测量单元(IMU) |
| U-blox 7P | 全球定位系统(GPS) |
| BlueRobotics Bar30 | 深度传感器 |
| | 高分辨率压力传感器,测量范围300米 |

图4展示了前馈和PID控制系统方案。前馈动作的估计精度至关重要。如果我们考虑一个纯粹的前馈控制器,准确的参数估计可能会导致不可忽视的稳态误差。PID控制器与前馈控制器一起工作以纠正这一误差。关于RUVIFIST车辆上实现的机电设计和控制系统的更详细描述,可以在Vangi等人(2025年)的研究中找到。

4. 结果
在本章中,我们展示了第3节中提出的参数估计方法的结果,这些结果是通过在意大利Barberino del Mugello的Bilancino Lake进行的现场活动收集的数据得出的(图5)。
如第3.1节所述,只考虑了车辆动态参数的一个子集,即纵摇、横摇和偏航。这一选择是基于这样的观察:在典型的自主水下航行器(AUV)任务中,这些自由度(DOFs)是指导系统主要激励的模式。相反,滚转和俯仰很少受到动态控制,通常被调节在固定设定点附近,通常对应于零滚转和零俯仰。

图5显示了RUVIFIST车辆在意大利Barberino del Mugello的Bilancino Lake进行实验活动的情况。

神经网络的训练解决了方程(12)中概述的优化问题。有效的训练依赖于一个大型且具有代表性的车辆操作动态数据集。为此,我们在两次独立的现场活动中收集了数据。第一次活动仅激励纵摇和偏航自由度来收集“测量”配置的数据。第二次活动专注于“悬停”配置,捕获了横摇、纵摇和偏航自由度的数据。

在“测量”配置中,数据是在车辆沿四点路径进行小范围检查的任务中收集的。这条路径以0.5 m/s、0.4 m/s、0.3 m/s和0.2 m/s的不同目标速度重复了四次。目标速度剖面是使用双S轨迹生成的,过渡时间为5秒。结果车辆路径如图6所示。任务在0.6米的恒定深度下执行,总距离略低于400米,大约产生了10,500个样本,频率为10 Hz。原始数据随后被处理以提高信噪比(SNR),特别是对于导航传感器的测量数据。训练过程使用了学习率(LR)调度器。在初始迭代(周期)中,LR被设置为较大的值,以促进快速收敛到最优网络权重。在后续迭代中,LR被降低,以便更精确地收敛到最优解。图7展示了估计参数(附加质量Xu?、阻力Du和阻力Dr)的训练结果。如图所示,估计值迅速收敛,在优化的初始阶段变化较大,而在最后阶段仅有轻微波动。

值得注意的是,网络并不直接估计车辆的附加质量。相反,它试图估计干质量m和附加质量项MA的总和。这种选择是在初步使用模拟数据进行测试后得出的,因为初始估计可以设置为车辆已知的干质量。一个关键的观察是,与附加质量项相比,阻力系数的收敛速度更快。这种现象可以通过数据集的组成来解释,该数据集包含更多来自恒速段的数据,而不是来自加速和减速操作的数据,后者对于识别附加质量至关重要。

此外,可以观察到,沿航向方向的估计阻力在收敛到最终值之前会经历一个初始的超调阶段。这种行为可能归因于调度器,由于调度器的作用,最初在网络权重中引起了较大的变化。因此,网络可能会暂时超过优化函数梯度引导估计的局部最小值。然而,调度器的目的正是随着训练的进展逐渐降低LR,从而减轻超调并促进向正确的成本函数最小值的收敛。
特别是对于“测量”配置,我们获得了表3中呈现的参数。

第二次实验活动专门用于获取RUVIFIST车辆在“悬停”配置下的数据。遵循与“测量”活动类似的程序,车辆以多种速度(0.4 m/s、0.3 m/s和0.2 m/s)执行了四点割草机轨迹,如图8所示。在这条轨迹中,车辆保持了接近恒定的航向,以产生横摇运动,图中用红色箭头表示。为了确保充分激发所有相关动态,任务结束时进行了单独的原位旋转,以收集偏航自由度的数据。

表3列出了“测量”配置的估计参数。

第二次实验活动的任务生成了大约8000个样本,频率为10 Hz,总行驶距离约为200米。即使在这种情况下,数据也是为了提高信噪比并获得更好的网络训练数据而处理的。训练使用与之前相同的标准进行,即使用LR调度器在训练过程中调整LR。

图9(a)至9(e)展示了估计参数的训练结果。如图所示,估计值迅速收敛,在优化的初始阶段变化较大,而在最后阶段仅有轻微波动。

对于“悬停”配置,我们获得了表4中的参数。

为了验证基于PINN估计的前馈(FF)控制器的效果,我们实施了一个FF控制器。在第一阶段的测试中,禁用了FF控制动作,车辆仅由GS-PID反馈环路控制。预测的FF贡献值被实时计算并记录下来,以便与GS-PID控制动作进行比较,但没有作为控制动作提供给系统。然后通过将这个预测贡献值与实际的GS-PID输出进行比较来量化基础模型的保真度。在第二阶段,激活了经过验证的FF控制器,系统仅依赖于FF控制动作。图10显示了在车辆沿直线以0.5 m/s的目标速度到达 waypoint时,对估计的纵摇动态参数(Xu?和Du)的验证结果。底部图表证实了GS-PID控制器的有效性,实际上,实际纵摇速度(蓝色)在稳态下紧密跟随了所需剖面(橙色)。顶部图表展示了模型的准确性,显示出FF控制动作(蓝色)与GS-PID反馈控制器所需的动作(橙色)之间有很强的对应关系,中间图表还报告了FF控制器提供的控制动作与GS-PID提供的控制动作之间的误差。

在稳态下,GS-PID和FF控制动作几乎相同,平均误差为2.40 N。最大的差异发生在加速阶段,此时FF动作高于GS-PID的动作。这种差异可以通过下图解释,该图显示GS-PID控制器被调整为保守的,以确保在各种操作条件下的鲁棒性。

同样的测试也针对系统的航向自由度进行了,结果如图11所示。在这种情况下,引导系统仅提供了具有线性剖面的位置参考;因此,省略了附加质量项的评估,因为参考信号中的不连续性阻止了可靠的估计。在未来的工作中,我们计划改进参考生成器,以便也能够计算指令航向的二阶导数。图11显示了Dr的现场验证测试结果。中间图表中的最高误差峰值对应于加速阶段,这是由于系统响应的延迟造成的。

由于我们忽略了沿偏航方向的附加质量,因此只需考虑恒速阶段。在图11中,恒速阶段是7秒到22秒的时间间隔,即所需航向线性增加的时期。在此期间,GS-PID的控制动作和FF控制系统的控制动作几乎相等,平均误差为1.7 N m。与纵摇实验相比,FF控制动作在过渡期间低于GS-PID的控制动作。这个结果是预期之中的,因为前馈模型中没有包含与角加速度相关的项。

基于在“测量”配置中获得的估计质量,我们决定不重复对“悬停”配置进行相同的测试。相反,我们进入了第二阶段的测试,在此阶段禁用了PID控制器,系统仅由FF控制项驱动。

由于之前的测试发现加速阶段存在差异,特别是在纵摇方向上,并且由于GS-PID控制器控制的加速阶段非常保守,因此在“测量”和“悬停”配置中都进行了额外的测试。在这些测试中,仅使用了FF控制系统来驱动车辆。图12展示了这次测试的结果。

如图12的顶部图表所示,GS-PID反馈控制器(橙色)被禁用。底部面板通过比较期望的(橙色)和实际(蓝色)纵摇速度来展示跟踪性能。定量分析集中在两个不同的阶段。在加速期间,模型展示了高精度,平均跟踪误差仅为0.0212 m/s。这个值是在考虑了推进器的物理死区引入的响应延迟后计算得出的。在轨迹的后续稳态阶段,性能受到阻力估计精确度的控制,平均误差增加到0.0336米/秒。图13展示了与图12相同的结果,重点关注两个不同的运动阶段:加速阶段,此时附加质量的贡献最为显著;以及匀速阶段,此时只有阻尼项起作用。下载:下载高分辨率图片(541KB)下载:下载全尺寸图片

图12. 仅启用FF控制系统的情况下,简单任务的突进速度演变。

采用类似的方法来验证沿航向方向的阻力项。即使忽略沿航向方向的附加质量并不需要仅使用FF控制系统来进行测试以获得更多关于估计准确性的信息,但还是进行了现场测试(图14)。下载:下载高分辨率图片(524KB)下载:下载全尺寸图片

图13. 调查配置中的加速和稳态比较。该图展示了前一图的放大部分,突出了两个不同的阶段:加速和稳态。

在这次测试中观察到的动态响应突出了由于在控制模型中排除了附加质量而产生的两个关键缺陷。首先,系统的时间延迟大大增加。航向响应比参考信号滞后了大约1.0秒,这与突进自由度所观察到的0.3秒延迟形成了鲜明对比。其次,系统出现了显著的超调现象。当车辆接近期望航向时,基于模型的控制器低估了惯性效应,未能施加足够的制动力矩。因此,车辆的力矩导致其旋转超过了目标位置,从而在指令航向和测量航向之间产生了暂时但显著的偏差。下载:下载高分辨率图片(436KB)下载:下载全尺寸图片

图14. 仅启用FF动作时的航向方向现场测试。上图显示了PID(蓝色)和FF控制系统(橙色)的控制动作。下图显示了车辆的期望(橙色)和测量(蓝色)航向。

然后对处于“悬停”配置的车辆进行了相同的测试。图15详细展示了使用仅FF测试对“悬停”配置下的突进动态模型进行的验证。结果表明附加质量的估计非常准确,车辆加速阶段的平均误差仅为0.0080米/秒。与线性阻力Du相关的稳态性能也很强;当指令速度为0.4米/秒时,系统稳定在平均速度0.3705米/秒,因此平均稳态误差为0.0295米/秒。由于在“悬停”配置中也允许摆动运动,因此进行了专门测试,结果如图16所示。即使在这种情况下,对附加质量Xv?和阻力项Dv的动态参数估计也非常准确。实际上,加速阶段的平均误差为0.0169米/秒,稳态阶段的平均误差为0.0021米/秒。下载:下载高分辨率图片(499KB)下载:下载全尺寸图片

图15. 仅启用FF动作时的悬停配置下的突进运动现场测试。上图显示了PID(橙色)和FF控制系统(蓝色)的控制动作。下图显示了车辆的期望(橙色)和测量(蓝色)航向。

对于摆动运动,两个估计参数的相对准确性与所述方向相反。这可以通过训练数据集的不平衡来解释;数据收集路径中摆动运动的段较长且更为明显。然而,突进和摆动的动态参数都足够准确。下载:下载高分辨率图片(454KB)下载:下载全尺寸图片

图16. 仅启用FF动作时的悬停配置下的摆动运动现场测试。上图显示了PID(橙色)和FF控制系统(蓝色)的控制动作。下图显示了车辆的期望(橙色)和测量(蓝色)航向。

混合控制系统

仅使用GS-PID控制器和仅使用FF控制器的配置都存在局限性。GS-PID控制器动态响应缓慢,导致加速阶段延长。另一方面,FF控制系统无法补偿外部或未建模的干扰。然而,这两种控制器的结合可以提供显著的优势,将FF控制器的快速响应与GS-PID控制器的干扰抑制能力结合起来。为了展示结合FF项和GS-PID控制动作的好处,对处于“悬停”配置的车辆进行了简单测试。图17显示了结合GS-PID和FF控制动作的突进和摆动运动段的结果。从这项实验分析中可以看出,GS-PID控制器在突进方向产生的平均控制力分别为-1.1528牛顿和1.6706牛顿。GS-PID控制系统具有双重功能:它补偿了估计动态参数中的不准确性,并同时减轻了未建模外部干扰的影响。下载:下载高分辨率图片(1010KB)下载:下载全尺寸图片

图17. 结合GS-PID和FF控制动作的突进和摆动运动结果。在(a)中显示了突进运动的结果,上图为GS-PID(橙色)控制系统和FF项(蓝色)的控制动作,下图为期望(橙色)和实际(蓝色)速度。在(b)中显示了摆动运动的结果,上图为GS-PID(橙色)控制系统和FF项(蓝色)的控制动作,下图为期望(橙色)和实际(蓝色)速度。

FF和GS-PID控制动作的协同组合显著提高了水下车辆的总体跟踪性能(表5),其性能优于单独应用任一控制策略。特别是,与仅使用FF控制器的情况相比(见图12、图13、图14、图15-16),加入GS-PID项有效减少了期望速度和实际速度之间的延迟,从而实现了更准确和响应更快的运动跟踪。

表5. 使用FF和GS-PID控制动作的跟踪误差

控制系统的改进之外,这种估计程序还带来了另一个与RUVIFIST车辆相关的的重要结果。事实上,在撰写这篇论文时,尚未对车辆进行动态分析以估计两种配置的阻力系数和附加质量。有了这些估计值,现在可以定量比较两种配置的优势。特别是,通过比较表3和表4中的数值,我们可以计算出“调查”配置和“悬停”配置之间的阻力和质量增加。沿突进方向,附加质量项Du?从24.40千克增加到39.60千克,相对增加了62.30%。同样,线性阻力系数Du从42.13千克/秒增加到56.24千克/秒,增加了33.49%。这种流体动力参数的增加,加上推进器从纯突进轴的重新定向,导致突进运动所需功率的显著增加。具体来说,由于沿突进方向的流体动力阻力增加了大约33%,因此维持给定突进速度所需的推力也相应增加了大约33%。此外,在“悬停”配置中,推进器相对于xbody轴旋转了34°,因此沿突进方向的有效推力分量减少了。因此,推进器必须产生更大的总推力才能达到相同的前向力。这两个因素的结合导致沿突进轴的总推力需求估计增加了大约60%:(17)thovering=1.33cos(0.593412)tsurvey=1.330.82903757255tsurvey=1.604tsurvey

这些结果得到了现场活动期间收集的实验数据的支持。实际上,通过比较两种配置在u=0.2m/s时的功耗,观察到大约55%的增加。

5. 结论和未来工作

在这项研究中,提出了一种基于神经网络的创新识别方法,用于估计能够在水下任务中改变形状的可重构AUV的动态参数。开发了一种PINN,可以直接从实验数据中推断关键参数,如附加质量和线性阻尼系数。通过将基于物理的约束嵌入损失函数中,该模型产生了物理上一致的估计值,同时减少了对昂贵且耗时的传统系统识别程序的依赖。实验验证是这项工作的核心。结果表明,基于PINN的框架在参数估计方面实现了高精度。此外,前馈控制和GS-PID控制策略的集成提高了系统性能,减少了跟踪误差。估计还使得能够对调查和悬停配置进行定量比较,提供了关于配置依赖的附加质量和阻力效应如何影响车辆动力学的新见解。尽管结果很有前景,但RUVIFIST项目仍有几个需要改进的地方。下一步将是估计车辆的其余自由度,特别是运动的起伏方向,以及调整沿偏航轴的参考生成器,以便估计和验证与该自由度相关的惯性和附加惯性相关的动态参数。在这一阶段之后,可以考虑两个不同的方向。第一个方向是提高动态模型的复杂性,包括质量和阻尼矩阵的非对角线项。第二个方向是开发更先进的基于模型的控制策略,例如MPC,利用基础系统模型。

缩写

ARMA自动回归移动平均

AURV自主水下可重构车辆

AUVA自主水下车辆

CFD计算流体动力学

DL深度学习

DNN深度神经网络

DOF自由度

DVLD多普勒速度日志

FC全连接

FF前馈

GNSS全球导航卫星系统

GSG增益调度

IMU惯性测量单元

LRL学习率

LS最小二乘

LSTM长短期记忆

ML机器学习

MPC模型预测控制

MSE均方误差

NMPC非线性模型预测控制

NN神经网络

PDE偏微分方程

PID比例积分微分

PINN物理信息神经网络

PPC预定性能控制

ROV远程操作车辆

RUVIFIST用于检查、自由浮动、干预和调查任务的可重构水下车辆

SNR信噪比

USV无人水面船只

C作者贡献声明

Mirco Vangi:撰写——原始草稿、软件、方法论、数据管理、概念化

Alessandro Bucci:撰写——审阅与编辑、方法论、形式分析、概念化

Gherardo Liverani:撰写——审阅与编辑、软件、资源、方法论

Davide Colasanto:验证、数据管理

Alessandro Ridolfi:撰写——审阅与编辑、监督、项目管理、资金获取

Benedetto Allotta:撰写——审阅与编辑、验证、监督、项目管理、资金获取
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号