无偏的仅依赖轴承的定位与导航方法，用于追踪恒速目标

《IEEE Transactions on Intelligent Vehicles》：Unbiased Bearing-Only Localization and Circumnavigation of a Constant Velocity Target

【字体：大中小】 时间：2026年05月11日 来源：IEEE Transactions on Intelligent Vehicles 14.3

编辑推荐：

　　摘要：本文研究了如何控制自主车辆（代理）来定位并绕行一个未知目标（可以是无人地面车辆或无人水面车辆），该目标以恒定但未知的速度移动。我们假设代理只能测量到目标的方位角。本文提出了一种基于方位角测量的自适应估计算法（无需显式微分），可以同时估计目标的位置和速度。与现有结果不同，该算

　　摘要：本文研究了如何控制自主车辆（代理）来定位并绕行一个未知目标（可以是无人地面车辆或无人水面车辆），该目标以恒定但未知的速度移动。我们假设代理只能测量到目标的方位角。本文提出了一种基于方位角测量的自适应估计算法（无需显式微分），可以同时估计目标的位置和速度。与现有结果不同，该算法能够实现无偏估计，使得目标的位置和速度的估计误差趋于零。此外，所提出的目标估计器不需要持续激励，而这是大多数基于方位角定位方法通常需要的条件。随后，设计了一个绕行控制器，用于引导代理以预定的距离接近并包围目标。本文严格分析了包括目标估计器和绕行控制器在内的整个系统的渐近稳定性。数值仿真验证了所提算法的性能。CCBY - IEEE 并非该材料的版权拥有者。请遵循 https://creativecommons.org/licenses/by/4.0/ 上的指示，以获取全文和相关规定。

第一部分：引言

目标绕行涉及引导一个或多个代理围绕目标以预定半径进行运动，在民用和军事领域有着广泛的应用，例如 [1], [2], [3], [4], [5]。大量的研究致力于解决代理能够获取目标状态信息（如目标的位置和/或速度）情况下的目标绕行问题。然而，当目标不配合且不向代理披露其状态信息时，绕行任务会变得复杂。在这种情况下，绕行问题不仅包括目标定位的估计器设计，还包括用于操控代理的绕行控制器，从而将算法设计成为一个双重控制问题 [6]。

根据所使用的感测技术，文献中可以区分两种主要的目标定位方法：距离测量 [7], [8], [9], [10] 和方位角测量 [11], [12], [13], [14], [15], [16], [17], [18], [19], [20], [21], [22], [23], [24], [25], [26], [27], [28], [29], [30], [31], [32], [33], [34], [35], [36], [37], [38]。距离测量通常是主动感测技术，因为它们要求代理向目标连续发送可检测的信号（如无线电波或激光束）。相比之下，方位角测量是被动感测技术，不需要向目标发送任何信号，仅依赖从目标自然发出的信号。由于这一优点，在需要保持无线电静默或隐藏代理的情况下，方位角测量受到青睐，因此仅基于方位角的目标定位和绕行（以下简称 BoTLC）成为一个热门的研究课题。作为早期针对 BoTLC 问题的研究，[11], [12] 的作者提出了一种自适应估计器，仅使用代理在全局框架中的位置及其机载方位角测量来定位目标在二维空间中的位置。作者证明了在跟踪静止目标时可以实现无偏位置估计，并且在目标缓慢移动时可以实现有偏估计。然后，开发了一个结合估计器和绕行控制器的系统，用于驱动单个全向代理以期望的半径包围目标。之后，该控制框架被扩展用于定位和绕行多个目标 [13], [14], [15]，在三维环境中 [16], [17], [18]，在离散时间平台上 [19]，以及使用鲁棒积分控制 [20]，而不需要使用代理相对于全局框架的自身位置 [21], [22]，并实现了有限时间收敛 [23]，还用于引导非全向代理 [24]、固定速度代理 [25]、第二积分器代理 [26] 和多个代理 [27], [28], [29], [30], [31], [32], [33]。

值得注意的是，上述关于 BoTLC 问题的研究要么只考虑静止目标 [17], [18], [20], [23], [25], [26], [32], [33]，要么无法准确估计以未知速度移动的目标的位置 [11], [12], [13], [14], [15], [16], [19], [21], [22], [24], [27], [28], [29], [30], [31]。到目前为止，尽管在实际应用中迫切需要提高估计精度，但文献中很少有相关研究。在少数基于方位角的无偏移动目标估计结果中，通常需要对测量值和/或代理的速度信息进行显式微分。[34] 的作者提出了一种分布式算法，该算法利用局部网络中的方位角测量和方位角测量的导数来准确估计目标相对于一组代理的速度和相对距离。[35] 中开发了一种仅使用方位角测量和代理速度的分布式估计器，用于准确跟踪移动目标。然而，使用需要显式微分测量的估计器通常是不希望的，因为高频噪声可能会被放大。在不同的研究中，[36], [37] 的研究人员采用了两阶段估计方法：第一阶段使用 [11], [12] 中的粗略估计器，第二阶段使用卡尔曼滤波器。结合生成代理虚拟位置和伪方位角测量的算法，第二阶段的卡尔曼滤波器可以进一步完善粗略估计并实现零估计误差。尽管如此，[36], [37] 中的估计误差的渐近无偏收敛性仅通过数值验证，缺乏技术证明。另一种思路是在 [38] 中提出了一种利用估计目标位置相对于代理方位角测量的侧向变化信息的目标估计算法。作者 [38] 表明，当目标以恒定速度移动时，可以实现几乎零的估计误差。然而，[38] 中的实际无偏收敛性是基于仿真分析得出的，缺乏形式证明。因此，上述讨论促使本文研究 BoTLC 问题中的无偏移动目标估计。

贡献：本文提出了一种新颖的目标估计算法和绕行控制器来解决 BoTLC 问题。本文主要有三个贡献：首先，据作者所知，所提出的算法是第一个仅使用方位角测量实现无偏移动目标估计和绕行的结果。与文献中的现有结果相比：与 [17], [18], [20], [23], [25], [26], [32], [33] 等只考虑静止目标的研究不同，本文探讨了一个更现实的场景，即目标以未知速度移动；与 [11], [12], [13], [14], [15], [16], [19], [21], [22], [24], [27], [28], [29], [30], [31] 等仅解决移动目标但只能获得有偏估计的研究不同，本文提出的算法在目标以未知但恒定速度移动时可以实现零估计误差；与 [34], [35] 不同，后者虽然获得了无偏移动目标估计，但使用了速率信息，而本文提出的算法仅使用方位角测量。该算法不需要对方位角测量进行显式微分，也不需要代理的速率测量或速度信息；与 [36], [37], [38] 不同，后者仅通过数值仿真证明了实际无偏估计，本文使用李雅普诺夫稳定性理论严格证明了无偏渐近收敛性。其次，与 [11], [12] 中依赖方位角信号的持续激励来实现目标估计器收敛的结果不同，本文引入了一种创新的坐标转换方法，使得高度耦合的系统可以被视为线性多面体系统。这样，对持续激励的显式要求被消除，可以用对代理角速度的放宽约束来代替。据我们所知，这是第一次提出了一种严格的方法来证明这一具有挑战性的绕行系统的稳定性。最后，与大多数现有方法不同，所提出的估计算法不需要事先知道目标速度的上限。（不过，与估计算法结合使用的控制算法仍然需要知道这个上限。）

本文的其余部分组织如下：第二部分提供数学预备知识并阐述研究问题。第三部分提出了所提出的算法。第四部分讨论了稳定性分析。第五部分展示了仿真结果，第六部分提供了结论性意见和未来研究方向。然后，A_{m}(pp(t))=A_{0,m}+∑_{i=1}^{q} p_{i}(t) A_{i,m}，对所有的pp(t)∈R^{q}成立。定义 \begin{equation*} A_{\lbrace m\rbrace }(\bm {p}(t)) = A_{0,\lbrace m\rbrace } + \sum _{i=1}^{q} p_{i}(t) A_{i,\lbrace m\rbrace }, \quad \forall \, \bm {p}(t) \in \mathbb {R}^{q} \tag{11} \end{equation*} 以及 xx^{\prime}_{m}(t)=A_{m}(pp(t))xx_{m}(t) 成为（1）的扩展系统。定义 \begin{equation*} \dot{\bm {x}}^{\lbrace m\rbrace }(t) = A_{\lbrace m\rbrace }(\bm {p}(t)) \bm {x}^{\lbrace m\rbrace }(t) \tag{12} \end{equation*} 引理2.1（HPLF [39, 定义3.3, 定理3.3, 定理3.4],[40, 定理1]）：考虑LTVP系统（1）。设A_{j}=A(pp(j))表示j=1,…,r时的顶点矩阵，设A_{j,m}表示相对于度数为m的基向量xx_{m}的A_{j}的扩展矩阵。如果以下线性矩阵不等式系统 \begin{align*} &V > 0, \tag{13a}\\ &-V\bar{A}_{j,m} - \bar{A}_{j,m}^\top V-L(\bm {\alpha }^{(j)}) > 0, \quad j=1,\ldots,r \tag{13b} \end{align*} 有一个可行解(V,α_{1},\ldots,α_{r})，其中V=V^{T}∈R^{d×d}，α_{j}∈R^{d^{l}} 对于j=1,…,r成立，则v_{2m}(xx)=xx_{m}^T Vxx_{m}被称为系统（1）的齐次多项式Lyapunov函数（HPLF），使得v_{2m}(xx)沿着系统（1）的轨迹是正定的，v^{\prime}_{2m}(xx)沿着系统（1）的轨迹是负定的，从而证明系统（1）的原点具有全局渐近稳定性（GAS）。B. 背景和符号说明考虑一个仅在二维平面上移动的非合作目标（例如无人地面车辆或无人水面车辆）。设该目标在时间t的位置为xx(t)∈R^{2}。假设目标以恒定速度vv∈R^{2}移动。根据[11]，[12]，我们将三维环绕问题简化为二维问题，因为恒定高度控制问题与平面轨迹的控制无关，而前者是显而易见的。因此，我们假设负责定位和环绕目标的无人机（UAV，也称为代理）相对于目标以恒定高度机动。UAV在时间t时在二维平面上的位置表示为yy(t)∈R^{2}。类似于[11]，[12]，我们采用以下单积分器模型来简化UAV的运动学描述 \begin{equation*} \dot{\bm {y}} (t) = \bm {u} (t), \tag{15} \end{equation*} 其中uu(t)是待设计的环绕控制器。设φ_{t}∈R^{2}是从代理出发指向目标的时间t的单位向量，φ_{t}=(xx(t)-yy(t))∥=xx(t)-yy(t)d(t)，\begin{equation*} \bm {\varphi } (t) = \frac{\bm {x}(t)- \bm {y} (t)}{\Vert \bm {x}(t) - \bm {y} (t) \Vert } =: \frac{\bm {x}(t) - \bm {y} (t)}{d (t)}, \tag{16} 其中d(t)是代理与目标在时间t的欧几里得距离。单位向量φ_{t}表示代理对目标的局部方位测量。φ_{t}?∈R^{2}是通过将φ_{t}顺时针旋转π/2得到的另一个单位向量。设θ(t)表示在代理的局部坐标系中从x轴逆时针旋转的方位角。图1提供了符号的图形说明。图1. 问题几何和符号说明。C. 问题陈述需要同时解决以下两个研究问题。问题2.1（定位）：设计一个自适应目标位置估计器xx^{\prime}(t)=xx^{\prime}(yy(t),φ_{t})和一个自适应目标速度估计器vv^{\prime}(t)=vv^{\prime}(yy(t),φ_{t})，使得无人机仅使用局部方位测量就能定位以恒定速度移动的目标。特别是，目标位置xx^{*}(t)和目标速度vv^{*}(t)的估计误差，如下定义，收敛到零：\begin{align*} \lim_{t\to \infty } \Vert \tilde{\bm {x}}(t) \Vert &:= \lim_{t\to \infty } \Vert \hat{\bm {x}}(t) - \bm {x}(t) \Vert = 0, \tag{17}\\ \lim_{t\to \infty } \Vert \tilde{\bm {v}}(t) \Vert &:= \lim_{t\to \infty } \Vert \hat{\bm {v}}(t) - \bm {v} \Vert = 0, \tag{18} \end{align*} 其中xx^{*}(t)和vv^{*}(t)分别是代理在时间t构建的xx(t)和vv的估计值。问题2.2（环绕）：设计一个环绕控制律uu(t)=uu(yy(t),φ_{t},d^{*})，使得无人机被驱动到一个以目标为中心、半径为d^{*}>0的圆形轨道上，同时环绕目标。特别是，在所提出的控制律下，跟踪误差收敛到零：\begin{equation*} \lim _{t\to \infty } \Vert \bm {x} - \bm {y} (t) \Vert - d^{*} = 0. \tag{19} \end{equation*} 为了解决上述两个问题，我们做出以下假设。假设2.1（有限的感知能力）：单位方位向量φ_{t}，对所有t≥0，是代理唯一可用的测量数据。假设2.2（先验知识）：代理事先不知道目标的位置和速度。但假设代理知道自己相对于初始坐标系的位置以及对目标速度的上限的保守估计（不需要非常精确）。第三节。提出的算法A. 估计器设计我们提出以下目标估计器，\begin{align*} \dot{\hat{\bm {v}}}(t) &= k_{v} \left(I- \bm {\varphi }(t)\bm {\varphi }^\top (t)\left(\bm {y}(t)-\hat{\bm {x}}(t)\right), \tag{20a}\\ \dot{\hat{\bm {x}}}(t) &= k_{x} \left(I-\bm {\varphi }(t)\bm {\varphi }^\top (t)\left(\bm {y}(t)-\hat{\bm {x}}(t)\right) + \hat{\bm {v}}(t), \tag{20b} \end{align*} 其中kv,kx>0是控制增益，I是适当维度的单位矩阵。B. 控制器设计我们定义环绕控制律如下：\begin{equation*} \bm {u}(t) = \left(\hat{d}(t) -d^{*} \right)\bm {\varphi }(t) + \left(k_{\omega } -\bar{\bm {\varphi }}^\top (t) \hat{\bm {v}}(t) \bar{\bm {\varphi }}(t) + \hat{\bm {v}}(t), \tag{21} \end{equation*} 其中d^{(t)}:=∥yy(t)?xx^{*}(t)∥是代理在时间t时估计的代理与目标之间的距离，k_{\omega}>0是一个控制常数，应选择某个常数ω>0以满足k_{\omega } -∥vv∥≥ω>0。\end{equation*} 注3.1：注意，这样定义的φ_{t}使得代理围绕目标逆时针移动。如果需要顺时针环绕，单位向量φ_{t?}应该通过将φ_{t}顺时针旋转3π/2来构造。注3.2：所提出的估计器（20）可以在不知道目标速度上限的情况下部署，而环绕控制器（21）中的k_{\omega}项需要根据vv的上限来选择。这个要求的原因是为了确保代理的速度足够超过目标的速度，从而实现有效的环绕。出于同样的原因，不需要知道vv的确切或精确的上限。k_{\omega}的选择也会影响角速度，这将在后面的章节中讨论。第四节。系统分析在本节中，我们证明所提出的目标估计器（20）和控制器（21）同时解决了问题2.1和问题2.2。为此，我们将证明分为三个部分并采取以下步骤：部分A：我们首先提出一些适用于t∈[0,T1)的初步结果，其中T1>0是在引理4.2中解释的某个时间。这些初步结果如下组织：引理4.1将目标估计误差的动态系统表示为参数θ(t)的线性参数变化系统。引理4.2为t∈[0,T1)的代理-目标距离d(t)建立了一个界限；引理4.3然后表明代理环绕目标的角速度θ^{\prime}(t)也是有界的。换句话说，参数θ^{\prime}(t)属于某个多面体Θ。引理4.4考虑了一种状态变换，通过这种变换，估计误差动态作为参数θ(t)的线性参数变化系统可以转换为另一种参数θ^{\prime}(t)的线性参数变化系统。此外，由于θ^{\prime}(t)∈Θ，因此变换后的系统对于t∈[0,T1)也是多面体的；引理4.5数值求解了一个齐次多项式Lyapunov函数，如果变换后的系统对所有t≥0保持多面体，则变换后系统的原点将是全局渐近稳定的；引理4.6证明估计误差∥xx^{*}(t)∥和∥vv^{*}(t)∥对于t∈[0,T1)被一个常数所限制。部分B：在这部分，我们将部分A中获得的初步结果推广到所有t≥0：引理4.7通过反证法证明引理4.2中的初步结果对所有t≥0成立；引理4.8证明了其余的初步结果对所有t≥0成立。部分C：我们在最后这部分陈述主要结果。定理4.1证明目标估计误差收敛到零，回答了问题2.1。定理4.2证明跟踪误差收敛到零，回答了问题2.2。现在我们继续进行系统分析的第一部分。A. 初步结果引理4.1：在目标估计器（20）下，估计误差动态可以被视为一个线性参数变化系统，ee^{\prime}(t)=[?k_{x}P(θ(t))?kvP(θ(t))I00]=W(θ(t))ee(t)，\begin{equation*} \dot{\bm {e}}(t) = \underbrace{\begin{bmatrix}-k_{x} P(\theta (t)) & I \; \\ -k_{v} P(\theta (t)) & \bm {0} \; \end{bmatrix}}_{:=W(\theta (t))} \bm {e}(t) \tag{23} \end{equation*} 其中ee(t):=[xx^{*}(t),vv^{*}(t)]?∈R^{4}是一个误差向量，00表示适当维度的零矩阵，P(θ(t))是一个投影矩阵，定义为P(θ(t))=[cos^{2}(θ(t))sin(θ(t))cos(θ(t))sin(θ(t))cos(θ(t))sin^{2}(θ(t))。\end{equation*} 证明：根据[12, 引理2]，我们有I?φ_{t}φ_{t}φ_{t}^\top(t)=φ_{t}φ_{t}^\top(t)。\end{equation*} 注意单位方位向量φ_{t?}可以用θ(t)表示为φ_{t}=[cos(θ(t)),sin(θ(t))]?。然后，(20a)和(20b)中的(I?φ_{t}φ_{t}φ_{t}^(t))(yy(t)?xx^{*}(t))项可以写成更紧凑的形式，即(I?φ_{t}φ_{t}φ_{t})^(yy(t)?xx^{*}(t))=(25)φ_{t}φ_{t}φ_{t}^\top(t)(yy(t)?xx^{*}(t)+xx^{*}(t))=(16)φ_{t}φ_{t}φ_{t}^\top(t)(?φ_{t}d(t)?xx^{*}(t))=φ_{t}φ_{t}^\topφ_{t}=0?φ_{t}φ_{t}φ_{t}^\top(t)xx^{*}(t)=(24)?P(θ(t))xx^{*}(t)。\end{equation*} 接着，得到估计误差动态为，vv^{*}^{\prime}(t)=vv^{\prime}(t)?vv^{\prime}=(20a)，\end{equation}\dd{v}^{*}(t)=vv^{*}(t)?vv^{\prime}=(26)，\end{equation}\dd{v}^{*}(t)=xx^{*}^{\prime}(t)?xx^{*}(t)=(20b)，\end{equation}\dd{v}^{*}(t)=kvP(θ(t))xx^{*}(t)+vv^{*}(t)?vv=?k_{x}P(θ(t))xx^{*}(t)+vv^{*}(t)。\end{equation*} 方程(23)是通过将(27)和(28)写成矩阵形式得到的。□假设4.1：假设代理的初始位置满足d(0)≥ds，其中ds是某个常数，满足0< />< />0，使得d^{*}-ds?2–√γ∥ee(0)∥≥η>0\end{equation*} 其中γ是一个稍后在(63)中定义的正常数。引理4.2：假设假设4.1成立。那么，在目标估计器（20）和环绕控制器（21）下，存在某个时间T1>0，使得对于t∈[0,T1)，代理与目标之间的距离d(t)满足以下不等式，00使得(31)成立，无论环绕控制器(21)的行为如何。\end{equation}注4.1：因为目标估计器（20）和控制器（21）都包含φ_{t}项，所以φ_{t}项应该是明确定义的。引理4.2提供了一个充分条件，确保φ_{t}对于t∈[0,T1)是明确定义的。引理4.2稍后将扩展到对所有t≥0成立。引理4.3：在目标估计器（20）和控制器（21）下，角度θ(t)的变化率满足以下不等式，0<ωmin≤θ˙(t)≤ωmax，t∈[0,t1]。对于某些常数ωmax,ωmin>0，有
$$
0 < \omega _{min} \leq \dot{\theta }(t) \leq \omega _{max},\quad t \in [0,\mathcal {T}_{1},
$$
证明：首先根据以下定义对代理-目标距离d(t)关于时间求导，
$$
d(t) = \left(\bm {x}(t) - \bm {y}(t)\right)^\top \left(\bm {x}(t) - \bm {y}(t)\right) - \sqrt{\left(\bm {x}(t) - \bm {y}(t)\right)^2},
$$
然后继续求导得到
$$
\dot{d}(t) = \frac{d}{dt} \left(\bm {x}(t) - \bm {y}(t)\right)^\top \left(\bm {x}(t) - \bm {y}(t)\right) = \bm {\varphi }^\top (t) \left(\dot{\bm {x}}(t) - \dot{\bm {y}}(t)\right) = \bm {\varphi }^\top (t) \left(\dot{\bm {v} - \left(\hat{d}(t) - d^* \right) \bm {\varphi }(t) \right) - (\hat{d}(t) - d^*) - \bm {\varphi }^\top (t) \bm {v}~(t).
$$
接下来，我们推导控制φφ(t)演变的微分方程，
$$
\phiφ^\prime(t) = \frac{d}{dt} \left(\bm {x}(t) - \bm {y}(t)\right) = \bm {\varphi }^\top (t) \left(\dot{\bm {x}}(t) - \dot{\bm {y}}(t) - \bm {\varphi }(t) - (\hat{d}(t) - d^*) - \bm {\varphi }^\top (t) \bm {v}~(t) \right) = \left(A_0 + \theta˙(t)\right) \bm {z}(t),
$$
其中
$$
\bm {z}(t) = \begin{bmatrix}\cos \left(\theta (t) - \frac{3\pi }{2} \right) & \sin \left(\theta (t) - \frac{3\pi }{2} \right) \end{bmatrix} = \begin{bmatrix}- \sin (\theta (t)) & \cos (\theta (t))\end{bmatrix}.
$$
由于φφ(t)与φφˉ(t)垂直，并且φφˉ(t)是通过将φφ(t)顺时针旋转π/2得到的，我们可以用角度θ(t)来表示φφ(t)，
$$
\phiφ(t) = \begin{bmatrix}- \sin(\theta(t)) & \cos(\theta(t))\end{bmatrix}.
$$
因此，应用链式法则得到φφ˙(t)的另一种表达式为
$$
\phiφ^\prime(t) = \frac{d}{dt} \begin{bmatrix}- \sin (\theta (t)) \\ \cos (\theta (t))\end{bmatrix} = - k_\omega + \bar{\bm {\varphi }}^\top (t) \bm {v}.
$$
根据引理4.2，我们知道φφ(t)对于t∈[0,T1]是良定义的，因此角度θ(t)也是良定义的。进一步，由于不存在任何θ(t)∈[0,2π)使得cos(θ(t))=sin(θ(t))=0，我们使用(37)得到角速度θ˙(t)的表达式为
$$
\theta˙(t) = \frac{d\theta(t)}{dt} = kω?φφˉ^\top(t)\bm {v}.
$$
接下来，根据(22)和(31)，我们得到θ˙(t)对于t∈[0,T1]满足以下界限，
$$
0 < \frac{\varpi }{d_{max}} \leq \dot{\theta }(t) \leq \frac{k_\omega + \Vert \bm {v} \Vert }{d_{min}.
$$
因此，通过选择ωmin=?/dmax，我们得出θ˙(t)对于t∈[0,T1)是有下界的。同样，我们可以选择ωmax=(kω+∥vv∥)/dmin作为θ˙(t)的上界。为了便于后续分析，我们引入以下辅助矩阵。设R(θ(t))∈R2×?是一个按角度θ(t)顺时针旋转2π的矩阵，
$$
R(θ(t)) = \begin{bmatrix}\cos (\theta (t)) & \sin (\theta (t)) \\ -\sin (\theta (t)) & \cos (\theta (t))\end{bmatrix},
$$
以及S(θ(t))∈R?×?是一个如下构造的辅助块对角矩阵，
$$
S(θ(t)) = \begin{bmatrix}R(θ(t)) & \bm {0} \\ \bm {0} & R(\theta (t))\end{bmatrix},
$$
其中00表示适当维度的零矩阵。作为准备，我们现在介绍一些关于辅助矩阵S(θ(t))的有用性质。

命题4.1：对于所有t≥0，辅助矩阵S(θ(t))是非奇异的。
证明：S(θ(t))的行列式为
$$
\det(S(θ(t))) = 1, \quad \forall \, t \geq 0.
$$

命题4.2：辅助矩阵S(θ(t))满足S(θ(t))S?(θ(t))=S?(θ(t))S(θ(t))=I，对于所有t≥0。
证明：由于旋转矩阵R(θ(t))是正交的，块对角矩阵S(θ(t)也继承了正交性。

引理4.4：估计误差动态(23)可以转换为线性时变多 Topic系统
$$
\bm {z}(t) = \begin{bmatrix}-k_{x} & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ -k_{v} & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} + \dot{\theta }(t) \bm {z}(t),
$$
其中zz(t)是转换后的误差向量，表示为
$$
\bm {z}(t) = [z_{1}(t),z_{2}(t),z_{3}(t),z_{4}(t)]^\top = S(θ(t))\bm {e}(t),
$$
并且对于t∈[0,T1)，θ˙(t)满足
$$
\theta˙(t) \in \{\omega _{min}, \omega _{max}\}.
$$
证明：根据命题4.1，我们知道S(θ(t))对于所有t≥0是可逆的。因此，转换(45)对于所有t≥0是双射且良定义的。注意到(24)中的投影矩阵P(θ(t))可以用旋转矩阵R(θ(t))表示为
$$
P(θ(t)) = R^\top (\theta (t)) \begin{bmatrix}1 & 0 \\ 0 & 0 \end{bmatrix} R (\theta (t)),
$$
因此误差动态中的系统矩阵W(θ(t))可以用S(θ(t))表示为
$$
W(θ(t)) = \begin{bmatrix}-k_{x} I & I \\ -k_{v} I & \bm {0} \end{bmatrix} \begin{bmatrix}P(\theta (t)) & \bm {0} \\ \bm {0} & I \end{bmatrix} = S^\top (\theta (t)) \begin{bmatrix}-k_{x} I & I \\ -k_{v} I & \bm {0} \end{bmatrix} \begin{bmatrix}1 & 0 \\ 0 & 0 \end{bmatrix} S(\theta (t)),
$$
接着我们得到S(θ(t))的时间导数为
$$
\frac{d}{dt} S(θ(t)) = \theta˙(t)A1S(θ(t)).
$$
现在我们展示转换(45)如何将原始误差系统(23)的动态映射到转换后的系统(44)的动态。鉴于zz(t)=S(θ(t))ee(t)，我们有
$$
\bm {z}(t) = \dot{S}(\theta (t)) \bm {e}(t) + S(\theta (t)) \dot{\bm {e}}(t) + S(θ (t)) W(θ (t)) \bm {e}(t) \theta˙(t)A1S(θ(t))ee(t) + S(θ (t))S?(t)A0S(θ(t))ee(t),
$$
这就是我们想要的。进一步，根据引理4.3，我们知道对于t∈[0,T1)，θ˙(t)的下界是ωmin，上界是ωmax，因此转换后的系统(44)在t∈[0,T1)期间是多 Topic的。

命题4.3：对于所有t≥0，有
$$
\Vert \bm {z}(t) \Vert = \Vert \bm {e}(t) \Vert.
$$
证明：这直接来自命题4.2。

为了准备接下来的稳定性分析，我们引入误差动态(44)的扩展版本。设zz{2}是变量zz(t)的二次齐次形式的基础向量，表示为
$$
\bm {z}^{\lbrace 2\rbrace } = [z_{1}^{2},z_{1} z_{2},z_{1} z_{3}, z_{1} z_{4},z_{2}^{2}, z_{2} z_{3},z_{2} z_{4}, z_{3}^{2}, z_{3} z_{4}, z_{4}^{2}]^\top.
$$
引入一个常数系数向量gg∈R1?，表示为
$$
\bm {g} = \left[ 1, 2, 2, 2, 1, 2, 2, 1, 2, 1 \right]^\top,
$$
以及对角矩阵G:=diag(gg)。那么，转换后的误差向量的范数∥zz(t)∥和扩展后的误差向量的范数∥zz{2}(t)∥满足
$$
\Vert \bm {z}(t) \Vert ^{4} = \bm {z}^{\lbrace 2\rbrace }^\top }(t) G\, \bm {z}^{\lbrace 2\rbrace }(t) \leq 2 \Vert \bm {z}^{\lbrace 2\rbrace }(t) \Vert ^{2}.
$$
不等式(52)可以通过展开两边的表达式来验证。

命题4.5：关于(51)中定义的基础向量zz{2}，(44)的扩展系统表示为
$$
\bm {z}^{\lbrace 2\rbrace }(t) = \left(A_{0,\lbrace 2\rbrace } + \dot{\theta }(t) A_{1,\lbrace 2\rbrace }\right) \bm {z}^{\lbrace 2\rbrace }(t),
$$
其中矩阵A0,{2},A1,{2}分别表示A0,A1的扩展矩阵。A0,{2} = \[
\begin{bmatrix}
-2kx_0 & 0 & 2 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & -k_x & 0 & 1 & 0 & 1 & 0 & 0 & 0 & 0 \\
-k_v & 0 & -k_x & 0 & 0 & 0 & 0 & 1 & 0 & 0 \\
0 & 0 & 0 & -k_x & 0 & 0 & 0 & 0 & 0 & 1 \\
0 & 0 & 0 & 0 & 0 & 0 & 2 & 0 & 0 & 0 \\
0 & -k_v & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 \\
0 & 0 & -2k_v & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & -k_v & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
\end{bmatrix}
\]
A1,{2} = [
\begin{bmatrix}
0 & 2 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
-1 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 1 & 0 & 1 & 0 & 0 \\
0 & -2 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & -1 & 0 & 0 & 0 & 1 & 0 & 0 \\
0 & 0 & 0 & -1 & 0 & -1 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 2 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & -1 & 0 & 1 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & -2 & 0 \\
\end{bmatrix}
\]

证明：首先我们得到变换后误差向量zz的第二阶克罗内克幂，zz[2] ∈ R^16，如下所示：
zz[2] = zz ? zz = [z21, z1z2, z1z3, z1z4, z1z2, z22, z2z3, z2z4, z1z3, ……, z2z3, z23, z3z4, z1z4, z2z4, z3z4, z24] ?

通过观察(51)和(55)，可以找到系数矩阵K2 ∈ R^16×10：
K2 =
\[
\begin{bmatrix}
1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 1 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
\end{bmatrix}
\]

应用(9)后，可以直接使用以下方程计算结果：
A0,{2}A1,{2} = (K^T K2)^{-1} K^T (I4?A0 + A0?I4)K2 = (K^T K2)^{-1} K^T (I4?A1 + A1?I4)K2

引理4.5：考虑扩展的误差系统(53)。设Aˉ1,{2}, Aˉ2,{2}为扩展误差系统的扩展顶点矩阵，定义为Aˉ1,{2} = A0,{2} + ω_minA1,{2}，Aˉ2,{2} = A0,{2} + ω_maxA1,{2}。

那么，存在一些常数(kx, kv, ω_min, ω_max)，使得由以下不等式组成的线性矩阵不等式组(V ? VAˉ1,{2} ? Aˉ^T1,{2}V ? L(αα(1)) ? VAˉ2,{2} ? Aˉ^T2,{2}V ? L(αα(2)) > 0有解。

注4.2：我们考虑在扩展系统(53)上制定的线性矩阵不等式组，而不是在未扩展的系统(44)上制定的，因为使用非平凡的参数化L(αα)可以得到更大的操作范围，即ω_max和ω_min之间的差异。

注4.3：常数(59)的选择基于以下理由。由于ω_min, ω_max不是控制增益，而是由与d_min和d_max相关的初始条件决定的，因此首先确定ω_min, ω_max的值，然后使用网格搜索算法调整kx, kv，直到线性矩阵不等式组(58)有解。

引理4.6：在目标估计器(20)和控制器(21)的条件下，对于t ∈ [0, T1]，目标估计误差的范数∥ee(t)∥有界，即∥ee(t)∥ ≤ γ∥ee(0)∥。查看源代码 \begin{align*} \Vert \bm {e}(t) \Vert \overset{(50)}{=}& \Vert \bm {z}(t) \Vert \\ \overset{(52)}{\leq }& \left(2\Vert \bm {z}^{\lbrace 2\rbrace }(t) \Vert ^{2}\right)^{1/4} \\ \overset{(65)}{\leq }& \left(\frac{2\lambda _{max}(V)}{\lambda _{min}(V)} \right)^{1/4} \sqrt{\Vert \bm {z}^{\lbrace 2\rbrace }(0) \Vert }. \end{align*} 因此，存在某个常数 γ 满足 (63) 使得 (62) 成立。□ 做出上述准备后，我们现在准备将结果推广到所有 t≥0 的情况。B. 推广性引理 4.7：在目标估计器 (20) 和控制器 (21) 的作用下，引理 4.2 对所有 t≥0 成立。证明：这个证明分为两部分：在第一部分中，我们推导 d(t) 的动态；在第二部分中，我们使用反证法来建立结论。第一部分：利用三角不等式，我们得到 ∥xx~(t)∥≥|d(t)?d^(t)| 对所有 t≥0。随后，我们有不等式 γ∥ee(0)∥≥Lemma4.6∥xx~(t)∥≥∣∣d(t)?d^(t)∣∣，(66) 查看源代码 \begin{align*} \gamma \Vert \bm {e}(0) \Vert \overset{\text{Lemma4.6}}{\geq } \Vert \tilde{\bm {x}}(t) \Vert \geq \big |d (t) - \hat{d} (t) \big |, \tag{66} \end{align*} 对 t∈[0,T1) 成立。引入辅助变量 δ(t) 和 ?(t) 作为 δ(t)?(t)=d(t)?d?，=d(t)?d^(t)。(67a)(67b) 查看源代码\begin{align*} \delta (t) &= d(t)- d^*, \tag{67a}\\ \varrho (t) &= d(t)-\hat{d}(t). \tag{67b} \end{align*} 因此，不等式 (66) 可以写成 |?(t)|≤∥xx~(t)∥≤γ∥ee(0)∥，t∈[0,T1)。(68) 查看源代码 \begin{equation*} |\varrho (t)| \leq \Vert \tilde{\bm {x}} (t) \Vert \leq \gamma \Vert \bm {e}(0) \Vert, \quad t \in [0,\mathcal {T}_{1}). \tag{68} \end{equation*} δ(t) 的动态可得为 δ˙(t)==(34)=(67)d˙(t)?0?(d^(t)?d?)?φφ?(t)vv~(t)?δ(t)+?(t)?φφ?(t)vv~(t)，(69) 查看源代码 \begin{align*} \dot{\delta }(t) =& \dot{d}(t) - 0 \\ \overset{(34)}{=}& -(\hat{d}(t) - d^*) - \bm {\varphi }^\top (t) \tilde{\bm {v}}(t) \\ \overset{(67)}{=}& - \delta (t) + \varrho (t) - \bm {\varphi }^\top (t) \tilde{\bm {v}}(t), \tag{69} \end{align*) 其显式解为 δ(t)=δ(0)e?t+∫t0e?(t?τ)(?(τ)?φφ?(t)vv~(t))dτ。(70) 查看源代码 \begin{equation*} \delta (t) = \delta (0)e^{-t} + \int _{0}^{t} e^{-(t-\tau)}\left(\varrho (\tau) - \bm {\varphi }^\top (t)\tilde{\bm {v}}(t) \right) \; d\tau. \tag{70} \end{equation*} 第二部分：假设 T1 指定了引理 4.2 中的界限 (31) 成立的最大时间区间 [0,T1)，即 d(t)∣∣t=T1?[dmin,dmax]。(71) 查看源代码 \begin{equation*} d(t)\Big |_{t=\mathcal {T}_{1}} \not\in \left[d_{min},\; d_{max}\right]. \tag{71} \end{equation*} 由于物理运动的连续性，如果 (71) 发生，那么必须存在一个有限的时间区间 t∈[τ??,τ]，其中 τ??≥0，τ≤T1，以及某个 ?≥dt，dt 是时间的一个无穷小变化，使得 d˙(t) 要么 (1) 如果 d(T1)dmax 则为严格正数。我们现在更详细地考虑这两种情况：情况 1：d(T1)0 是某个满足 dmin?d?+ε–0，(74) 查看源代码 \begin{align*} \dot{d}(t^{\prime }) \overset{(67a)}{=}& \dot{\delta }(t^{\prime }) \\ \overset{(69)}{\geq }& -\delta (t^{\prime }) + \varrho (t^{\prime }) - \Vert \tilde{\bm {v}}(t^{\prime }) \Vert \\ \geq& -\delta (t^{\prime }) - |\varrho (t^{\prime })| - \Vert \tilde{\bm {v}}(t^{\prime }) \Vert \\ \overset{(68)}{\geq }& -\delta (t^{\prime }) - \Vert \tilde{\bm {x}}(t^{\prime }) \Vert - \Vert \tilde{\bm {v}}(t^{\prime }) \Vert \\ \geq& -\delta (t^{\prime }) - \sqrt{2}\sqrt{\Vert \tilde{\bm {x}}(t^{\prime }) \Vert ^{2} + \Vert \tilde{\bm {v}}(t^{\prime }) \Vert ^{2}} \\ =& -\delta (t^{\prime }) - \sqrt{2} \Vert \bm {e}(t^{\prime }) \Vert \\ \overset{(62)}{\geq }& -\delta (t^{\prime }) - \sqrt{2} \gamma \Vert \bm {e}(0) \Vert \\ \overset{(72)}{\geq }& - (d_{min}-d^* + \underline{\varepsilon }) - \sqrt{2} \gamma \Vert \bm {e}(0) \Vert \\ \overset{(73)}{\geq }& -(d_{s} - d^* - \bar{\varepsilon }) - \sqrt{2} \gamma \Vert \bm {e}(0) \Vert \overset{(30)}{\geq } \eta > 0, \tag{74} \end{align*} 这与 (71) 的含义 d˙(t′)<0 相矛盾。情况 2：d(T1)>dmax。同样，假设在时间 t=τ?? 时，我们有 d˙(t)>0。此外，对于 d(t) 增加到 dmax 以上的情况，我们只需考虑 d(t) 非常接近边界 dmax 的情况，即δ(t)∈[dmax?d??εˉ,dmax?d?]，t∈[τ??,τ]，(75) 查看源代码 \begin{equation*} \delta (t) \in [d_{max}-d^* - \bar{\varepsilon }, d_{max} - d^* ],\quad t \in [\tau -\epsilon, \tau ], \tag{75} \end{equation*} 其中 εˉ 是某个满足 εˉ?μ 的小常数 (76) 查看源代码 \begin{equation*} \bar{\varepsilon } \ll \mu \tag{76} \end{equation*} 其中 μ 在 (32) 中定义。请参见图 2 和图 3，了解 (75) 中描述的情况和 δ(t) 的考虑范围。然后，在时间 t′=τ??+dt 时，可以证明 d(t′) 的导数满足以下不等式，d˙(t′)≤(69)≤≤(68)≤=≤(62)≤(75)≤(76)=(32)?δ(t′)+?(t′)+∥vv~(t′)∥?δ(t′)+|?(t′)|+∥vv~(t′)∥?δ(t′)+∥xx~(t′)∥+∥vv~(t′)∥?δ(t′)+2–√∥xx~(t′)∥2+∥vv~(t′)∥2???????????????√?δ(t′)+2–√∥ee(t′)∥?δ(t′)+2–√γ∥ee(0)∥?δ(t′)+2–√γ∥ee(0)∥?(dmax?d??εˉ)+2–√γ∥ee(0)∥?(dmax?d??μ)+2–√γ∥ee(0)∥d??max(2d??ds+μ,d(0))+μ+2–√γ∥ee(0)∥。查看源代码 \begin{align*} \dot{d}(t^{\prime }) \overset{(69)}{\leq }& -\delta (t^{\prime }) + \varrho (t^{\prime }) + \Vert \tilde{\bm {v}}(t^{\prime }) \Vert \\ \leq& -\delta (t^{\prime }) + |\varrho (t^{\prime })| + \Vert \tilde{\bm {v}}(t^{\prime }) \Vert \\ \overset{(68)}{\leq }& -\delta (t^{\prime }) + \Vert \tilde{\bm {x}}(t^{\prime }) \Vert + \Vert \tilde{\bm {v}}(t^{\prime }) \Vert \\ \leq& -\delta (t^{\prime }) + \sqrt{2} \sqrt{\Vert \tilde{\bm {x}}(t^{\prime }) \Vert ^{2} +\Vert \tilde{\bm {v}}(t^{\prime }) \Vert ^{2} } \\ =& -\delta (t^{\prime }) + \sqrt{2} \Vert \bm {e}(t^{\prime }) \Vert \\ \overset{(62)}{\leq }& -\delta (t^{\prime }) + \sqrt{2} \gamma \Vert \bm {e}(0) \Vert \\ \overset{(75)}{\leq }& -(d_{max}-d^* - \bar{\varepsilon }) + \sqrt{2} \gamma \Vert \bm {e}(0) \Vert \\ \overset{(32)}{\geq }& d^* - \max \left(2d^* - d_{s} + \mu, d(0)\right) + \mu + \sqrt{2} \gamma \Vert \bm {e}(0) \Vert. \end{align*} 考虑 2d??ds+μ>d(0) 的情况，那么我们有 d˙(t′)≤=≤(30)d??(2d??ds+μ)+μ+2–√γ∥ee(0)∥?(d??ds?2–√γ∥ee(0)∥)?η<0。(77a) 查看源代码 \begin{align*} \dot{d}(t^{\prime }) \leq& d^* - \left(2d^* -d_{s} +\mu \right) + \mu + \sqrt{2} \gamma \Vert \bm {e}(0) \Vert \\ =& - \left(d^* - d_{s} - \sqrt{2} \gamma \Vert \bm {e}(0) \Vert \right) \\ \overset{(30)}{\leq }& -\eta < 0. \tag{77a} \end{align*} 现在考虑 2d??ds+μ≤d(0) 的情况，那么我们得到 d˙(t′)≤≤=d??d(0)+μ+2–√γ∥ee(0)∥d??(2d??ds+μ)+μ+2–√γ∥ee(0)∥?η<0。(77b) 查看源代码 \begin{align*} \dot{d}(t^{\prime }) \leq& d^* - d(0) + \mu + \sqrt{2} \gamma \Vert \bm {e}(0) \Vert \\ \leq& d^* - \left(2d^* -d_{s} +\mu \right) + \mu + \sqrt{2} \gamma \Vert \bm {e}(0) \Vert \\ =& -\eta < 0. \tag{77b} \end{align*} 在情况 (77a) 和 (77b) 中，我们已经证明了 d˙(t′)<0，这与 (71) 的含义 d˙(t′)>0 相矛盾。通过在每种情况下都推导出矛盾，我们得出结论：不存在一个有限的时间 T1 使得 (71) 发生，因此，界限 (31) 对所有 t≥0 成立。□ 注释 4.4：通过检查上述边界情况 (74) 和 (77)，我们可以看到 δ(t) 的下界是 δ(t)≥dmin?d?，上界是 δ(t)≤dmax?d? 对所有 t≥0。通过在界限的两侧都加上 d?，我们得到了最初在 (31) 中制定的 d(t) 的界限。引理 4.8：引理 4.3、引理 4.4 和引理 4.6 的结果对所有 t≥0 成立。证明：从引理 4.7 我们知道 d(t)∈[dmin,dmax] 对所有 t≥0，因此，θ˙(t) 的界限 (39) 对所有 t≥0 成立。因此，引理 4.3 对所有 t≥0 成立。由于 θ˙(t)∈Θ 对所有 t≥0，转换后的误差系统 (44) 对所有 t≥0 是多topic 的。因此，引理 4.4 被推广到对所有 t≥0 成立。作为引理 2.1 和推广后的引理 4.4 的直接结果，我们知道在转换后的误差系统 (44) 的轨迹上，均匀多项式 Lyapunov 函数 v4(zz) 是正定的此外，通过比较图4(a)–(c)中所示的估计目标位置的轨迹，可以看出，所提出方法生成的估计目标位置轨迹与真实目标位置轨迹对齐，而[12]和[23]的算法生成的估计目标位置轨迹会在真实目标轨迹周围振荡，并且在每个时间点上都落后于目标。此外，图4(e)显示所提出的算法能够确保准确的目标环绕导航，agents与目标之间的距离d(t)会收敛到期望的距离d?。这与[12]和[23]方法中观察到的振荡行为形成对比。这些比较突出了所提出算法在准确定位和环绕移动速度未知的目标方面的优越能力。图4展示了所提出方法、Deghat等人（2014年）[12]以及Chen等人（2023年）[23]的方法在跟踪移动速度未知的目标时的性能。图5以图形方式进一步展示了所提出方法独有的性能指标。根据定理4.1，目标位置估计误差∥xx~(t)∥和目标速度估计误差∥vv~∥会随着t→∞而收敛到零，如图5(a)所示。图5(b)证实了引理4.2和引理4.7，表明误差信号δ(t)在整个系统演变过程中保持在(31)、(32)指定的范围内，并且随着时间的推移趋于零。最后，图5绘制了本节考虑的模拟示例中，变换后误差系统(44)的轨迹上的李雅普诺夫函数(64)及其时间导数。与引理2.1和引理4.5的预期一致，v4是正定的，v˙4是负定的。图5展示了所提出方法的详细性能指标。

热点排行