舰载着陆在航空航天应用中提出了独特的引导挑战。虽然已经为固定翼飞机[1]、直升机[2]和多旋翼飞行器[3][4]提出了舰载着陆引导方法,但火箭在无人机船上的着陆则是一个不同的控制问题。与依靠空气动力升力维持前进速度或具有悬停能力的飞机不同,垂直着陆的火箭需要在显著的执行器约束和干扰下通过推进减速来实现零速度、精确着陆。这要求开发出超越现有动力下降引导(PDG)方法的高性能引导律,以实现精度和最优性。
目前关于PDG方法的研究可以分为三类:分析引导、基于优化的引导和基于学习的引导。更详细的分类见图1。多项式引导方法起源于阿波罗月球下降引导[5][6],该方法利用位置和速度反馈来跟踪多项式参考轨迹。现代扩展包括增强型多项式形式[7]和分数阶泛化[8],它们引入了额外的参数来塑造轨迹。另一种分析方法是零努力误差/零努力速度(ZEM/ZEV)引导,该方法源自加速度最优控制理论,ZEM和ZEV无需进一步控制即可量化终端误差[9]。为了防止地面穿透,提出了各种改进措施,包括高度惩罚[10]、航点优化[11]和非凹轨迹构建[12]。滑动表面引导是第三种分析方法,它将PDG重新表述为一个具有有限时间收敛性的位置稳定问题[13]和单调下降问题[14]。这些分析引导方法为固定着陆目标提供了计算效率高的解决方案。
基于优化的引导将PDG表述为一个实时通过间接或直接方法解决的最优控制问题。间接方法解决必要的最优性条件[15][16],而直接方法将问题离散化为非线性规划公式[17][18][19]。参考文献[20]表明,PDG问题可以转化为二阶锥规划,并具有理论上的收敛保证和高效的数值求解器。该框架已扩展到包括六自由度动力学[18][21][22]、大气效应[17][23][24]和参数不确定性[26]。当在滚动时域框架中实现时,这些方法创建了对各种干扰具有抵抗力的闭环系统[21][23]。这些闭环解决方案的可靠性依赖于底层序列凸规划(SCP)算法的收敛特性,这促使了算法鲁棒性的最新创新。为了减轻人为不可行性,开发了平滑同伦技术,采用了从终端状态卷积到完整轨迹NURBS参数化[27][28]的各种方法。为了进一步提高稳定性,自适应信任区域策略现在利用微分代数根据状态依赖的非线性来调整步长[29]。此外,为了满足严格的机载时间要求,通过采用低复杂度矩阵求逆方案显著提高了计算效率[30]。然而,标准SCP公式的一个根本限制在于,它们主要依赖一阶泰勒展开来构建凸子问题,因此二阶曲率信息在高度非线性场景中基本上未被利用,这可能限制了收敛速度。这些基于优化的引导方法为固定目标提供了推进剂效率高的轨迹,但尚未扩展到像无人机船这样的移动目标。
基于学习的引导利用神经网络从模拟数据中开发引导策略。神经网络在PDG中可以扮演多种角色。参考文献[31]通过演员-评论家框架将强化学习与传统的ZEM/ZEV引导相结合,学习最优引导参数。参考文献[32]训练深度神经网络来评估推进剂最优着陆轨迹的可行性。参考文献[33]使用神经网络为数值优化方法提供初始猜测。参考文献[34]提出了一个基于物理的神经网络,用于调整参数化的基线引导律以应对随机不确定性。尽管这些数据驱动的方法展示了计算效率和解决复杂PDG问题的能力,但舰载着陆违反了它们针对固定终端的假设。
虽然传统的PDG方法对静态目标有效,但它们缺乏处理海上平台引入的干扰的特定机制,这通常会导致着陆精度和鲁棒性下降。本研究的动机是克服这一特定限制。为了处理由船舶运动引起的干扰并实现最佳着陆,本文提出了一种基于干扰抑制和凸优化的引导(DR-COBG)律。尽管在先前的文献[24][25][34]中探索了类似的最优和干扰抑制引导框架,但没有一个框架解决了着陆目标中的干扰问题,而这大大复杂化了问题。为了克服这些挑战,本文做出了三个关键贡献:
1) 为了在无人机船上实现最佳和精确着陆,开发了一个双环引导框架。与将无人机船运动视为干扰的现有工作不同,该框架将无人机船运动预测纳入轨迹优化中。舰载着陆引导问题被分解为针对预测甲板运动的最优引导问题和针对不可预测甲板运动的干扰抑制引导问题。这两个子问题更易于处理。
2) 为了确保实时应用的计算效率,用于优化着陆轨迹的外环引导采用了新的基于Hessian矩阵的序列凸规划(HSCP)方法。与使用一阶非线性动力学近似的现有SCP方法不同,HSCP进一步利用了动力学的二阶导数和代价函数来自适应调整惩罚项,从而提供可靠且快速的收敛。
3) 为了实现高精度着陆,用于跟踪优化轨迹的内环引导使用基于内部模型的观测器(IMBO)来估计和补偿甲板振动,实现指数级收敛。开发了一种甲板振动频率估计器(DOFE),能够预测未来的甲板运动。这与现有的干扰抑制引导方法不同,后者只能估计当前的无人机船运动,但无法预测未来的运动以实现精确着陆。
本文的结构如下。第2节阐述了引导问题。第3节给出了本文的主要结果,即引导律的 development。第4节展示了数值研究结果,证明了所提出引导律的性能。