基于干扰抑制和凸优化的自主舰载可重复使用火箭着陆引导系统

《Aerospace Science and Technology》:Disturbance rejection and convex optimization-based guidance for autonomous shipborne landing of a reusable rocket

【字体: 时间:2026年02月20日 来源:Aerospace Science and Technology 5.8

编辑推荐:

  火箭无人艇动态着陆双环导引框架设计及验证

  
王家伟|张然|李慧峰
北京航空航天大学航天学院,中国北京102206

摘要

将可重复使用的火箭降落在无人机船上面临独特的挑战,因为船体的运动会产生显著的干扰,而大多数火箭着陆研究并未考虑这一因素。为了解决这种干扰并实现最佳着陆,本文开发了一个双环引导框架,该框架结合了干扰抑制和凸优化技术。外环实时优化着陆轨迹,使其朝向预测的甲板状态。为了快速优化着陆轨迹,本文提出了一种基于Hessian矩阵的序列凸规划方法,该方法根据动力学非线性自适应调整惩罚项,从而加速收敛。生成后的轨迹由内环跟踪,内环采用基于内部模型的观测器与甲板振动频率估计器相结合。尽管甲板振动幅度和频率未知,该系统仍能实现指数级收敛。仿真研究验证了所提出的引导律的有效性,证明了其在无人机船剧烈振动条件下的鲁棒性和高着陆精度。

引言

舰载着陆在航空航天应用中提出了独特的引导挑战。虽然已经为固定翼飞机[1]、直升机[2]和多旋翼飞行器[3][4]提出了舰载着陆引导方法,但火箭在无人机船上的着陆则是一个不同的控制问题。与依靠空气动力升力维持前进速度或具有悬停能力的飞机不同,垂直着陆的火箭需要在显著的执行器约束和干扰下通过推进减速来实现零速度、精确着陆。这要求开发出超越现有动力下降引导(PDG)方法的高性能引导律,以实现精度和最优性。
目前关于PDG方法的研究可以分为三类:分析引导、基于优化的引导和基于学习的引导。更详细的分类见图1。多项式引导方法起源于阿波罗月球下降引导[5][6],该方法利用位置和速度反馈来跟踪多项式参考轨迹。现代扩展包括增强型多项式形式[7]和分数阶泛化[8],它们引入了额外的参数来塑造轨迹。另一种分析方法是零努力误差/零努力速度(ZEM/ZEV)引导,该方法源自加速度最优控制理论,ZEM和ZEV无需进一步控制即可量化终端误差[9]。为了防止地面穿透,提出了各种改进措施,包括高度惩罚[10]、航点优化[11]和非凹轨迹构建[12]。滑动表面引导是第三种分析方法,它将PDG重新表述为一个具有有限时间收敛性的位置稳定问题[13]和单调下降问题[14]。这些分析引导方法为固定着陆目标提供了计算效率高的解决方案。
基于优化的引导将PDG表述为一个实时通过间接或直接方法解决的最优控制问题。间接方法解决必要的最优性条件[15][16],而直接方法将问题离散化为非线性规划公式[17][18][19]。参考文献[20]表明,PDG问题可以转化为二阶锥规划,并具有理论上的收敛保证和高效的数值求解器。该框架已扩展到包括六自由度动力学[18][21][22]、大气效应[17][23][24]和参数不确定性[26]。当在滚动时域框架中实现时,这些方法创建了对各种干扰具有抵抗力的闭环系统[21][23]。这些闭环解决方案的可靠性依赖于底层序列凸规划(SCP)算法的收敛特性,这促使了算法鲁棒性的最新创新。为了减轻人为不可行性,开发了平滑同伦技术,采用了从终端状态卷积到完整轨迹NURBS参数化[27][28]的各种方法。为了进一步提高稳定性,自适应信任区域策略现在利用微分代数根据状态依赖的非线性来调整步长[29]。此外,为了满足严格的机载时间要求,通过采用低复杂度矩阵求逆方案显著提高了计算效率[30]。然而,标准SCP公式的一个根本限制在于,它们主要依赖一阶泰勒展开来构建凸子问题,因此二阶曲率信息在高度非线性场景中基本上未被利用,这可能限制了收敛速度。这些基于优化的引导方法为固定目标提供了推进剂效率高的轨迹,但尚未扩展到像无人机船这样的移动目标。
基于学习的引导利用神经网络从模拟数据中开发引导策略。神经网络在PDG中可以扮演多种角色。参考文献[31]通过演员-评论家框架将强化学习与传统的ZEM/ZEV引导相结合,学习最优引导参数。参考文献[32]训练深度神经网络来评估推进剂最优着陆轨迹的可行性。参考文献[33]使用神经网络为数值优化方法提供初始猜测。参考文献[34]提出了一个基于物理的神经网络,用于调整参数化的基线引导律以应对随机不确定性。尽管这些数据驱动的方法展示了计算效率和解决复杂PDG问题的能力,但舰载着陆违反了它们针对固定终端的假设。
虽然传统的PDG方法对静态目标有效,但它们缺乏处理海上平台引入的干扰的特定机制,这通常会导致着陆精度和鲁棒性下降。本研究的动机是克服这一特定限制。为了处理由船舶运动引起的干扰并实现最佳着陆,本文提出了一种基于干扰抑制和凸优化的引导(DR-COBG)律。尽管在先前的文献[24][25][34]中探索了类似的最优和干扰抑制引导框架,但没有一个框架解决了着陆目标中的干扰问题,而这大大复杂化了问题。为了克服这些挑战,本文做出了三个关键贡献:
1) 为了在无人机船上实现最佳和精确着陆,开发了一个双环引导框架。与将无人机船运动视为干扰的现有工作不同,该框架将无人机船运动预测纳入轨迹优化中。舰载着陆引导问题被分解为针对预测甲板运动的最优引导问题和针对不可预测甲板运动的干扰抑制引导问题。这两个子问题更易于处理。
2) 为了确保实时应用的计算效率,用于优化着陆轨迹的外环引导采用了新的基于Hessian矩阵的序列凸规划(HSCP)方法。与使用一阶非线性动力学近似的现有SCP方法不同,HSCP进一步利用了动力学的二阶导数和代价函数来自适应调整惩罚项,从而提供可靠且快速的收敛。
3) 为了实现高精度着陆,用于跟踪优化轨迹的内环引导使用基于内部模型的观测器(IMBO)来估计和补偿甲板振动,实现指数级收敛。开发了一种甲板振动频率估计器(DOFE),能够预测未来的甲板运动。这与现有的干扰抑制引导方法不同,后者只能估计当前的无人机船运动,但无法预测未来的运动以实现精确着陆。
本文的结构如下。第2节阐述了引导问题。第3节给出了本文的主要结果,即引导律的 development。第4节展示了数值研究结果,证明了所提出引导律的性能。

部分摘录

最优控制公式

舰载着陆引导问题被表述为一个最优控制问题。它使用两个参考框架:一个惯性参考框架I和一个机体固定参考框架B,如图2所示。状态变量(rI,VI,?,m)分别表示可重复使用火箭的位置、速度、姿态和质量。姿态?=(?偏航, ?俯仰)由偏航和俯仰角参数化。控制变量(F, ω)分别表示推力大小和姿态率。

双环引导框架

为了同时抑制船舶运动引起的干扰并实现最佳着陆性能,所提出的DR-COBG采用了双环框架,如图3所示。内环预测无人机船的运动并将这些预测发送给外环。外环然后使用这些预测生成最佳着陆轨迹,并将它们传回内环。内环跟踪这些优化轨迹并抑制任何不可预测的甲板振动

数值研究

进行了数值实验来验证所提出的DR-COBG的性能。着陆条件和可重复使用火箭的数据在表1中描述。
DR-COBG的参数如下。长时间和短时间的引导周期分别为0.05秒和0.005秒。对于外环,收敛准则?tol设置为
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号