基于非线性动态逆控制的鲁棒自适应学习控制方法，用于助推-滑行两级入轨的航空航天器

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Acta Astronautica》：Nonlinear dynamic inversion-based robust adaptive learning control for boost-glide two-stage-to-orbit aerospace vehicles

【字体：大中小】 时间：2026年05月10日 来源：Acta Astronautica 3.4

编辑推荐：

　　摘要：本文针对助推-滑翔两级入轨 aerospace飞行器，提出了一种基于非线性动态逆（NDI）的鲁棒自适应学习控制方法。针对其非线性动力学和强耦合特性，利用NDI对复杂非线性系统进行解耦和线性化处理。随后，结合模型参考自适应控制方法和径向基函数（RBF）神经网络开发了自适应学习

　　摘要：本文针对助推-滑翔两级入轨 aerospace飞行器，提出了一种基于非线性动态逆（NDI）的鲁棒自适应学习控制方法。针对其非线性动力学和强耦合特性，利用NDI对复杂非线性系统进行解耦和线性化处理。随后，结合模型参考自适应控制方法和径向基函数（RBF）神经网络开发了自适应学习控制器，并基于李雅普诺夫理论严格证明了闭环系统的稳定性。此外，引入了鲁棒性修正策略和改进的扩展状态观测器以进一步提高控制器的鲁棒性。在标称和非标称条件下进行了大量数值仿真，结果表明该控制方法具有令人满意的跟踪和学习性能。

引言：助推-滑翔两级入轨航天飞行器（TSTOAV）是一种可重复使用的高超音速飞行器，能够在稠密大气层、近太空和轨道空间中进行往返飞行。它既可用于载人航天运输，也可用于军事战略打击，具有广泛的军事和民用应用前景，已成为航空航天领域的主要研究方向之一[1][2][3]。为实现这些性能，助推-滑翔两级入轨飞行器的首要任务之一是设计具有高控制精度、强抗干扰能力和优异鲁棒性的飞行控制系统[4][5]。对于这种飞行器，模型的强非线性和多通道耦合特性给控制器设计带来了巨大挑战。同时，模型的参数不确定性和外部环境干扰对控制器的鲁棒性提出了高要求[6][7][8]。目前，众多学者已经开发了一系列针对复杂非线性系统的控制方法，这些方法大致可以分为三类：基于李雅普诺夫稳定性理论的设计方法、基于最优控制理论的设计方法以及基于线性系统理论的设计方法[9][10]。基于李雅普诺夫稳定性理论的设计方法通过分析系统动力学并设计适当的李雅普诺夫函数来确保控制系统的稳定性和收敛性，典型方法包括滑模变结构控制和反步控制。滑模变结构控制是一种鲁棒控制技术，旨在将系统状态驱动到指定的滑移面上，该滑移面经过精心设计以应对不确定性和干扰[11][12]。在[13][14][15]中，分别采用了积分滑模控制、终端滑模控制和自适应滑模控制来设计高超音速飞行器的姿态控制器，并在外部干扰存在的情况下实现了良好的性能。反步控制采用递归程序，每一步都涉及设计李雅普诺夫函数和控制律以稳定各个子系统[16]。在[17][18]中，为吸气式高超音速飞行器开发了鲁棒反步控制器，并在参数不确定性下评估了其有效性。基于最优控制理论的设计方法致力于通过最小化某种成本函数来优化控制系统性能[19][20][21]，这些方法考虑了系统约束和目标，寻求在最小化成本的同时实现期望的性能，典型的最优控制方法包括H∞控制、模型预测控制和线性二次控制[22][23]。在[24]中，结合H∞控制和模糊逻辑设计了鲁棒姿态控制器。在[25]中，基于演员-评论家策略结构的自适应动态规划方法被用于解决具有预定性能约束和未知随机干扰的高度-速度轨迹跟踪问题[25]。基于最优控制理论的设计方法确实可以实现优异的性能，但也存在一些局限性，如推导过程繁琐以及计算和存储要求较高，这限制了其在实际工程中的应用。基于线性系统理论的设计方法旨在将航天飞行器的非线性动力学简化为线性模型，然后依靠线性控制理论设计能够稳定和控制线性化系统的控制器。目前，在非线性控制系统设计中主要有两种方法，其中线性系统起主导作用。第一种方法是在小干扰下将非线性系统的整体系统近似为几个局部线性化系统，从而实现对非线性系统的近似。这类方法中最广泛使用的是增益调度PID控制，它仍然是工程设计的首选[26][27]。然而，这种近似策略有两个缺点：(1)需要选择多个操作点以确保系统在任务变化较大时的全局性能；(2)小干扰线性化忽略了高阶项的影响，可能导致某些操作点出现较大误差。第二种方法通过为非线性系统设计控制器，将闭环系统转换为等效的线性系统，有效解决了这一问题。典型的方法是非线性动态逆（NDI），也称为反馈线性化[28][29]。尽管这些方法可能无法完全捕捉非线性动力学的所有复杂性，但它们具有简单性和易于分析和实现的优点。此外，反馈线性化依赖于被控制对象的精确数学模型，因此确保其鲁棒性可能具有挑战性。因此，将反馈线性化与其他方法结合使用是实现鲁棒飞行控制的推荐方案[30][31][32]。总之，高超音速飞行器的控制方法发展取得了显著进展，许多方法已得到广泛探索并显示出良好的效果。然而，现有研究中对多种干扰因素的全面处理还不够充分[33][34]，包括强非线性、多通道耦合特性、模型参数不确定性及外部环境干扰。鉴于此，本文为助推-滑翔两级入轨航天飞行器的第一阶段升空阶段提出了一种基于非线性动态逆的鲁棒自适应学习控制方法，其主要贡献如下：(1)考虑到多通道之间的强耦合特性，应用非线性动态逆（NDI）解耦和线性化非线性模型，然后将两级入轨航天飞行器模型解耦为三个独立的二阶线性系统；(2)针对模型不确定性和外部环境干扰，开发了鲁棒自适应学习控制方法，具体基于NDI解耦的线性模型应用模型参考自适应控制方法设计姿态控制器，并引入RBF神经网络来近似未知的匹配干扰，同时基于李雅普诺夫理论分析闭环系统的稳定性；(3)为了进一步提高所设计控制器的鲁棒性，采取了两种措施：一种是自适应律的鲁棒性修正，另一种是改进的扩展状态观测器（IESO），前者通过在自适应律中引入阻尼项来增强鲁棒性，后者用于估计和补偿未预见的干扰；改进的扩展状态观测器基于具有饱和约束的新颖连续可微非线性函数设计，能够提供满意的估计性能。

结构概述：第二节描述了两级入轨航天飞行器的升空过程，并建立了用于姿态控制的简化对象模型。第三节详细介绍了基于NDI的鲁棒自适应学习控制器，并证明了闭环系统的稳定性。第四节评估了所提方法的有效性，第五节总结了本文。

TSTOAV数学模型描述：TSTOAV由上级和下级组成，上级由双固体火箭发动机（SRM）提供动力，从发射台垂直起飞并在多约束条件下以负攻角爬升。SRM关闭后，它在无动力的情况下滑翔至分离点，此时上级与下级分离。换句话说，TSTOAV的升空过程包括有动力升空阶段和无动力升空阶段，示意图如下。

基于NDI的鲁棒自适应学习姿态控制器设计：考虑到强非线性、多通道耦合特性、模型参数不确定性以及外部干扰，设计了基于NDI的鲁棒自适应学习姿态控制器，控制方案如图4所示。其中，使用基于NDI的解耦控制器解决非线性和多通道耦合问题，并采用基于RBFNN的自适应学习控制器进行精确的指令跟踪控制。

仿真条件：为了验证所提算法的有效性，进行了部分数值仿真，仿真条件如下：(1)参考[38]，图5展示了两级入轨航天飞行器的标称升空轨迹。具体来说，TSTOAV垂直发射，SRM的关机时间为70.8秒，该轨迹的初始和最终参数见表1。(2)在有动力升空阶段，需要达到所需的俯仰阻尼比。

结论与未来工作：本文提出了一种用于助推-滑翔两级入轨航天飞行器第一阶段升空阶段的鲁棒自适应学习控制方法。首先，设计基于NDI的解耦控制器以解决多通道之间的强耦合特性问题，然后将TSTOAV姿态系统解耦为三个独立的二阶线性系统。其次，设计了基于RBFNN的自适应学习姿态控制器。

联系信箱：

粤ICP备09063491号

热点排行