拉格朗日点,也称为平衡点[[1], [2], [3], [4], [5], [6]],是圆限制三体问题(CRTBP)的五个无动力特殊解。一个特别值得关注的情况是由太阳、地球和航天器组成的CRTBP空间。拉格朗日点独特的动力学和几何特性[7,8]使其适用于设计能够与地球轻松通信且能耗相对较低的深空站。
在日地拉格朗日点L2处的航天器编队飞行(SFF)系统可以显著提高深空探索中单体航天器的可靠性[9]。然而,该系统长期运行的挑战包括需要有效的姿态-轨道控制机制和能源供应系统。正如张等人[10]的文献综述所指出的,基于电磁场的航天器编队飞行控制是一个可行的解决方案。尽管这种解决方案在可逆性方面优于基于化学推进的编队飞行控制方法,但它也增加了SFF姿态-轨道耦合的复杂性[[11], [12], [13], [14]]。这意味着传统的基于线性Halo[7]轨道的方法在这种复杂情况下是不可行的。因此,开发稳健且智能的非线性控制策略对于日地L2点处的基于电磁场的SFF姿态-轨道耦合控制至关重要。
尽管学者们提出了许多针对SFF相对姿态-轨道集成控制的方法,例如使用基于双四元数的混合自适应滑模控制(SMC)和神经网络(NN)辅助的动力学状态估计和控制策略[[14], [15], [16], [17], [18], [19], [20], [21], [22], [23], [24], [25], [26], [27]],但文献中关于基于电磁场的SFF姿态-轨道耦合建模和控制的研究相对较少,特别是在深空SFF情况下。这种缺乏有几个原因:其中一个直接原因是生成和描述航天器之间电磁场的数学挑战;Schweighart[28,29]使用电磁偶极子概念来描述近距离下的这些相互作用,从而得出了在地球轨道电磁SFF控制研究中广泛使用的远场模型[13,19,20,25,[30], [31], [32]]。另一个关键原因是由电磁相互作用引起的非线性姿态-轨道耦合。解决这一缺陷的常见方法是定义一个磁矩指数,在使用磁力进行相对轨道控制时对其进行优化。Yang等人[33]利用这一原理设计了一种基于线性化轨道模型的SFF辅助最优控制策略。此外,环境不确定性增加了SFF姿态-轨道模型的复杂性。这促使人们开始在SFF控制中使用状态估计算法和强化学习(RL)方法[23,25,34,35]。然而,这些方法需要大量的训练数据和大量的梯度计算。
受上述综述的启发,本研究提出了一种基于神经网络(NN)辅助的自适应策略,用于日地拉格朗日点L2处的电磁SFF姿态-轨道耦合状态估计和控制。此外,引入了一种改进的基于磁矩的成本函数来优化所需能量。因此,本文的主要贡献包括:
- (i)
为了解决深空等复杂场景中的SFF姿态-轨道耦合状态估计和控制问题,将非线性反馈控制与两种NN结构相结合:第一种是基于Hermite多项式的神经网络(HeNN)用于SFF的相对轨道估计和控制,第二种是基于Legendre多项式的神经网络(LeNN)用于SFF的姿态估计和控制。这体现了改进的双NN辅助自适应非线性控制方案,相比现有方法(仅使用NN辅助SFF姿态或轨道状态估计和控制)有所改进。
需要注意的是,为了控制SFF状态,HeNN和LeNN都接收编队飞行系统的姿态-轨道状态响应作为输入,然后自主调整它们的学习参数以减少基于NN的状态估计误差,而不依赖于数学模型。在工程任务中,也使用了类似的原理,其中传感器提供关于SFF状态的实时信息。这预测了所提出的双NN辅助自适应非线性控制方法的潜在工程应用。
- (ii)
开发了一种改进的磁矩规划策略,能够在相对较低的能耗下实现日地L2处的SFF姿态-轨道耦合控制。这种方法显著优于仅使用电磁相互作用进行相对轨道或相对姿态控制的传统方法。
- (iii)
本文提出了一种适用于非线性且不确定系统的自适应控制方法。该方法在简单性和独立于梯度计算方面改进了新兴的深度强化学习(DRL)基方法。