《Neurocomputing》:Prescribed performance safe optimal tracking control for nonlinear systems subject to dynamic obstacles via NN-based adaptive dynamic programming
编辑推荐:
本文针对动态障碍环境下的不确定非线性系统,提出了一种前馈-反馈最优控制策略。通过结合神经网络自适应动态规划(ADP)与反步法(backstepping)技术,同时解决了预设性能跟踪(PPC)、障碍规避和成本优化的多重挑战。研究采用统一积分-乘法正切屏障李亚普诺夫函数(Lyapunov)设计前馈控制器,并利用神经网络逼近哈密顿-雅可比-贝尔曼方程(HJB)的解,显著降低了计算复杂度。稳定性分析证明闭环系统(CLS)信号一致最终有界,仿真验证了策略在兼顾安全性、经济性与动态性能方面的优越性。
亮点(Highlights)
• 提出统一积分-乘法正切屏障李亚普诺夫函数(Lyapunov),同步解决预设性能跟踪与动态障碍规避问题,突破传统静态障碍方法的局限性。
• 结合自适应动态规划(ADP)与反步法(backstepping),仅需单层神经网络(NN)逼近代价函数,避免传统策略迭代(policy iteration)与值迭代(value iteration)的复杂计算。
• 通过微分博弈将未知扰动纳入设计框架,增强闭环系统(CLS)在复杂环境中的鲁棒性,并引入一阶滤波器解决“计算爆炸”难题。
控制器设计(Controller design)
本节针对不确定非线性系统(1)设计控制器:基于反步法(backstepping)的前馈控制器,以及通过自适应动态规划(ADP)开发的反馈最优控制器。前馈控制器通过屏障李亚普诺夫函数(Lyapunov)动态约束跟踪误差与障碍距离,反馈控制器则利用神经网络(NN)在线学习HJB方程的最优解,实现多目标协同优化。
稳定性分析(Stability analysis)
定理1(Theorem 1)
对于满足假设1、3、4、5的不确定非线性系统(1),所提出的控制方案(含前馈控制器(9)、(16)、(17)、(24),反馈最优控制器(35)及自适应律(10)、(18)、(25)、(36))可确保闭环系统(CLS)所有信号一致最终有界,同时实现障碍规避、预设性能跟踪及代价函数最小化。
证明(Proof)
首先选取李亚普诺夫函数(Lyapunov)候选函数为:
(此处为数学表达式,保留原文格式)
通过微分与不等式放缩,证明所有误差信号有界,且预设性能与安全约束始终满足。
仿真结果(Simulation results)
以非线性系统(具体方程)为仿真对象,参考轨迹为yr=sin(t),设置3个动态障碍物(轨迹分别为…)。安全半径与排斥半径设为rs=0.5、r0=1.0,预设收敛时间与区域为Tc=5s、μ∞=0.1。仿真结果表明,系统在躲避动态障碍的同时,跟踪误差在指定时间内进入预设区间,控制成本显著低于非优化方案。
结论(Conclusion)
本研究成功解决了非线性系统在动态障碍环境下的预设性能安全最优跟踪控制问题。基于反步法(backstepping)的前馈控制器实现了动态避障与性能约束,而自适应动态规划(ADP)框架则通过神经网络(NN)高效逼近最优解,为复杂环境下的智能系统提供了兼顾安全、经济与动态性能的解决方案。