《Automatica》:Stabilization of strictly pre-dissipative receding horizon linear quadratic control by terminal costs
编辑推荐:
本文针对严格预耗散性滚动时域控制问题,探讨了如何利用终端代价(而非终端约束)来实现闭环系统的渐近稳定性。研究者聚焦于线性二次(LQ)框架,证明了二次型终端代价是必要的,并阐明了其与代数Riccati方程特定解的内在联系。该研究为无终端约束模型预测控制器的设计提供了坚实的理论依据,是相关领域的一项重要进展。
在自动控制领域,模型预测控制(Model Predictive Control, MPC),也称为滚动时域控制(Receding Horizon Control, RHC),是一种强大且应用广泛的控制策略。其核心思想是在每个控制时刻,在线求解一个有限时域的最优控制问题(Optimal Control Problem, OCP),并将计算得到的最优控制序列的第一个元素应用于被控系统。然而,这种方法面临一个根本性挑战:仅通过优化有限时域的目标,通常无法保证闭环系统能渐近稳定到期望的平衡点,而只能实现“实用”渐近稳定,即系统状态最终收敛到平衡点的一个邻域内,邻域的大小取决于优化时域的长度。
为了获得真正的渐近稳定性,传统方法通常需要联合使用终端约束和终端代价。终端约束(例如,要求预测时域末端的状态必须位于某个集合内)和精心设计的终端代价(通常是一个局部控制李雅普诺夫函数)共同作用,可以确保控制器的稳定性。但设计一个全局的控制李雅普诺夫函数通常非常困难,而终端约束的引入会增加在线优化的计算复杂度和可行性问题。那么,一个自然而然的问题是:能否在不引入终端约束的情况下,仅通过设计合适的终端代价来保证渐近稳定性?尤其是在所研究的最优控制问题仅满足“严格预耗散性”(strict pre-dissipativity)而非更强的“严格耗散性”(strict dissipativity)时,这一问题更具挑战性。严格耗散性要求存在一个有下界的存储函数(storage function),而严格预耗散性则允许存储函数无下界。对于存储函数无下界的问题,传统的稳定性理论不再直接适用。本文发表于控制领域顶级期刊《Automatica》,旨在深入探索并回答上述问题,为无终端约束MPC的设计提供新的理论工具。
为了开展这项研究,作者们聚焦于线性二次(LQ)框架。虽然存在处理一般非线性问题的伴随论文,但线性二次设定允许研究者获得更强、更具体的结果。研究主要运用了代数Riccati方程(Algebraic Riccati Equation, ARE)理论、耗散性系统理论以及最优控制中的标准工具,对问题进行形式化描述和深入分析。通过严谨的数学推导,建立了终端代价设计与代数Riccati方程特定解之间的深刻联系。
2. 问题陈述
研究者考虑形如 xk+1=Axk+Buk的离散时间线性系统,其中 x∈Rnx为状态,u∈Rnu为控制输入。滚动时域最优控制问题旨在最小化一个给定的阶段成本 ?(x,u)和终端成本 Vf(x)在有限预测时域 N上的总和。在本文聚焦的线性二次情况下,阶段成本和终端成本具有特定的二次型形式。该研究关注的核心是,在最优控制问题仅满足严格预耗散性(即对应的存储函数可能无下界)时,终端成本 Vf(x)=xTPfx中的矩阵 Pf需要满足何种条件,才能保证由此滚动时域控制律产生的闭环系统是渐近稳定的。研究将这个问题与离散代数Riccati方程(Discrete Algebraic Riccati Equation, DARE)解的存在性和性质紧密联系起来。
3. 初步结果
本部分为证明主要结论提供了必要的理论准备。首先,文章引入了严格(x,u)-预耗散性的定义和与之相关的旋转成本(rotated cost)概念。对于一个给定的矩阵Λ和存储函数λ(x)=xTΛx,旋转成本L(x,u)定义为原成本函数经过Λ变换后的形式。严格(x,u)-预耗散性成立等价于旋转成本矩阵HΛ是正定的。这一变换是将耗散性分析转化为标准稳定化问题的重要工具。文章还讨论了通过预镇定(pre-stabilization)将一般LQ问题转化为标准形式的技术,这简化了后续分析。
4. 主要结果
这是本文的核心部分,提出了保证稳定性的关键条件。定理4.3指出,假设系统(A,B)可镇定,并且存在一个矩阵Λ使得严格(x,u)-预耗散性成立(即HΛ?0)。那么,对于任意满足Pf?Λ的终端代价矩阵Pf,只要预测时域N足够长,由滚动时域控制律产生的闭环系统就是渐近稳定的。这里的“?”表示矩阵不等式。定理4.4进一步强化了这个结论,指出如果存在一个矩阵P∞是离散代数Riccati方程(DARE)的一个解,并且满足P∞?Λ,那么选择Pf=P∞就能保证对于任意有限的预测时域N≥1,闭环系统都是渐近稳定的。定理4.6则处理了Pf=Λ的临界情况,指出此时闭环系统是李雅普诺夫稳定的,并且当N→∞时,滚动时域控制律收敛到对应的无限时域最优控制律。这些定理清晰地表明,终端代价矩阵Pf必须“足够大”(在矩阵不等式意义下大于耗散性分析中产生的矩阵Λ),才能补偿因存储函数无下界(即严格预耗散性)而可能缺失的稳定性属性。一个二次型的终端代价在此是必要且有效的。
5. 与已有文献的讨论
本章节将本文的结果与现有研究进行了对比和关联。特别指出,本文的框架和结论可以涵盖和推广早期一些关于线性终端代价和终端约束的工作。例如,在Faulwasser和Zanon (2018) 以及Zanon和Faulwasser (2018) 的研究中,在假定系统局部线性二次近似可镇定的前提下,使用线性终端代价也能获得稳定性。本文的结果表明,在严格预耗散的设定下,二次型终端代价是必要的,并且可以将之前工作中提出的线性部分整合进来。文章也讨论了与标准LQR(线性二次调节器)理论的关系,指出即使(Q,A)可检测,如果终端代价Pf选择不当(例如太小),无限时域LQR也可能是不稳定的甚至无解,这通过示例2.2进行了生动说明。
6. 数值示例
研究者通过一个标量系统的数值例子,直观地演示了理论结果。示例显示,当选择终端代价矩阵Pf小于某个临界值时,有限时域和无限时域LQR都无法镇定系统;而当Pf大于该临界值时,对于一个足够长的预测时域N,滚动时域控制器能够成功镇定系统。这验证了定理4.3中关于Pf需足够大且预测时域需足够长的条件。
结论与意义
本文系统性地研究了对于严格预耗散的滚动时域线性二次控制问题,如何通过设计合适的二次型终端代价(而无需终端约束)来确保闭环系统的渐近稳定性。研究取得了以下关键结论:首先,明确指出了保证稳定性的充分条件是终端代价矩阵Pf必须“大于”由耗散性分析得到的矩阵Λ(即Pf?Λ)。其次,将终端代价的设计与离散代数Riccati方程(DARE)的特定解联系起来,为实际选择Pf提供了明确指导(例如可选择满足P∞?Λ的DARE解P∞)。最后,通过严谨的理论证明和数值示例,验证了所提方法的有效性。
这项研究具有重要的理论和实践意义。在理论上,它弥补了严格耗散性框架下稳定性理论的缺口,将结论推广至存储函数可能无下界的严格预耗散情形,深化了人们对模型预测控制稳定性机制的理解。在实践上,它提供了一种无需设计复杂终端约束和全局李雅普诺夫函数的稳定性保证方法,简化了控制器的设计流程,尤其有利于在线计算。由于聚焦于线性二次问题,所得条件具体、可检验,便于在实际控制系统设计中应用。本文工作为无终端约束模型预测控制的进一步发展奠定了坚实的理论基础,是控制理论领域一个颇具价值的贡献。