图子（graphon）Q-噪声线性系统的二次最优控制

《Automatica》：Quadratic optimal control of graphon Q-noise linear systems

【字体：大中小】 时间：2026年05月11日 来源：Automatica 5.9

编辑推荐：

　　亚历克斯·杜尼亚克|彼得·E·凯恩斯麦吉尔大学电气与计算机工程系，蒙特利尔，QC H3A 0E9，加拿大摘要在大而复杂的网络上对线性二次高斯最优控制问题进行建模在计算上是不可行的。图论提供了一种方法来克服这些困难，该方法通过为无限长的图序列定义极限对象，从而允

　　亚历克斯·杜尼亚克|彼得·E·凯恩斯
麦吉尔大学电气与计算机工程系，蒙特利尔，QC H3A 0E9，加拿大

摘要
在大而复杂的网络上对线性二次高斯最优控制问题进行建模在计算上是不可行的。图论提供了一种方法来克服这些困难，该方法通过为无限长的图序列定义极限对象，从而允许用无限维算子来近似任意大的网络。通过使用Q噪声（Q-noise）将这一方法扩展到随机系统中，Q噪声是在有限维空间中对维纳过程的推广，适用于函数空间中的过程。定义了在具有Q噪声干扰的图论系统上的线性二次问题的最优控制，并证明其是相应有限图最优控制问题的极限。该理论进一步扩展到了有限秩系统，并提出了一个完全详细的特例。此外，还计算了针对某些示例Q噪声分布的最坏情况长范围平均最优控制性能。

1. 引言
大型图在现代系统建模和分析中很常见，特别是在优化和控制方面。从互联网到电力生成和分配，再到社交网络，复杂网络几十年来一直是研究的重点。然而，对于所有足够大的网络，使用标准方法进行全局建模和分析是不可行的。
处理大型网络的一种方法是使用图论（Lovász，2012年）。非正式地说，图论是在单位正方形上定义的一个函数，它代表了图序列的邻接矩阵的极限。因此，使用图论对大型系统进行建模可以允许在函数分析框架内近似非常大的网络，从而实现对其建模、分析和设计。本文将大型图上的线性二次高斯（LQG）问题理论扩展到了图论上的LQG问题。
Medvedev（2014年）首次在系统动力学中引入了图论的应用，并在Medvedev和Simpson（2023年）的工作中进一步发展。以前关于图论控制的研究主要集中在确定性系统上（Gao & Caines，2019年、2020年、2021年），而图论上的随机平均场博弈则在Caines和Huang（2021年）、Caines和Huang（2018年）、Tchuendom等人（2020年）、Gao等人（2021年）以及Lacker和Soret（2023年）的研究中有所探讨。图论平均场博弈特别扩展到了大型稀疏图的情况，参见Lacker和Soret（2022年）、Cui和Koeppl（2022年）以及Caines（2022年）的工作。
Gawarecki和Mandrekar（2011年）介绍了在无限维空间中构建维纳过程的方法，Fabbri等人（2017年）将它们用于无限维控制中。随后在图论控制和博弈中使用Q维纳过程，试图解决图论框架中每个节点处特殊维纳过程带来的可测性问题。例如，Aurell等人（2022b年）在线性二次图论平均场博弈中使用了Fubini扩展，Aurell等人（2022a年）在流行病博弈中也解决了这个问题。Liu等人（2019年）首次对图系统上的Q维纳过程进行了初步研究。在Dunyak和Caines（2022年）的工作中，引入了称为Q噪声的时空高斯噪声作为具有布朗干扰的图序列的系统极限对象。Medvedev和Simpson（2023年）提出了一种用于图论系统中模拟Q噪声系统的数值方法。Liu和Firoozi（2025年）也探索了具有Q维纳过程的平均场博弈。
研究分布在具有空间相关噪声的大网络上的系统控制问题，是由于Q噪声理论在具有经济代理人地理分布的问题中的潜在应用而激发的。例如，整个系统可能由空间分布的节点组成，这些节点之间的代理人的动态演变和互动状态具有显著的价值，这可能发生在对可再生和不可再生资源进行受控开发的建模中，包括那些具有价值环境特性的资源。分析分布在大网络上的大型随机代理人群体的复杂性，构成了发展基于图论极限对象的受控系统Q噪声理论的动机。
本文表明，可以通过图论极限来近似解决大型图上的线性二次Q噪声最优控制问题。在这里，通过分析图论极限来近似解决希尔伯特空间中的线性二次高斯问题。分析依赖于Ichikawa（1979年）中的希尔伯特空间方法，该方法在这里被扩展到长范围平均LQG问题，前者通过极限论证得出，后者在纯局部控制的情况下通过相应的代数Riccati方程解决。
这项研究的另一个重要领域是通过有限秩系统来近似大型图系统。特别是当图论极限的秩M<∞时，一个足够大的图上的系统可以用M维线性系统来近似。对于确定性系统，Gao和Caines（2020年、2021年）首次展示了这种有限秩收敛性。

在接下来的部分中，我们将解释为什么用图论和Q噪声极限来建模大型网络上的线性二次高斯系统是合理的。第2节中，我们定义了本文中使用的符号，并总结了Q噪声系统的相关先验结果。第3节提出了有限维线性二次高斯系统收敛到无限维线性二次Q噪声系统的形式证明，以及长范围平均问题。第4节将Gao和Caines（2021年）中提出的有限秩图论分析扩展到Q噪声系统。第5节展示了Q噪声方法的有用性，即证明大型无权随机图上的LQG问题的解可以通过原始系统的图论极限派生的低阶系统来很好地近似。第6节为未来的研究提供了一些方向。

1.1 动机：网络系统和图论
定义两个图GAN=(VN,EAN)和GBN=(VN,EBN)，它们都有N<∞个顶点，以及相应的邻接矩阵AN和BN。设xN:[0,T]N→R是一个状态向量，其中第i个值与图的第i个顶点相关联，设uN:[0,T]N→RN是每个顶点的控制输入。为了清晰起见，下面考虑的是每个节点都有标量状态的系统。该理论可以直接扩展到每个节点都有向量状态的系统。设矩阵AN和BN的(i,j)项分别表示状态和控制输入对节点j的影响。对于每个节点，定义一个布朗运动，使得N分量布朗运动WtN具有严格正的协方差矩阵QN。设aN和bN是描述节点状态及其控制对其自身影响的常数。
最后，定义一个图上基于网络平均的控制系统（Gao & Caines，2020年），每个节点的方程为：
(1) dxti=(aNxti+∑j=1NAijNxtj+bNuti+∑j=1NBijNutj)dt+dWiN(t)，
或者以向量形式表示为：
(2) dxtN=((AN+aN)xtN+(BN+bN)utN)dt+dWN(t)。
假设AN和BN的项在N趋于无穷大时是均匀有界的，那么邻接矩阵序列{AN}和{BN}，1≤N<∞，映射到单位正方形上，它们的（不一定唯一的）相关图论极限（Lovász，2012年）收敛。图论是定义在[0,1]×[0,1]→[0,1]上的有界可测函数，描述了图序列的邻接矩阵的极限。这些分别表示为A和B（如Gao和Caines（2020年）中所述）。
当底层图是无向图时，其图论也是对称的。表示图论极限系统为：
(3) dxt=((A+aI)xt+(B+bI)ut)+dwt，
其中xt和ut是单位正方形上的平方可积函数，A和B是图论，a和b是实数常数，I是单位算子，wt是Q噪声，它是从有限维向量到单位正方形上的随机时变函数的广义高斯噪声，具体定义见第2.2节，满足定理2.1中的条件，以确保极限的存在性是均方意义上的。

1.2 线性二次Q噪声控制
设xtN是图GN上的网络控制系统状态，如方程（2）所示。假设MN是一个N×N的正矩阵，RN是一个N×N的严格正矩阵。那么具有终端时间T的控制系统的相关线性二次高斯最优控制问题通过最小化性能函数来定义：
(4) infu0TJ(x0,u)=infu0TE∫0TxtN?MNxtN+utN?RNutNdt。
极限问题的解与标准有限维LQG问题的形式相同，但方程的系数是算子值，解也是算子值。这项工作分析了这种网络平均最优控制问题序列的算子极限的性质，并表明极限问题的解可以通过相关Riccati方程的算子极限获得。

1.3 有限秩系统的特例
前一节中描述的系统定义在单位正方形上的平方可积随机函数空间LP2[0,1]中。一般来说，无法找到这样的系统的封闭形式解。然而，当系统的图论参数和Q噪声协方差函数的秩是有限的，则系统的状态在有限维空间中演化。这允许对特定图复杂但图论极限简单的系统进行建模，例如在Erdos-Renyi图上的系统。这将在第4节中进行探讨。

1.4 Q噪声模型的动机
为了说明Q噪声框架对于建模非常大的线性系统的价值，考虑两个在300个节点图上的线性随机系统。对于每个索引i∈{1,…,N}，两个系统的第i个节点的状态满足以下具有布朗干扰Wti的随机微分方程：
dxti=1N∑j=1NcosπiN?jNxtjdt+dWti,
x0i=1。
在第一个系统中，假设状态i和状态j之间的布朗运动干扰的协方差矩阵Qij=1?maxiN,jN是逐条给出的。随着节点数量的增加，这个系统在LP2[0,1]范数中收敛到Q噪声系统。在第二个系统中，假设布朗运动干扰Wti是独立的。结果是噪声的个别状态压倒了整个系统的轨迹。两个这样的系统在终端时间T=1时的样本轨迹如图1所示。
此外，还有一个基本的可测性考虑：对于实数α∈[0,1]参数化的Wiener过程Bα(t)，如果它们对于α∈[0,1]是独立的，则它们不存在为定义良好的随机过程。因此，有必要为高维系统引入一个明确的空间协方差概念。我们用Q噪声来解决这个问题。

下载：下载高分辨率图像（646KB）
下载：下载全尺寸图像
图1. 上图：图（5）的轨迹，每个节点都有独立噪声。由于独立噪声的幅度非常大，状态轨迹中没有明显的系统结构。下图：图（5）的状态轨迹，其中包含Q噪声干扰。虽然系统中存在噪声，但整体结构表明极限将在空间和时间上都是连续的。

2. 基础知识
2.1 符号
• 实数向量的集合，维度为m，表示为Rm。
• 图论（即，在单位正方形上用作线性积分算子核的有界对称函数），用斜体粗体大写字母表示，例如A、B和M。
• L2[0,1]表示单位正方形上的实数平方可积函数的希尔伯特空间。L2[0,1]配备了内积，表示为〈u,v〉。为了简洁起见，〈u,v〉有时写作v?u。
• 此外，LP2[0,1]表示单位正方形上的平方可积随机函数空间，其内积为（6）〈u,v〉=E∫01u(α)v(α)dα，相对于概率空间（Ω,F,P），我们将范数写作（7）‖u‖P2=〈u,u〉。
• L2[0,1]、LP2[0,1]和有限维空间中的单位算子表示为I。
• 形如A和B的算子具有结构A=A+aI，其中A是图论，a是实数标量。设M表示这些算子的集合。
• 具有核Q:[0,1]2→R的线性积分算子作用于函数f∈L2[0,1]，定义为（8）
(Qf)(x)=∫01Q(x,y)f(y)dy，?x∈[0,1]。
• 算子Q配备了标准算子范数‖Q‖op。当不引起歧义时，省略括号。
• 对于每个函数f∈L2[0,1]，如果满足以下不等式（9）?0≤∫01∫01Q(x,y)f(x)f(y)dxdy?〈Qf,f〉<∞，则称对称函数Q:[0,1]2→R为非负的：此外，用Q表示有界迹类对称非负函数的集合。集合Q是被称为Q噪声过程的随机过程类的有效协方差函数的集合。对于给定的线性系统xt，满足x?t=Atxt，Φ(t,s)表示求解xt=Φ(t,s)xs的半群解算子，对于任何给定的初始条件xs。Q噪声过程（时间区间[0,T]上的随机过程）将表示为wt。Q噪声过程的完整定义在下面的2.2节中给出。单位区间N个增量的划分表示为PN={P1,…,PN}，其中P1=[0,1/N]且Pi=(i?1/N,i/N]。一个在单位区间上分段常数的LP2[0,1]函数表示为v[N]，一个在笛卡尔积PN×PN上分段常数的自伴L2[0,1]算子M表示为M[N]（如果它的形式是M[N]=M[N]+mI）。这种表述对于将网络的N×N邻接矩阵映射到单位正方形上的函数是必要的，详见2.5.2节。

Q噪声公理
Q-Wiener过程的限制类在下面被公理化。QWN噪声过程最初应用于Dunyak和Caines（2022）的graphon系统，是满足以下公理的LP2[0,1]值随机过程：
1. 设Q∈Q，并定义乘积空间([0,1],B(0,1),μ[0,1])×([0,T],B(0,T),μ[0,T])×(Ω,F,P)，使用乘积测度μ[0,1]×μ[0,T]×P。对于所有t∈[0,T],α∈[0,1], ω∈Ω，定义可测随机变量w(α,t,ω):[0,1]×[0,T]×Ω→R。当含义明确时，省略ω的表示。
2. 对于所有α∈[0,1]，w(α,t)?w(α,s)对于所有t,s∈[0,T]是Wiener过程增量，且w(α,t)?w(α,s)～N(0,|t?s|Q(α,α))，其中w(α,0)=0对于所有α∈[0,1]。
3. 设wt?t′(α)=w(α,t)?w(α,t′)。那么，E[wt?t′(α)ws?s′(β)]=|[t,t′]∩[s,s′]|?Q(α,β)。

正交基示例：设{W1,W2,…}是一系列独立的布朗运动。设Q∈Q具有对角化的正交基{?k}k=1∞，其特征值为{λk}k=1∞。那么(10)g(α,t,ω)=∑k=1∞λk?k(α)Wk(t,ω)是一个QWN噪声过程。这种表述在文献中的通用名称是Q-Wiener过程（(Gawarecki & Mandrekar, 2011), Fabbri等人（2017)）。

2.3. Q噪声上的算子
定义2.1 M表示形式为M=W+cI的算子集合，其中W是一个有界自伴Hilbert–Schmidt积分算子（因此具有平方可和的特征值），将L2[0,1]映射到L2[0,1]，c>0是一个正常数，I是L2[0,1]上的单位算子。

定义2.2 Q噪声上的算子
设Q∈Q且wt是Q空间噪声。设M∈M，并且设s0，存在M>N>N0(?)使得
(27)E[‖wt[N]?wt[M]‖22]=E∫01(wt[N](α)?wt[M](α))2dα≤∑r=1∞∫01∑j=1MSjM(α)cj,rM?∑k=1NSkN(α)ck,rN2dα0，存在N0使得对于所有N>M>N0，
(34)E[‖x0[N]?x0[M]‖22]0，存在N0′使得对于所有N,M>N0′
(39)E[‖xt[N]?xt[M]‖2]0组成的有界泛函，m≥0且r>0。当控制输入ut适应于由wt生成的滤波器并且∫0T|ut|2dt<∞时，它是可接受的。此类问题从此被称为Q-LQG问题，并用它们的系统参数{A,B,Q,M,MT,R}表示。

定理3.1
假设M,R,MT是有界的正自伴L2[0,1]算子，并且R:L2[0,1]→L2[0,1]是可逆的。那么，性能函数(42)可以通过ut=?R?1B?Stxt最小化，其中S:[0,1]×[0,1]×[0,T]→R是对于所有t的L2[0,1]线性算子，其核满足以下Riccati方程，
?ddt〈Stv,v〉=2〈Av,Stv〉?〈StBR?1B?Stv,v〉+〈Mv,v〉，?v∈LP2[0,1]
(43)ST=MT。

此外，由于所有算子A,B,Q,M,R,MT都是有界的，St满足算子Riccati方程的（更强的）经典解概念，即?S?t=A?St+StA?StBR?1B?St+M，
(44)ST=MT。

证明
对于第一种温和解的情况，参见Ichikawa (1979, 第4节)其中F=I,D=0,C=0（因此Γ(?)=0且Δ(St)=0）。对于第二种经典解的情况，参见Bensoussan等人（2007, 第IV-I部分, 第3.2节）。

推论3.1.1 Ichikawa, 1979
给定一个具有参数{A,B,Q,M,MT,R}的Q-LQG问题，其中St是解决(43)的自伴L2[0,1]算子。St在L2[0,1]非负算子空间中是唯一的。此外，价值函数由下式给出：
(45)V(xt,t)=〈Stxt,xt〉+∫tTtrace(SrQ)dr。

正如预期的那样，Q噪声的强度不改变最优控制ut，但确实影响Q-LQG问题的价值函数。

根据定理3.1，给定L2[0,1]的一个正交归一化基{?k}k∞：(53)trace(S∞Q)=∑k=1∞〈S∞?k,Q?k〉。限制在M=I，‖Q‖HS=1和‖A‖HS=1的情况下，这个值对于对应于A的最大特征值的特征函数来说是最大的。引理3.3 最大迹引理设M=I，并且{?k}k=0∞是A的正交归一化特征向量集，其特征值分别为{λk}k=0∞。设λˉ=supkλk和λ?=infkλk，如果λˉ和λ?是在有限k下得到的，则它们的对应特征函数分别为?ˉ和??。那么，对于形式为A=A+aI的系统，(54)sup‖Q‖HS=1trace(S∞Q)=sup‖Q‖HS=1∑k〈S∞?k,Q?k〉=(λˉ+a)+(λˉ+a)2+1。当λˉ是在有限k下得到的时，该值达到上界；而当??是在有限k下得到的时，该值达到下界。证明注意，算子(A2+I)可以表示为(55)A2+I=A2+2aA+(a2+1)I=∑k=1∞λk2〈?,?k〉?k+2aλk〈?,?k〉?k+(a2+1)〈?,?k〉?k=∑k=1∞((λk+a)2+1)〈?,?k〉?k。取（必然为正的）特征值的正根，我们得到算子根(56)(A2+I)1/2=∑k=0∞(λk+a)2+1〈?,?k〉，进而得到(57)S∞=∑k=0∞(λk+a)+(λk+a)2+1〈?,?k〉?k。首先，假设??是在有限k下得到的。然后，设置Q=〈?,??〉得到(58)trace(S∞Q)=(λ?+a)+(λ?+a)2+1。由于Q受到‖Q‖HS=1的限制，并且特征基是正交归一化的，给任何其他特征函数赋一个正值都不能增加这个值。同样地，如果下界λ?是在有限k下得到的，那么当Q=〈?,??〉时，可以得到最小值(59)trace(S∞Q)=(λ?+a)+(λ?+a)2+1。如果上界（或下界）不是在有限k下得到的，那么当λk→∞=0时，意味着上界（或下界）值为(60)trace(S∞Q)=a+a2+1，通过设置Q=〈?,?k〉对于任意大的k都可以使这个值任意接近。为了说明引理3.3，表1中展示了一些最坏情况的例子，将S∞值与T=1时的St值进行比较（此时局部激励项a=0）。在每个例子中，底层图A只有非负的特征值，最佳情况下的成本相同（即trace(S∞Q)=1）。当相关算子是无限维的时候，系统不能被完全模拟。然而，当算子是有限维的时候，系统可以被完全分析为一个N维系统。表1. 不同图的性质与Hilbert–Schmidt范数有界噪声协方差Q的最坏情况性能比较。计算H.S.范数（trace(S∞Q）2与方程(54)计算出的最大值是一致的。图性质A的最大特征值||S∞Q||H.S.2A(x,y)=(x2?1)(y2?1)0.5331.666A(x,y)=0.5 (Erdos-Renyi)0.51.618A(x,y)=cos(2π(x?y))0.51.618A(x,y)=1?max(x,y) (UAG)0.4051.484S.W. (σ=0.1,γ=0.3)0.1831.2004. 有限秩图在这里，高和Caines (2021)中描述的理论通过添加随机扰动被扩展到Q噪声系统。这需要对手询噪声协方差算子Q生成的子空间施加额外的约束。定义线性算子T的一个不变子空间S?L2[0,1]为这样的子空间：对于所有x∈S，(61)x∈S?Tx∈S。表示S的正交补空间S⊥，使得对于所有v∈S和所有v?∈S⊥，〈v,v?〉=0。这将L2[0,1]划分为两个正交空间S和S⊥，因此L2[0,1]=S⊕S⊥。如果对于所有v?∈S⊥，有Tv?=0，则称算子T相对于不变子空间S是有限秩的。对于由(12)生成的给定线性Q噪声图过程，其中A=A+aI，B=B+bI，以及具有协方差算子Q的Q噪声wt，做出以下有限秩图（FRG）假设：•(FRG1) S由有限数量的正交归一化L2[0,1]函数生成，记为f=(f1,…fN)。•(FRG2) 算子A和B是有限秩自伴图算子，它们共享非平凡不变子空间S。即对于所有v?∈S⊥，有Av?=0和Bv?=0。•(FRG3) wt是有限维的，并且有形式为(62)wt=∑k=1NλkfkWtk的表示。等价地，协方差算子Q相对于S是有限秩的。根据(FRG1)，由(12)生成的线性Q噪声图过程的状态过程可以分解为两个正交分量(63)?xt?xtf+x?t，xf∈S，x?∈S⊥，其中xtf是xt到S的正交投影，x?t是xt到S⊥的正交投影。因此，xtf由S的元素线性组合构成，x?由S⊥的元素线性组合构成。类似地，ut可以分解为(64)?ut?utf+u?t。根据Q噪声公理，wt被定义为与Q的特征基相关联的加权维纳过程的总和。因此，wt也可以相对于S和S⊥分解为其正交分量。这具有一般形式(65)wt=wtf+w?t，其中?wtf?(wt|S)=∑r=1N〈∑k=1∞λk?kWtk,fr〉fr=∑r=1N(∑k=1∞λk〈?k,fr〉Wtk)fr，(66)?w?t?(wt|S⊥)=wt?wtf。根据(FRG3)，wt相对于A和B的共同不变子空间S是有限秩的，因此wtf=w，w?t=0，且x?t是确定性的。因此，这些过程根据(67)演化dxtf=((A+aI)xtf+(B+bI)utf)dt+dwt，dx?t=(ax?t+bu?t)dt，x0f∈RN，x?0∈LP2[0,1]。值得注意的是，由于A和B的有限秩假设，正交过程x?t是对角的——单位区间上的每个点都按照一维线性微分方程演化。由于这种分解，系统可以被建模为一个有限维系统。4.1. 投影到不变子空间S为了将有限秩线性Q噪声图系统投影到有限维不变子空间S，定义RN值的状态过程xtf, utf：(68)?xtf?[〈xtf,f1〉,〈xtf,f2〉,…,〈fN,xtf〉，(69)?utf?[〈utf,f1〉,〈utf,f2〉,…,〈fN,utf〉，即xtf和utf是投影到由f定义的坐标空间上。类似地，定义以下N×N矩阵(70)??Aij?〈Afi,fj〉，Bij?〈Bfi,fj〉，(71)Q=diag({λk}k=1N)，并让Wtf是一个具有协方差矩阵Q的N维维纳过程。然后状态过程xtf等价地根据有限维微分方程(72)演化dxtf=((A+aI)xtf+(B+bI)utf)dt+dWtf，(73)x0f=[〈x0f,f1〉,〈x0f,f2〉,…,〈fN,x0f〉。这种构建允许对xtf和utf进行低维分析，然后可以通过将每个元素[utf]k与其对应的基函数fk关联起来映射回LP2[0,1]空间(74)?utf=∑k=1[utf]kfk?utf°f。这种方法特别适用于有限秩图系统上的线性二次问题。4.2. 有限秩线性二次控制考虑一个图Q-LQG最优控制问题，其中算子为A=A+aI和B=B+bI，成本算子为M、MT和R。与标准Q-LQG问题一样，目标函数是(75)J(u,x0)=E[∫0T(〈Mxt,xt〉+〈Rut,ut〉)dt]+E[〈MTxT,xT〉。通过对xt和ut进行正交分解，(76)〈xt,Mxt〉=〈xtf+x?t,M(xtf+x?t〉，(77)=〈xtf,Mxtf〉+〈x?t,Mx?t〉，〈ut,Rut〉=〈utf,Rutf〉+〈u?t,Ru?t〉。与A和B算子类似，N×N实数矩阵M和R可以定义为(78)??Mij?〈Mfi,fj〉，Rij?〈Rfi,fj〉，(79)MTij=〈MTfi,fj〉。然后，最优控制问题可以分解为以下N维LQG最优控制问题（可以使用标准的Riccati方程方法解决）和L2[0,1]确定正交过程(80)J(u,x0)=Jf(uf,x0f)+J?(u?,x?0)，(81)?Jf(uf,x0f)?E[∫0T((xtf)?Mxtf+(utf)?Rutf)dt+(xTf)?MTxTf]，(82)dxtf=((A+aI)xtf+(B+bI)utf)dt+dCtf，(83)x0f=[〈x0f,f1〉,…,〈x0f,fN〕，x0f∈RN，(84)J?(u?,x?0)=∫0T(x?t?Mx?t+u?t?Ru?t)dt+x?T?MTx?T，(85)dx?t=(ax?t+bu?t)dt。(86)x?0∈LP2[0,1]。此外，当M、MT和R相对于f是有限秩的（除了对角常数之外），那么J?(u?,x?0)的最小化解实际上是一维的，因为反馈控制是对角的，每个α∈[0,1]的系数都是相同的。定理4.1定义一个Q-LQG问题，其系数为{A+aI,B+bI,Q,M+mI,MT+mtI,R+rI}，其中所有算子相对于一个正交子空间S都是秩N的，它们在S上的投影分别记为{A,B,Q,M,MT,R}。那么，优化控制ut0由(87)?ut0?utf+u?t给出，ut0∈LP2[0,1]，t∈[0,T](88)?utf?∑k=1[?(R+rI)?1(B+bI)?Ptxtf]kfk，(89)?u?t??b2rptx?t，其中Pt和pt是解决以下N维和一维Riccati方程的时变算子(90)?Pt?=(A+aI)?Pt+Pt(A+aI)?Pt(B+bI)?1(B+bI)Pt+(M+mI)，(91)PT=(MT+mTI)，Pt∈RN×N(92)p?t=2apt?b2rpt2+m，(93)pT=mT。这个结果类似于Gao和Caines (2021)中展示的确定性有限维图LQR解。Riccati方程(90)–(91)分别给出了标准的N维和一维算子解Pt和pt。使用解Pt，对于N维状态向量xtf的有限秩子空间LQG问题的优化控制由(94)utf=?(R+rI)?1(B+bI)?Ptxtf给出。通过将控制向量的第k个元素与相应的基函数fk关联起来，有限维控制可以映射回原始空间。类似地，虽然正交状态补空间x?t是无限维的，但由于状态过程的对角性质，反馈增益是一维的，可以通过解决标量Riccati方程(92)–(93)找到最优控制。这给出了utf和u?t的最优控制，因此也给出了ut0的最优控制。5. 数值示例对于以下数值模拟，单位区间[0,1]被划分为N个段落，第k个段落Ik表示为(95)??I1?[0,1N],Ik?(k?1N,kN]。在每个例子中，N=50，模拟系统的状态遵循形式(96)dxt[N]=(A[N]xt[N]+B[N]ut[N])dt+dwt[N]，如方程(21)所示。这个离散化系统被用作无限维系统的近似解。在接下来的部分中，A=A+0.1I和B=0.1I，其中A是对称图，I是单位算子。为了模拟Q-LQG问题，我们设置一个终止时间T=1，并使用时间增量Δt=0.001实现欧拉方法。有三个关键结果需要展示：首先，线性二次高斯有限图系统收敛到图系统的过程。接下来，可以将具有有限秩图极限的图系统有效地表示为有限秩分解。最后，我们证明了有限时间范围内的反馈解收敛到无限时间范围内的解。为了比较轨迹，我们引入了两个系统轨迹xt和yt在时间t的根平方距离(97)rmd(xt,yt)=〈xt?yt,xt?yt〉。5.1. 有限秩有限图收敛考虑使用以下W随机图(Lovász, 2012)核生成的有限图：(98)A(α,β)=(α2?1)(β2?1)，α,β∈[0,1]。显然，A是一个秩为一的图，其基函数由(99)f(α)=(α2?1)∫01(β2?1)2dβ给出，α∈[0,1]。对于划分I的每一对网格点，独立采样一个Bernoulli随机变量来在这对点之间生成一条边，边的概率由(100)P(eij=1)=A(αi,αj)给出，αi,αj∈[0,1],i,j∈{1,…,N}。这创建了一个包含50个节点的图，如图3及其邻接矩阵所示。尽管其秩为一，但有限的邻接矩阵A[N]是满秩的。与第3.2节类似，为了模拟最坏情况，Q噪声扰动被施加在基函数f上(101)wt(α)=f(α)Wt，α∈[0,1]。然后，可以使用标准方法解决有限图LQG问题，并用定理3.2解决极限系统。有限图系统的轨迹如图4-I所示，通过将A[N]投影到正交基函数f上生成的有限秩系统如图4-II所示。这是通过模拟系统(102)dxtf=(〈A[N]f,f〉+0.1)xtf+0.1utfdt+dWtf，(103)dx?t=(0.1x?t+0.1u?t)dt,t∈[0,1]，(104)x0f∈R1,x?0∈LP2[0,1]实现的，其中〈A[N]f,f〉+0.1等于常数1.7251。尽管有限图的邻接矩阵是满秩的，但(分段常数)系统投影到由f生成的特征空间上捕获了有限轨迹的行为。使用A代替A[N]生成的极限系统如图5-I所示，有限图系统和极限系统轨迹的根平方差异随时间的变化如图5-II所示。下载：下载高分辨率图像（208KB）下载：下载全尺寸图像图3. 左：一个五十个节点的W随机图。右：用于数值模拟的关联邻接矩阵。黄色方块表示一条边，蓝色方块表示没有边。尽管极限系统的秩为一，但邻接矩阵的秩为49（因为它有49个唯一的特征值）。下载：下载高分辨率图像（370KB）下载：下载全尺寸图像图4. 上：使用分段常数图A[N]生成的系统。中：当A[N]投影到特征空间上生成的系统轨迹。下：有限图系统轨迹与投影图系统轨迹的根平方这种情况在一般的Q-Wiener过程文献中很常见（例如参见Fabbri等人（2017年）以及Gawarecki和Mandrekar（2011年）的研究），但我们对从有限图到图论极限（graphon limit）的收敛性分析可能没有直接的类似研究。本文仅关注具有完全观测数据的集中式控制问题。一个扩展方向是将Kalman滤波器应用于具有部分观测数据的系统，并定义Q-LQG问题与最优滤波算法之间的分离原理。

热点排行