基于残差的、非因果的、基于管道的随机模型预测控制用于波浪能转换器，具备自适应方差紧缩和概率安全特性

《Ocean Engineering》：Residual-driven non-causal tube-based stochastic model predictive control for wave energy converters with adaptive variance tightening and probabilistic safety

【字体：大中小】 时间：2026年05月10日 来源：Ocean Engineering 5.5

编辑推荐：

　　滕刚|姚张|塔辛·特兹多甘南安普顿大学工程学院，南安普顿，SO17 1BJ，英国摘要本文提出了一种基于残差的、非因果的管状随机模型预测控制（SMPC）框架，用于波浪能转换器（WEC），以在随机海况下最大化吸收的能量，同时确保概率安全性。短时域的波浪激励力预测被

　　滕刚|姚张|塔辛·特兹多甘
南安普顿大学工程学院，南安普顿，SO17 1BJ，英国

摘要
本文提出了一种基于残差的、非因果的管状随机模型预测控制（SMPC）框架，用于波浪能转换器（WEC），以在随机海况下最大化吸收的能量，同时确保概率安全性。短时域的波浪激励力预测被整合到前视滚动时域控制器中，而干扰不确定性则通过轻量级的方差更新递归在线从波浪预测残差中校准。所得到的时变干扰方差用于驱动机会约束中的自适应管状紧固，有效风险水平进一步使用管覆盖信息在线校准，使控制器能够根据预测质量和闭环不确定性调整其保守性。此外，还采用了辅助的LQR反馈律和稳态卡尔曼滤波器来提高鲁棒性和可实现性，并包含软约束以确保在罕见不利情况下的可行性。控制动作是通过在每个采样时刻解决一个温启动的二次规划来获得的。使用在英国康沃尔郡海岸收集的真实波浪数据进行的仿真结果表明，所提出的方法将吸收的能量保持在确定性MPC基准的1%以内，同时实现了92%的升沉位移和90%的升沉速度的管覆盖率。结果表明，该方法在预测辅助的WEC控制中具有改进的尾部风险行为和有利的性能-风险权衡。

1. 引言
在生态退化和化石燃料枯竭的双重压力下，清洁能源的发展已成为全球优先事项。在海洋可再生能源中，波浪能因其高能量密度、相对可预测性和广泛的地理分布而具有吸引力（Falnes和Kurniawan，2020；Guo和Ringwood，2021；Gao等人，2026）。然而，其实际部署受到高平均能源成本、低转换效率以及在高度可变的海况下维持安全和高效运行的困难的限制（Drew等人，2009；Wang等人，2024a；Gao等人，2025）。尽管波浪能利用已经研究了很多年（Falc?o，2010；H. Li等人，2022），但要实现高转换效率仍需要能够在恶劣和高度可变的海洋条件下有效运行的稳健设备和控制设计。近年来，人们在各种类型的波浪能转换器（WEC）及其控制策略的开发上投入了大量努力，包括点吸收器、振荡水柱和衰减器（Manan Jariwala等人，2025）。特别是基于预测的非因果控制展示了通过利用短时域波浪预测信息来提高能量收集的明显潜力（Zhan和Li，2018）。这里使用的“非因果”一词表示k时刻的最优控制动作明确依赖于有限预测范围内的未来波浪信息，因此未来波浪信息有助于当前的控制动作，而不仅仅是k时刻之前的信息（Ringwood等人，2014；Zhan和Li，2018；Zhan和Ringwood，2024）。然而，可实现的性能强烈依赖于预测的准确性，不准确的波浪预测会显著降低非因果控制方案的有效性（Li等人，2018）。

为了支持基于预测的控制，已经研究了一系列波浪预测方法，包括基于模型的估计、数据驱动的预测器和基于上游感测的框架（Wang等人，2024b）。尽管取得了这些进展，但基于预测的WEC控制的有效性仍然强烈依赖于预测质量，点吸收器仍然需要主动控制才能在变化的海况下维持满意的能量捕获（Hals等人，2011）。模型预测控制（MPC）已被广泛应用于WEC，因为它可以明确处理多变量动态和操作约束（Zhang等人，2020）。然而，针对WEC的MPC对现实海况下的建模误差和预测不确定性仍然很敏感（Lorenzen等人，2019）。基于管状的MPC通过辅助反馈和约束紧固提高了鲁棒性，而RMPC可以强制满足最坏情况的约束，但往往以增加保守性和减少能量捕获为代价（Evans等人，2014；Lasheen等人，2017）。这激发了随机模型预测控制（SMPC）的发展，它通过机会约束或紧化的确定性近似提供了更灵活的性能-风险权衡（Zhang等人，2023；Mesbah，2016）。

波浪能量转换的控制目标可以表述为一个受限的非因果能量最大化问题，其中控制动作依赖于未来的波浪激励力信息（Zhang和Li，2019）。在所提出的实现中，所需的未来波浪激励力信息由有限时域的AR预测器在线提供，而不是预先假设已知。实际上，预测质量有限，影响WEC运行的不确定性是随机的和时变的（Yildirim和Karniadakis，2015；Ligeikis和Scruggs，2023）。这为SMPC设计带来了实际挑战：用于处理概率约束的紧固必须足够保守以确保安全，但又不能过于保守以至于不必要的牺牲能量捕获。

尽管取得了这些进展，许多现有的SMPC公式仍然依赖于随时间固定的干扰描述和风险设置（F. Li等人，2022；Santos等人，2020）。这对于WEC操作可能是限制性的，因为波浪激励环境和短时域波浪预测的质量在运行过程中可能会发生显著变化（Ma等人，2025）。固定的干扰方差可能与控制器看到的实际残差不确定性不匹配：如果它高估了真实不确定性水平，则会导致管状紧固过紧，从而减少能量捕获；如果它低估了真实不确定性水平，则会削弱概率约束的约束力并降低闭环可靠性。因此，需要一个能够从预测残差中在线更新其不确定性描述并在运行过程中校准其有效风险水平的SMPC框架，而不是依赖于时间不变的随机设计。

为了解决上述限制，本文提出了一种基于残差的、非因果的管状SMPC框架，用于WEC，其中波浪预测残差用于在线更新干扰方差，由此产生的时变不确定性水平直接驱动自适应的机会约束紧固。同时，使用经验管覆盖信息在线校准有效风险水平，使控制器能够根据预测质量和实现的闭环不确定性调整其保守性。为了实际实现，采用了面向线性控制的流体动力学模型，而辐射模型不匹配、残差流体动力学非线性、PTO损耗和相关植物模型差异通过干扰通道表示为累积的随机不确定性。

本文的主要贡献如下：
1. 开发了一种基于残差的、非因果的管状SMPC框架，用于WEC的受限能量最大化控制，其中干扰方差从波浪预测残差中在线更新，而不是作为固定的静态量规定，从而允许在时变预测不确定性下进行自适应的随机紧固。
2. 引入了一种自适应的风险校准机制，使用经验管覆盖信息在线调节每一步的机会约束水平，以便根据实现的闭环不确定性调整控制器的保守性，而不是预先固定。
3. 通过结合短时域激励力预测、时域均匀的方差紧固策略、辅助的LQR反馈律和稳态卡尔曼滤波器，构建了一个计算上轻量级的实现，保持了实时控制的可行性。
4. 使用在英国康沃尔郡海岸收集的真实波浪数据验证了所提出的方法（Zhang等人，2019；Li和Belmont，2014），结果表明它在随机海况下保持了能量导向的性能，并改善了尾部风险性能。
5. 在算法1中总结了完整的实施导向SMPC工作流程，支持可重复性和实际部署。

本文的结构如下：第2节介绍WEC动态系统的数学建模。第3节分析非因果SMPC的结构设计。第4节展示仿真结果和分析。第5节对本文进行总体总结。

下载：下载高分辨率图像（179KB）
下载：下载全尺寸图像

图1. 点吸收器的示意图。

2. WEC动态系统的数学建模
本节介绍了单点吸收器的动态模型。采用了面向线性控制的流体动力学模型以实现可控的控制器合成，而残差流体动力学非线性、辐射模型不匹配、PTO损耗和其他植物模型差异被视为通过随后引入的随机干扰描述来处理的累积不确定性。
2.1 WEC的升沉动态和流体动力力学力表示
2.1节介绍了WEC的升沉动态和流体动力力学力表示。
2.2节将流体动力学模型转换为面向控制的状态空间模型及其离散时间形式，这引入了建模不确定性。
2.3节描述了如何将WEC的能量最大化目标和物理约束统一为非因果MPC优化问题。

2.1 WEC动态建模
图1显示了液压动力取放（PTO）的部分结构设计，其中液压缸垂直安装在浮标下方，并固定在海床底部。zw和zv分别是海浪高度和浮标中点的位置。有关此设计的更多细节可以在Weiss等人（2012）中找到。当前研究主要集中在深水中的实际海况，尚未考虑浅水条件。在这种情况下，WEC的PTO位移通常视为升沉位移zv。PTO力由fu表示，它表示作用在缸内活塞上的力。输出功率P为P??fuz?v。在[t0,t1]期间吸收的能量为E=∫t0t1P(t)dt。浮标的升沉运动受到PTO力的限制：|fu|≤umax。点吸收器浮标的动态方程（Yu和Falnes，1995）由牛顿第二定律给出：
(1) msz?v=?fs?fr+fe+fu
其中ms是浮标质量。恢复力fs由下式给出：
(2) fs=kszv
其中静水 stiffness 由ks=ρgs给出，ρ表示水密度，g表示标准重力，s表示浮标的横截面积。辐射力fr由下式给出：
(3) fr=m∞z?v+∫?∞∞hr(τ)z?v(t?τ)dτ
其中m∞是附加质量，hr是辐射力的核，可以通过液压软件包计算。卷积项(3)可以通过因果的有限维状态空间模型近似为fr?∫?∞∞hr(τ)z?v(t?τ)dτ。
(4a) x?r=Arxr+Brz?v
(4b) yr=fr=Crxr≈∫?∞thr(τ)z?v(t?τ)dτ
其中(Ar,Br,Cr,0)是状态空间实现，xr∈Rnr是状态。根据Yu和Falnes（1995），波浪激励力fe由下式给出：
(5) fe=∫?∞∞he(τ)zw(t?τ)dτ
其中he是激励力的核，状态空间近似为：
(6a) x?e=Aexe+Bezw
(6b) ye=fe=Cexe≈∫?∞∞he(τ)zw(t?τ)dτ
其中(Ae,Be,Ce,0)是状态空间实现，xe∈Rne是状态。

2.2 状态空间模型
利用(4)的状态空间建模，(1)的面向控制的全序状态空间模型可以表示为：
(7a) x?=Acx+Bucu+Bwcw
(7b) z=Czx
(7c) v=Cvx
其中w是波浪激励力，其预测被纳入控制器设计中，x?[zv,z?v,xr]表示系统状态向量，z?zv表示垂直位移，v?z?v表示相应的速度。相应的输出矩阵定义为Cz=1001×nr，Cv=0101×nr，Cc=CzCv。矩阵(Ac,Buc,Bwc)为：
(8) Ac=010?ksm0?Crm0
BrAr,Buc=01m0，Bwc=01m0
m?ms+m∞。

为了制定MPC方案，将连续时间模型(7)转换为离散时间模型(9)：
(9a) xk+1=Axk+Buuk+Bwwk
(9b) zk=Czdxk
(9c) vk=Cvdxk
其中(A,Bu,Bw)是(Ac,Buc,Bwc)的离散时间形式，Czd和Cvd分别是连续时间输出矩阵Cz和Cv的离散时间输出矩阵。zk是升沉位移，vk是升沉速度。所得到的离散时间模型为以下部分开发的控制器设计提供了基础。

2.3 控制优化问题
基于第2.1节定义的连续时间WEC动态和约束，引入了相应的离散时间公式进行控制设计。时间k的输出功率和从时间0到时间k的能量输出为：
(10a) Pk??vkuk
(10b) Ek??ts∑i=0kviui
为了安全运行，zk、vk和uk的约束表示为：
(11) |zk|≤Φmax
|vk|≤vmax
|uk|≤umax
其中Φmax、vmax和umax分别表示最大允许的升沉位移、升沉速度和PTO控制力。控制目标是在满足(11)中的状态和输入约束的同时，最大化(10b)中定义的吸收能量。对于基于预测的滚动时域控制，波浪激励力由预测范围内的有界预测序列表示，写为：
(12) |wk|≤wmax
其中对应的np步波浪激励力预测由下式给出：
(13) wk=[wk|k,wk+1|k,…,wk+np?1|k]?
wmax表示用于预测和控制器设计中鲁棒性建模的激励力幅度的上限。

非因果WEC控制目标是在尊重状态和执行器限制的同时，在滚动时域内最大化吸收的能量。在其直接表述中，该目标受到吸收功率项 ?vk+i|kuk+i|k 的控制，这导致了在线实现中通常非凸的优化结构。为了保持实时可行性，本文开发的控制器采用了一个凸二次替代成本函数，该函数保留了原始表述中的能量导向行为，同时在预测、收紧和可行性约束下确保每个采样时刻都能可靠地解决二次规划（QP）问题。

3. 非因果SMPC结构设计
本节描述了所提出的非因果SMPC。本文使用“非因果”一词表示递归视界优化明确依赖于有限视界内的未来波浪激励力信息，而不仅仅依赖于当前时间可用的信息（Ringwood等人，2014年）。第3.1节解释了整体控制器策略。第3.2节介绍了SMPC架构设计。第3.3节介绍了一种基于自回归模型的波浪预测方法。

3.1. 整体策略
图2展示了所提出的非因果SMPC的整体框架。该框架结合了短视界波浪激励力预测、名义递归视界QP规划、基于管道的反馈校正和卡尔曼状态估计，在随机海况下实现能量最大化控制并具有概率安全性。递归视界自回归（AR）预测器提供了一个短视界的激励力预测序列 {w?k+i∣k}i=0N?1，该序列输入到名义预测模型中，得到的前馈输入序列是通过解决一个凸二次规划（QP）来获得的，该规划受到执行器限制和收紧的名义约束的约束。通过基于管道的结构实现了对不确定性的鲁棒性，其中辅助的LQR反馈律调节了与管道中心的偏差，产生了一个稳定的闭环误差过渡F?，而稳态卡尔曼滤波器根据位移和速度测量值重建了完整状态以用于实施反馈。驱动随机激励力建模和管道收紧的干扰强度使用一步预测的波浪残差ew(k)在线进行校准，该残差通过指数加权移动平均（EWMA）递归更新一个变化的可变方差Qwtime(k)，该方差具有方差下限。这个在线更新的可变方差通过误差协方差递归传播，生成自适应的管道半宽度和相应的概率约束收紧。概率安全性通过风险校准的概率约束和面向面的风险分配以及二阶矩收紧来强制执行，可行性则使用软约束和收紧保护措施来维持。最终的控制输入是通过结合名义QP动作和LQR校正形成的，利用非因果预测在随机波浪激励力下平衡能量捕获和概率约束满足。

3.2. 随机模型预测控制
在实际的波浪能转换（WEC）部署中，只有部分状态是直接可测量的，辐射动态的非因果、长记忆特性可能会加剧激励力预测误差对闭环性能的影响。为了解决这些挑战，本研究实现了一种基于管道的SMPC方案，用于在随机波浪激励力下进行操作。所提出的实现包括三个关键组成部分：(i) 一个稳态卡尔曼滤波器，它从位移和速度测量值中重建完整状态，即使在传感器噪声存在的情况下也能提供可靠的反馈；(ii) 一个非因果自回归（AR）预测器，它生成用于递归视界规划的短视界激励力预测序列；(iii) 通过从闭环误差动态传播的二阶矩获得的机会约束满足，以实现概率约束满足。为了提高实际可行性，引入了软约束以防止在极端实现下的偶尔不可行性，同时惩罚接近边界的操作，从而平衡了约束意识、鲁棒性和实时可实现性。

3.2.1. 具有非因果预测和在线方差校准的系统模型
离散时间控制导向模型表示为：(14)xk+1=Adxk+Bduk+Gdwk，其中xk∈Rn表示状态向量，uk∈R是PTO控制输入，Ad、Bd、Gd分别是离散时间状态矩阵、输入矩阵和干扰矩阵。递归视界自回归（AR）预测器提供激励力的条件均值预测，表示为w?k。因此，控制器相对于干扰信息是非因果的，因为控制决策在时间k时明确依赖于预测视界内的未来波浪激励力序列，而不仅仅依赖于时间k为止的信息。实现的激励力分解为：(15)wk=w?k∣k?1+w?k，E[w?k]=0，Var(w?k)=Qwtime(k)，其中w?k捕获了未建模的激励力变异性和预测误差，并在高斯采样中注入模拟中，使用学习到的变化方差以实现可重复的随机激励力实现。收紧映射可以改用Cantelli不等式以在潜在的非高斯重尾情况下保持保守性。

3.2.2. 管道分解和反馈收缩
为了管理不确定性，状态被分解为名义管道中心组件和随机偏差：(20)xk=x?k+ek，其中x?k表示管道中心，ek捕获由干扰、预测误差和建模不匹配引起的偏差。
与实现一致，管道中心使用无干扰的名义模型进行传播：(21)x?k+1=Adx?k+Bd?k|k，其中?k|k是在时间k优化的前馈控制序列的第一个元素。
为了收缩，设计了一个稳定的LQR增益KLQR，通过离散时间代数Riccati方程和权重Qx和Ru，fb。应用的控制律为：(22)uk=?k|k?KLQR(x?k?x?k)，uk∈[?Umax,Umax]，其中x?k是卡尔曼滤波器的状态估计。由此产生的闭环误差动态为：(23)ek+1=F?ek+Gdw?k，F?=Ad?BdKLQR，w?k～N0，Qwtime(k)，这意味着在稳定反馈下偏差的收缩，而随机项模拟了残余激励力的不确定性。在实现中，指令控制输入在[?Umax,Umax]范围内饱和。为了视觉化的数值鲁棒性，图表显示的轴限与硬边界对齐；用于管道覆盖和违规统计的记录状态轨迹不会被人为剪切。

3.2.3. 预测驱动的堆叠模型用于QP
在N步视界内，QP中使用的堆叠名义状态预测可以用紧凑的仿射形式表示为：(27)Z=Szx?k+SuΦ+SgW?k，其中Z=[x?k+1?,…,x?k+N?]?，Φ=[?k|k,?k+1|k,…,?k+N?1|k]?，预测向量W?k在(19)中定义。预测矩阵Sz、Su、Sg是根据离散时间模型构建的：Sz=AdAd2?AdN，Su=Bd0?0AdBdBd?0????AdN?1BdAdN?2Bd?Bd，(28)Sg=Gd0?0AdGdGd?0????AdN?1GdAdN?2Gd?Gd。为了表示方便，我们定义了预测驱动的仿射项：(29)zaff=Szx?k+SgW?k，Z=zaff+SuΦ，它将当前名义状态和激励力预测的已知贡献与决策变量贡献SuΦ分开。

3.2.4. 管道协方差传播和收紧的机会约束
鉴于(22)引起的闭环偏差动态，约束收紧是根据管道偏差的传播二阶矩构建的。因为辅助反馈使用了卡尔曼估计x?k，测量噪声可以通过反馈通道进入闭环。与实现一致，这种效应通过添加一个等效的过程噪声项来保守表示：(30)Qv=BvRvBv?，Bv=BdKLQRL，其中Rv是测量噪声协方差，L∈Rn×2是稳态卡尔曼增益。由于KLQR∈R1×n，因此Bv∈Rn×2。
一步协方差更新和视界复制。完整的视界依赖的协方差传播将提供更详细的不确定性增长阶段描述，但也会增加在线计算负担。为了保持轻量级和实时导向的实现，在线更新一个一步协方差代理，并将结果收紧均匀应用于整个预测视界。这种视界一致的策略保留了自适应的不确定性敏感收紧，同时避免了在每个采样时刻重复传播完整协方差序列的成本。设Σerr(k)表示维护的协方差状态。更新公式为：(31)Σerr(k+)=F?Σerr(k)F??+GdQwtime(k)Gd?+Qv，Σerr(k)←max(Σerr(k),Σmin)，然后通过对称化Σerr=12Σerr+Σerr?。下限逐项应用：(32)(Σmin)ii=0.012，i=1,0.022，i=2,0，i=3,4，(Σmin)ij=0，对于i≠j。在实现中，一步代理取为Σ1(k)?Σerr(k+)，并在构建收紧约束时跨视界复制。尽管这种近似没有明确区分视界内的阶段协方差增长，但它足以保持当前实现中实际在线约束处理所需的主要收紧行为。(?)(k+)表示在时间k应用一步协方差递归后的值，Σerr(k)表示在步骤k开始时的预更新值。
只有位移和速度约束被收紧。面向面的约束表示定义为：(33)H=1000001000?100000?1000，h=zmaxvmaxzmaxvmax，其中zmax和vmax分别是位移和速度限制。在每个时间步骤k，为每个约束面r∈{1,2,3,4}在线分配单边风险水平βr(k)。每步风险预算由βstep参数化，并在实现中满足∑r=14βr(k)=4βstep。βstep使用EWMA管道覆盖指标在线调整，以目标期望的经验管道覆盖，饱和界限βmin≤βstep≤βmax以保持数值鲁棒性。
让I{?}表示指示函数，并定义估计的管道偏差：(34)e?k=x?k?x?k。覆盖指标也可以使用实现的状态xk来评估，以报告经验管道覆盖。然而，在可实施的操作中，它是自然从x?k计算得出的。使用当前的管道半宽qz(k)σz(k)和qv(k)σv(k)，更新EWMA覆盖分数为：(35)p?in(k)=λcovp?in(k?1)+(1?λcov)12(I{|e?z,k|≤qz(k)σz(k)}+I{|e?v,k|≤qv(k)σv(k)}。其中p?in(k)∈[0,1]是EWMA对管道覆盖的估计，βstep在线调整以将p?in(k)引导到目标水平，饱和界限βmin≤βstep≤βmax以防止数值退化。在每个时间步骤，根据不确定性和与约束的接近程度将总风险预算4βstep分配给四个面。设σface,r(k)=HrΣ1(k)Hr?并定义一个名义松弛代理：(36)slackr(k)=hr?|Hrx?k|，r∈{1,2,3,4}。面权重设置为：wr(k)=σface,r(k)/slackr(k)，风险分配如下：(37)βr(k)=4βstepwr(k)∑j=14wj(k)，βr(k)∈(0,0.5)。
关于方差估计误差和实际安全性。机会约束收紧是根据在线方差估计构建的，因此对估计值和实际干扰水平之间的不匹配很敏感。低估干扰方差可能导致收紧不足，从而削弱预期的安全水平，而高估主要引入了额外的保守性。在所提出的设计中，通过几个实际的保护措施减少了这种敏感性，包括(18)中的方差下限、(32)中的协方差下限、(26)中的数据驱动的下限校准以及下面描述的在线风险重新校准。
在实现中使用的预测索引。
在时间步骤k，使用可用的预测向量解决QP：(19)W?k=[w?k+1,w?k+2,…,w?k+N]?，而(14)中的植物传播使用当前步骤实现的激励力，即w?k∣k?1加上具有方差Qwtime(k)的采样干扰w?k。w?k∣k?1表示用于基于残差的方差校正的一步均值预测，不包括在W?k中。

3.2.2. 管道分解和反馈收缩
为了管理不确定性，状态被分解为名义管道中心组件和随机偏差：(20)xk=x?k+ek，其中x?k表示管道中心，ek捕获由干扰、预测误差和建模不匹配引起的偏差。这些机制减少了在EWMA估计器对非平稳条件反应不佳时导致过松的风险，并有助于保持实际的约束能力和可行性。通过高斯和基于矩的保守选项来强化机会约束。给定分配的单侧风险水平βr(k)，考虑了两种强化映射。当为了计算方便采用高斯近似时，强化使用相应的正态分位数。或者，当对扰动分布的前两个矩之外的部分不信任时，可以通过Cantelli不等式获得一个保守的第二矩界限，这在潜在的非高斯重尾情况下仍然有效。在这两种情况下，强化都是从管道偏差的传递二阶矩计算得出的。在模拟中，仅使用高斯抽样来生成可再现的随机激励力实现，而强化映射可以根据假设的分布知识水平独立选择。(i) 高斯分位数强化。(38)qr(k)=z1?βr(k)，其中 (39)z1?β=2erf?1(2(1?β)?1)。(ii) 保守的第二矩强化（Cantelli）。(40)qr(k)=1?βr(k)βr(k)。为了方便表示，与位移面相关的分位数（r∈{1,3}）用qz(k)表示，与速度面相关的分位数（r∈{2,4}）用qv(k)表示。让Hr表示H的第r行，并定义每个面的标准差为：(41)σface,r(k)=HrΣ1(k)Hr?。然后每个面的强化界限由下式给出：(42)ηr(k)=hr?qr(k)σface,r(k)，并在预测范围内均匀应用，这与(31)中的范围统一协方差代理一致。为了防止由于过度强化而导致的数值不可行性，施加了一个小的正下界ηr(k)≥ηmin。如果被违反，实施将自动通过增加βstep来降低风险水平，直到恢复条件ηr(k)>ηmin。此外，还应用了物理上限，以确保隐含的管道半宽度不超过硬限制：(43)σz(k)≤0.95zmaxqz(k)，σv(k)≤0.95vmaxqv(k)。这些保护措施是为了在时间变化的强化下保持实际的滚动时域可行性；在报告的模拟中，所得到的QP在所有时间步都保持可行，无需手动膨胀管道。原始的每个面的机会约束是PrHrxk+i≤hr≥1?βr(k)，对于所有r∈{1,2,3,4}。使用堆叠矩阵H=H0?00H?????00?0H∈R4N×nN和堆叠的强化界限η(k)=1N?ηface(k)∈R4N，通过确定性不等式(44)HZ≤η(k)+s，s≥0来保守地执行，其中s∈R≥04N是一个非负松弛向量。(注：机会约束和可行性)机会约束是通过在采用的不确定性模型下风险校准的管道强化来执行的。为了在罕见的不利实现、模型不匹配和不完美的方差适应下保持滚动时域可行性，强化约束是通过在成本中加入非负松弛变量来实施的，这样可以在实现扰动超过当前强化捕获的不确定性水平时防止突然的不可行性，同时对这种违规行为保持明确的惩罚。3.2.5. 具有软约束的二次规划在每个时间步骤中，SPMC控制器解决一个前馈决策向量Φ的凸二次规划（QP），并增加一个非负松弛向量s∈R≥04N，在必要时放松强化的约束。这个凸二次形式用作原始非凸能量最大化目标的实现导向替代，以便控制器在协调随机强化和软约束处理的同时保持实时的可行性。引入松弛变量是为了在罕见的不利实现和植物模型不匹配下保持滚动时域可行性，并在成本中对其进行惩罚，以阻止约束放松。二次成本通过对名义状态和输入幅度进行惩罚来体现：(45)Q?=Qx0?000Qx??????000?0Qx00?00Pterm,R?=Ru0?00Ru?????00?0Ru。其中Ru?0是为了保持数值条件而保持固定的。使用堆叠的预测Z=zaff+SuΦ，QP的Hessian和由仿射分量引起的线性项为：(46)HQP=2Su?Q?Su+R??0，(47)fstate=2Su?Q?zaff。其中Ru?0意味着HQP?0，因此保证了凸性，性能差异可归因于扰动建模和管道强化的机会约束机制。使用堆叠的强化约束HZ≤η(k)+s（参见(44)）和Z=zaff+SuΦ，在每个时间步骤解决的QP为：(48)minΦ,s12Φ?HQPΦ+fstate?Φ+ρ‖s‖22s.t.H(zaff+SuΦ)≤η(k)+s,Umin≤Φ≤Umax,s≥0，其中ρ>0是松弛惩罚。问题是凸的，因为HQP?0。在实现中，通过将决策向量扩展为[Φ?s?]?加上Hessian HQP002ρI和线性项[fstate?0?]?来实现软形式，并使用quadprog和warm-start初始化进行解决。3.2.6. 通过稳态卡尔曼滤波器进行状态估计在考虑的WEC设置中，只直接测量位移和速度。测量模型为：(49)yk=Cmeasxk+vk，Cmeas=1000001000，其中yk∈R2且vk表示测量噪声。通过Riccati迭代离线计算一个稳态卡尔曼增益L，然后在闭环操作期间保持不变以最小化在线计算开销。相应的估计器递归为：(50)x?k+1=Adx?k+Bduk+L(yk?Cmeas(Adx?k+Bduk))，它使用创新yk?Cmeas(Adx?k+Bduk)来校正一步预测的状态。估计值x?k由辅助反馈(22)用来调节与名义管道中心的偏差，并计算可实施的管道覆盖指标。在当前的实现中，稳态增益是使用一个恒定的名义扰动/过程噪声水平Qw以及测量协方差Rv来计算的，而时变方差Qwtime(k)用于(i)在模拟植物中生成随机激励力扰动和(ii)在机会约束中的自适应管道强化。因此，非因果预测信息通过QP预测和强化机制影响控制动作，而不是通过估计器动态的时变修改。3.2.7. 性能指标瞬时吸收功率计算为：(51)Pk=?ukvk，其中vk是实现的重力速度，符号约定遵循采用的PTO力定义。累积吸收能量通过离散时间积分来评估：(52)Ek+1=Ek+TsPk，E0=0，Ns个样本上的平均吸收功率为：(53)P?=1Ns∑k=1NsPk。为了量化概率安全，让zdn(k)、zup(k)和vdn(k)、vup(k)表示样本k处的位移和速度的下/上限界限。经验管道覆盖比率计算为：pz=1Ns∑k=1NsI[xk]1∈[zdn(k),zup(k)]，(54)pv=1Ns∑k=1NsI[xk]2∈[vdn(k),vup(k)]，其中I{?}是指示函数。为了简洁地总结经验性能-风险权衡，报告了以下风险-成本指数：(55)Riskcost=1001?pz+pv2，当两个受限状态在所有样本中都保持在管道内时等于零，并且随着管道覆盖率的降低而增加。3.3. 通过自回归模型进行波浪预测为了提供非因果SPMC所需的短时域预测，使用递归最小二乘（RLS）识别了一个轻量级的自回归（AR）预测器。预测器作为一个计算效率高的在线预测模块，用于滚动时域规划，并包含在其中以保持控制架构的整体实时导向特性。采样时间为Ts，训练和预测持续时间分别为Ttrain和Tpredict。每个5秒的训练周期后进行1秒的预测阶段。总预测时间表示为Ttotal。每个预测范围覆盖Npred个离散预测步骤，训练-预测周期时间偏移为Nshift。初始正则化系数为αbase。为了确保训练数据在规模上保持一致，波浪数据被标准化为：(56)w?=w?μσ，其中w?表示标准化的波浪信号，μ和σ分别是w的均值和标准差。在进行多步预测之前，从最近的过去观测中构建一个初始回归向量?：(57)?=w?Ntrainw?Ntrain?1?w?Ntrain?p+1?，其中p是AR模型阶数。相应的一步预测由下式给出：(58)wpred=θ?，其中θ是参数向量。预测误差定义为：(59)epred=w??wpred，并用于递归更新预测器参数。为了提高数值鲁棒性，引入了一个动态正则化系数：(60)αdynamic=αdynamic(1+|epred|)，其中αdynamic初始化为αbase。RLS增益计算为：(61)K=P?′λrls+?P?′+αdynamic+l，其中λrls是遗忘因子，P是协方差矩阵，l是正则化项。参数更新遵循：(62)θk=θk?1+Kek,pred，协方差矩阵更新为：(63)Pk=(1?K?k?1)Pk?1λrls。为了保持预测器的轻量级和数值上的良好条件，AR阶数和正则化设置是使用标准的预测误差和信息准则检查来选择的，而不是通过引入更复杂的预测架构。对于多步预测，最新的预测值被递归反馈到回归器中。预测回归器初始化为：(64)?pred=w?1,predw?Ntrainw?Ntrain?1?w?Ntrain?p+2?，多步预测计算为：(65)w?pred=θ?pred。在每个预测步骤中，新预测的值被反馈回来更新回归器，从而为非因果控制器生成一个滚动的短时域预测序列。然后对预测值进行反归一化：(66)w?=w?predσ+μ，其中w?表示在原始尺度上的预测激励力估计。这个反归一化序列用于构建提供给滚动时域SPMC优化的短时域预测。下载：下载高分辨率图像（340KB）下载：下载全尺寸图像4. 仿真结果和分析本节展示了在Lenovo ThinkPad X13 Gen 2上使用MATLAB R2023b获得的仿真结果。仿真使用了在英国康沃尔海岸收集的真实波浪数据。为了确保公平比较，确定性MPC和提出的控制器使用相同的植物模型、相同的状态和输入约束，以及相同的预测范围。两个控制器都使用由有限视界预测器生成的相同非因果波浪激励力预览信息。不同之处在于，提出的SPMC额外包含了自适应随机强化、风险校准的机会约束和在线方差学习，而确定性MPC基线是作为没有随机强化的确定性QP来解决的。两个控制器使用相同的求解器配置和可比的二次惩罚，以确保优化条件的一致性。因此，比较突出了随机不确定性处理和自适应强化的效果，而不是预览可用性本身的效果。计算辐射力的脉冲函数的状态空间矩阵为：Ar=00?17.910?17.701?4.41Br=36.539475.1Cr=001。系统以ts=0.1s的采样时间进行离散化，提出的控制器按照算法1实施。仿真中使用的控制器参数总结在表1、表2、表3中。在每个采样时间，波浪预测在1秒的预测窗口内进行，相当于采样时间Ts=0.1s时的10步预测范围。表3中的参数是通过考虑波浪记录下的可行性、数值鲁棒性和经验闭环性能的数值调整试验选择的。遗忘因子λQ和λcov选择接近于1，以便在线适应保持平滑，同时对缓慢变化的不确定性条件做出反应。引入了界限βmin和βmax，以将风险校准机制保持在实际有意义的范围内，并避免过度薄弱或过于严格的强化。方差下限σfloor和松弛惩罚ρ被调整，以防止方差崩溃、减少过松和在罕见不利实现下保持可行性。图3比较了测量和预测的波浪激励力。预测器捕获了主导的短时域激励趋势，并提供了非因果SPMC使用的预测序列。相应的AR模型设置列在表2中。表1. WEC模型的物理参数。描述符号值浮质量ms242千克增加质量m∞83.5千克总质量m=ms+m∞325.5千克刚度ks3866 N/m控制输入限制umax3.5 kN重力位移限制Φmax1米重力速度限制vmax2米/秒表2. 自回归预测器的关键参数。描述符号值遗忘因子λrls0.99初始正则化系数αbase10?8正则化参数?10?8采样时间Ts0.1秒训练持续时间Ttrain5秒预测持续时间Tpredict1秒总预测时间Ttotal200秒预测范围步骤Npred10周期时间偏移Nshift10协方差矩阵P107×Ip单位矩阵Ip10?001?????00?01∈Rp×p表3. SMPC实施的关键参数。描述符号值预测范围长度N50方差遗忘因子λQ0.98方差下限（标准差）σfloor0.10松弛惩罚ρ100覆盖EWMA因子λcov0.99校准EWMA因子λcal0.99目标管道覆盖cov?0.90每步风险下限βmin0.05每步风险上限βmax0.25图4展示了所提出的基于管道的SPMC下的重力-位移响应。在200秒的仿真过程中，实现的位移始终保持在硬位移界限内，而自适应强化生成的时间变化概率管道实现了大约92%的经验管道覆盖。这表明残差驱动的方差更新和基于覆盖的风险校准在不需要牺牲可行性的情况下保持了有效的概率约束。这种经验上的约束行为特别相关，因为强化是由在线方差估计而不是精确的扰动统计驱动的。保持的高管道覆盖率提供了实际证据，表明所提出的保护措施有助于减轻在测试的非平稳条件下的方差估计滞后和不匹配的影响。下载：下载高分辨率图像（355KB）下载：下载全尺寸图像图3. 实际和预测的波浪激励力比较。实际波浪激励力（红色实线）。预测的波浪激励力（蓝色虚线）。图5展示了所提出的基于管道的SPMC下的重力-速度响应。实现的速度在整个仿真范围内满足了硬速度限制，自适应概率管道实现了大约90%的经验管道覆盖。结合位移结果，这确认了在线强化机制在随机波浪激励力不确定性下提供了有效的风险感知约束。下载：下载高分辨率图像（362KB）下载：下载全尺寸图像图4. 基于管道的SPMC下的重力位移时域响应。实线蓝色代表系统的真实位移轨迹，浅蓝色阴影区域代表概率管道的上限和下限。图6展示了所提出的基于管道的SPMC下的PTO控制输入的时域响应。在200秒的仿真过程中，指令力保持在规定的执行器范围内，表明在随机波浪激励力下保持了QP的可行性和有效的约束处理。控制信号会根据非平稳激励力的变化而快速响应，反映出滚动时域的重新规划和辅助反馈作用，同时保持有界和平滑的轮廓，不会出现持续的饱和现象。这种行为证实了控制器能够生成可行的实时指令，在执行器限制与闭环稳定性和能量吸收目标之间取得平衡。

下载：下载高分辨率图像（447KB）
下载：下载全尺寸图像

图5. 基于管状随机模型预测控制（SMPC）的纵荡速度时域响应。实线蓝色表示系统的实际速度轨迹，浅蓝色阴影区域表示概率管的上限和下限。图7、图8、图9分别展示了在能量最大化控制框架下获得的PTO控制输入、纵荡位移和纵荡速度的时域响应。在所有情况下，都满足了施加的状态和执行器约束。案例1对应于具有精确激励力预测的 proposed 控制器（蓝色实线曲线）。案例2对应于激励力预测误差为10%的 proposed 控制器（红色实线曲线）。案例3对应于确定性模型预测控制（DMPC）基线（黑色实线曲线），它使用与 SMPC 相同的有限时域非因果波预测，但不包括随机收紧或风险校准的机会约束。

下载：下载高分辨率图像（378KB）
下载：下载全尺寸图像

图6. 基于管状 SMPC 的控制输入时域响应。

下载：下载高分辨率图像（460KB）
下载：下载全尺寸图像

图7. 控制输入响应比较。具有精确预测的 proposed 控制器（蓝色实线）。具有不精确预测的 proposed 控制器（红色实线）。确定性模型预测控制（黑色实线）。

下载：下载高分辨率图像（389KB）
下载：下载全尺寸图像

图8. 纵荡位移响应比较。具有精确预测的 proposed 控制器（蓝色实线）。具有不精确预测的 proposed 控制器（红色实线）。确定性模型预测控制（黑色实线）。

下载：下载高分辨率图像（516KB）
下载：下载全尺寸图像

图9. 纵荡速度响应比较。具有精确预测的 proposed 控制器（蓝色实线）。具有不精确预测的 proposed 控制器（红色实线）。确定性模型预测控制（黑色实线）。

图10 通过将辐射子系统的有限冲激响应（FIR）近似与频率域中的精确离散时间无限冲激响应（IIR）表示进行比较，验证了所采用的近似方法。上方面板以对数刻度显示幅度，下方面板报告了归一化频率 Ω/π 的相位。两种响应在感兴趣的带宽范围内表现出密切的一致性，表明选定的 FIR 截断长度能够在保持 Huq(ejΩ) 的幅度和相位特性的同时，几乎不产生失真。这种验证非常重要，因为 FIR 形式使得预测控制器（例如通过卷积或提升状态增强）能够高效实现，同时保留了准确波到线模拟和可靠约束感知优化所需的主导辐射动态。因此，后续的 MPC/SMPC 比较不太可能因过于粗略的辐射近似而产生偏差，观察到的性能-风险行为主要归因于控制设计而非建模伪影。

图11 比较了在相同的200秒海况实现下，使用 proposed SMPC 和确定性 MPC 基准得到的吸收功率的的经验累积分布函数（CDF）。除了单个平均功率值外，CDF 还通过报告吸收功率不超过给定水平的概率提供了分布级特征，而互补的CDF 则报告超过该水平的概率。因此，该图突显了 SMPC 在相同状态和输入约束下如何重塑功率统计特性，例如通过减少不良低功率和负功率事件的频率和严重程度，并将概率质量从下行尾部重新分配。这种分布比较补充了累积能量结果，并提供了非因果预测和基于概率约束的管状收紧优化所实现的性能-风险权衡的额外证据。

下载：下载高分辨率图像（242KB）
下载：下载全尺寸图像

图10. Huq(ejΩ) 的频率响应，比较了精确的 IIR 模型和截断的 FIR 近似。图12 报告了下行功率的互补累积分布函数（CCDF），定义为负功率幅度 L=max(?P,0)，其中 P 表示瞬时吸收功率。对于给定的阈值 x≥0，尾部概率 P(L≥x) 量化了大型负功率事件的频率，即仅通过平均功率指标无法捕捉到的不良功率交换事件。

下载：下载高分辨率图像（182KB）
下载：下载全尺寸图像

图11. 200秒模拟时域内 SMPC 和确定性 MPC 的吸收功率累积分布函数（CDF）比较。与确定性 MPC 基线相比，SMPC 曲线在广泛的阈值 x 范围内显示出一致的较低尾部概率，表明所提出的风险感知优化减少了极端负功率事件的频率和严重程度。这种分布级证据通过明确表征尾部风险来补充累积能量和平均功率指标：较小的尾部意味着更好的运营稳健性和减少对罕见但可能有害的运营事件的暴露，同时仍然遵守施加的状态和输入约束。图13 展示了用于驱动 proposed SMPC 中自适应管状收紧的在线扰动方差跟踪。在每个控制步骤中，短时域波预测器提供激励力预测 Fpred(k)，然后计算预测残差 e(k)=Fact(k)?Fpred(k)。接着使用指数加权移动平均（EWMA）对 e2(k) 进行处理，以获得残差激励能量的平滑估计。由此产生的时变扰动方差 Qwtime(k) 遵循这一趋势，同时强制实施方差下限以避免协方差退化和过度积极的收紧。

下载：下载高分辨率图像（195KB）
下载：下载全尺寸图像

图12. 在 SMPC 和确定性 MPC 下负功率幅度的经验尾部概率（CCDF）。这种自适应机制将波预测精度直接与约束保守性联系起来：当残差能量增加时，Qwtime(k) 上升，管子相应地扩张；较小的残差导致较不保守的收紧。因此，控制器可以在不依赖于固定的、手动调整的扰动方差的情况下自动平衡性能和安全。这种自适应机制是 proposed SMPC 在预测质量变化时能够保持有利性能-风险权衡的核心原因，与不通过方差学习或风险校准在线调整其约束保守性的确定性 MPC 基线形成对比。图14 使用负功率幅度 L=max(?P,0) 的风险值（VaR）和条件风险值（CVaR）来量化尾部风险行为。对于置信水平 α（例如 α=0.95），VaRα 被定义为 L 的 α-分位数，CVaRα 被定义为超过 VaRα 的 L 的条件平均值。这些指标捕捉了尾部行为的互补方面：VaRα 确定了尾部阈值，而 CVaRα 测量了超出该阈值的平均严重程度。与确定性 MPC 基线相比，所提出的 SMPC 产生了较低的 VaRα 但较高的 CVaRα。这表明 SMPC 减少了不良尾部的起始水平，而最极端尾部区域的条件严重程度较高。因此，这种差异反映了下行尾部的重塑，而不是两种风险度量之间的矛盾。这些结果结合了平均功率和累积能量的比较，提供了在随机海况下尾部风险行为的分布意义视图。

下载：下载高分辨率图像（320KB）
下载：下载全尺寸图像

图13. 基于预测残差（EWMA）的残差驱动扰动方差跟踪用于管状收紧：Qwtime(k) 从预测残差估算得出。图15 报告了所提出的基于管状的 SMPC 下闭环状态的实验概率密度函数（PDF）。上方面板显示了纵荡位移的 PDF，下方面板显示了纵荡速度的 PDF。在这两种情况下，分布都集中在零附近并且大致对称，表明响应保持居中且没有持续漂移。此外，在随机激励力下有效约束的强制执行也体现在概率质量之外没有概率质量。这些分布特征支持了基于管状的 SMPC 在随机海况下调节系统并限制速度偏离的观点，并且在概率意义上满足了状态约束。

下载：下载高分辨率图像（146KB）
下载：下载全尺寸图像

图14. SMPC 和确定性 MPC 的负功率幅度的 VaR 和 CVaR。图16 比较了在相同海况实现下所提出的 SMPC 和确定性 MPC 基准的累积吸收能量。所提出的方法在实施自适应随机收紧和风险校准的机会约束的同时，将吸收能量保持在确定性基线的大约1%以内。这一结果表明，所提出的控制器在随机波激励下保持了以能量为导向的性能，同时实现了明确的风险感知操作。剩余的能量差异反映了稳健性的能量成本，即在不确定激励力下的最大能量捕获与更安全操作之间的权衡（见表4）。

下载：下载高分辨率图像（191KB）
下载：下载全尺寸图像

图15. 基于管状的 SMPC 的状态概率密度分布。上图显示了纵荡位移的概率密度函数，下图显示了纵荡速度的概率密度函数。与确定性 MPC 基线相比，所提出的 SMPC 的能量减少虽然较小但是一致的，可以解释为稳健性的能量成本。从物理上讲，SMPC 采用自适应随机收紧和风险校准的管状调节，每当估计的不确定性水平增加时，就会限制可允许的运动和控制范围。因此，控制器可能会有意避免一些在确定性公式下可以接受的激进能量最大化行为，但在不确定性下可能会使系统暴露于更高的不良偏离或负功率事件概率。从这个意义上说，观察到的能量损失不仅仅是一种数值惩罚，而是反映了在提高概率安全性和减少尾部风险暴露之间的有意权衡。

下载：下载高分辨率图像（174KB）
下载：下载全尺寸图像

图16. 确定性 MPC 和 SMPC 的能量捕获比较。表4. 在五种波系列下，非因果 SMPC 和 MPC 之间的能量统计比较。

表4. 在五种激励力预测误差 profile 下，非因果 SMPC 和 MPC 之间的能量统计比较。

波系列 | MPC (kJ) | SMPC (kJ) | 能量差异 (%)
|--------|---------|---------|-------------|--------|
| 199.25 | 98.52 | ?0.74 | | |
| 293.09 | 92.60 | ?0.53 | | |
| 386.89 | 86.44 | ?0.52 | | |
| 483.24 | 82.62 | ?0.74 | | |
| 580.81 | 80.09 | ?0.89 | | |
| 平均值 ± 标准差 | 88.66 ± 7.52 | 88.05 ± 7.51 | ?0.68 | ±0.16 |

为了进一步检验所提出自适应机制的泛化能力，在五种不同的激励力预测误差 profile 下进行了额外模拟，分别为0%、2.5%、5%、7.5%和10%。表5总结了确定性 MPC 和所提出的 SMPC 的相应累积吸收能量结果。随着预测误差的增加，两种控制器的吸收能量总体上都减少了，反映了在预测质量下降时预览信息的可用性降低。同时，两种控制器之间的能量差异在所有测试案例中都保持有限。这表明残差驱动的方差更新和在线风险校准允许所提出的 SMPC 随着预测质量的变化调整其保守性，同时保持稳定的闭环能量捕获性能。因此，这些额外结果进一步支持了所提出方法在不同预测误差条件下的实际适应性。图17 展示了从 JONSWAP 光谱（谱峰度 γ=1，即接近 Pierson–Moskowitz 形式的宽频谱）生成的不规则海况下的大规模模拟中获得的点吸收器的捕获宽度比（CWR）（Zhang 和 Li，2019）。峰值周期从1秒扫描到12秒，以1秒为增量，模型不确定性和波预测误差都在控制设计和性能评估中得到明确考虑。

表5. 在五种激励力预测误差 profile 下，确定性 MPC 和所提出的 SMPC 之间的累积吸收能量统计比较。

预测误差 | MPC (kJ) | SMPC (kJ) | 能量差异 (%) |
|--------|---------|---------|-------------|
| 0% | 99.25 | 98.52 | ?0.74 | |
| 2.5% | 97.34 | 96.77 | ?0.59 | |
| 5% | 95.53 | 94.93 | ?0.63 | |
| 7.5% | 93.84 | 93.05 | ?0.85 | |
| 10% | 91.87 | 91.14 | ?0.80 | |
| 平均值 ± 标准差 | 95.57 ± 2.89 | 94.88 ± 2.92 | ?0.72 | ±0.11 |

结果表明 CWR 与峰值周期之间具有非单调的依赖性：随着 Tp 的增加，CWR 首先上升然后下降，在大约 Tp≈4s 时达到最大值。这种行为与点吸收器的频率响应特性一致，即当主导波周期位于设备的主要响应带内时能量捕获最大，而当激励偏离该带时性能下降。总体而言，结果表明所提出的 SMPC 在适应波预测误差和模型不确定性的同时，保持了稳健的能量捕获性能。

下载：下载高分辨率图像（219KB）
下载：下载全尺寸图像

图17. 捕获宽度比（CWR）。

5. 结论
本文提出了一个基于残差的、非因果的、基于管状的随机模型预测控制（SMPC）框架，用于在随机海况下运行的波浪能量转换器。所提出的控制器在一个计算上可行的滚动时域架构中集成了短时域波激励力预测、基于管状的反馈校正和概率约束处理。该系统的核心特点是一种基于在线扰动-方差校准机制的随机收紧控制方法，该机制由波浪预测残差驱动，通过该方法可以根据观测到的预测质量持续更新用于随机收紧的不确定性水平。此外，通过使用经验性的波浪覆盖信息在线调整有效风险水平，从而能够在闭环运行期间实现约束保守性的自适应调节。使用从英国康沃尔海岸收集的真实波浪数据进行的仿真研究表明，所提出的方法在能源性能和概率安全性之间实现了良好的平衡。具体而言，控制器使累积吸收的能量保持在确定性模型预测（MPC）基准的约1%以内，同时通过自适应随机收紧和基于概率的波浪约束调节提供了风险意识强的运行。这种较小的能量损失反映了鲁棒性的能量成本，即在不确定性下实现能量最大化与更安全运行之间的权衡。在大部分仿真时间内，产生的位移和速度响应都良好地保持在概率波浪覆盖范围内，这表明所提出的基于残差驱动的收紧机制能够在不过度保守的情况下有效管理随机激励不确定性。这些结果支持了将非因果预测与自适应随机收紧相结合在波浪能 converters（WEC）控制中应用的实用价值。

本研究采用了一个以线性控制为导向的流体动力学模型，以确保数值上的易处理性和滚动时域实现的可行性。在该模型框架内，辐射模型不匹配、残差引起的流体动力学非线性、波浪转换器（PTO）损失以及相关植物模型的差异被视为通过扰动通道传递的整体随机不确定性。在更强的非线性运行条件下，例如大振幅机构运动或更明显的粘性效应下，实际扰动行为可能会偏离用于波浪约束调整的方差驱动不确定性描述，这可能会使得基于概率的约束近似变得不那么准确，可能需要更保守的收紧措施或更高精度的非线性预测模型。尽管当前的模型框架为控制器设计提供了实用且有效的基础，但仍然需要在更高精度的非线性模型和更广泛的不确定性条件下进行进一步验证，以评估在更具挑战性的海洋状态下的性能极限。

未来的工作将从几个方向扩展所提出的框架。首先，将针对更高精度的非线性和时变WEC模型开发控制器，以提高在能量需求更高和运行条件变化更大的情况下的鲁棒性。其次，将研究包括具有显式不确定性表征的学习型预测器在内的更先进的预测模块，以提高预测质量的同时保持实时可行性。第三，将在硬件在环（HIL）和实时实验环境中实现和评估完整的控制架构，以评估在实际部署条件下的计算延迟、估计器鲁棒性和端到端的约束处理能力。

作者贡献声明：
高腾：撰写——审阅与编辑、撰写——初稿、可视化、验证、软件开发、方法论研究、数据分析、概念化。
张瑶：撰写——审阅与编辑、监督工作、资源协调、项目管理工作、资金筹措、概念化。
Tahsin Tezdogan：撰写——审阅与编辑、监督工作。

热点排行