状态估计是控制理论和工程学科中的基础支柱,它能够从随时间变化的噪声测量数据中推断出不可观测的内部系统状态(如位置、速度或热力学变量)[1]。现代状态估计方法主要基于贝叶斯推断,包括卡尔曼滤波器(KF)及其非线性扩展,如扩展卡尔曼滤波器(EKF)、无迹卡尔曼滤波器(UKF)和粒子滤波器(PF)[2]。
经典的KF通过递归预测-校正机制为线性高斯系统提供最优最小方差估计。对于非线性动态,EKF通过围绕当前估计值对状态转移和观测模型进行局部线性化来近似解,但在高度非线性情况下容易受到近似误差的影响,从而降低性能。UKF通过无迹变换来克服这些限制,它传播一组确定的西格玛点来捕获均值和协方差统计信息,而无需显式线性化。相比之下,PF利用顺序蒙特卡洛采样在非线性、非高斯环境中近似后验分布,特别适用于多模态或重尾噪声情况。这些方法已广泛应用于惯性导航[3]到故障检测和隔离[4],[5]等领域,为稳健的决策和反馈控制策略提供了支持。
尽管这些方法非常有效,但它们都假设对底层系统模型有精确的了解——这一关键假设在现实世界中经常因参数不确定性、未建模的动态或外源干扰而受到违反。在模型不匹配的情况下实现稳健的状态估计仍然是鲁棒控制和滤波理论中的一个持久且艰巨的挑战[6]。
虽然EKF、UKF和PF被广泛使用,但它们本质上受到模型近似、线性化或采样方法的限制,在高度非线性、不确定的条件下效果较差。例如,当系统表现出强烈的非线性或与其名义模型有很大偏差时,EKF容易产生显著误差。同样,UKF虽然在处理非线性方面优于EKF,但仍需要精确的协方差估计,且当系统模型不精确时往往表现不佳。PF在处理复杂噪声分布时虽然具有高度灵活性,但计算复杂性和效率低下,尤其是在处理高维系统时。
相比之下,2007年Habibi提出的平滑变结构滤波器(SVSF)在这些情况下具有明显优势。SVSF受到滑模控制的启发,构建了一个切换超平面,并使用不连续的校正增益来驱动状态估计向真实轨迹收敛,使其本质上对模型不确定性和外部干扰具有鲁棒性。这种鲁棒性使SVSF在系统动态未知或高度非线性的情况下比EKF、UKF和PF表现得更好。与依赖于线性近似的EKF和UKF不同,SVSF可以直接适应系统动态的突然变化,如故障或外部扰动,而无需重新线性化或复杂的滤波步骤。
此外,SVSF能够在完全可观测和可控的情况下将估计误差限制在真实状态流形的有限子空间内,使其特别适合存在不确定性的实际系统。SVSF不受EKF的线性假设或PF的计算负担的限制,为非线性状态估计任务提供了更具可扩展性和适应性的解决方案。
基于扩展卡尔曼滤波器的平滑变结构滤波器(EK-SVSF)[9]结合了EKF的精确估计能力和SVSF的鲁棒性。这种混合设计在名义条件和不确定的动态环境中都能实现最佳性能,使其特别适用于行为不可预测的非线性系统的状态估计任务。
然而,EK-SVSF部署中的一个关键障碍是平滑边界层(SBL)的参数化,它控制着从不连续切换到连续切换的过渡。过宽的SBL会通过减弱校正作用降低估计精度,而过窄的SBL则会加剧抖振现象——即类似噪声的高频振荡[8]。这种二分法需要谨慎权衡,以在保持闭环稳定性的同时最小化估计误差协方差的迹。此外,鉴于系统动态的时变性质,SBL必须具有自适应特性,以跟踪不断变化的不确定性和噪声统计信息。
因此,设计一个时变的SBL成为EK-SVSF中的核心理论挑战,通常被概念化为从模型差异和瞬时估计残差到SBL的函数映射。现有的策略包括启发式的试错调整到先进的元启发式方法,包括随机搜索和进化算法[10]、[11]。然而,普遍存在的模型不确定性经常阻碍收敛到全局最优配置,使得SBL合成在认知模糊性下成为一个受限的优化问题。
因此,设计一个时变的SBL成为EK-SVSF中的核心理论挑战,通常被概念化为从模型差异和瞬时估计残差到SBL的函数映射。现有的策略包括启发式的试错调整到先进的元启发式方法,包括随机搜索和进化算法[10]、[11]。然而,普遍存在的模型不确定性经常阻碍收敛到全局最优配置,使得SBL合成在认知模糊性下成为一个受限的优化问题。
作为回应,控制和估计领域的数据驱动方法越来越受到重视[12],它们利用机器学习从经验数据中提取模式,而无需依赖显式模型。本文提出了一种数据驱动的SBL确定框架,专门设计用于增强对模型不确定性的鲁棒性。其核心是部署了一个深度学习架构,直接从残差序列中推断时变SBL参数,通过多目标损失函数平衡抖振抑制(通过能量范数量化)和估计精度。传统的损失加权方法通常依赖于手动校准或超参数扫描,导致灵活性不足或计算开销。为了规避这一点,我们提出了一种基于变异系数的自适应加权机制[13],根据它们的相对分散动态平衡损失贡献,从而实现高效且上下文感知的优化(图1)。
总之,本文提出了一种数据驱动的EK-SVSF,称为DEK-SVSF。这项工作的主要贡献有两个方面:1)一种模型不可知的、数据驱动的时变SBL宽度计算方法,消除了对不确定动态的依赖,并且可以推广到任意不确定的系统;2)一种基于变异系数的创新自适应加权方案,用于协调多损失目标,减少对初始超参数的敏感性并提高学习效果。
本文的结构如下:第2节回顾了EK-SVSF的发展历程。第3节阐述了EK-SVSF的公式及其提出的方法。第4节通过双重实验验证和比较评估来支持该方法。第5节总结了结论并指出了未来研究的方向。