在工业应用中,准确的预测能力至关重要[5],包括预测和维护(PHM)[6]、[7]、预测设备的关键性能指标[8]、[9]以及检测操作数据中的异常[10]、[11]、[12]。然而,工业时间序列数据通常具有非线性、非平稳性和变量间复杂相互依赖性等特性。这些特性给准确预测带来了重大挑战。传统的统计方法往往难以捕捉这些非线性和动态关系[13],而基于神经网络的方法由于能够直接从数据中建模复杂非线性模式而受到重视[14]。
尽管取得了这些进展,但大多数现有方法主要关注点估计而非全面的不确定性量化,这限制了它们在风险敏感的工业应用中的实用性[15]。它们的确定性本质限制了它们表达预测不确定性的能力[16]。在存在测量噪声、认知限制和外部干扰等重大不确定性的情况下,这种局限性尤为突出[17]。这些不确定性往往导致不可靠的预测,使得决策者难以有效评估可靠性或风险[18]。
如图2所示,不确定性量化可以实现区间估计,不仅提供点预测,还提供置信区间。这在高风险的工业环境中尤为重要,因为不准确的预测可能导致操作中断、安全隐患或重大财务损失。因此,缺乏不确定性量化会限制从数据中提取有价值的信息,从而限制了深入分析和理解的机会[19]、[20]。为了解决这些挑战,本研究提出了一种时间序列预测框架,该框架专注于量化不确定性,深入探索高不确定性区域的信息,并充分利用数据的潜力。
不确定性量化已成为提高预测可靠性和鲁棒性的关键研究方向[21]。在神经网络领域,三种方法论框架受到了广泛关注:高斯过程回归(GPR)[22]、[23]、贝叶斯神经网络(BNNs)[24]、[25]和神经网络集成[26]、[27]。这些方法代表了基于神经网络的不确定性量化技术的前沿。GPR提供了高度准确的不确定性估计,但在应用于大型数据集时难以扩展。神经网络集成通过聚合多个模型的预测来近似不确定性,但计算成本较高且在捕捉随机不确定性方面存在局限性。相比之下,BNN将贝叶斯原理融入神经网络中,能够在保持可扩展性和灵活性的同时有效建模随机和认知不确定性。鉴于这些优势,本研究采用BNN作为实现时间序列预测中可靠不确定性量化的基础。
BNN通过将概率分布应用于模型参数而不是使用固定值,扩展了传统神经网络的功能,从而允许不确定性在网络架构中传播[28]。这种贝叶斯形式允许整合关于参数分布的先验知识,显著提高了预测准确性和计算效率[29]。在BNN中,先验分布的选择对模型行为和性能至关重要[30],常见的选择包括零均值高斯先验[31]和马蹄形先验[32],它们提供了简洁性和数学上的便利性。然而,固定先验往往缺乏对数据特定特征的适应性,这可能会在复杂场景中限制性能。为了克服这一缺点,本研究采用数据驱动的先验[33],根据数据的上下界定义高斯先验参数,动态确定参数。通过利用数据界限来确定先验参数,避免了依赖任意假设,提供了一个更原则性和精确的框架来编码先验知识。
在BNN框架内,已经开发了几种推理技术来近似难以处理的后验分布,每种技术都在理论严谨性和实际适用性之间提供了不同的权衡[21]。马尔可夫链蒙特卡洛(MCMC)方法[34]、变分推断(VI)方法[35]和蒙特卡洛Dropout模型[36]是BNN中不确定性量化的三种主要策略。MCMC提供了高度准确的不确定性估计,但在大规模模型上计算成本过高。MC Dropout轻量且易于实现,但只能提供粗略的不确定性近似。VI在效率和近似质量之间取得了平衡,使其能够扩展到大型数据集,同时保持实际应用的灵活性。本研究选择VI作为核心推理方法,并引入创新改进以提高其在时间序列预测中的准确性和有效性。
VI通常通过最小化Kullback-Leibler(KL)散度[37]来估计后验分布,该散度衡量近似后验分布和真实后验分布之间的差异。然而,KL散度的不对称性可能导致评估偏差和训练不稳定。为了缓解这些问题,引入了对称交叉熵(SCE)[38]作为替代方案,提供了更平衡和稳定的后验近似。这种改进提高了不确定性估计的准确性和训练过程的鲁棒性,确保了时间序列预测的可靠性。
为了解决上述挑战,本研究提出了一个改进的BNN框架,提高了多变量时间序列预测中的不确定性量化、模型适应性和鲁棒性。本工作的主要贡献总结如下:
基于不确定性的数据划分策略。提出了一种新颖的数据划分方法,利用初步的不确定性量化结果来识别最具信息量的数据子集,然后将其用作验证集。这种方法通过有效地将不确定性信息纳入数据中,提高了模型校准和预测准确性。
数据驱动的自适应先验分布。
引入了一种数据驱动的方法来构建自适应先验分布,其中网络参数的高斯先验均值和方差是根据数据区间界限动态确定的。这种方法减少了手动选择先验的主观性,并增强了模型对多样化和复杂数据集的适应性。
对称交叉熵损失函数。
开发了一种对称交叉熵损失函数,用于评估真实后验分布和近似后验分布之间的差异。与KL散度相比,它避免了由其不对称性引起的偏差,从而提供了更准确的后验近似和更稳定的训练过程。
全面的实验验证。
在标准数值基准数据集和真实世界雷达数据集上进行了全面实验。结果表明,所提出的框架在各种场景下始终实现了更高的预测准确性和不确定性校准。
本文的其余部分结构如下:第2节介绍相关方法和背景知识。第3节介绍所提出的框架。第4节描述实验和结果。最后,第5节总结本文。