UGSCE-BNN：一种基于不确定性引导的对称交叉熵贝叶斯神经网络，用于工业时间序列预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月13日 来源：Knowledge-Based Systems 7.6

编辑推荐：

　　不确定性引导的对称交叉熵贝叶斯神经网络框架提出数据划分策略、动态先验分布及对称交叉熵损失，有效提升多变量时间序列预测的精度与不确定性量化能力，实验验证其在复杂噪声数据下的鲁棒性。

Jiahui Long|Xiang Jia

国防科技大学系统工程学院，中国长沙，410003

摘要

多变量时间序列预测在工业应用中发挥着关键作用，准确的预测和可靠的不确定性量化对于做出明智的决策至关重要。贝叶斯神经网络作为一种有前景的方法脱颖而出，因为它能够提供概率预测并捕捉不确定性。然而，它们的性能常常受到一些挑战的限制，包括缺乏有效的先验分布、数据利用效率低下以及Kullback-Leibler散度的不对称性。为了解决这些问题，我们提出了Uncertainty-Guided Symmetric Cross-Entropy Bayesian Neurial Network（UGSCE-BNN）框架。该框架引入了三项关键创新：（1）一种基于不确定性的数据划分策略，以提高数据利用效率和学习效果；（2）一种数据驱动的先验分布，用于整合不确定性并增强模型的表达能力；（3）使用对称交叉熵代替Kullback-Leibler散度作为BNN中的损失函数，从而提供更强大和可靠的预测能力。UGSCE-BNN在合成数值数据和真实世界雷达数据集上进行了评估，包括基线比较和消融研究。结果表明，UGSCE-BNN在处理复杂和噪声数据时具有更高的预测准确性和鲁棒性。这些发现突显了该框架的通用性和可靠性，使其成为工业应用中的有力解决方案。

引言

随着传感器的迅速普及、设备连接的增加以及自动化监控系统的广泛采用，时间序列数据在各个领域的应用范围不断扩大[1]、[2]。在时间序列分析的众多挑战中，多变量时间序列预测（MTSF）已成为一项关键任务。这涉及到根据历史观测数据预测多个相互依赖变量的未来值[3]、[4]，如图1所示。在这种情况下，输入数据包含多个影响因素，这些因素由预测模型进行处理以生成目标时间序列。这些因素可以分为随时间变化的动态因素和在特定时期内相对稳定的静态因素。

例如，在雷达系统中，预测测量指标需要考虑静态和动态因素。静态因素（如温度和飞行路径）虽然保持稳定，但会从根本上影响雷达信号的传播特性和检测能力。动态因素（如信噪比）会随时间变化，显著影响检测范围和整个系统的性能。整合这些不同类型的影响因素对于实现准确的雷达预测至关重要。

在工业应用中，准确的预测能力至关重要[5]，包括预测和维护（PHM）[6]、[7]、预测设备的关键性能指标[8]、[9]以及检测操作数据中的异常[10]、[11]、[12]。然而，工业时间序列数据通常具有非线性、非平稳性和变量间复杂相互依赖性等特性。这些特性给准确预测带来了重大挑战。传统的统计方法往往难以捕捉这些非线性和动态关系[13]，而基于神经网络的方法由于能够直接从数据中建模复杂非线性模式而受到重视[14]。

尽管取得了这些进展，但大多数现有方法主要关注点估计而非全面的不确定性量化，这限制了它们在风险敏感的工业应用中的实用性[15]。它们的确定性本质限制了它们表达预测不确定性的能力[16]。在存在测量噪声、认知限制和外部干扰等重大不确定性的情况下，这种局限性尤为突出[17]。这些不确定性往往导致不可靠的预测，使得决策者难以有效评估可靠性或风险[18]。

如图2所示，不确定性量化可以实现区间估计，不仅提供点预测，还提供置信区间。这在高风险的工业环境中尤为重要，因为不准确的预测可能导致操作中断、安全隐患或重大财务损失。因此，缺乏不确定性量化会限制从数据中提取有价值的信息，从而限制了深入分析和理解的机会[19]、[20]。为了解决这些挑战，本研究提出了一种时间序列预测框架，该框架专注于量化不确定性，深入探索高不确定性区域的信息，并充分利用数据的潜力。

不确定性量化已成为提高预测可靠性和鲁棒性的关键研究方向[21]。在神经网络领域，三种方法论框架受到了广泛关注：高斯过程回归（GPR）[22]、[23]、贝叶斯神经网络（BNNs）[24]、[25]和神经网络集成[26]、[27]。这些方法代表了基于神经网络的不确定性量化技术的前沿。GPR提供了高度准确的不确定性估计，但在应用于大型数据集时难以扩展。神经网络集成通过聚合多个模型的预测来近似不确定性，但计算成本较高且在捕捉随机不确定性方面存在局限性。相比之下，BNN将贝叶斯原理融入神经网络中，能够在保持可扩展性和灵活性的同时有效建模随机和认知不确定性。鉴于这些优势，本研究采用BNN作为实现时间序列预测中可靠不确定性量化的基础。

BNN通过将概率分布应用于模型参数而不是使用固定值，扩展了传统神经网络的功能，从而允许不确定性在网络架构中传播[28]。这种贝叶斯形式允许整合关于参数分布的先验知识，显著提高了预测准确性和计算效率[29]。在BNN中，先验分布的选择对模型行为和性能至关重要[30]，常见的选择包括零均值高斯先验[31]和马蹄形先验[32]，它们提供了简洁性和数学上的便利性。然而，固定先验往往缺乏对数据特定特征的适应性，这可能会在复杂场景中限制性能。为了克服这一缺点，本研究采用数据驱动的先验[33]，根据数据的上下界定义高斯先验参数，动态确定参数。通过利用数据界限来确定先验参数，避免了依赖任意假设，提供了一个更原则性和精确的框架来编码先验知识。

在BNN框架内，已经开发了几种推理技术来近似难以处理的后验分布，每种技术都在理论严谨性和实际适用性之间提供了不同的权衡[21]。马尔可夫链蒙特卡洛（MCMC）方法[34]、变分推断（VI）方法[35]和蒙特卡洛Dropout模型[36]是BNN中不确定性量化的三种主要策略。MCMC提供了高度准确的不确定性估计，但在大规模模型上计算成本过高。MC Dropout轻量且易于实现，但只能提供粗略的不确定性近似。VI在效率和近似质量之间取得了平衡，使其能够扩展到大型数据集，同时保持实际应用的灵活性。本研究选择VI作为核心推理方法，并引入创新改进以提高其在时间序列预测中的准确性和有效性。

VI通常通过最小化Kullback-Leibler（KL）散度[37]来估计后验分布，该散度衡量近似后验分布和真实后验分布之间的差异。然而，KL散度的不对称性可能导致评估偏差和训练不稳定。为了缓解这些问题，引入了对称交叉熵（SCE）[38]作为替代方案，提供了更平衡和稳定的后验近似。这种改进提高了不确定性估计的准确性和训练过程的鲁棒性，确保了时间序列预测的可靠性。

为了解决上述挑战，本研究提出了一个改进的BNN框架，提高了多变量时间序列预测中的不确定性量化、模型适应性和鲁棒性。本工作的主要贡献总结如下：

基于不确定性的数据划分策略。提出了一种新颖的数据划分方法，利用初步的不确定性量化结果来识别最具信息量的数据子集，然后将其用作验证集。这种方法通过有效地将不确定性信息纳入数据中，提高了模型校准和预测准确性。

数据驱动的自适应先验分布。

引入了一种数据驱动的方法来构建自适应先验分布，其中网络参数的高斯先验均值和方差是根据数据区间界限动态确定的。这种方法减少了手动选择先验的主观性，并增强了模型对多样化和复杂数据集的适应性。

对称交叉熵损失函数。

开发了一种对称交叉熵损失函数，用于评估真实后验分布和近似后验分布之间的差异。与KL散度相比，它避免了由其不对称性引起的偏差，从而提供了更准确的后验近似和更稳定的训练过程。

全面的实验验证。

在标准数值基准数据集和真实世界雷达数据集上进行了全面实验。结果表明，所提出的框架在各种场景下始终实现了更高的预测准确性和不确定性校准。

本文的其余部分结构如下：第2节介绍相关方法和背景知识。第3节介绍所提出的框架。第4节描述实验和结果。最后，第5节总结本文。

部分摘录

多变量时间序列预测模型

多变量时间序列预测方法的发展经历了从传统统计方法到复杂机器学习技术的演变。传统统计方法基于明确的数学公式，旨在建模时间依赖性和变量间的交互作用。这些方法，如多元线性回归（MLR）[39]、向量自回归（VAR）模型[40]和自回归积分滑动平均（ARIMA）[41]，提供了

方法论

本节详细介绍了Uncertainty-Guided Symmetric Cross-Entropy Bayesian Neurial Network（UGSCE-BNN），这是一种用于多变量时间序列预测的改进型贝叶斯神经网络框架。所提出的方法引入了三项关键创新：基于不确定性的数据划分策略、自适应先验分布和对称交叉熵损失，从而提高了不确定性量化和模型鲁棒性。

实验

为了验证所提出预测方法的有效性，我们在两个不同的数据集上进行了实验。这些实验包括与神经网络中经典不确定性量化方法的比较、分析每个组件贡献的消融研究，以及研究不同损失函数和超参数敏感性的影响。

结论

本文提出了UGSCE-BNN框架，该框架整合了三项关键创新：一种基于不确定性的验证集划分策略，用于提高数据利用效率；一种数据驱动的高斯先验，用于将不确定性纳入模型；以及使用SCE代替KL散度以提高鲁棒性和可靠性。在数值数据和雷达数据集上的实验表明，该框架具有鲁棒性和适应性，通过有效平衡实现了更高的预测准确性

CRediT作者贡献声明

Jiahui Long：撰写——原始草稿、可视化、验证、方法论、形式分析、数据整理、概念化。Xiang Jia：撰写——审稿与编辑、监督、项目管理、资金获取。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本工作部分得到了中国国家自然科学基金（NSFC）的支持，项目编号为72271238，以及自主项目编号202501-RCGC-ZZ-039。

联系信箱：

粤ICP备09063491号

摘要

引言

部分摘录

多变量时间序列预测模型

方法论

实验

结论

CRediT作者贡献声明

利益冲突声明

致谢

热点排行