综述:传感器使能的智能能源网络中用于预测性维护和剩余使用寿命的生存模型:一篇综述

《Sensors》:Survival Models for Predictive Maintenance and Remaining Useful Life in Sensor-Enabled Smart Energy Networks: A Review Mohammad Reza Shadi, Hamid Mirshekali, Maryamsadat Tahavori and Hamid Reza Shaker

【字体: 时间:2026年03月21日 来源:Sensors 3.5

编辑推荐:

  这篇综述系统性地回顾了生存模型在智能电网和区域供热网络预测性维护中的应用,涵盖非参数、半参数、参数及机器学习方法,并重点阐述了应对删失(censoring)和截断的数据处理技巧,以及使用静态与时变协变量进行风险评估和剩余使用寿命(RUL)估计的策略,为研究人员和从业者提供了从模型选择、拟合到评估的实用指南。

  
在智能能源网络(包括配电网络和区域供热网络)的运维管理中,设备维护正从基于时间的计划性模式转向数据驱动的预测性模式。这些传感器使能的基础设施,其运行条件复杂多变,维护决策充满挑战。一个核心难题是,设备寿命数据常常是不完整的:预防性维护和有限的观察窗口会系统性地引入删失截断。如果忽视这些部分观测的寿命数据,将会导致有偏的推断和误导性的性能评估。生存模型,作为处理“时间-事件”数据的核心工具,为智能能源网络中的预测性维护剩余使用寿命估计提供了强有力的理论框架。
生存模型的分类学
本文提出了一个清晰的生存模型分类法,主要分为四大家族:非参数模型、半参数模型、参数模型和学习型模型。这张图概括了本文采纳的主要分类法。各类模型的核心区别在于对“时间-事件”过程的假设强度以及处理协变量影响的方式。
  • 非参数模型,如Kaplan-Meier和Nelson-Aalen模型,直接从观测到的事件数据描述生存行为,结构假设最少,适用于基线估计和描述性比较。
  • 半参数模型,以Cox比例风险模型及其变体为代表,在保持基线风险灵活性的同时,能够分析协变量(如传感器读数、工况信息)对风险的影响。
  • 参数模型,包括Weibull、Gamma、Gompertz、指数分布以及加速失效时间模型(如对数正态、对数逻辑斯蒂),设定了明确的寿命分布形式,在需要解释风险形状或进行外推预测时特别有用。
  • 学习型生存模型进一步扩展了这一体系,通过神经网络Cox、神经网络Weibull、基于Transformer的生存模型和随机生存森林等方法,捕捉非线性效应和高维交互。
选择哪种模型,取决于实际问题的数据特征(样本量、删失结构、协变量丰富度)和维护目标(描述性评估、协变量效应分析、长期寿命估计或数据驱动风险预测)。
传感器与数据的不完整性:删失与截断
在生存和可靠性研究中,删失是指设备被观测到,但其确切的事件(失效)时间未知。记录仍然包含有效信息,因为我们知道该设备在某个特定时间之前依然存活。这在维护数据中非常常见,例如观察在失效前结束,或者预防性维护在失效前终止了跟踪,从而产生了右删失记录。此图展示了生存数据中常见的删失和截断类型。相比之下,截断是一种选择机制,只有当设备的事件时间落在预定义的观察窗口内时,它才会被纳入数据集。因此,在窗口外发生的故障不会出现在样本中,这会改变观测总体的构成,如果不明确处理,可能会使推断产生偏差。
对于智能能源资产数据集,左截断尤其值得关注,因为许多组件在数字监控开始之前已经运行了多年。在这种设置下,观测样本是以在监控进入时间之前存活为条件的,如果忽略这种延迟进入,可能会使风险和生存估计产生偏差。标准处理方法是使用延迟进入生存建模,其中资产仅在其观察开始时间之后才进入风险集。
传感器通过提供运行应力和异常行为的时变证据,在生存和RUL建模中扮演着核心角色。这使得故障风险可以基于比年龄和安装元数据更多的信息进行条件化。在配电系统中,SCADA和配电自动化系统提供系统状态和负荷的连续测量值;在区域供热网络中,监控系统捕获温度、压力、流量等变量。这些信号可以转化为资产级别的暴露量,并作为协变量纳入模型,从而随时间调整风险。
从模型输出到维护决策
生存模型在公用事业维护规划中的实用价值,在于其预测结果能够自然地转化为行动。公用事业公司需要的不是抽象的“健康评分”,而是能够用与其决策相同的单位(时间和风险)来回答规划问题的预测。生存模型通过估计资产在定义的时间范围内(例如未来k年)保持运行的概率来提供这个接口。它还通过危险函数描述故障压力如何随年龄变化。这种危险可以随时间变化,并且可能不单向移动。通常,它可以用浴盆曲线来描述,如图所示,该曲线说明了生命周期的三个阶段:
  • 早期阶段(高故障率):由于安装问题或早期缺陷,故障相对常见。
  • 中期阶段(稳定故障率):故障率在很长一段时间内保持相当稳定。
  • 晚期阶段(故障率上升):随着老化和磨损占主导地位,故障再次上升。
这些输出共同使规划者能够在具有不同年龄和历史的不同资产之间,在一个共同的基础上进行比较。它们也支持透明的干预规则,例如,当预测的近期风险超过政策阈值时,安排更新计划。
具体而言,设T表示资产的(随机)失效时间。生存函数 S(t) = P(T > t) 给出了资产在时间t之后仍可运行的概率。危险函数 h(t) 描述了在时间t的瞬时故障强度,而累积危险 H(t) = ∫0th(u) du 通过 S(t) = exp[-H(t)] 与生存函数相关联。给定资产在时间t仍然存活,其剩余使用寿命 的条件分布可以从生存函数中推导出来。
为了可靠地比较和选择模型,需要一个全面的评估框架。这应包括区分度度量(如C-index)、考虑删失的RUL精度度量(如均方根误差、平均绝对误差),以及通过适当评分规则(如时间依赖性Brier分数和积分Brier分数)进行的概率校准评估。这样的评估实践确保了模型不仅在风险排序上表现良好,而且在预测失效概率方面也是校准准确的。
总之,这篇综述为智能能源网络中的预测性维护和RUL估计,提供了一个关于生存模型的系统性指南。它强调了在模型构建和评估中正确处理数据不完整性(删失/截断)的重要性,并将模型家族与数据类型、核心假设以及面向决策的输出(如风险排序、远期失效概率、RUL分布)进行了系统的映射。对于希望在这一领域实施基于风险的、可辩护的维护规划的研究人员和从业者而言,本文提供了宝贵的见解和实践路径。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号