在核能和航空等安全关键的人机系统中,系统级风险在很大程度上受到人类性能的影响,即使硬件和软件的可靠性不断提高[1]、[2]、[3]、[4]、[5]。人类可靠性分析(HRA)提供了系统化的程序,用于识别人类故障事件(HFEs)、建模性能形成机制,并量化人类错误概率(HEPs),以便用于概率安全评估和操作风险管理[6]、[7]、[8]、[9]。
HRA中的一个长期挑战是连续HFEs之间的依赖性[10]、[11]、[12]。当一个先前行动的结果改变了后续行动的成功或失败的可能性时,就会产生依赖性,这通常是通过共享的背景、共同的机组人员、时间压力和工厂状态耦合实现的[13]、[14]。由于正依赖性可以通过增加初始故障后的后续故障可能性来放大风险,因此需要依赖性建模以避免保守的HEP估计[7]、[13]、[15]。主要输出是条件人类错误概率(CHEP),它量化了在先前故障条件下后续故障的概率。
依赖性评估被嵌入到主流的HRA方法中,包括CREAM[16]、[17]、[18]、SPAR-H[19]、[20]、[21]和THERP[22]、[23]。其中,THERP在实践中被广泛采用,它使用五个定性级别来描述依赖性,即零依赖性(ZD)、低依赖性(LD)、中等依赖性(MD)、高依赖性(HD)和完全依赖性(CD),以及从依赖性级别到CHEP的映射[24]。然而,THERP风格的依赖性评估经常因主观性、中间判断的透明度有限以及重复性有限而受到批评,特别是当依赖性级别来自具有不同背景的多个专家时[10]、[13]。
为了缓解这些限制,越来越多的工作使用考虑不确定性的表示方法和辅助决策支持技术来扩展THERP风格的依赖性评估。例如,使用区间和证据推理来获得区间值的依赖性输出[25],结合影响分析方法对依赖性驱动因素进行语言建模[26],基于云模型的依赖性评估[27],以及包含可信度衰减和聚合运算符的动态公式[28]。尽管这些研究改进了不确定性建模,但在基于小组的依赖性评估中仍存在重要差距,其中的主要困难不仅是不确定性,还有小组讨论过程中专家的分歧和不一致性。
第一个差距是关于如何在汇总之前管理专家的分歧。在实践中,依赖性判断通常来自专家小组,但许多方法仍然直接汇总不同的观点,例如通过平均、加权平均或直接融合信念结构[29]、[30]、[31]。这种汇总可能会掩盖实质性的冲突,降低所得依赖性水平的可解释性,并削弱可追溯性,因为它没有记录如何协调不一致的判断。此外,传统的HRA依赖性程序将不一致性视为给定输入,并在明确的一致性要求下为引导专家达成一致评估提供有限的支持[10]、[13]。
第二个差距是关于确定依赖性驱动因素的相对重要性。依赖性由多个因素塑造,如时间接近性、任务的相似性和执行者的相似性,在现实场景中这些驱动因素的影响通常不相等[26]、[27]。尽管如此,许多依赖性模型假设因素的重要性相等,或者采用的加权方案需要大量的成对比较,可能在认知负担下产生逻辑上不一致的权重模式[32]。这限制了最终CHEP的可辩护性,因为所暗示的因素影响可能与专家的偏好不一致。
重要的是,基于小组的依赖性评估中的分歧并不是单一的同质现象。可以区分两个概念上不同的组成部分。第一个是定量分歧,指的是依赖性级别评估的分散,特别是当专家意见表示为离散依赖性类别的基本信念赋值(BBAs)时。第二个是结构不一致性,指的是专家在优先考虑依赖性驱动因素时的不连贯模式,例如成对因素优先级之间的矛盾以及整体依赖性判断中反映的暗示因素影响之间的矛盾。现有的基于THERP的扩展很少明确区分这些组成部分,因此提供了有限的机制来以受控的方式减少分散性,同时强制实施一致的因素加权[24]、[25]、[26]。
受这些差距的启发,本研究将HRA中成熟的依赖性评估方法结构化地整合起来,旨在改善对专家分歧和不一致性的处理。首先,专家的依赖性判断被表示为BBAs,并使用直接作用于信念结构的共识达成过程(CRP)进行优化。CRP受到忠实度约束并明确量化,以便修订后的BBAs满足指定的一致性要求,同时尽可能接近每个专家的原始评估结果,并保留残余的不确定性而不是消除它。为了解决依赖性驱动因素重要性的不一致性,使用完全一致性方法(FUCOM)推导出一组逻辑上一致的因素权重,同时减轻信息收集的负担。FUCOM不改变概率量;相反,它提供了内部一致的重要性系数,这些系数在依赖性评估和随后的CHEP映射中作为影响参数,与可靠性和风险建模的标准实践一致。然后,使用Dempster-Shafer证据理论(DSET)汇总经过共识优化的BBAs和基于FUCOM的系数,并映射到与THERP兼容的CHEPs。总体而言,这项工作的贡献是方法论上的:该研究没有重新定义依赖性级别,但提供了一个在不确定性和分歧情况下基于小组的依赖性评估的操作性和可追溯的程序。
与现有的依赖性评估研究相比,这项工作的贡献主要是方法论和过程导向的。虽然各个组成部分(CRP、FUCOM、DSET)已经建立,但它们的整合解决了当前HRA实践中一个具体的差距:缺乏管理专家分歧的透明审计跟踪。标准方法通常直接汇总不同的观点,掩盖了冲突的程度。所提出的框架强制在融合之前进行明确、可量化的信念结构协调。因此,新颖之处在于能够精确追踪专家的判断在多大程度上被调整以满足小组的一致性要求,从而提高了安全关键审计中最终CHEP的可辩护性。
本文的主要贡献有三个方面:
(1) 开发了一种基于信念结构的共识机制,用于基于小组的依赖性评估,能够在汇总之前控制不同BBAs的协调,并提供关于专家调整程度的明确信息。
(2) 结合了基于FUCOM的一致性强化加权步骤,以推导出具有较低比较负担和更好逻辑一致性的依赖性因素的重要性权重。
(3) 实现了一个结构化的CRP-FUCOM-DSET框架,从专家输入获得与THERP兼容的CHEPs,从而支持依赖性评估的透明度、可重复性和可解释性。
总之,本研究受到以下研究问题的指导:
RQ1:如何使用结构化的CRP在BBAs上操作,以透明和数学上一致的方式协调专家对依赖性水平的不同评估?
RQ2:FUCOM能否为依赖性驱动因素提供内部一致和可辩护的重要性权重,这些权重如何影响最终的CHEPs?
RQ3:整合的CRP-FUCOM-DSET框架产生的CHEPs是否稳定且可解释,同时在数值上与使用传统汇总或标准依赖性建模方法获得的输出相当?
本文的其余部分结构如下。第2节介绍了本研究中采用的核心方法的初步知识。第3节描述了所提出的方法论。第4节提出了一个案例研究,第5节提供了进一步的讨论。最后,第6节总结了本文。