《IEEE Access》:A Feasibility Study on the Integration of Human Performance Data From Diverse Sources Based on the Complexity of a Proceduralized Task
编辑推荐:
为应对全范围模拟器采集人因绩效数据(HRA)资源消耗大的挑战,本文研究了如何利用任务复杂度(TACOM)度量,作为一种工具,来整合与比较来自不同模拟环境(如简化模拟器)的绩效数据,以期为支持人因可靠性分析(HRA)和保障社会技术系统安全提供一种可行方法。
在核电站、化工厂等高风险社会技术系统的运行中,人因绩效下降(如人因错误)往往是引发重大事故、造成惨重伤亡和巨大经济损失的关键因素之一。这就像一根隐形的“连接线”,一旦接上,就可能将系统推向危险的边缘。为了防范风险,我们必须深刻理解“这根线何时、为何会接通”,也就是人因绩效是在何时、因何原因发生退化。理想的做法是,从尽可能多的、不同情境中收集人因操作员的表现数据。然而,现实骨感——利用高仿真的全范围模拟器采集数据虽然质量上佳,但耗费的时间、人力和财力堪称“天价”,让人望而却步。
于是,研究人员将目光投向了资源需求较低的简化模拟器。美国爱达荷国家实验室(INL)提出的“简化人因错误实验计划”(SHEEP)框架,就旨在利用来自简化模拟器甚至学生操作员的数据,来补充和支撑全范围模拟器的研究。但这里存在一个核心难题:如何将来自不同模拟环境、具有不同特征(如不同的绩效形成因子PSF)的人因绩效数据,合理、有效地整合起来并进行比较?就像比较苹果和橙子的甜度,如果它们本身大小不一、品种不同,直接比较就没有意义。我们需要一把“公制的尺子”,能够衡量它们的核心属性,从而建立可比性。本研究正是要探索这样一把“尺子”——任务复杂度(TACOM)度量,看看它是否能成为整合多源人因绩效数据、提取有价值信息的有力工具。
为了探究TACOM度量的适用性,研究人员开展了一项可行性研究。研究思路是:既然TACOM能客观量化一个程序化任务(由规程规定的操作步骤)的复杂程度,那么理论上,无论操作员面对何种模拟环境,只要他们执行的任务在“行动层面”的描述一致,其绩效数据(如任务完成时间)就应该可以与任务的TACOM分值关联起来进行比较。研究的核心是,利用TACOM这把“标尺”,去分析来自两个不同简化模拟器(CNS和Rancor)的学生操作员绩效数据,并与从全范围模拟器得到的职业操作员数据基准(95%预测限)进行比较。
本研究所运用的关键技术方法主要包括:1) 任务复杂度(TACOM)量化技术:基于从程序化任务的“行动层面”描述中提取的九个复杂度因素,通过五个子度量,并依据一个包含任务范围(TS)、任务可结构化程度(TR)和任务不确定性(TU)三个维度的广义任务复杂度模型,计算得到代表整体复杂度的单一TACOM分值。2) SHEEP框架下的实验设计与数据采集:在INL的SHEEP框架下,利用Rancor和CNS两种简化模拟器,收集了由36名职业操作员和36名学生操作员产生的人因绩效数据(包括任务完成时间和错误率),并进行了人因绩效分析、学习效应分析和时间分布分析等。3) 统计比较与案例分析:将简化模拟器收集的任务完成时间数据,根据其对应程序步骤的TACOM分值,与基于全范围模拟器职业操作员数据建立的TACOM-任务时间回归线(特别是其95%预测限)进行比较,以评估TACOM在整合不同来源数据方面的可行性。
SECTION I. 引言 研究表明,在社会技术系统(如核电设施)的安全事故中,人因错误是重要诱因,占比可达60%-90%。为了理解人因错误的发生机制(何时、为何发生),需要从广泛情境中收集人因绩效数据。虽然全范围模拟器是数据采集的金标准,但资源消耗巨大。因此,集成来自简化模拟器等低成本来源的数据成为一种有前景的解决方案,SHEEP框架便是为此而生。然而,如何在不同模拟环境间建立可靠的比较基准仍是一个挑战。本研究提出,任务复杂度(TACOM)度量可以作为这样一个基准,因为它能量化程序化任务的内在复杂度,从而为比较不同环境下的人因绩效提供共同标尺。
SECTION II. SHEEP框架的发展 SHEEP框架旨在利用简化模拟器和学生操作员的数据来补充和支持全范围模拟器的人因可靠性分析(HRA)数据收集。该框架包含三个步骤:识别可从简化模拟器获取的HRA项目、通过实验处理这些项目、将数据应用于支持HRA和任务分析等。研究使用了Rancor(界面简单,3个控制窗口)和CNS(更复杂,9个控制窗口)两种简化模拟器,分析了职业与学生操作员在不同模拟器复杂度下的绩效差异。结果发现,学生操作员的平均错误率高于职业操作员,且Rancor的错误率低于CNS。这引出了关于绩效差异根源的更深层问题。
SECTION III. TACOM度量的特征 程序是管理社会技术系统的关键约束,而程序内容模糊或难以理解是导致人因错误的主要原因。TACOM(Task Complexity)度量旨在量化程序化任务的复杂度。它基于九个复杂度因素,通过五个子度量,并映射到任务范围(TS)、任务可结构化程度(TR)和任务不确定性(TU)三个维度,最终计算出一个代表整体复杂度的TACOM分值。TACOM的一个关键优势在于,它关注“行动层面”的任务描述,这使其独立于具体的人机界面(HSI)。研究表明,TACOM分值与职业操作员的任务完成时间存在强统计相关性(p <0.0001),并且即使是在模拟(模拟主控室MCR)和数字MCR这两种截然不同的工作环境中,对于具有相同TACOM分值的任务,职业操作员的完成时间也相近。这证实了TACOM可以作为比较不同环境下人因绩效的通用基准。
SECTION IV. 案例研究 为了验证TACOM在整合不同来源数据方面的实用性,研究对来自CNS和Rancor两个简化模拟器的学生操作员任务完成时间数据进行了案例分析。研究人员计算了这些任务步骤对应的TACOM分值,并将其实测时间与基于全范围模拟器职业操作员数据建立的“95%预测限”回归线进行比较。这个预测限可以被视为职业操作员在不发生绩效退化情况下完成某TACOM分值任务的最大允许时间。结果显示,在CNS收集的32个任务时间数据点中,有5个超出了95%预测限;而在Rancor收集的15个数据点中,仅有1个超出。如果以超出预测限的比例作为衡量标准,可以推断CNS的模拟器复杂度约为Rancor的2.34倍(5/32对比1/15)。这个结果在数量级上与两者错误率的比值(CNS 0.0168 / Rancor 0.0095 ≈ 1.77)具有可比性,为“CNS比Rancor更复杂”的直观判断提供了基于TACOM的量化支持。
SECTION V. 讨论与结论 保障社会技术系统安全需要理解人因绩效,这离不开广泛的数据收集。集成全范围与简化模拟器数据是解决资源限制的关键,但面临如何建立有效比较基准的挑战。本研究提出并验证了TACOM度量作为整合多源人因绩效数据工具的可行性。TACOM通过量化程序化任务的内在复杂度,为比较不同模拟环境下(甚至包括未来先进反应堆)的操作员绩效提供了共同基础。案例分析表明,基于TACOM分值和95%预测限的比较,能够量化不同简化模拟器(CNS vs. Rancor)之间的相对复杂度差异。尽管研究存在数据点数量有限、部分任务包含“等待时间”等局限性,但结果初步证实了TACOM在识别“可比任务组”方面的潜力。这意味着TACOM有助于推进SHEEP框架中尚未充分探索的部分(如图1中非高亮区域),例如,将简化模拟器数据与全范围模拟器数据在更广泛的人因绩效指标(如错误发生率)上进行比较,从而为理解人因绩效退化的本质、支持先进反应堆的人因可靠性分析提供新的见解。因此,TACOM度量有望在解决“如何经济有效地获取人因绩效数据”这一技术挑战中发挥重要作用。