海上操作室是一个典型的复杂人机交互系统[1]。在海上操作室中,人机界面是获取情境信息的重要途径,良好的界面设计有助于提高机组人员的情境意识(SA)水平[2]。情境意识被定义为对环境中元素的感知(SA的第一层次SA1)、对其意义的理解(SA的第二层次SA2)以及对它们在未来近期的状态的预测(SA的第三层次SA3)[3],[4]。充足的SA有利于快速响应和高效操作,而不足的SA会对决策和任务执行产生负面影响[5],[6]。如今,SA已成为评估复杂系统设计的关键指标,可以为交互设计提供有价值的诊断数据[7],[8]。因此,测量和分析SA对于优化界面设计、提高任务性能和确保海上安全具有重要意义。
目前,主要有四种SA测量方法,包括主观测量、记忆探针测量、性能测量和生理测量[9],[10],[11],[6]。前两种方法是直接测量,而后两种方法是间接测量。主观测量利用问卷和评分量表来评估SA,例如情境意识评分技术(SART)[12]、情境意识行为评分量表(SABARS)[13]和机组人员意识评分量表(CARS)[6],其优点是应用方便且无侵入性,但可能存在主观偏见[11]。记忆探针测量通过评估任务执行过程中特定时间点最近记忆的内容来评估SA,通常包括情境意识全局评估技术(SAGAT)和情境当前评估方法(SPAM)[14]。记忆探针测量已被证明具有良好的结构和预测有效性[15]。然而,确定适当的探询问题需要详细的认知任务分析,且数据收集可能具有侵入性[16],[15]。
与上述两种直接测量方法相比,性能测量是一种客观的间接方法来评估SA[5]。例如,Mansikka等人[10]进行了一项模拟空战实验,发现SA与性能之间存在强烈关联,因为高SA准确性导致了良好的团队表现[10]。此外,通过使用能够减少干扰的生理信号传感器可以增强SA测量[17],[18],[19]。Zhang等人[6]研究了25篇关于生理测量的文章,包括眼动追踪、脑电图(EEG)和皮肤电反应(EDA),发现生理测量与直接SA测量之间存在中等程度的相关性。生理测量是实时的、客观的,可以与其他测量方法结合使用以提高评估的可靠性[6]。尽管上述测量方法已得到广泛应用,但它们都是事后方法,将“人机交互”因素纳入考虑[20],[21]。因此,只有在人机系统建立之后才能测量SA,这使得修改系统以改善SA的成本高昂或难以实现[22],[23]。
相比之下,理论SA测量模型能够在系统开发的初步阶段提供人体工程学评估,有助于以低成本及时进行修改,减少人为错误并预防潜在的事故风险[22],[23],[24]。根据先前的研究,SA是通过认知过程实现的[3],并且基于SA形成机制的定量特征描述建立了许多理论SA测量模型[20],[25],[22],[26]。例如,Wickens等人[27]提出了注意力-情境意识(A-SA)模型,强调了与注意力分配相关的SA错误[27]。A-SA模型包含两个模块,一个负责管理对环境中事件和渠道的注意力分配(对应于SA1),另一个涉及对当前(对应于SA2)和未来(对应于SA3)状态的推断、情境评估、理解或信念。此外,Wickens[26]研究了航空人机界面的几个关键显示特征,并提出了显示格式和情境意识模型(DFSAM),以预测哪种类型的显示特征有助于提高飞行员的SA。该模型通过高保真合成视觉模拟数据进行了验证,模型预测与飞行控制性能显著相关[26]。
为了提高SA的预测能力,Hooey等人[25]开发了人机集成设计与分析系统(MIDAS)模型。环境被分解为“情境元素”(SEs),这些信息对于高级任务是必要的[25]。操作员通过一系列子模型处理SEs,包括视觉注意力、感知和记忆。SA最终计算为实际SA(检测或理解的SEs数量)与最佳SA(完成任务所需的SEs数量)的比率[25],[23]。模型预测对显示配置和操作员职责的差异敏感[25]。此外,自适应控制思维-理性(ACT-R)作为人类认知和性能的理论[28],已被广泛应用于SA测量模型的开发[5],[20],[22],[23]。Liu等人[22]根据ACT-R分析了SA生成过程,并建立了联合定性和定量SA模型。统计分析表明,模型预测与SAGAT和SART结果相关[22],[23]。Feng等人[20]进一步将ACT-R与排队网络结合,提出了SA动态循环(SADC)模型,以描述飞行员SA的动态生成和更新过程[20]。进行了一个操作员在环实验来验证SADC模型,SPAM响应时间和SART得分与SADC模型预测显著相关[20]。
上述理论测量模型基于认知过程分析和计算SA,并在预测SA方面表现出良好的有效性[20],[23]。然而,仍存在一些局限性。首先,在当前模型中,环境中的所有SEs都通过一致的认知机制进行处理以形成SA。然而,先前的研究表明,对环境的认知控制存在不同的层次[29],[30],因此有必要根据不同的认知过程进一步分类SEs以提高模型可靠性。其次,界面设计是SA形成的关键因素,在多个模型中得到了强调[20],[27]。然而,在计算SA时,界面设计的影响主要体现在感知(SA1)[5],[23]上,而对理解(SA2)和预测(SA3)的影响在一定程度上被忽视了,这可能会影响模型的精度。最后,大多数SA测量模型最初是为预测飞行员的SA而开发的,模型仅通过飞行模拟实验进行了验证。在海洋等领域,关于模型有效性的证据仍然不足。
为了解决上述局限性,我们的研究构建了一种基于信息分类和认知过程特征的SA测量模型。该模型首先采用技能、规则和知识(SRK)分类法对显示界面上的SEs进行分类[29]。随后,基于ACT-R理论对处理SEs的认知过程进行了定性分析和定量描述,并将界面设计对SA1和SA2/SA3的影响纳入认知激活量的计算中。最后,参考MIDAS模型[25],[23],通过实际SA与最佳SA的比率来计算SA。为了验证模型的有效性,24名参与者在四种不同任务复杂度或界面设计的模拟海上情境判断任务中进行了实验,使用了多种SA测量方法,包括性能测量、主观测量和生理测量。对模型预测和实验数据进行了相关性分析,结果表明模型在我们的研究中具有良好的预测效果。该模型可以提供SA的事前预测,从而为评估和改进人机界面设计提供见解。