在职业事故严重性建模中,如何考虑未观测到的异质性、内生性以及时间不稳定性因素
《Accident Analysis & Prevention》:Accounting for unobserved heterogeneity, endogeneity, and temporal instability in occupational accident severity modeling
【字体:
大
中
小
】
时间:2026年05月10日
来源:Accident Analysis & Prevention 6.2
编辑推荐:
查鲁尔·萨拉姆(Chairul Salam)
矿业工程系,巴图利钦理工学院(Politeknik Batulicin),南加里曼丹省,72271,印度尼西亚
**摘要**
本研究通过基于仿真的诊断方法,评估了事故严重性建模中三个相互关联的挑战:未观察到的异质性、内生
查鲁尔·萨拉姆(Chairul Salam)
矿业工程系,巴图利钦理工学院(Politeknik Batulicin),南加里曼丹省,72271,印度尼西亚
**摘要**
本研究通过基于仿真的诊断方法,评估了事故严重性建模中三个相互关联的挑战:未观察到的异质性、内生性和时间不稳定性。尽管这些问题已经得到了广泛的独立研究,但它们对统计推断和模型可靠性的综合影响仍不够清楚。为了解决这一差距,本文开发了一个透明的蒙特卡洛模拟框架,用于生成具有可控结构属性的模拟事故数据,从而能够在已知条件下系统地评估模型性能。分析采用了混合有序逻辑斯蒂(mixed ordered logit)模型,并结合控制函数方法进行内生性校正,以及滚动时间窗口策略来捕捉时间变化。结果表明,单独或同时忽略这些因素可能会导致参数估计出现显著偏差、统计显著变量的错误识别,以及不同时间段内推断结果的不稳定性。特别是,内生性会导致行为效应估计的系统性扭曲;未观察到的异质性会改变效应的大小和显著性模式;而时间聚合则会掩盖动态的结构变化。这些发现并不直接提供政策建议,而是作为方法论上的启示,强调了事故严重性分析中模型错误设定所带来的风险。该研究通过提供一个可复制的框架来评估推断的稳健性,并明确了常用建模方法的局限性,从而为使用现实世界安全数据进行更严谨的实证研究提供了参考。
**引言**
职业事故严重性分析在安全管理中起着核心作用,因为它有助于风险优先级排序、干预措施设计和监管决策。严重性模型被广泛用于识别高风险行为、危险的工作条件以及易受伤害的工人群体,人们隐含地期望这些估计结果能为预防措施提供可靠的基础。尽管在方法论上取得了很大进展,但许多关于事故严重性的研究仍然依赖于一些未经充分审查的简化假设。尤其是,通常同时假设风险因素对所有事故的影响是相同的、与安全相关的行为是外生的,以及事故严重性的决定因素具有时间稳定性。虽然这些假设便于估计和解释,但当它们不能反映实际的事故生成过程时,可能会严重扭曲推断结果(Ahmed等人,2023a;Chen等人,2025;Salam M.等人,2026)。
首先,同质参数设定隐含地假设观察到的风险因素对所有工人、任务和操作环境中的伤害严重性影响相同。然而,在具有不同经验水平、安全文化和暴露条件的职业环境中,这一假设很可能不成立。当忽略异质性时,估计的系数可能无法为针对特定工人群体或操作环境的特定安全干预措施提供有用的信息,甚至可能产生误导。
其次,诸如不安全行为、个人防护装备(PPE)使用和疲劳等与安全相关的行为通常被视为事故严重性的外生决定因素。实际上,这些行为是由包括风险感知、工作压力和组织规范在内的未观察因素塑造的内生决策过程的结果。当这些行为与未观察到的事故严重性决定因素相关时,传统的严重性模型会将行为因果关系与风险选择混淆,导致估计偏差和不可靠的政策结论(Brasil等人,2025;Salam等人,2025b;Yousaf和Wu,2024)。
第三,大多数事故严重性分析隐含地假设风险因素与伤害结果之间的关系是时间不变的。在技术、法规、生产压力和劳动力构成随时间变化的动态职业系统中,这一假设难以成立。基于汇总数据校准的静态模型可能会掩盖风险机制中的结构变化,从而削弱安全政策的长期有效性(Salam等人,2026;Phuksuksakul等人,2024a;Yang等人,2024)。
重要的是,这些问题不仅仅是技术性问题,它们代表了直接影响职业安全管理的推断风险。当严重性模型设定错误时,安全干预措施可能会方向错误,执行优先级可能被误判,资源配置也可能效率低下。解决这些推断风险需要能够明确评估异质性、行为内生性和时间动态如何影响事故严重性推断的分析框架。
**图1** 展示了本研究提出的分析框架,突出了决定事故严重性的概念机制,并说明了所采用的高级建模策略的合理性。
(a) 面板描述了传统视角,其中假设可观察的行为和环境因素直接影响伤害严重性结果。尽管这一框架在现有研究中被广泛使用,但它隐含地假设了效应的同质性、外生性和时间稳定性。
(b) 面板通过明确承认未观察到的异质性来扩展这一表示方法,即潜在的个体和情境特征(如风险偏好、安全文化和经验)调节了观察到的风险因素的影响。这促使使用混合逻辑斯蒂模型,允许严重性参数在观测值之间变化,而不是强加固定的参数假设。
(c) 面板展示了与安全相关的行为中固有的内生性路径。不安全行为和PPE使用等行为选择受到同时影响事故严重性的未观察因素的影响,从而在解释变量和误差项之间产生相关性。这种结构依赖性违反了外生性假设,需要通过控制函数技术进行显式校正以获得无偏估计。
(d) 面板强调了时间不稳定性,指出风险因素与严重性结果之间的关系可能因监管变化、组织学习、技术采用或操作条件的变化而随时间演变。这一组成部分证明了实施时间诊断和动态建模方法的必要性,以测试和解释参数的不稳定性。这四个面板表明,事故严重性的确定是一个具有异质性、内生性和时间动态性的过程。这一综合框架为提出的带有内生性校正和时间不稳定性分析的混合逻辑斯蒂模型提供了概念基础,明显区别于传统的静态严重性建模方法。
大量文献应用了先进的统计和机器学习技术来模拟职业和交通环境中的事故严重性。这些研究提高了预测性能,并扩展了安全分析中考虑的可观察因素范围。然而,仅凭预测准确性并不能保证安全政策设计的可靠性(Ahmed等人,2023b;Almaskati等人,2024)。现有研究主要分别探讨了异质性、内生性和时间变化。一些研究通过随机参数或层次结构来捕捉未观察到的异质性,证明严重性效应在不同个体和情境中存在差异;其他研究通过比较不同时期的模型或测试参数变化来探索时间不稳定性;还有少数研究使用工具变量或控制函数方法来解决与安全相关行为的内生性问题(Alhaek等人,2024;Phuksuksakul等人,2024b)。
目前尚未充分探索的是,同时忽略这些维度如何影响事故严重性推断的可靠性及由此产生的安全政策的可靠性。在许多应用研究中,严重性模型在某个方面采用了先进技术,但在其他方面仍保持限制性假设。因此,估计的效果可能看似统计上稳健,但实际上容易受到遗漏的异质性、内生行为或未被识别的时间变化的影响而产生偏差。从安全科学的角度来看,这是一个关键问题。如果安全政策是基于错误设定的模型结果制定的,那么随着时间的推移,这些政策不仅可能失去有效性,还可能针对错误的风险因素或群体。因此,需要开展实证研究,超越方法论上的展示,明确评估事故严重性模型错误设定对政策的影响。与探讨高级模型是否可以估计相比,对于职业安全来说,更相关的问题是建模假设如何影响推断、解释和决策制定。
本研究通过实证方法探讨了未观察到的异质性、行为内生性和时间不稳定性如何共同影响事故严重性估计及其政策解释,从而为这一领域做出了贡献。通过关注推断的稳健性而非预测的新颖性,该分析为理解职业环境中的事故严重性机制提供了更扎实和决策相关的见解。本研究通过提供一个结构化的、基于仿真的诊断框架,对三个相互关联的推断挑战(未观察到的异质性、内生性和时间不稳定性)进行了评估,为该领域的研究提供了理论基础。
首先,本研究并非提出新的估计技术,而是系统地探讨了这三个因素的联合存在如何影响参数估计、统计推断和模型解释。虽然每个问题都已被广泛单独研究,但它们的综合影响在受控实验环境中的关注度相对有限。通过利用透明的蒙特卡洛模拟框架,本研究量化了忽略这些因素(单独或共同)可能导致的估计效应偏差以及关键解释变量的统计显著性变化。其次,本研究引入了一种可复制的基于仿真的设计,将数据生成过程与事故严重性分析中常用的建模假设明确联系起来。这种设计允许在已知结构条件下控制模型行为,从而提供了对广泛采用的方法(如带有控制函数校正的混合有序逻辑斯蒂模型和滚动时间窗口估计)的可靠性和局限性的洞察。从这个意义上说,该研究的贡献在于提供方法论上的启示,使文献中的现有实证发现能够得到更严格的解释。第三,本研究提供了模型错误设定导致的偏差程度和方向的定量证据。具体来说,结果表明,忽略内生性可能导致行为效应的系统性高估或低估;未观察到的异质性可能掩盖或夸大变量显著性;时间不稳定性可能在汇总时间段内导致误导性推断。这些发现有助于更细致地理解事故严重性研究中的模型敏感性和稳健性。第四,本研究阐明了基于仿真的推断在安全建模中的应用范围和局限性。这些发现并非直接提供政策建议,而是作为方法论上的启示,强调了在解释实证模型时未充分考虑数据复杂性的潜在风险。这一区别对于使用真实世界职业或交通安全数据的未来实证研究至关重要。
**结论**
本研究的主要贡献在于提供了一个透明、可复制且分析严谨的框架,用于理解多种模型错误设定之间的相互作用,从而为事故严重性分析提供了更稳健的建模实践。
**术语说明**
- **事故严重性(Occupational accident severity)**:本研究中的因变量,用Si∈1,2,?,J表示,其中较高的值表示更严重的伤害结果。严重性水平被定义为有序的分类变量,反映了伤害后果的递增程度(例如,轻微伤害、医疗处理、失去工作时间的伤害和致命伤害)。
- **序数性质(Ordinal nature)**:Si的序数特性意味着伤害结果是有序的,但不是基数的,因此违反了方法论要求。
- **渐进式建模策略(Progressive modeling strategy)**:本研究采用了一种渐进的建模策略,从传统的有序响应基准开始,逐步引入更先进的分析组件,以解决职业事故严重性建模中的未观察到的异质性、行为内生性和时间不稳定性。
- **未观察到的异质性(Unobserved heterogeneity)**:混合逻辑斯蒂估计结果提供了强有力的实证证据,表明职业事故严重性的决定因素存在未观察到的异质性。一些解释变量表现出显著的随机参数标准差,表明这些变量的效应在观测值之间存在显著差异,而非固定在总体均值上。
- **忽略内生性的后果(Consequences of ignoring endogeneity)**:研究表明,将行为变量视为外生因素会导致估计的严重性效应出现系统性偏差,直接影响安全政策的设计。当忽略内生性时,估计的系数会将行为的因果效应与风险感知、自我选择和补偿性安全策略等未观察因素混淆,从而导致政策建议的偏差。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号