海事事故中人员伤亡严重程度的决定因素:基于2014–2023年间581份调查报告的文本挖掘分析
《Ocean Engineering》:Determinants of casualty severity in maritime accidents: Evidence from text mining of 581 investigation reports, 2014–2023
【字体:
大
中
小
】
时间:2026年02月03日
来源:Ocean Engineering 5.5
编辑推荐:
本研究构建了基于多模态信息抽取和有序逻辑回归的海事故故严重性量化分析框架,通过MBERT-BiLSTM-CRF和MBERT-Softmax模型实现事故类型、船舶类型、环境条件、管理缺陷及人因行为的高效提取,结合边际效应分析揭示碰撞(OR=2.246)、沉没(OR=3.626)、渔船(OR=4.213)、低能见度(OR=4.774)等关键风险因素对伤亡严重性的影响机制,并提出工程改进、运营优化和风险沟通强化三类管理措施。
刘东格|程亮|艾波|谢瑞|王西东|尚恒帅
山东科技大学测绘与地理信息学院,中国青岛,266590
摘要
本研究开发了一种可复制的流程,将长篇事故报告转化为关于中国海域事故严重程度决定因素的结构化证据。利用2014年至2023年间中国海事安全管理局发布的581份调查报告,我们结合了针对该领域的MBERT模型(用于命名实体识别和文本分类)以及有序逻辑回归和边际效应分析,来评估事故类型、船舶类型、人为因素、管理因素和环境因素如何影响事故严重程度。MBERT-BiLSTM-CRF和MBERT-Softmax组件能够高精度地提取关键信息,随后通过有序逻辑回归和比例优势模型得出可解释的结果。研究结果表明:碰撞(OR = 2.246,p < 0.001)和沉船(OR = 3.626,p = 0.014)显著增加了事故严重程度;渔船(OR = 4.213,p = 0.029)的事故敏感性较高;能见度低(OR = 4.774,p = 0.048)是关键的环境触发因素;在人为因素中,饮酒和疲劳(OR = 5.396,p = 0.049)的边际效应最大;缺乏安全警告(OR = 2.506,p = 0.019)是最严重的管理缺陷。比例线检验支持了模型的有效性。将这些发现应用于实践,我们建议从三个方面采取针对性措施:针对高动能和稳定性丧失情况的工程措施、检测与响应约束的操作措施,以及加强风险沟通和报警系统的管理措施。该框架提供了一种从文本证据到因果量化的可重用方法,为监管机构和运营者提供了优先考虑高效减少事故的干预措施的依据。
引言
全球超过80%的货物贸易量通过海运完成;作为世界领先的造船和航运国家,中国的沿海和近海海域的海上交通密度位居全球前列(联合国贸易和发展会议,2024年;Johansson等人,2017年)。随着“一带一路”倡议和海上强国战略的深入实施,中国的海上运输路线实现了多通道、高频、全天候的运营,同时船队也变得更加多样化,吨位趋于增加(孙和高,2021年;Saeed等人,2021年)。随着海上活动的持续扩大,包括碰撞、沉船、搁浅以及火灾或爆炸在内的海上事故也日益频繁(Rawson和Brito,2023年)。根据中国海事安全管理局(CMSA)2014年至2023年间发布的581份详细调查报告的数据,共有519人死亡、163人受伤、341人失踪(中华人民共和国海事安全管理局,2025年)。欧洲海事安全局(EMSA)在其年度事故统计报告中指出,2014年至2022年间发生了23,814起海上事故,涉及26,108艘船舶,造成6,781人受伤和604人死亡(欧洲海事安全局,2024年)。复杂的海上交通环境、船员疲劳和管理疏漏使得事故风险持续升高,对海洋经济的安全以及生命和财产构成持续威胁(何等人,2022年;Kaptan等人,2021年;Adumene等人,2022年)。
因此,挖掘海上事故数据以揭示因果因素与事故结果之间的内在联系至关重要,从而实现有针对性的预防和管理(马等人,2024年)。目前,事故调查报告大多以冗长的非结构化文本形式保存,关键信息往往隐藏在长篇文字中,数据收集主要依赖人工,这限制了自动化使用和大规模研究(甘等人,2023年)。有效地从这些文本中提取关键信息不仅有助于准确重建事故场景和明确因果链,还为预防和应急决策提供了数据支持。先前的研究已经证明了这种方法的可行性和益处,例如从调查报告中提取因果关系和语义元素,并构建海上事故的知识图谱(刘等人,2023年;胡等人,2024年)。然而,现有的方法仍然依赖于专家阅读或基于规则和关键词的提取方式,限制了效率和客观性,也阻碍了大规模语料库的应用。基于自然语言处理(NLP)的自动化解释可以将分散的文本证据转化为结构化数据,从而大幅提高海上安全监督的智能化和精细度(张等人,2025年)。将命名实体识别(NER)与文本分类(TextCLS)相结合,可以共同提取多维信息,包括事故类型、船舶类型、环境条件、管理缺陷和人类行为,从而为系统性的因果分析和定量风险评估建立坚实的数据基础。
海上事故研究一直是一个重要课题,涵盖了时空分布(张等人,2021年)、风险评估(Brandt等人,2024年)、因果机制(Aydin等人,2021年)和应急决策(周,2022年)等方面。其中,对因果机制和贡献因素的研究尤为重要,有序逻辑回归(Khan等人,2023年)、贝叶斯网络(BN)(Kong等人,2024年)、人为因素分析与分类系统(HFACS)(Guo等人,2025年)和机器学习(Yi等人,2023年)等方法已被广泛应用。Munim等人(2024年)利用1981年至2020年挪威沿海水域的9,025起事故记录,首次将AutoML框架引入海上安全研究,实现了高精度的事故风险预测,为监管机构和运营者提供了部署早期预警系统的可行途径。Shi等人(2021年)对2000年至2020年间关于海上事故中人为因素的213篇出版物进行了系统回顾,涵盖了因素识别、相互作用和控制/干预,并强调了定量、前瞻性因果分析的必要性。Wang等人(2021年)使用有序逻辑回归分析了事故严重程度与人、船舶和环境因素之间的联系,为海事部门的有效预防措施提供了依据。
然而,当前研究仍存在一些局限性:首先,大多数研究仅关注因果因素与事故发生之间的联系,而对这些因素如何影响事故结果的定量分析较少(Shi等人,2021年);其次,由于数据获取渠道有限,分析视角仍然不完整,管理因素常常被忽视(Wang等人,2021年)。Lin和Goodrich(2010)的研究表明,海上事故严重程度的非线性源于多维危险因素之间的复杂相互作用。因此,确定事故严重程度的主要决定因素对于减少海上事故中的生命损失和提升航行安全至关重要。通过对2000年至2022年间491篇关于海上事故的出版物进行系统回顾,Cao等人(2023年)将影响因素分为五类:事故因素、船舶因素、人为环境因素和管理因素。基于此,本研究使用2014年至2023年间中国海事安全管理局发布的581份调查报告,对事故严重程度进行了因果分析。主要贡献如下:
(1)设计了结合MBERT-BiLSTM-CRF和MBERT-Softmax的联合解释模型,实现了从大规模海上事故文本中高精度提取与事故相关的特征。
(2)基于结构化输出建立了有序逻辑回归模型,以研究事故类型、船舶类型、环境因素、管理因素和人为因素对事故结果的定量影响。
(3)利用边际效应揭示了每个重要因素增加严重事故概率的程度,并提出了针对性的安全管理建议。
数据获取与处理
本研究以2014年至2023年间中国海事安全管理局发布的581份海上事故调查报告为基础,探讨了海上事故严重程度的决定因素。这些报告通常包含数十到数百页的文字,全面介绍了事故、船舶、船员、环境条件和管理方面的信息,但由于以非结构化文本形式存储,存在规模庞大等问题。
数据集注释
为了支持本研究的领域模型训练,我们构建了两个手动注释的数据集。第一个是命名实体识别数据集:选择了240段文本进行细粒度实体注释,共标注出513个实体;类别方案和示例见表2。第二个是文本分类数据集:723段文本分别被标记为“人为因素”351次、“环境因素”127次和“管理因素”245次;类别定义和
讨论
通过构建预训练的语言模型MBERT,本研究开发了一个综合解释框架,用于分析海上事故中的伤亡结果,该框架联合提取了多维元素:事故类型、船舶类型、环境条件、管理缺陷和人类行为,并将结构化输出与有序逻辑回归和边际效应分析相结合,从而形成了从文本证据到量化因果关系的完整流程。研究结果表明:
结论
本研究采用“深度学习模型驱动的信息提取—有序逻辑回归—边际效应”的闭环方法,系统地描述了中国海域海上事故中伤亡严重程度的因果结构。基于2014年至2023年间581份事故调查报告的实证证据,结果表明:碰撞(OR = 2.246,p < 0.001)和沉船(OR = 3.626,p = 0.014)显著增加了事故严重程度;渔船(OR = 4.213,
CRediT作者贡献声明
刘东格:撰写——审稿与编辑,撰写——初稿,验证,方法论,调查,正式分析。程亮:项目管理,调查,资金获取,概念构思。艾波:监督,资金获取。谢瑞:撰写——审稿与编辑,可视化。王西东:撰写——审稿与编辑。尚恒帅:撰写——审稿与编辑,资金获取。
利益冲突声明
作者声明没有已知的竞争性财务利益或个人关系可能影响本文的研究结果。
致谢
本研究得到了中国国家重点研发计划(2022YFB3903603)和山东省自然科学基金(ZR2025MS591)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号