一种针对小样本多模态数据的导航风险评估模型,该模型采用了改进的贝叶斯网络

《Ocean Engineering》:A navigation risk assessment model for small-sample multimodal data with an improved Bayesian network

【字体: 时间:2026年02月20日 来源:Ocean Engineering 5.5

编辑推荐:

  海洋航行风险评估中,传统贝叶斯网络受限于小样本数据和高维多模态特征的不确定性,本研究提出多维自助扩展贝叶斯网络模型(SSM-IBN)。通过开发多维自助扩展技术提升小样本条件下的概率估计精度,采用犹豫模糊聚类算法解决专家主观判断的不确定性,最终实现海洋航行风险评估的精度提升18.2%-58.1%(RMSE降低)和R2值增长0.294-1.0185。实际应用于北太平洋航运风险分析,验证了模型在小样本多模态数据下的有效性。

  
钱龙霞|王英英|洪梅|唐世倩|庞志成
南京邮电大学理学院,南京,210023,中国

摘要

在海洋环境风险场景中,传统的贝叶斯网络模型由于数据不足和语言不确定性,在实现精确的风险评估方面面临挑战。为了解决这一挑战,提出了一种改进型贝叶斯网络的小样本多模态模型(SSM-IBN),用于远洋船舶的航行风险评估。该框架包含两项关键创新:(1)开发了一种多维自举扩展技术,以从高维小样本数据集中捕获统计特征,从而改善了贝叶斯网络在数据有限条件下的表现。(2)提出了犹豫模糊聚类层次算法,以处理传统贝叶斯方法无法充分处理的主观数据不确定性。此外,通过使用四个不同的训练样本集进行了系统验证,随后将该模型应用于北太平洋航运的风险分析。实验结果表明,与传统的贝叶斯网络相比,当扩展倍数k=9时,SSM-IBN的RMSE降低了18.2%–58.1%,R2提高了0.294–1.0185。在海上风险评估中的实际应用进一步证实了该模型在小样本场景下的优势。

引言

随着全球气候变化的加剧,海洋环境变得越来越复杂和恶劣,对船舶航行的安全产生了重大影响(Luo等人,2025年)。进行风险评估对于确保远洋船舶的航行安全至关重要(Huang等人,2022年)。远洋船舶航行风险评估的一个主要限制是缺乏将风险与其影响因素联系起来的样本(Qian等人,2018年)。此外,航行风险因素包括与风、波浪、能见度等相关的危险因素,与船舶性能相关的脆弱性因素,以及与人类行为相关的管理能力因素(Wang等人,2025年)。这导致航行风险数据呈现出高维多模态形式,包括定量数据和定性判断。在定性评估中,不同领域的专家评估往往不一致且模糊。在没有标准化的不确定性表示框架的情况下,从多模态数据中完全提取信息非常困难(Wang等人,2025年)。
贝叶斯网络模型由于其通过概率推理机制捕捉非线性关系的能力,已成为风险评估研究的基石(Terzi等人,2019年;Fan等人,2024年)。Li等人(2022年)使用贝叶斯网络描述了航行风险因素之间的相关特性,并预测了北极水域的风险。Khan等人(2020年)通过贝叶斯网络分析了香港水域的事故风险,并推导出各种事故类型的发生概率。最大似然估计和马尔可夫链蒙特卡洛(MCMC)通常用于估计先验概率和条件依赖性(Zhang等人,2024年)。然而,这些方法严重依赖于大规模数据集(Yu等人,2022年)。例如,一些研究基于大量的航行事故报告来计算概率和条件概率表(Khan等人,2020年;Khan等人,2020年)。为了解决电池系统火灾事故样本量有限的问题,Erol和Be?ik?i(2025年)通过整合危险与操作性(HAZOP)和贝叶斯信念网络(BBN)方法,基于实际风险评估案例,实现了船上电池火灾概率的定量计算。Lee等人(2024年)应用了加权求和方法来估计贝叶斯网络内的条件概率。此外,半监督学习和特征选择也被应用于小样本条件下的概率推理。然而,这些方法可能导致模式崩溃或丢失关键的特征交互模式(Duarte和Berton,2023年;Zhang等人,2022年)。自举方法具有三个核心优势:有效避免小样本场景中的模式崩溃,完全保留非线性特征交互,以及准确捕捉高维数据中的复杂特征相关性(Al Luhayb等人,2024年)。因此,为了解决小样本条件下的概率推理瓶颈问题,本研究提出了一种基于自举方法的多维扩展技术。
为了充分捕获多模态航行数据中包含的不确定性信息,将模糊认知映射方法与贝叶斯网络相结合是一种传统方法(Wang等人,2025年)。云模型常用于量化船舶航行风险的不确定性信息,然后构建贝叶斯网络模型来评估护航作业的碰撞风险(Li等人,2024年)。在其他研究中,使用改进的Z数来表征不确定性问题,同时利用贝叶斯网络分析各种因素之间的因果关系,最终实现了海运运输领域货物处理作业的主动风险评估(Tekeli等人,2025年)。此外,模糊逻辑用于不确定性量化,CREAM被应用于计算每种类型事故的认知故障概率(CFP)(Lee等人,2024年)。值得注意的是,现有研究主要集中在信息的数学处理上,忽略了实际评估场景中普遍存在的语言决策特征;这些特征难以进行精确的数值量化,本质上依赖于自然语言表达(Wang等人,2022年)。犹豫模糊语言集合理论保留了语言的直观性,并允许通过自然语言术语集和犹豫程度量化机制对语义信息进行数学操作(Wu和Xu,2015年)。本研究旨在构建一个基于语言信息驱动的贝叶斯网络框架进行风险评估。与传统模糊认知映射方法相比,新框架旨在实现两个关键目标:(1)通过犹豫模糊聚类算法解决非结构化语言数据到离散节点状态的可靠映射;(2)使用犹豫程度加权的条件概率学习方法加强网络对专家意见分歧的建模能力。
本文的贡献如下。首先,提出了一种多维自举扩展技术,以增强贝叶斯网络模型,解决小样本场景下的先验概率估计问题。其次,集成了一种犹豫模糊聚类层次算法,进一步细化贝叶斯网络模型,便于完全提取多模态航行风险数据中嵌入的不确定性信息。第三,提出了SSM-IBN,用于小样本多模态数据集情况下的远洋船舶航行风险评估。本文分为以下部分:第2节介绍了SSM-IBN的结构和数学原理;第3节进行了一些实验来验证SSM-IBN的有效性;第4节进行了海洋运输风险评估的案例研究;第5节提出了一些结论和未来的工作。

部分摘录

模型开发

在标准贝叶斯网络模型的基础上,SSM-IBN增加了几项关键改进,以提高其在风险评估任务中的准确性和功能性。首先,为样本量有限的指标设计了一个多节点自举风险样本扩展模块,大大增加了模型训练和测试的风险样本量和多样性,从而产生更可靠和通用性更强的风险评估结果。其次,在推导节点之后

仿真实验

本节主要进行了一系列仿真实验,包括在各种小样本条件下评估SSM-IBN的性能、模型的参数敏感性分析以及与其他模型的比较。

指标选择和结构学习

远洋船舶的航行风险评估是一个多维和非线性的课题(Zhang等人,2024年)。本研究的核心关注点是恶劣的海况和天气条件,这些是直接影响航行环境危险性的关键因素。本研究旨在开发一个更精细和全面的模型,以全面评估在不同情况下由恶劣海况和天气因素引起的多层次风险(即不同的人类

讨论

贝叶斯网络模型依赖于大规模数据集来计算准确的概率分布,但在小样本数据上的表现较差;此类数据集中的信息不足导致推断结果的准确性和可靠性较低(Yang等人,2022年;Zhu等人,2024年)。只有少数研究人员针对小样本情况优化了贝叶斯网络模型。例如,Hou等人(2022年)提出了一种使用迁移学习参数聚合方法的轴承故障诊断方法

CRediT作者贡献声明

钱龙霞:撰写——原始草案、方法论、调查、资金获取、概念化。王英英:撰写——原始草案、可视化、验证、方法论。洪梅:撰写——审阅与编辑、资源、调查。唐世倩:撰写——审阅与编辑、可视化。庞志成:撰写——审阅与编辑、验证。

资助

本工作得到了高影响天气重点实验室开放项目(专项)、中国气象局国家自然科学基金(批准号:42375016)的支持。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号