基于知识图谱增强的大型语言模型,用于解释起重机事故的因果关系分析

《RELIABILITY ENGINEERING & SYSTEM SAFETY》:Knowledge Graph-Enhanced Large Language Models for Explainable Causal Analysis of Crane Accidents

【字体: 时间:2026年05月11日 来源:RELIABILITY ENGINEERING & SYSTEM SAFETY 11

编辑推荐:

  张伟|曹一丹|张建荣 华中科技大学土木与水利工程学院,武汉430074,中国 摘要 起重机事故的特点是突发性强、演变过程具有链式特征,且因果因素之间的耦合性很强。传统的基于经验的方法不足以进行可靠的因果分析和基于证据的解读。本研究提出了一个基于知识图谱增强的大型语言模型框架,

  
张伟|曹一丹|张建荣
华中科技大学土木与水利工程学院,武汉430074,中国

摘要

起重机事故的特点是突发性强、演变过程具有链式特征,且因果因素之间的耦合性很强。传统的基于经验的方法不足以进行可靠的因果分析和基于证据的解读。本研究提出了一个基于知识图谱增强的大型语言模型框架,用于起重机事故场景中的可解释因果分析和问答。该框架基于人机环境管理(HMEM)框架建立了一个针对起重机事故原因的领域特定本体,并开发了一个多阶段的自动化知识提取流程。通过少量样本提示、关系 enrichment 和自判别过滤,该方法能够高效地提取事故实体和关系,从而构建出高质量的起重机事故知识图谱。进一步引入了图谱检索增强生成(GraphRAG)机制,将基于 BAAI General Embedding(BGE)的语义向量检索与多跳因果路径扩展相结合,实现了结构化约束的因果证据的检索。基于证据的生成策略确保生成的回答在逻辑上连贯,与检索到的因果证据一致且可追踪。“CraneSafe QA”原型系统支持知识提取、图谱可视化、因果链分析和交互式推理。实验表明,在不同语义深度的查询中,该系统在检索准确性、证据一致性和抗噪能力方面均有所提升。结果表明,基于知识图谱增强的大型语言模型显著提高了起重机事故场景中因果分析的可靠性和可解释性。

引言

起重机作为现代建筑中的关键设备,广泛应用于高层建筑、大型桥梁项目和其他复杂的工程场景中,极大地提高了施工效率[1]。然而,由于其复杂的机械结构和高度动态的工作环境,起重机也是施工现场事故风险最高的设备类别之一。事故发生时,往往会导致多人死亡和严重的财产损失。统计数据显示,2000年至2010年间全球共记录了1,125起与起重机相关的事故,造成780多人死亡[2]。中国国家市场监督管理总局发布的数据表明,2013年至2023年间发生了608起起重机事故,导致799人死亡[3]。如图1所示,近年来起重机事故的发生率仍然很高。传统的事故原因分析方法通常无法有效识别潜在危险或在高并发性和强耦合性的场景中实施及时干预。因此,迫切需要引入智能技术来增强对起重机事故原因的理解和解释。
随着人工智能技术的快速发展,知识图谱(KGs)已成为处理事故数据和揭示复杂因果关系的宝贵工具。通过结构化地建模事故相关实体及其相互关系,知识图谱将分散的信息整合成一个多维的、可查询且可解释的知识网络,支持事故分析、因果追踪和责任归属[4,5]。尽管知识图谱在结构化知识表示方面具有优势,但在实现智能知识检索、动态知识更新和基于证据的分析方面仍存在挑战[6,7]。同时,大型语言模型(LLMs)在处理复杂信息方面展现了巨大的潜力,凭借其强大的自然语言理解和生成能力。然而,由于训练语料库中缺乏领域特定知识,LLMs 在处理特定问题时常常会产生错误信息[8]。在起重机事故场景中,因果理解的准确性和可靠性至关重要,因此这些问题尤为严重,因为错误的建议可能导致严重后果。
为了解决这些挑战,检索增强生成(RAG)作为一种有效的解决方案应运而生。其核心思想是将外部知识与大型语言模型生成相结合,从而大幅提高事实准确性和响应可靠性[9,10]。传统的 RAG 方法主要依赖于文本片段检索,这限制了它们处理复杂多跳推理或跨文档推理任务的能力。相比之下,基于图谱的 RAG(GraphRAG)方法通过结构化的知识图谱来检索信息,保留了实体和关系中丰富的语义信息,同时支持多级和多跳的因果知识检索。因此,GraphRAG 更适合处理专业领域中的复杂问题[11,12]。这种范式特别适用于起重机安全场景,因为这些场景的特点是跨条件、跨因素和多阶段的链式演变过程[13]。
为此,本研究提出并开发了一个基于知识图谱增强的起重机事故分析问答系统(CraneSafe QA),该系统将领域特定的知识图谱与基于大型语言模型的分析相结合,如图2所示。该系统基于263份真实的起重机事故报告构建,并结合了人机环境管理(HMEM)框架,构建了一个全面覆盖事故原因、演变过程和后果的领域知识图谱。在此基础上,使用 BAAI General Embedding(BGE)模型进行深度语义向量检索,并引入了 GraphRAG 机制,将多跳基于图谱的推理与基于证据的生成相结合。这种集成使得模型能够生成逻辑连贯、基于证据的因果分析和问答结果。该系统提供了数据驱动的、结构化的、基于证据的起重机事故原因解释方法,同时也为高风险机械领域的事故原因分析探索了新的范式。本研究的主要贡献如下:
  • 领域知识图谱构建:本研究基于 HMEM 系统理论,利用大型语言模型从事故报告中提取关键信息,并以结构化形式表示,从而构建了一个针对起重机事故原因分析的领域知识图谱。与许多传统知识图谱不同,所提出的图谱明确组织了因果关系,使得事故机制能够得到结构化的表示。
  • 改进的检索增强生成:提出了一种改进的 RAG 方法,将基于 BGE 的语义检索与基于结构化知识的多跳图谱检索相结合。通过利用图谱的连通性,该方法能够识别相关的因果路径,克服了单跳文本检索的局限性,提高了问答结果的可靠性和可解释性。
  • 可解释因果分析的集成框架:CraneSafe QA 系统作为一个集成框架,连接了数据处理、知识提取、图谱构建和检索增强问答。该框架支持基于证据的回答,并提供了答案与结构化知识之间的可追踪链接,增强了因果分析的透明度。

章节片段

起重机事故的特点是风险高度集中,多个致病因素之间的耦合性强[14,15]。鉴于这种复杂性,学术研究和工程实践已经开发了相对全面的管理框架,涵盖了人力、机械、环境和管理等多个维度。各种分析工具被广泛应用,包括故障树分析(FTA)[16]、决策制定试验与评估实验室方法(DEMATEL)[17] 等

为了解决起重机事故知识嵌入在大量非结构化文本中且难以有效利用的问题,本研究开发了一个端到端的、基于知识增强的智能问答系统 CraneSafe QA,如图3所示。需要注意的是,该框架不执行因果发现或因果效应估计。相反,它依赖于从事故报告中提取的结构化因果关系

本研究选择塔式起重机作为研究目标,因为它们在建筑施工中应用广泛,且相对于其他类型的起重机,事故发生率更高。事故调查报告从中华人民共和国应急管理部和省级应急管理机构的官方网站系统中系统收集,并结合了行业安全公告和公开发布的安全信息

结果表明,提出的 CraneSafe QA 系统在检索准确性、证据一致性和回答质量方面表现稳定,消融研究突显了结构化知识表示和图谱增强因果路径分析的作用。然而,在 VERA 协议下使用 GPT-4o-mini 作为自动评估器可能会引入自我强化偏差,因为评估器和被评估系统可能具有相似的训练分布

本研究提出了一个用于起重机事故场景中的可解释因果分析和问答的知识图谱增强框架。通过集成自动化知识提取、知识图谱构建、图谱增强检索和基于证据的回答生成,该框架实现了起重机事故知识的结构化表示、因果链重建和基于证据的解释性问答。主要发现如下:

  • 一个

张伟:概念化、方法论、形式分析、写作 - 原始草案、可视化、验证、调查。曹一丹:方法论、形式分析、数据管理、软件、验证、可视化、调查、写作 - 原始草案。张建荣:方法论、实验设计、监督、项目管理、资源协调、写作 - 审稿与编辑。

作者声明他们没有已知的会影响到本文工作的利益冲突或个人关系。

本文得到了中国国家重点研发计划[资助编号 2021YFB3301100]的支持。作者对此表示衷心的感谢。

张伟:写作 – 原始草案、可视化、验证、方法论、调查、资金获取、形式分析、概念化。曹一丹:写作 – 原始草案、可视化、验证、软件、方法论、调查、形式分析、数据管理。张建荣:写作 – 审稿与编辑、监督、资源协调、项目管理、方法论。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号