复合故障诊断的复杂因果推理链：提升基于超图的因果强化学习模型（Causal-LLM）的干预推理能力

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《JOURNAL OF MANUFACTURING SYSTEMS》：Long causal chain-of-thought for compound fault diagnosis: enhancing hypergraph-based Causal-LLM intervention reasoning

【字体：大中小】 时间：2026年03月24日 来源：JOURNAL OF MANUFACTURING SYSTEMS 14.2

编辑推荐：

　　复合故障诊断中提出基于超图知识图谱的长因果链推理方法，通过分层提示自动构建因果超图，强化学习训练因果LLM实现动态干预推理，闭环算法提升根因定位和解决方案生成准确性。

李飞|李新宇|鲍金松

东华大学机械工程学院，上海201620，中国

摘要

设备故障调查文档包含了丰富的语义信息，这些信息隐含地描述了关键组件的因果状态和故障机制。然而，由于设备故障的复杂性以及干预后因果链的动态演变，当前的大型语言模型（LLMs）在模拟长链因果关系和多耦合复合故障语义方面存在困难。这些限制阻碍了对干预效果的准确推断，并制约了有效的根本原因定位和解决方案决策。为了解决这些问题，我们提出了长因果链思维（LC-CoT）方法，该方法增强了基于超图的因果LLM在复合故障诊断（CFD）中的干预推理能力。首先，一种少样本LC-CoT提示策略指导LLM分层分析故障树，并自动构建因果知识超图（CKH）。其次，采用带有因果干预反馈的强化学习策略来训练因果LLM进行长链因果推理和动态干预。第三，LC-CoT推理算法将细粒度的CKH检索与干预推理相结合，从而在复合故障场景中实现准确诊断。最后，基于桥式起重机案例研究构建了一个CKH，并使用47,466个三元组来训练因果LLM。在CFD任务上的消融实验和对比实验进一步证明了所提出方法在根本原因分析、解决方案决策和干预推理方面的优越性和有效性。

引言

准确的故障诊断对于智能大型设备的安全运行至关重要[1]。在整个系统生命周期中，从设计制造到运行维护，大量的领域知识不断被收集、结构化并保存在诊断报告中，从而为健康评估和根本原因分析提供了坚实的数据基础[2]、[3]。故障诊断的本质在于深入理解故障传播的因果机制，这使得能够快速定位根本原因并制定最佳解决方案。知识图谱（KGs）通过建立结构化的关联、消除冗余和量化推理不确定性，为建模因果知识提供了坚实的基础[4]。当KG作为LLM的外部检索知识库使用时，它不仅显著增强了因果推理能力，还允许随着知识的发展实时更新领域信息，从而避免了固定LLM参数所需的频繁微调[5]、[6]。

为了捕捉复合故障中多因素耦合引起的高阶语义，需要构建一个知识超图来进行精确表示[7]。这种方法将复合故障超边引入知识图谱中，定义为连接两个或多个实体的不可分割的n元关系。在图1(a)所示的CKH示例中，创建了两种超边类型：?，表示A + B → C，以及?，表示G → I + C。现有的KG-LLM方法仍然难以从长上下文语料库中提取跨越多个实体的长链因果关系和复合故障的多元关联，并且它们忽略了扩展的思维链推理所带来的好处[8]、[9]、[10]。

思维链（CoT）提示显著提高了LLM在常识性因果推理中的性能[11]、[12]。然而，在需要更高鲁棒性的故障诊断场景中，仍然存在两个关键挑战。首先，复合故障的复杂因果结构，其特征是长因果链和高阶超边，难以与LLM的表示完全对齐，这成为因果推断的一个关键瓶颈[13]、[14]、[15]。其次，尽管LLM能够生成CoT，但它们无法将每个推理子步骤与KG检索过程同步对齐，导致链推理和检索操作之间出现不一致。此外，设备检查通常涉及实时干预，导致长因果链动态演变。LLM在因果动态干预推理方面仍存在局限性[16]、[17]。将干预效果纳入LLM推理循环可以显著提高复合故障根本原因的准确定位和最佳解决方案的生成。

为了解决上述挑战，我们提出了一种LC-CoT增强型推理方法，用于复合设备故障中长链因果关系的协作干预诊断。首先，设计了一种少样本LC-CoT提示策略，用于从长上下文诊断叙述中分层提取树状结构的长因果链和复合超边，从而实现CKH的自动构建。进一步开发了一种基于强化学习（RL）的因果感知对齐（CAA）策略，结合因果干预反馈来训练LLM，使得因果LLM具备长链推理和动态干预能力。在图1(a)所示的“根本原因分析和解决方案决策”示例中，因果LLM最初从查询中推断出部分链B → D → G，并将其分解为两个连续的因果对（B, D）和（D, G），增强了LC-CoT推理子步骤与CKH检索之间的细粒度协作。经过多阶段路径评估后，因果LLM输出了合并后的Top-1长因果链：A + B → C → D → E → F → G。通过利用因果LLM，链节点的分类如下：A和B是根本原因节点（作为链的起点，满足P(G=0 | A=0 ∨ B=0)=1；E是可干预原因节点（有可执行的干预解决方案，满足P(G=0 | E=0)=1；C、D和F是传播节点（传递因果性但无需干预）。最终，模型确定A和B为根本原因，E为可干预原因，然后生成相应的干预解决方案。图1(b)展示了因果干预推理的过程。因果LLM首先评估初始干预do(A=0)：尽管这减轻了C的发生，但条件B=1仍然会触发C=1。这导致推断出干预后的因果链：do(A=0)+B=1→C=1→D=1→E=1→F=1→G=1，从而确定故障G仍会发生。然后模型进入第二阶段的干预，遵循类似的迭代过程进行细化。LC-CoT增强实现了“复合长链推理和分阶段干预”的闭环诊断过程，有效提高了复杂故障的根本原因定位和解决方案决策的准确性。

总之，本研究做出了以下三个独特的贡献：

(1)

工业诊断的知识结构化。我们提出了一种少样本LC-CoT提示策略，指导LLM进行分层故障树分析和CKH的自动构建。这使得能够系统地从故障票据和手册中提取长链因果依赖性和复合超边语义，大大减少了工业故障建模中的手动知识工程工作。

(2)

用于可执行推理的干预保真度学习。我们开发了一种CAA强化学习策略，共同优化了链的一致性、多因果正确性和干预连贯性。通过结合干预条件下的奖励反馈和包含事实及干预样本的LC-CoT指令集，所得到的因果LLM实现了更可靠的长链推理和基于动作的条件结果预测，这对于维护决策支持至关重要。

(3)

用于维护执行的闭环干预推理。我们设计了一种基于CKH的闭环干预推理算法，将细粒度的CKH检索、分阶段因果推理和干预推导统一在一个框架内。这种闭环设计提高了根本原因定位和解决方案决策的准确性和效率，为可解释和可验证的工业维护辅助提供了实用途径。

本文的其余部分组织如下。第2节回顾了基于因果KG的故障诊断、增强型LLM基因果推理和CoT增强型LLM-KG可解释性的研究。第3节介绍了整体框架，包括LC-CoT增强的CKH构建、基于CAA的因果LLM训练以及长因果链根本原因分析和干预推理算法。第4节基于工程案例研究展示了多项消融实验和结果评估，展示了人机协作故障诊断的交互过程。第5节讨论了所提出方法的发现、意义和局限性。最后，第6节总结了本文。

部分片段

KG驱动的故障诊断

在整个设备生命周期中生成的故障调查报告为根本原因分析和操作安全提供了关键的数据基础[18]。KGs以图形形式表示实体及其关系，而LLMs在语义理解和推理方面表现出色。KGs和LLMs的集成已广泛应用于工程文档检索[19]、装配顺序规划[20]、[21]以及设备故障诊断[22]、[23]、[24]、[25]等任务中。

整体框架

对于设备中的CFD任务，LC-CoT增强型超图基因果LLM推理的架构如图2所示。核心框架包括三个主要组成部分：LC-CoT增强的CKH构建、用于支持因果LLM因果干预反馈训练的LC-CoT数据结构指令集，以及用于执行两个关键任务——根本原因分析和解决方案决策（RCA-SDM）和因果干预的LC-CoT增强型因果推理算法

实验数据

为了验证所提出方法的有效性，对某种桥式起重机设备进行了CFD案例研究。收集并存储了由一线检查员在近五年内记录的480份设备故障票据，数据以固定词表格式保存，如图3所示。该数据集记录了故障过程、原因分析和故障措施等键值对数据。使用提示和一次性LC-CoT示例进行基于LLM的提取

讨论与局限性

复合故障的因果链既复杂又动态，涉及长链语义、多耦合实体和干预后的传播阻塞。现有方法难以表示这种复杂的因果结构，并对长因果链中的干预进行推理。本研究提出了一种基于LC-CoT的推理方法，以增强复合故障的协作干预诊断。该方法采用一次性LC-CoT提示策略指导LLM提取

结论

对于设备维护中的CFD，我们提出了一种LC-CoT增强型超图基因果LLM干预推理方法。首先，少样本LC-CoT提示策略指导LLM自动挖掘长因果链并从故障票据中提取复合故障语义，生成连接多个故障实体的超边，从而实现CKH的自动构建。其次，引入了带有因果干预反馈的CAA微调策略。一个加权奖励

利益声明

下面列出的作者声明他们与任何组织或实体没有关联或参与，无论是在财务利益（如酬金；教育资助；参与演讲者机构；会员资格、就业、咨询公司、股票所有权或其他股权利益；以及专家证词或专利许可安排）方面，还是在非财务利益（如个人或专业关系、隶属关系、知识或信念）方面

CRediT作者贡献声明

李飞：写作 – 审稿与编辑，写作 – 原始草稿，可视化，验证，软件，方法论，数据管理。李新宇：写作 – 审稿与编辑，可视化，资源，方法论，调查，资金获取，形式分析。鲍金松：写作 – 审稿与编辑，验证，监督，资源，资金获取，概念化。

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

致谢

本工作得到了国家自然科学基金（资助编号：52475513 和资助编号：52405256）以及上海市科学技术委员会的关键技术研发计划（编号：25JC3202300）的支持。

联系信箱：

粤ICP备09063491号

摘要

引言