编辑推荐:
煤矿瓦斯突出预警系统研究提出基于SHAP提示和预训练大语言模型的多模态融合框架STime-LLMs,通过时间序列特征提取与文本语义对齐实现长期预测,结合模糊逻辑评估提升主动预警能力,实验准确率达94.17%且提前30分钟预警。
刘炳龙|李中华|王恩远|张朝阳|尹山|田赫
中国矿业大学煤矿瓦斯与火灾控制重点实验室,徐州221116,中国
摘要
煤与瓦斯突出是深部地下工程中的一种严重危害,其特点是突发性和巨大的破坏潜力。为了解决当前早期预警系统存在的持续性问题,特别是风险信息利用不足、时间延迟以及依赖被动防御机制的问题,本研究引入了STime-LLMs框架。该框架基于SHAP提示技术和预训练的大型语言模型(Pre-LLMs)。首先,我们使用SHAP分析从时间序列数据中提取关键特征,并将其重构为文本形式。然后,通过利用Pre-LLMs将原始时间序列数据与SHAP文本洞察力和传统指标结合起来,实现了可靠的长期预测,有效解决了多模态数据融合的复杂挑战。最后,通过将历史数据和预测数据整合到模糊评估模块中,该框架实现了对瓦斯突出危险的主动态势感知。实验结果表明,所提出的方法具有94.17%的态势评估准确率,并能在30分钟内识别潜在风险。
引言
煤与瓦斯突出是指在隧道挖掘过程中瓦斯和煤的动态剧烈喷发,是地下工程中最具破坏性的危险之一,对人员安全和项目经济可行性构成严重威胁(Lei等人,2025;李勇等人,2025;王等人,2022)。随着挖掘深度的增加,地质条件和瓦斯发生情况的恶化,这些突发的突发性和破坏强度持续增强(刘涛等人,2023;尹山等人,2024;唐等人,2022;张晓等人,2022)。由于这一复杂系统的高度非线性,传统的静态评估方法难以捕捉灾难演变的瞬态和变化特征,导致早期预警系统存在时间延迟和仅依赖被动防御机制的局限性(Agrawal等人,2023;张等人,2024)。因此,迫切需要建立一个能够深度整合实时监测风险特征和传统指标的瓦斯突出安全态势感知模型。这样的模型对于实现向主动态势感知的转变至关重要,从而满足在复杂深地环境中进行主动预防和控制的需求。
在煤层隧道挖掘过程中,广泛使用切屑解吸指数、气体压力和切屑量等指标来表征前方煤体的瓦斯发生情况、地质结构和物理参数(郭等人,2026;纪等人,2023;舒等人,2023;张刚等人,2022)。虽然基于这些指标的传统临界值方法可以部分识别突出风险,但测量过程耗时且劳动强度大。因此,这些方法阻碍了动态风险评估,无法捕捉挖掘过程中突出灾害的时间演变规律(郭等人,2024;王等人,2020;王等人,2024;张凯等人,2020;张等人,2023)。最近,监测技术的进步促进了动态预警方法的发展。利用非接触式技术,如声发射(AE)、电磁辐射(EMR)和微地震信号,这些方法实现了连续监测和动态评估(任等人,2025;芮等人,2024;舒等人,2022;岳等人,2025)。然而,干扰信号的区分仍然是一个持续存在的挑战,往往导致预警结果受到环境噪声的影响而非实际危险的前兆(陈等人,2024;Kursunoglu和Onder,2019;李等人,2023)。
相比之下,气体浓度监测数据包含了更丰富的潜在预警信息。研究人员广泛分析了气体浓度序列的统计、分形和混沌特征,以提取突出的预警信号(陈等人,2025;刘炳龙等人,2024;刘晓等人,2023;宋等人,2019)。同时,机器学习和神经网络框架被用于预测气体浓度,以促进主动预警(Akda?和Fi?ne,2023;张勇等人,2020)。然而,尽管在灾害评估和预警技术方面取得了显著进展,但仍存在一些关键挑战。首先,传统静态指标与实时监测数据的整合不足,导致综合风险信息利用不足。其次,传统的机器学习和神经网络模型严重依赖大规模标记数据集,这与实际风险样本的稀缺性相矛盾。最后,气体浓度动态的高度非线性往往导致长期预测的准确性不佳,从而限制了这些方法在实地应用中的效果。
为了解决这些挑战,预训练的大型语言模型(Pre-LLMs)提供了一个新的视角。从根本上说,LLMs是在大规模语料库上训练的基础模型,在自然语言处理任务中表现出色,同时具备预测建模所需的复杂推理和上下文识别能力(李宏等人,2025;林等人,2024;赵等人,2024)。重要的是,LLMs的核心架构可以无需大量重新训练即可适应预测任务。研究人员已经进行了大量研究,将时间序列数据与LLMs架构对齐,使其在医学、交通和材料科学等多个领域得到广泛应用(Atangana Njock等人,2025;Moon等人,2025;徐和刘,2025)。这一范式为解决煤矿瓦斯分析中的关键瓶颈提供了有希望的新途径,特别是风险样本的稀缺性和长期预测的不足。此外,LLMs处理多模态知识的能力(涵盖文本、语言和图像)引起了研究界的广泛关注。通过利用这种知识来对齐多模态数据,这些模型促进了不同数据类型的整合,从而解决了多源异构数据融合的传统难题(Chan等人,2025;金等人,2024;林等人,2025;刘晨等人,2025)。然而,将通用LLMs的语言能力成功应用于瓦斯灾害预防特定领域,需要克服时间序列数据的语义对齐和异构输入融合的挑战。具体来说,连续的气体时间序列数据缺乏语义上下文,这意味着直接输入无法充分激活LLMs的推理潜力。相反,用于突出预测的关键传统指标是低频数据,具有时空不对齐的特点。因此,需要一个强大的融合机制来保持这些静态指标在模型中的物理约束效果。
本文提出了STime-LLMs,这是一个多模态瓦斯突出安全态势感知框架,它将SHAP提示技术与Pre-LLMs相结合。首先,我们使用SHAP方法从时间序列数据中提取关键特征,生成描述性文本提示。同时,利用补丁重编程技术将连续的时间序列切片映射到预训练模型可理解的文本嵌入中,实现时间特征和语言语义之间的深度对齐。然后,利用Pre-LLMs的强大跨领域推理能力,预测气体浓度和风速监测数据的长期演变趋势。同时,指定的池化和门控机制将低频静态指标(如钻屑量和地质结构)作为物理约束嵌入到评估和预测过程中,从而减轻单一来源数据中的潜在偏差。最后,在态势感知层中,我们构建了一个基于模糊逻辑的决策模型。该模型对LLM生成的动态预测和传统静态指标进行决策级融合。通过计算这些多维指标的隶属度,该框架实现了对瓦斯突出安全状况的定量评估。
本文的主要贡献如下:首先,我们提出了一种基于Pre-LLMs的长期瓦斯突出预测新范式,在样本量小和非线性条件下显著提高了气体浓度预测的鲁棒性和泛化能力;其次,我们设计了一种利用SHAP文本提示和门控机制的多模态语义对齐方法,有效解决了连续时间序列数据与离散文本知识之间的语义对齐问题,同时整合了静态指标;最后,我们构建了一个瓦斯突出安全态势感知模型,通过模糊逻辑将LLMs的动态预测输出与静态地质指标深度整合,实现了从被动监测到主动态势感知的转变,为深隧道中的灾害预防和控制提供了有效方法。
部分摘录
特征提取和SHAP文本前缀
在隧道挖掘背景下,气体浓度是地质条件、煤层瓦斯发生和挖掘技术相互作用因素的综合体现,同时也受到风速的显著干扰。鉴于实时监测数据包含了丰富的潜在关键信息,我们对气体浓度和风速数据进行了四个主要维度的特征提取:统计特征、趋势
时间序列数据的有效特征提取
实时气体浓度监测数据是评估瓦斯突出风险的基本指标,因为这类灾害的前兆阶段总是伴随着气体浓度的异常波动。因此,本研究采用特征挖掘和分析技术从这些数据中提取显著的预警特征。通过系统地分析四个不同维度的实时监测数据,包括分布、趋势、峰值等
时间序列监测和文本双模态数据融合过程
总之,本研究在结构化建模框架内利用SHAP分析从时间序列数据中提取强相关的时变特征信息。通过双模态框架的文本分析模块,我们为时间序列输入提供了上下文背景和关键局部特征信息。此外,时间序列数据经过重新编程,生成与Pre-LLMs兼容的数据表示,而SHAP衍生的文本信息则
双模态瓦斯突出安全态势感知结果分析
在本研究中,我们使用Pre-LLM BERT,将训练和验证限制在补丁重编程、时间序列数据和SHAP文本提示的双模态融合以及态势评估上。与STime-LLMs的完整参数微调相比,我们的方法只需要少量的时间序列数据和15个训练周期即可完成模型训练。训练过程中建立的参数配置详见表3
结论
本文提出了STime-LLMs,这是一种能够将深隧道实时监测数据与文本特征和静态指标整合的多模态模型。该框架代表了隧道挖掘过程中瓦斯突出安全态势感知(评估和预测)基础模型的重大方法论进步。具体结论如下:
1.通过引入文本语义表示来增强道路监测数据的利用
CRediT作者贡献声明
田赫:方法论。尹山:形式分析。张朝阳:形式分析。王恩远:可视化、验证。李中华:写作——审阅与编辑、监督。刘炳龙:写作——审阅与编辑、原始草稿、方法论。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
本研究得到了中国国家重点研发计划(2022YFC3004705)、贵州省科技规划项目(编号[2023] General 279)和江苏省科技计划专项基金(BM2022013)的支持