基于变压器的火灾类型识别技术,结合抑制策略映射以实现智能火灾响应

《Process Safety and Environmental Protection》:Transformer-based fire-type recognition with suppression strategy mapping for intelligent fire response

【字体: 时间:2026年02月16日 来源:Process Safety and Environmental Protection 7.8

编辑推荐:

  准确识别火灾类型对制定适当扑救策略至关重要。本文提出基于Transformer的火灾类型识别与扑救策略映射框架,创新性引入火感知位置编码和关系适配器模块,解决传统视觉模型难以捕捉火焰动态特征及复杂场景适应性问题。通过构建包含2480张标注图像的混合数据集,实验表明该框架在F1-score达82.0%、mAP@0.5达80.9%的指标上显著优于基线模型,实现火灾类型与灭火剂的有效映射。

  
陶建远|王平|姜汉峰|韩宇
中山大学智能系统工程学院,中国深圳市兴港西路,518107

摘要

准确识别火灾类型对于在安全关键环境中指导适当的灭火策略至关重要。错误的响应可能会加剧危险,导致设备损坏、有毒物质排放或严重的安全风险。尽管基于视觉的火灾检测在实时识别方面取得了进展,但大多数现有系统仍然局限于二进制检测,缺乏针对特定类型火灾的灭火策略指导。本研究提出了一个基于Transformer的框架,用于火灾类型识别和灭火策略映射,从而弥合了视觉感知与可操作应急响应之间的差距。该架构具有两个主要优势:一种火灾感知的位置编码,可以改善动态火灾特征的空间建模;以及一种火灾关系适配器,可以在复杂的火灾条件下促进上下文感知的特征适应。与之前的火灾特定Transformer变体不同,所提出的设计引入了明确的火灾感知空间编码和针对火焰及烟雾动态的关系适应。此外,还开发了一种基于标签的灭火策略映射机制,将每种识别的火灾类型与推荐的灭火剂关联起来,以实现可解释和可操作的决策支持。为了支持强大的训练和评估,构建了一个包含2480张标记RGB图像的双源数据集,涵盖了四种火灾类型(A/B/C/E类),这些图像结合了真实场景中的火灾图像和从12种代表性可燃材料中收集的实验数据。实验表明,所提出的框架在多个评估指标上始终优于现有的最佳基线,尤其是在数据受限的条件下。实验结果显示,该框架的F1分数为82.0%,mAP@0.5为80.9%,在各种评估指标上均表现出一致的改进。本研究作为一个概念验证提出,而不是一个已部署的系统,目前在数据规模、火灾类型多样性和现场验证方面存在局限性。

引言

不同类型的火灾具有不同的强度和蔓延程度。更重要的是,它们的燃烧特性直接影响了适当的灭火方法。标准的消防安全规范(例如NFPA 1;EN 2)定义了基于风险的火灾类别及其相应的灭火剂。错误分类可能导致复燃、有毒烟雾释放、设备损坏或电气危险。在电池存储系统(Huang等人,2024年)、人口密集的城市地区(Chow,2009年)和工业场所(Barry,2016年)等环境中,这一问题尤为突出,因为这些地方的复杂材料组成和受限空间增加了错误应用灭火策略的可能性,这里作为激励示例而非直接部署场景。在野地-城市交界区域,未能识别火灾类型导致了不可控制的火灾蔓延和结构损失(Hakes等人,2017年)。这些现实情况突显了需要智能系统来超越简单的火灾检测,以提供特定类型的、可操作的灭火指导。尽管已有几项研究探讨了火灾/烟雾分类或灭火剂扩散行为,但很少有研究明确将火灾类型识别与灭火策略映射相结合。这是现代消防安全管理的关键组成部分。
尽管基于深度学习的火灾检测取得了显著进展,但大多数现有模型仍然局限于二进制分类任务:即判断是否存在火灾。使用CNN和YOLO变体的常见方法已经实现了高精度和实时性能(Cheng等人,2024年;Gragnaniello等人,2024年;?zel等人,2024年),但将所有火灾视为单一的视觉类别。然而,通常会忽略与火灾类型和灭火需求相关的关键线索,如火焰颜色、烟雾密度和空间纹理。YOLOv5和YOLOv4已被广泛应用于火灾检测任务(Maric等人,2023年;Bochkovskiy等人,2020年),Faster R-CNN和SSD(Ren等人,2015年;Liu等人,2016年)也是如此。然而,由于这些模型主要是为一般对象检测设计的,它们缺乏区分不同燃烧类型所需的语义粒度,因此不适合需要精确灭火决策的操作安全场景。
虽然某些先前的系统已经对灭火动态或基于规则的响应进行了建模,但当前的基于视觉的火灾检测流程很少将视觉输出转化为可操作的灭火策略。一些现有研究调查了灭火剂的扩散行为(Ge等人,2020年)、火灾风险评估框架(Lin等人,2025年)以及海洋环境的安全系统(Makhmudov等人,2024年;Alkhatib等人,2024年)。然而,这些系统通常依赖于传感器输入或预定义的规则,而不是使用基于图像的火灾类型分类作为决策的动态触发器。即使是视觉辅助的安全监控平台也往往仅停留在检测阶段,而不提供灭火建议(Chen等人,2023年)。为了解决这一差距,本研究提出了一种基于标签的策略机制,将每种火灾类型分类(例如B类)与其适当的灭火剂(例如泡沫)联系起来,形成了视觉感知与应急响应操作之间的可解释接口。
火灾感知还面临许多挑战:火焰的形状和强度是动态变化的,烟雾会导致不同程度的遮挡,背景可能被阳光、雾或反射等令人困惑的元素所干扰。这些问题会降低模型在真实世界场景中的性能。几种基于CNN的方法,包括改进的YOLOv5变体(Wu等人,2022年)、密集架构如FSDNet(Zhu等人,2023年),以及为嵌入式或稳健操作设计的紧凑型或低功耗模型(Zheng等人,2023年;Xu等人,2023年;de Venancio等人,2022年;Sun等人,2023年),试图增强多尺度表示,但在视觉复杂的火灾条件下往往牺牲了特征的表达能力。这些局限性突显了需要更强大和上下文感知的特征增强策略。
最近的基于Transformer的检测器,如DETR,展示了强大的全局推理和端到端优化潜力(Carion等人,2020年)。DETR消除了后处理和锚点设计的需求,提高了场景级别的理解能力。然而,对于火灾类型检测,DETR有两个局限性。首先,其固定的正弦位置编码不足以表示火灾的不规则轮廓和快速演变。尽管Deformable DETR解决了一些定位问题(Zhu等人,2020年),但它没有结合特定领域的火灾表示。其次,DETR缺乏场景自适应的预编码机制,这限制了其在复杂火灾环境中的鲁棒性。最近提出的针对火灾的Transformer(Sun和Cheng,2024年;Wang等人,2023年;Yang等人,2024年),如FSH-DETR(Liang和Zeng,2024年)和FTA-DETR(Zheng等人,2024年),虽然提高了准确性,但并未直接解决火灾类型分类或灭火决策的需求。与这些Transformer变体不同,我们的框架引入了一种火灾感知的位置编码,通过门控融合将坐标和多正弦嵌入结合起来,以及一个火灾关系适配器,明确模拟了火焰、烟雾和背景区域之间的上下文依赖性。这两个模块共同增强了火灾特定识别任务的空间推理和上下文适应能力。
总之,本研究提出了一个统一的基于Transformer的框架,用于火灾类型识别和灭火策略映射,以支持安全关键火灾响应情况下的实际决策。主要贡献如下:(1)一种火灾感知的位置编码模块,用于增强火灾特征的空间表示;(2)一种火灾关系适配器,用于在复杂场景中提高适应性;(3)一种基于标签的映射系统,将分类输出与相应的灭火剂关联起来;(4)一个结合了网络收集和实验室生成的火灾图像的双源数据集,这些图像基于12种材料,每种材料被手动分类为A/B/C/E类。总体而言,这些组件支持多样化的安全应用中的可解释和实用的火灾响应规划。应当注意的是,本研究在数据规模和火灾类型多样性方面仍存在局限性,尚未进行现场验证。

部分摘录

火灾检测模型和类型感知识别

传统的火灾检测模型主要关注确定火灾的存在与否。卷积神经网络(CNN)和一阶段检测器,如YOLOv3、YOLO9000和YOLOv5,因其实时性能和在视频或图像中检测火焰区域的鲁棒性而被广泛采用(Redmon和Farhadi,2018年;Redmon和Farhadi,2017年;Redmon等人,2016年)。这些模型通常为类似火灾的区域生成边界框,从而支持早期预警

方法论

所提出的模型采用基于Transformer的架构,执行集成的火焰定位、火灾类型分类和灭火策略映射,以支持实际的火灾响应应用,如图1所示。该模型在DETR的基础上构建了ResNet-50骨干网络,并提出了两项针对性的改进,以改善对复杂火灾场景的感知:一种火灾感知的位置编码,它融合了坐标和多频率正弦嵌入,以更好地捕捉

数据集构建

真实场景火灾数据集
数据集的第一个组成部分包括从公开可用的火灾事件记录、消防安全图像库和媒体来源收集的1240张RGB图像,如图4所示。这些图像涵盖了住宅、工业、交通和公共基础设施环境中的各种真实世界火灾场景。每张图像都经过了手动筛选,以确保存在清晰可见的火焰和相关上下文线索。

性能分析

如表2所示,所提出的模型在所有评估指标上始终优于所有基线检测器。它在火灾类型分类准确性方面取得了最高的F1分数(82.0%)、精确度(86.0%)和召回率(78.4%)。这种优异的性能反映了模型在处理具有不同视觉特征的火灾类型时提取稳定和区分性特征的能力,即使在反射眩光或低对比度烟雾等具有挑战性的条件下也是如此

结论

本研究提出了一个针对火灾类型感知和灭火策略指导的增强型基于Transformer的框架,解决了现有火灾检测系统中的关键局限性。所提出的架构结合了两个新颖组件——火灾感知的位置编码和火灾关系适配器——显著提高了模型捕捉与火灾现象相关的关键视觉线索的能力,并提供了可靠的火灾类型分类

CRediT作者贡献声明

陶建远:撰写——原始草案、方法论、概念化。王平:撰写——审阅与编辑、监督、资源协调。姜汉峰:可视化、验证、数据管理。韩宇:监督、资源协调、资金获取。

资金信息

中国广东省科学技术规划项目,资助/奖励编号:2024B1111100001GDNRC[2024]52

未引用的参考文献

Mukherjee等人(2022年)

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系,这些关系可能会影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号