一种基于视频的多目标动态排放检测的资源高效型森林火灾烟雾快速准确检测系统

《Array》:A resource-efficient system for rapid and accurate forest fire smoke detection using Video-based Multiple Object Kinetic Emission Detection

【字体: 时间:2026年06月07日 来源:Array 4.5

编辑推荐:

  森林火灾代表着重大的环境威胁,主要是由于其造成的巨大经济损失和人员伤亡。烟雾是野火最明显的早期指标。然而,利用计算机视觉有效检测烟雾具有挑战性,特别是当烟雾距离相机较远且仅在有限区域内可见时。克服这一挑战的当前方法通常需要对更高分辨率图像进行计算密集型处理,或

  
森林火灾代表着重大的环境威胁,主要是由于其造成的巨大经济损失和人员伤亡。烟雾是野火最明显的早期指标。然而,利用计算机视觉有效检测烟雾具有挑战性,特别是当烟雾距离相机较远且仅在有限区域内可见时。克服这一挑战的当前方法通常需要对更高分辨率图像进行计算密集型处理,或安装更高密度的相机,这两种都是昂贵的解决方案。为了解决这些限制,研究人员引入了一种名为基于视频的多目标动态排放检测(Video-based Multiple Objects Kinetic Emission Detection, VMOKED)的新框架。它专门设计用于在集中式多流处理环境中,即使在有限的计算预算下,也能准确且可扩展地检测森林烟雾排放。VMOKED框架集成了三个关键组件:(1) 实时目标检测模型,(2) 利用特征金字塔网络架构和MobileNetV3骨干网络的紧凑型天空地面分割(Sky-Ground Segmentation, SGS)模型,以及(3) 设计用于有效利用时间信息的运动测量模块。在研究人员的数据集上的实验结果表明,所提出的VMOKED框架在定量性能上优于其他方法。突出其效率,VMOKED仅需每秒64.89千兆浮点运算(Giga Floating-Point Operations Per Second, GFLOPs),并实现了仅7.65毫秒的检测时间。代码可在https://doi.org/10.5281/zenodo.20474086获取。
森林火灾是重大的环境威胁,主要由其引发的经济损失和人员伤亡构成。烟雾作为野火最早期的可见指标,但计算机视觉检测面临挑战,尤其在烟雾距离相机远、仅小范围可见时。现有方法需要高分辨率图像处理或更多相机,成本高昂。为此,研究人员提出了一种基于视频的多目标动态排放检测(VMOKED)框架,专门用于在集中式多流处理环境中,低计算预算下准确且可扩展地检测森林烟雾。该框架集成实时目标检测、紧凑型天空地面分割(SGS)(基于特征金字塔网络和MobileNetV3骨干)以及运动测量模块。实验结果表明,VMOKED在F1分数(0.9456)、延迟(7.65 ms)和计算量(64.89 GFLOPs)上优于对比方法,并可同时处理42路视频流。论文发表在《Array》。

研究人员采用的关键技术方法包括:使用YOLO-NAS L模型(基于PP-YOLOE损失)作为实时目标检测模块,用于初始空间候选区域识别;采用基于特征金字塔网络(FPN)架构和MobileNetV3骨干的紧凑型天空地面分割(SGS)模型(输入尺寸320×320,使用Dice损失),用于过滤天空区域误报;设计运动测量模块(计算M1和M2分数基于帧间差异),用于确认烟羽动态特征。数据来源为自建数据集:WSDataset(包含11,539帧正样本和13,095帧负样本)和SGSDataset(15,790个标注样本),均来自越南林同省热带森林区域的42个高海拔相机。

**评估各组件性能与贡献(Q1)**:通过消融实验,研究人员发现单独使用YOLO-NAS L时F1为0.8391、准确率0.8903。引入SGS模块后F1提升至0.8734、准确率0.9147;引入运动测量模块(M1和M2)后F1提升至0.9011、准确率0.9372。三者联合使用达到最佳性能:F1 0.9456、准确率0.9669。这表明SGS和运动测量模块分别从空间上下文中过滤天空区域误报和利用时序特征消除静态物体误报,互补增强。

**测量VMOKED框架的部分延迟(Q2)**:通过分解各组件延迟,研究人员测得正常模式下总延迟为7.69 ms(YOLO-NAS占6.28 ms,运动测量占0.53 ms,预设相似性检查占0.88 ms);预设切换场景下(占比0.74%)延迟为2.38 ms(SGS占1.5 ms,预设检查占0.88 ms)。加权平均延迟为7.65 ms,满足实时性要求。

**VMOKED与其他方法的性能比较(Q3)**:在WSDataset上,研究人员将VMOKED与YOLO-v5s/l、YOLO-v5l+TPT/AVT、YOLO-v9、CNN-LSTM、STCNet-MobileNet/ResNeXt对比。VMOKED获得最高F1(0.9456)和准确率(0.9669),精度(0.9646)优于所有对比模型;计算量64.89 GFLOPs低于YOLO-v9(103.2 GFLOPs)和STCNet-ResNeXt(68.24 GFLOPs);延迟7.65 ms仅高于STCNet-MobileNet(4.36 ms)。这表明混合框架有效结合了单帧检测速度与序列级精度。

**VMOKED单相机流的低资源消耗(Q4)**:通过分析单流计算成本,研究人员得出每路视频流仅需约1.54 GFLOPs(64.89/42),远低于序列方法每流27–107 GFLOPs,证明了集中式服务器部署时的高效资源利用。

**系统可处理的最大相机数量(Q5)**:通过动态调整DL推理线程与视频流线程,研究人员确定系统可在实验环境(RTX 4000 8 GB、i9-11900、32 GB RAM)中同时处理42路视频流,每路3.7 FPS检测速率,端到端延迟约9.5 ms。

**总结讨论与结论翻译**:讨论部分指出局限性:数据集仅来自越南热带森林,缺乏跨气候区验证;系统仅支持白天操作;SGS模块可能错误过滤高空烟羽;边缘部署需模型压缩。结论部分翻译为:在本研究中,研究人员介绍了一种新颖的视频烟雾检测系统VMOKED,旨在快速准确地检测森林烟雾排放,为野火预防提供有效工具。所提出的框架在自建WSDataset和SGSDataset上高效组合模型,在有限计算资源下保证鲁棒性能。实验结果表明系统具有卓越能力,获得高F1分数0.9456、低延迟7.65 ms和低计算需求64.89 GFLOPs。系统可扩展至42路视频流(3.7 FPS)。尽管取得进展,与烟雾共享形态和运动特征的物体仍造成误报。未来研究将整合先进特征提取和注意力机制,并在多样化环境中进行大规模部署。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号