MCRF-Net:一种基于改进版YOLOv8s-seg的机场跑道实例分割方法,具有较低的可见度干扰

《Digital Signal Processing》:MCRF-Net: a low visible airport runway instance segmentation method based on improved YOLOv8s-seg

【字体: 时间:2026年03月02日 来源:Digital Signal Processing 3

编辑推荐:

  低可见度场景下机场跑道实例分割方法研究,提出MCRF-Net改进YOLOv8s-seg模型,创新C2MSB模块融合CSP与Mix结构块优化模糊区域捕捉,CGB模块增强上下文信息融合,CRA-Up机制平衡全局上下文与计算效率,FAC2f模块提升去噪能力。实验表明在BARS数据集上mAP提升3.81%,优于主流模型。

  
王尔深|程玉明|徐松|于腾立|曲平平|娜拉|陈云豪
沈阳航空航天大学电子与信息工程学院,中国沈阳,110136

摘要

作为飞机着陆的基础设施,机场跑道的精确实例分割至关重要。然而,在低能见度场景下对机场跑道进行实例分割面临许多挑战,例如光线不足、特征提取困难以及目标尺度的实时变化。为此,我们提出了一种基于YOLOv8s-seg的实例分割方法MCRF-Net。首先,改进了主干网络中的CSP瓶颈结构(包含2个卷积层C2f),并将Mix结构块和瓶颈模块融合在一起,形成了C2f和Mix结构块的集成(C2MSB),从而优化了模糊区域的捕捉和纹理恢复,并有效处理了低能见度图像的模糊分布。其次,引入了上下文引导块(CGB)来替代主干网络和颈部网络的原始卷积层,以增强模型融合上下文信息的能力;为了在恢复空间分辨率的同时考虑自注意力的计算效率,设计了通道缩减注意力机制(CRA-Up),该机制通过结合池化和双线性插值来平衡特征分辨率和效率;最后,提出了一种新的C2f模块(FAC2f),用于替换模型颈部网络中的所有C2f模块,以提高模型的去噪能力。在BARS数据集上的实验结果表明,与原始模型相比,MCRF-Net的mAP、mAP@0.5和mAP@0.75值分别提高了3.81%、0.65%和2.76%;并且与当前主流的实例分割模型相比,MCRF-Net的准确性表现更好。

引言

在现代航空运输系统中,安全检测和识别机场跑道对于飞行安全和更好的机场运营至关重要[1]。飞机着陆是最复杂且不确定的阶段。在此过程中,飞行高度和速度会下降。飞行员面临身体和心理压力以及视觉疲劳。他们必须控制着陆滑行姿态,并持续观察跑道的位置[2]。成功着陆需要正确的俯仰角和下降率。飞机必须与跑道中心线对齐并穿过着陆点[3]。对于自主着陆而言,获得可靠和精确的目标姿态参数至关重要。传统的着陆引导方法包括仪表着陆系统(ILS)[4]、全球导航卫星系统(GNSS)[5]、精密进近雷达(PAR)[6]和惯性导航系统(INS)[7]。ILS基于精密着陆雷达,广泛用于有人驾驶飞机的自主着陆。该系统通过雷达跟踪无人机的位置,并通过数据链路将这些数据传输给无人机,然后飞行控制系统完成自动着陆[8]。然而,ILS的准确性依赖于雷达测量,并且严重依赖地面设备。这种依赖性降低了无人机的自主性[9]。GNSS提供更稳定和准确的信号,其技术成熟,广泛用于无人机定位。GNSS不需要复杂的地面设备,适用于大面积区域,并且与雷达兼容。它具有良好的长期准确性,但短期准确性较差,容易受到干扰和信号丢失的影响。INS基于惯性原理,通过惯性元件获取运动状态,具有良好的自主性和快速的数据更新能力,并覆盖较大的测量范围。然而,INS存在累积误差。航空运输是全球化时代的关键基础设施,它支持全球经济活动并连接不同地区的社会。根据IATA 2024年年度报告[10],2024年共有4060万次航班。航空运输的安全性和可靠性影响着人们的生命、财产以及贸易的顺利进行。为了提高飞机安全性和性能,航空业已经使着陆过程更加自动化,这有助于减少飞行员和无人机的认知和疲劳风险[11]。在能见度较低的情况下,如雾天、暴雨和夜间,清晰的跑道识别[12]对于着陆和滑行[13]至关重要。
为了解决上述问题,本研究采用YOLOv8s-seg作为基础网络框架,并实施了针对性的改进。优化的YOLOv8s-seg模型在低能见度场景下保持了具有竞争力的参数数量,同时显著提高了分割准确性。本研究专注于低能见度场景下机场跑道的实例分割任务,并使用BARS[14]公共机场跑道数据集验证了先进的YOLOv8s-seg算法。主要贡献如下:
  • 我们提出了C2MSB(C2f和Mix结构块的集成)模块:通过在主干网络中CSP瓶颈(包含2个卷积层C2f)的瓶颈处插入混合结构块,结合Mix结构块的特征提取、多尺度注意力集成、深度可分离卷积优化以及三级残差连接的动态块状特征融合,我们可以在控制计算成本的同时平衡全局和局部细节的恢复,提高多尺度特征表达能力和计算效率。
  • 在本研究中,使用上下文引导块(CGB)替代主干网络和颈部网络的原始卷积层,以增强模型捕获关键信息的能力,并在控制参数数量的同时提高机场跑道实例的分割准确性。
  • 为了平衡全局上下文提取和自注意力计算的效率,使模型能够快速处理大规模、低能见度的模糊图像,本研究在主干网络的SPPF模块之前引入了通道缩减注意力机制(CRA),并在其平均池化之后添加双线性插值以放大输入特征并恢复空间分辨率。
  • 我们在颈部网络C2f模块的瓶颈处两个原始卷积层之间插入了频率谱动态聚合(FSDA)模块,构建了FAC2f模块,从而提高了YOLOv8s-seg在低能见度图像中的降噪能力。
  • 相关研究

    相关工作

    实例分割技术作为计算机视觉的瑰宝,具有目标级定位和像素级解析的双重任务特性,在机场跑道感知场景中展现出独特的价值[15]。在低能见度场景下,传统的视觉检测方法往往难以有效工作,因此需要先进的图像处理和模式识别技术来提高机场跑道的检测和分割准确性。当前的学术研究

    整体结构

    近年来,计算机视觉领域在对象检测(OD)和实例分割(IS)方面取得了显著进展。随着深度学习技术的快速发展,以YOLO(You Only Look Once)[29]为代表的单阶段检测器已成为实时目标检测的主流解决方案。YOLO因其高效的推理速度和高准确性而受到青睐。实例分割作为计算机视觉的核心任务之一,需要同时进行类别

    实验设置和评估标准

    在本研究中,我们基于公开可用的机场跑道实例分割数据集BARS[14]训练和评估了改进后的模型。公开可用的机场跑道实例分割数据集BARS包含10256张机场跑道图像,这些图像使用FAA认证的X-Plane仿真平台收集,涵盖了世界上几乎所有的地形,并基于现实场景设计。BARS数据集从各个机场收集跑道图像

    结论

    为了解决低能见度场景下视觉辅助着陆系统中跑道实例分割的挑战,引入了公开可用的数据集BARS。该数据集涵盖了各种天气条件和地理环境,基于现实情况设计,能够高精度地划分跑道区域。
    在跑道实例分割任务中,提出了创新的MCRF-Net来解决不均匀模糊的问题

    代码、数据和材料的可用性

    由于隐私原因,支持本文发现的数据并未公开。

    作者声明

    王尔深(第一作者):概念构思、方法论、代码编写、调查、形式分析、初稿撰写;程玉明:数据整理、代码编写、形式分析、初稿撰写、审阅与编辑;徐松:可视化、调查;于腾立:资源提供、监督;曲平平:代码编写、验证;娜拉:可视化审阅;陈云豪:调查审阅;王尔深(通讯作者):概念构思、资金获取、资源提供、监督、撰写

    利益冲突声明

    作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:如果还有其他作者,他们声明没有已知的可能会影响本文所述工作的财务利益或个人关系。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号