“扫视-聚焦-注视”:一种基于鹰眼视觉原理的创新全景图像检测方法,用于在合成孔径雷达(SAR)图像中识别船只

《ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING》:Glance-Focus-Gaze: A novel Eagle-Eye Vision-Inspired Panorama-Population-Individual progressive screening paradigm to capture ships in SAR images

【字体: 时间:2026年03月16日 来源:ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING 12.2

编辑推荐:

  SAR船舶检测中提出基于鹰眼视觉的GFG-PPI渐进筛查范式,通过上游GFG分支实现全景概览、群体聚焦与个体注视三阶段检测,下游SOSS分支处理孤立船只,结合动态人口感知协调(DPAO)实现双路径协同超越(DPST),显著提升复杂场景下小船只检测精度。

  
张天文|高贵|张晓玲
中国成都西南交通大学地球科学与工程学院

摘要

在合成孔径雷达(SAR)遥感图像中直接捕获船只具有挑战性,这往往导致低散射目标的定位不准确和检测遗漏。为了解决这个问题,我们受到鹰眼视觉(EEV)的启发,提出了一种全景-群体-个体(PPI)渐进式筛选范式,称为“扫视-聚焦-注视”(GFG),用于高效的SAR船只检测。船只捕获任务被分解为三个阶段:扫视全景、聚焦群体和注视个体。扫视全景是指快速预览整个全景图像以建立空间关系依赖性,从而获得初步的粗粒度全局感知;聚焦群体是指将注意力从全景图像缩小到船只聚集的子区域;注视个体是指在之前感知的全景图像的基础上,仔细地捕捉每个单独的船只。通过将注意力从群体转移到个体,实现了对每艘船只的精确捕获。设计了一个上游的GFG分支来实现上述阶段。此外,我们还提出了一个下游的单个异常值特定拍摄(SOSS)分支,用于直接检测个体船只。该分支由上游GFG分支提供的动态群体感知协调(DPAO)指导,用于捕获不在任何群体中的船只。最终,GFG和SOSS成功集成,形成了互补性,实现了双路径协同超越(DPST)。在SSDD和HRSID数据集上的测试结果表明了所提出方法的有效性。在SSDD数据集上,DPST的准确率为78.0%,比第二好的M2S-DETR高出1.8%;在HRSID数据集上,准确率为76.3%,比第二好的EDHC高出3.5%。SSDD数据集可在https://github.com/TianwenZhang0825/Official-SSDD获取,HRSID数据集可在https://github.com/chaozhong2010/HRSID获取,代码可在https://github.com/TianwenZhang0825/GFG获取。

引言

合成孔径雷达(SAR)是地球观测的杰出工具(张和张,2022年)。与光学、红外和高光谱传感器相比,SAR不受光线和天气的影响(朱等人,2022年),因此非常适合监测海洋船只(孙,2026年)。
随着多颗SAR卫星的发射,出现了许多船只检测算法。恒定误报率(CFAR)算法,如CA-CAFR(匡等人,2020年);OS-CFAR(Hyun和Lee,2011年);CHA-CFAR(Zefreh等人,2021年);以及ASL-CFAR(李,2022年),通过建模海杂波来设置自适应阈值以区分背景和船只,这是最广泛使用的算法。然而,其性能经常受到海况变化的影响(邵,2023年),从而影响了场景的泛化能力(张等人,2020年)。
近年来,随着Faster R-CNN(任等人,2015年)、YOLO(Redmon等人,2016年)、FCOS(田,2022年)、CenterNet(段等人,2019年)、DETR(Carion等人,2020年)、DAB-DETR(S. Liu等人,2023年)和Sparse R-CNN(P. Sun等人,2021年)等模型的出现,SAR领域的学者将它们改进为多种变体,用于船只检测,例如FLCSE(张和张,2022年);FBR-Net(傅,2021年);RFEM(岳等人,2022年);MAI-SE(张和张,2022年);FEPS-Net(白,2023年);YOLOv8-BYTE(Yasir,2024年);COPO-DETR(张等人,2025年);TLSA(张等人,2026年)和SwarmPRL(张等人,2026年)。早期的工作G-CNN(张,2019年)和DS-CNN(史,2019年)主要关注SAR船只检测的有效性。自从开放数据集(如HRSID(魏,2020年);SSDD(张,2021年);PSDD(高,2025年);LS-SSDD-v1.0(张等人,2020年)发布以来,深度研究结果越来越多。一些代表性的工作包括:
特征交互(胡,2022年)被设计用于像素检测;傅里叶场景变换(刘,2025年)被提出以增强特征提取;混合表示学习增强(周,2023年)被设计用于减少延迟;沈等人(沈等人,2024年)研究了一种轻量级架构;陈等人(陈,2023年)将空间和通道可控卷积引入变换器以提高性能;为了更好地检测小型船只,DINO(张等人,2021年)通过改进去噪和框检测(秦,2025年)进行了优化;一致的标签分配机制(周,2024年)实现了快速训练收敛;郑等人(郑,2024年)研究了跨层融合以获得更好的感受野;刘等人(刘等人,2024年)设计了一种可解释的证据引导方法以获得可靠的结果;CenterNet(唐,2024年)被改进以实现实时性能,有助于导航意图预测;CNN被适配到Transformer(王,2024年),通过自适应损失进行全局和局部特征建模;FDI-YOLO(王,2025年)被提出用于特征解耦;因果推理被研究以提高模型鲁棒性(詹,2025年);郭等人(郭,2025年)引入了混合感受野和多位置编码以提高DETR的性能。
上述方法从不同角度解决了不同问题,并取得了显著成果。然而,它们都直接从图像中定位单个船只,如图1所示。我们认为这可能不是最优方案,因为一步直接定位虽然方便,但增加了检测难度。从原始全景图像预测船只的空间位置是不准确的。此外,低散射的小型船只与背景金属设施相似,可能导致检测遗漏。
因此,受到鹰眼视觉(EEV)(段和徐,2022年)的启发,提出了一种全景-群体-个体(PPI)渐进式筛选范式,用于“扫视-聚焦-注视”(GFG)SAR船只检测。图1将提出的GFG范式与之前的方法进行了比较。GFG不直接捕获船只,而是有三个渐进阶段:扫视全景、聚焦群体和注视个体。扫视全景表示快速预览全景图像以建立空间关系依赖性,从而获得初步的粗粒度全局理解;聚焦群体表示将注意力从全景图像集中到包含船只的子区域;注视个体表示在之前获得的扫视全景感知的指导下,仔细地定位每个群体中的个体,从而研究船只之间的空间关联模式。上游GFG分支被设计用于实现上述阶段;此外,我们还设计了一个下游的单个异常值特定拍摄(SOSS)分支,用于直接检测个体船只,该分支在上游GFG分支提供的动态群体感知协调(DPAO)的指导下运行,专门针对不在任何群体中的船只实例。上游GFG分支和下游SOSS分支之间的协同集成促进了功能互补性,实现了双路径协同超越(DPST)。在SSDD和HRSID数据集上的测试结果表明了DPST框架的先进性能。
本文的主要贡献总结如下:
  • 1. 提出了一种受鹰眼视觉启发的SAR船只捕获方法。分析了SAR和鹰的特性,并进行了比较。据我们所知,这是首次将鹰眼视觉应用于SAR船只检测的模拟。
  • 2. 提出了一种新颖的GFG-PPI概念,用于高效的SAR船只检测。据我们所知,这也是该领域的首次尝试。
  • 3. 提出了一种通过DPAO连接GFG和SOSS的新DPST框架。据我们所知,这也是首次尝试。
  • 章节片段

    SAR与鹰

    太空中的SAR卫星类似于高空飞翔的鹰。SAR船只检测和鹰捕猎在关键操作参数上具有相似性。图2和表1进行了比较分析。SAR卫星扩展了人类的感知能力;鹰体现了自然选择的进化狩猎智慧。它们在高空视野、高速攻击和精确终止的核心逻辑上高度一致;鹰的视觉分辨率超过……

    数据

    本研究中使用了SSDD和HRSID数据集。数据总结见表4。图14显示了船只的多尺度分布。SSDD(张,2021年)包含1160张SAR图像和2551艘船只;HRSID(张,2019年)是一个更大的数据集,包含5604张SAR图像和3642艘船只。所有图像均来自知名的地球观测卫星,如TerraSAR-X、RadarSat-2和Sentinel-1。极化模式包括共极化和交叉极化。训练和测试数据的比例与它们的公开数据相同。

    结论

    我们提出了一种渐进式捕获SAR船只的方法,从扫视全景开始,逐步聚焦到群体,最后到个体船只的检测,这一方法受到了鹰眼视觉的启发。我们提出了一种新的框架DPST,包括上游的GFG分支和下游的SOSS分支,以实现双路径协同超越。通过SKF和PG进一步增强了融合效果。DPST具有四个优点:适用于复杂的近海场景;在误报和检测遗漏之间有良好的平衡;定位更加精确;

    CRediT作者贡献声明

    张天文:撰写——审阅与编辑、撰写——原始草案、可视化、验证、方法论、调查、数据整理、概念化。高贵:调查、形式分析。张晓玲:监督、调查、形式分析。

    资助

    本工作部分得到了中国国家自然科学基金(项目编号U24A20589)的支持,部分得到了中国国家重点研发计划(项目编号2023YFB3905504)的支持,部分得到了中国教育部创新团队的支持(项目编号8091B042227),以及四川省自然科学基金创新小组的支持(项目编号2023NSFSC1974)。

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

    致谢

    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号