编辑推荐:
本研究基于YOLOv11架构开发IB-YOLO深度学习模型,用于Sentinel-1 WV SAR数据中千米级冰山的检测与定位。通过构建13,686个手动标注样本的数据集,优化模型架构组合,最终实现高精度检测。模型在2016-2018年数据集上成功识别80,245个冰山,揭示冰山分布与断崖前缘的关联性,季节性变化特征及幂律分布规律,为南极冰山监测提供新方法。
作者:谢涛、王晨、李晓明、李慧敏、范高静、Alexis Mouche、Bertrand Chapron
单位:南京信息科学职业技术学院气候系统预测与风险管理国家重点实验室,中国南京 210044
摘要
Sentinel-1波模式(WV)合成孔径雷达(SAR)定期在南大洋获取高分辨率图像,但其用于自动化和统计分析冰山研究的潜力尚未得到充分挖掘。本研究提出了IByolo模型,该模型基于YOLOv11架构开发,用于在开阔海域的WV SAR数据中检测和定位千米级冰山。该模型基于包含13,686个冰山的标注数据集进行训练,这些数据分布在2,062张图像中。通过多种架构配置的敏感性测试,发现HGNetV2+C2PSA-CAA+P2组合具有最佳性能,准确率为0.41。IByolo能够生成可靠的冰山边界框,从而实现0.1-5平方公里范围内冰山表面积的高效估算。将此模型应用于2016-2018年间在40°S以南获取的19,025张图像后,共检测到80,245座冰山。大多数图像中的冰山数量较少,总表面积低于5平方公里。冰山主要分布在威德尔海东北部、阿蒙森-罗斯海以及东南极洲沿岸的主要崩解区。其数量存在明显的季节性变化,夏季达到峰值,冬季接近零。这一发现与基于高度计的千米级冰山分析结果一致,两者结合有助于更深入地了解南极冰山的移动和变化规律。研究还发现冰山大小分布遵循幂律分布,指数为-1.42,这与先前的卫星观测结果一致。这些结果表明,将WV SAR数据与先进的物体检测框架结合使用,可以实现对冰山的有效监测。由此产生的数据集对于研究南极冰山动态、淡水通量及其对气候的影响具有重要价值。
引言
冰山崩解是南极冰盖质量损失的主要机制。随着全球气候变化导致海洋温度上升,冰架的结构弱化与崩塌加速,进而增加了冰山崩解活动(Depoorter等人,2013;Paolo等人,2015)。冰山脱离后,会在盛行风和洋流的驱动下远离南极边缘,进入南大洋(Wagner等人,2017;Collares等人,2018)。这些漂浮的冰山影响着多种海洋过程,如环流动态、垂直分层、营养物质再分配和生物生产力(Arrigo等人,2002;Lucas等人,2025)。它们的淡水通量对气候建模和生物过程预测也有重要影响(Mackie等人,2020;Boyd等人,2024)。因此,即使基于空间采样观测数据,准确监测冰山的位置、范围和时间变化对于量化其在极地气候系统中的作用至关重要。
早期的冰山观测主要依赖船载调查。自1981年以来,挪威极地研究所为国际冰山数据库提供了详细的实地测量数据,建立了长期记录,并得到了南极研究科学委员会的正式认可(Jacka和Giles,2007)。然而,这些实地数据仅限于航运路线和特定研究区域,限制了其在大范围或全年监测中的应用。为弥补这一不足,卫星遥感技术得到了越来越多的应用。散射计能够实现近乎连续的冰山追踪,并被用于整合杨百翰大学的数据与美国国家冰中心的海冰数据库(Budge和Long,2018)。尽管散射计覆盖范围广泛,但其25公里的空间分辨率限制了小于6公里冰山的检测能力。另一种方法是卫星高度计,它能够识别千米级冰山,并用于生成1992-2014年的南大洋冰山分布图(Tournadre等人,2016),此后数据不断更新。但这种方法仅适用于开阔水域,且对波形假设敏感,难以验证(Tournadre等人,2008,2012)。因此,仍需要高分辨率、可扩展的方法来实现南极地区的常规冰山检测和尺寸估算。
与光学卫星相比(Fu等人,2018;Zhou等人,2025),合成孔径雷达(SAR)系统因具有高空间分辨率和全天候、昼夜通用的能力而特别适合极地监测(Jackson等人,2004;Torres等人,2012)。SAR图像的辐射特性和纹理特征使得利用计算机视觉和机器学习实现自动冰山检测成为可能,早期研究主要依赖阈值分割和分割算法。例如,Wesche和Dierking(2012)应用K分布阈值技术从Envisat ASAR数据中检测出小至0.02平方公里的冰山,但检测效果受海况和海冰干扰影响。基于物体的分类方法也被提出,如Mazur等人(2017)的研究,在多种海表条件下表现出更好的鲁棒性。深度学习的最新进展提高了SAR图像中冰山检测的准确性和泛化能力,包括基于网格图的超级像素分类(Barbat等人,2019,2021)、狄利克雷过程混合模型分类器(Evans等人,2023)、非迭代聚类后的支持向量机分割(Koo等人,2023)、U-net深度学习方法(Braakmann-Folgmann等人,2023)、结合增量随机森林的超级像素分割(Guan等人,2025)以及Inception-v3卷积神经网络(Wang等人,2026)。这些方法共同证明了利用SAR数据建立长期冰山数据库的可行性,以补充现有的观测记录。
Sentinel-1(S-1)凭借其稳定的数据采集策略和高辐射质量,已成为极地遥感应用的关键卫星平台。现有的冰山检测研究主要集中在南极海岸线附近的宽幅图像上,这些区域经常观察到大型平板冰山(Li等人,2018;Braakmann-Folgmann等人,2021,2022;Evans等人,2023;Chen等人,2026)。相比之下,S-1波模式(WV)图像虽然以空间采样方式获取(见图1(a)和(b)),但在南大洋冰山监测中的应用仍较少。尽管有一小部分WV数据覆盖海冰区域,但绝大多数数据来自开阔水域。从统计上看,这些定期采集的高分辨率图像构成了大量数据,具有系统性和空间代表性,有利于检测漂浮的千米级冰山。这一独特能力补充了基于沿海宽幅SAR和光学图像的现有冰山研究。在之前关于S-1 WV图像(无论是否包含冰山)的场景级分类研究基础上(Wang等人,2019,2026),本研究引入了基于YOLOv11架构的IByolo模型,用于检测每个开阔海域图像中的冰山。虽然研究冰山在波冰区和密集海冰覆盖下的情况也很有趣(如Guan等人,2025的冰山破碎研究和England等人,2020的冰山破裂建模),但这超出了本文的范围,将在后续研究中进一步探讨。
本文其余部分安排如下:首先编译了一个包含13,686个手动标注边界框的训练数据集,覆盖2,062张WV图像。通过一系列控制实验系统优化了模型架构和训练配置。数据集构建和模型开发的详细信息分别见于“数据集”和“IB模型的训练与评估”部分。训练好的IByolo模型被应用于2016-2018三年的WV数据,以量化南大洋冰山的发生和时空变化。第4节展示了研究结果,第5节进行了讨论和总结。
Sentinel-1波模式
S-1是一颗极地轨道、太阳同步的SAR卫星,由欧洲航天局(ESA)在Copernicus计划下运行(Torres等人,2012)。它旨在实现地球表面的长期、常态化监测。该卫星星座包括S-1A、S-1B和S-1C,分别于2014年、2016年和2024年发射。S-1C取代了因电源故障于2021年停止运行的S-1B。每颗S-1卫星的重复周期为12天。
IByolo模型的训练与评估
本节描述了IByolo模型的开发过程,该模型基于YOLO架构,用于端到端检测S-1 WV SAR图像中的冰山。通过一系列实验评估模型性能并优化其检测能力。选择YOLO框架是因为其在实时物体检测任务中的有效性,能够在单次网络遍历中同时完成分类和定位。
2016-2018年南极周围S-1A WV开阔海域的冰山
将IByolo模型应用于2016-2018年间被分类为含有冰山的19,025张S-1A WV SAR图像,共检测到80,245座冰山。该SAR数据集有助于详细分析南大洋千米级冰山的时空分布、变化特性和尺寸规律。尽管由于分辨率和对比度限制,部分冰山可能未被检测到,但该数据集为相关研究提供了坚实的基础。
讨论与结论
本研究提出了基于深度学习的冰山检测模型IByolo,该模型基于YOLOv11架构开发,优化用于开放海域S-1 WV SAR图像中千米级冰山的物体级分析。为了训练模型,我们编制了迄今为止最详细的自定义数据集,包含超过13,000个冰山标注,分布在约2,000张图像中。优化后的IByolo模型表现出优异的检测性能(精确度:0.86,召回率:0.83)。
CRediT作者贡献声明
谢涛:负责撰写初稿、方法论和正式分析。王晨:负责撰写、审稿与编辑、方法论、资金争取和概念构建。李晓明:负责撰写、审稿与编辑、监督、资金争取和概念构建。李慧敏:负责撰写、审稿与编辑、可视化方法论。范高静:负责撰写、审稿与编辑、可视化。Alexis Mouche:负责撰写、审稿与编辑。Bertrand Chapron:负责撰写、审稿与编辑。
利益冲突声明
作者声明没有已知的可能影响本文研究的财务利益或个人关系。
致谢
作者感谢ESA、IFREMER和不来梅大学提供S-1 WV SAR数据、Altiberg数据及海冰浓度数据,同时感谢匿名审稿人的宝贵意见,这些意见提升了论文质量。本研究得到了“国家杰出青年科学基金”(项目编号:42025605)的支持,部分资金还来自航空航天信息技术大学的高层次人才研究启动项目以及欧洲航天局的支持。