综述:一种基于可解释集成机器学习框架的洪水易发性制图方法,该方法利用社交媒体数据:以中国广州为例 周宇涵(Yuhan Zhou)、 卢海鹏(Haipeng Lu)、 刘思岑(Sicen Liu) 张树良(Shuliang Zhang)

《Remote Sensing》:An Explainable Ensemble Machine Learning Framework for Flood Susceptibility Mapping Using Social Media Data: A Case Study of Guangzhou, China Yuhan Zhou, Haipeng Lu, Sicen Liu and Shuliang Zhang

【字体: 时间:2026年05月11日 来源:Remote Sensing 4.1

编辑推荐:

  **亮点:** - **主要发现是什么?** 该综述强调了技术上的重大转变,从传统的光谱指数转向更复杂的机器学习(ML)和深度学习(DL)模型。目前,这些方法分别占近期冰川测绘研究的20%和56%。 - **数据融合**,特别是结合光学、合成孔径雷达(SAR)

  **亮点:**
- **主要发现是什么?**
该综述强调了技术上的重大转变,从传统的光谱指数转向更复杂的机器学习(ML)和深度学习(DL)模型。目前,这些方法分别占近期冰川测绘研究的20%和56%。
- **数据融合**,特别是结合光学、合成孔径雷达(SAR)和地形测量数据,与单一传感器方法相比,始终能够实现最高的冰川测绘精度。

**主要发现的含义是什么?**
向自动化、数据驱动系统的转变使得对复杂特征(如覆盖有碎屑的冰川和崩解前沿)的精确、大规模监测成为可能,而这些特征之前难以进行表征。

**未来的进展依赖于什么?**
未来的进展需要克服“真实地面”数据的瓶颈,这需要通过社区主导的努力来开发标准化、高分辨率的基准数据集,并提高模型在不同地理区域之间的可转移性。

**摘要:**
冰川是全球气候变化的关键指标,其加速退缩对海平面上升、水资源和生态系统稳定性有着深远的影响。准确和及时的冰川范围测绘对于监测这些变化至关重要。本综述全面概述了用于冰川测绘的遥感技术的演变过程,从传统的光谱指数发展到当前的机器学习(ML)和深度学习(DL)模型。我们分析了各种方法的优点和局限性,包括标准化差异雪指数(NDSI)的计算效率、随机森林(RF)等ML算法的分类能力,以及U-Net及其变体在冰川测绘语义分割中的卓越性能。我们的分析显示,自动化、数据驱动的方法显著提高了冰川边界的准确性和规模。然而,由于缺乏标准化、高分辨率的训练和验证数据集,获取准确的“真实地面”数据仍是一个关键挑战。其他主要限制还包括过度依赖少数模型架构,以及需要弥合研究级精度与操作型实时监测系统之间的差距。未来该领域的进展将依赖于社区主导的努力,以创建坚实的基准数据集、探索更多样化和高效的模型架构、开发复杂的数据融合技术,并提高模型的可转移性和不确定性量化能力。通过将尖端人工智能与改进的数据实践相结合,遥感界可以提供理解并应对气候变化影响所需的关键数据。

**1. 引言:**
冰川对全球环境的影响深远,尤其是在气候变化及其对全球地表温度和海平面的广泛影响背景下[1,2]。作为气候变暖的敏感指标,冰川正在以加速的速度退缩,这一趋势具有重大的全球性后果[3,4]。历史上,在20世纪后半叶,非主要冰盖地区的冰川贡献了大约15-20%的观测到的海平面上升[5]。这一趋势更加明显;自2000年以来,全球冰川平均每年损失2730亿吨冰[6]。这种全球性下降对地球系统和人类系统都至关重要,因为冰川融水直接影响天气模式、水文循环和海平面上升[7]。在安第斯山脉和喜马拉雅山脉等地区,融水减少威胁到维持农业生产力和粮食安全的淡水资源,可能导致水资源短缺、资源竞争和重大的社会经济挑战[8,9]。
政府间气候变化专门委员会(IPCC)的预测表明,这种冰冻圈的衰退将在整个21世纪持续。相对于1986-2005年的基线,2015年至2100年的冰川质量损失预测在低排放情景(RCP2.6)下为22-44%,在高排放情景(RCP8.5)下为37-57%。对于拥有较小冰川的地区(如欧洲阿尔卑斯山脉、比利牛斯山脉和热带安第斯山脉),RCP8.5情景下预计冰川质量将减少80%以上[10]。这突显了冰川在维持全球气候稳定性和区域生态完整性方面的关键作用[10]。

**为了应对监测这些广阔、偏远且通常难以到达的冰川环境的挑战,遥感已成为不可或缺的工具。**
多种配备不同传感器的卫星平台被用来获取电磁频谱范围内的数据。例如Landsat和Sentinel-2任务上的光学传感器可以捕捉地球表面的光谱反射率,从而根据其独特特征将雪和冰与周围的地形(如岩石、植被和水)区分开来。补充这些的是合成孔径雷达(SAR)传感器,它们能够穿透云层并在任何光照条件下工作,确保在经常多云的山区持续获取数据[11,12,13]。此外,这些遥感技术对于生成提供地形更深层次理解的高级地理空间产品至关重要[14]。例如,数字高程模型(DEM)用于提供表面的3D视图[15],这又是地形测量和土地形态定量分析的基础[16,17]。从DEM中可以计算出坡度和朝向等关键参数,这些参数直接影响雪积累、太阳辐射和雪崩风险等因素。热传感器还能够推导出地表温度(LST),这是监测地表能量平衡和模拟冰川融化的关键变量[18]。这些衍生产品将原始卫星数据转化为可用于分析复杂环境系统的信息。其中最基本的是光谱指数,它们利用不同光谱带之间的数学比率来增强冰与非冰表面之间的对比度。更先进的方法利用经典机器学习(ML)算法进行复杂的图像分类,从而在涉及阴影或覆盖有碎屑的冰的情况下提高精度。最近,深度学习(DL)模型的出现进一步推动了该领域的发展,它们可以从图像中自动学习复杂的空间和光谱特征,为实现高精度和全自动的大规模冰川监测提供了途径[19]。

**根据Scopus上以“Ice Sheet”、“Glacier”和“Remote sensing”为关键词进行的调查,**在过去三十年里,利用遥感技术研究冰盖和冰川的出版物数量一直在增加,自2014年以来更是显著增长[20]。在卫星遥感技术广泛普及之前,冰川测绘主要依赖于系统的实地调查、航空摄影和摄影测量技术[21]。早期由[18]进行的开创性工作提供了加拿大北极地区的首批全面冰川清单,证明了标准化测绘对于理解区域冰川分布和质量平衡的重要性[22]。在此基础上,20世纪60年代末和70年代在Fritz Müller和Gunnar ?strem的领导下,在斯堪的纳维亚、瑞士的Rhone Glacier以及North Water项目等山区发起了重大的冰川清查计划[23,24,25,26,27,28,29,30,31,32,33,34]。这些项目建立了使用航空照片和地形图进行冰川识别、分类和制图的一致方法[24,25,26,27,28,29,30,31,32]。

**?strem领导的斯堪的纳维亚冰川清查计划**通过将长期质量平衡测量与空间清查相结合,进一步推进了定量冰川测绘的发展,为将冰川范围变化与气候变异性联系起来奠定了基础[23]。这些早期努力为现代冰川清单(如世界冰川清单和Randolph冰川清单(RGI)奠定了概念和方法论基础,并强烈影响了向基于卫星的冰川测绘框架的转变[35,36,37,38,39]。随着全球冰川退缩的加速,对自动化、可重复和可扩展的冰川测绘方法的需求变得越来越迫切[40,41,42,43]。早期的冰川清单提供了冰川范围的静态快照,但持续的气候变化要求在广阔且通常难以到达的地区进行频繁更新。在这种情况下,如Global Land Ice Measurements from Space(GLIMS)倡议和RGI这样的全球冰川数据库已成为不可或缺的参考框架[44,45]。GLIMS旨在系统地收集和标准化来自卫星图像的冰川轮廓,同时保留区域专业知识和元数据[46]。RGI随后将多个区域清单整合成一个全球范围内完整的时间一致的数据集,适用于气候建模和大规模变化检测[47]。这些清单不仅提供了冰川轮廓,还提供了包括冰川朝向、海拔范围和区域环境在内的关键历史和背景信息,这对于解释观察到的变化以及训练和验证自动化测绘算法至关重要[48]。

**2000年代中期至2010年代初的早期综述论文**主要关注建立和巩固基础遥感技术[49,50]。例如,关于冰川测绘的综述总结了来自Landsat、Advanced Spaceborne Thermal Emission and Reflection Radiometer(ASTER)和Moderate Resolution Imaging Spectroradiometer(MODIS)等任务的光学卫星数据的广泛采用[51,52,53,54,55,56,57,58,59]。主要讨论的技术是光谱指数的使用,特别是标准化差异雪指数(NDSI),它利用雪和冰在可见光和短波红外反射率之间的强烈对比。[59]
这些综述中确定的主要挑战是持久且根本性的:频繁的云层覆盖导致可见度降低、高起伏地形中的地形阴影导致数据丢失,以及覆盖有碎屑的冰舌与周围岩石之间的光谱相似性,使得基于简单指数的方法无效。为了解决云层和阴影问题,这些综述提出了多时相图像合成和使用数字高程模型(DEM)进行地形校正等解决方案[60,61]。

**到2010年代中期,新一代的综述文章开始记录向多传感器数据融合和经典ML应用的趋势**[62,63,64,65]。这一时期的综述讨论了光学数据与SAR和热成像的协同使用,以解决最复杂的分类问题[66,67,68,69]。SAR因其全天候、白天和夜晚的成像能力而受到重视,而热数据则有助于区分覆盖有碎屑的冰(温度较低)与相邻的太阳加热的冰碛[70]。主要挑战从简单的数据可用性转变为整合这些不同数据集的复杂性。正如当时的综述所概述的,解决方案是应用监督分类算法,如最大似然(Maximum Likelihood)、支持向量机(SVM)和RF[71,72,73]。这些方法可以整合多个数据层(例如光谱带、SAR后向散射、纹理和地形参数),从而实现比任何单一传感器方法更稳健和准确的冰冻圈特征分类[74,75]。

**从遥感图像中准确识别和划分冰川是一个显著且多方面的挑战**,因为高山环境具有光谱和空间的复杂性。主要难点在于区分冰川冰与其他光谱相似或视觉上模糊的表面特征。干净的冰川冰可能与季节性积雪混淆,尤其是在积累期间;而将其与大型冰盖或常年积雪区分开来则需要上下文和地形分析[76,77]。冰川上部和下游的水体也会加剧这个问题,因为它们具有独特的光谱特征,使得精确划分冰川边界变得复杂。

**三个最持久且困难的挑战是**碎屑覆盖、积雪覆盖和地形阴影的存在[78,79,80]。随着冰川的退缩,覆盖有碎屑的冰舌越来越常见,它们在光谱上常常与周围的碎石和裸露的岩石难以区分,这是冰川清单中被低估的主要原因之一[81,82]。另一方面,新鲜的积雪可能掩盖冰川的真实范围,掩盖其边缘,使其难以与相邻的积雪覆盖地形区分开来。最后,冰川地区的极端地形起伏会产生大面积的阴影,这会破坏光学传感器记录的光谱信息,导致阴影中的冰或雪被错误地分类为水或裸露的地表[83,84]。将这些特征与植被和土壤等其他标准土地覆盖类型区分开来[85,86,87]需要比简单的光谱分析更多的方法。

**本综述的重要性在于,**过去几十年中,克服这些挑战推动了遥感技术的创新[88]。早期方法在处理碎屑、阴影和积雪方面的局限性促使人们开发出更先进的技术。这一技术进步从应对这些问题存在困难的基本光谱指数,发展到结合多种数据源以提高分类能力的传统机器学习算法,最终到能够自动推断上下文关系的现代深度学习模型,显示了明显的科学进步。本综述通过提供一个全面的、面向未来的综合分析,为该领域增添了独特价值,并通过几个关键支柱支持战略研究规划。

**方法类别的比较分析:**与之前的调查不同,本研究比较了光谱指数、机器学习算法和深度学习模型,评估了它们在不同冰川环境中的性能、效率及其适用性。

**数据融合趋势的记录:**我们研究了向多源集成过渡的趋势,强调了结合光学和SAR数据、纳入数字高程模型(DEM)以及使用LiDAR辅助制图对于克服感知限制的重要性。

**研究空白与未来方向的识别:**通过评估当前的技术水平,我们确定了关键瓶颈,如缺乏标准化的“真实”基准数据集以及提高模型可转移性的需求,为未来的研究和监测系统提供了明确的路线图。

本综述综合了冰川提取遥感方法的进展,特别关注三个方法论领域:光谱指数、机器学习和深度学习方法。论文强调了这些方法的优点、局限性及比较效果,指出了知识空白,并讨论了可能塑造未来冰川监测研究的新兴趋势。

**方法论:**本研究采用了一种全面的方法来识别、评估和综合现有关于利用遥感数据进行冰川绘制的科研成果。研究框架分为三个主要阶段:(1) 通过数据库识别研究,(2) 基于关键词筛选经过同行评审的文章,(3) 分析和准备手稿。这种结构化的方法确保了对当前技术水平的透明、可复制和无偏见的评估。

**2.1 冰川表面**
冰川化地形通常包含一系列在结构、动态和活动程度上各不相同的相关冰川地貌。干净和覆盖有碎屑的冰川代表活跃的冰川系统,具有连续的冰核和动态流动。相比之下,埋藏的或残留的冰存在于以碎屑为主的地形中,其中冰是不连续的,并且经常被表面物质部分隔离。死冰是指不再流动的古老冰川残余,但可能仍然存在于碎屑覆盖层之下。虽然岩石冰川通常含有大量冰,但其特点是蠕动驱动的变形,可能代表了冰川过程与冰缘过程之间的过渡形态。尽管这些地貌在许多山区环境中具有遗传相关性,但它们在冰连续性、动态和地貌表达上存在差异,因此对其区分对于冰川学解释和遥感分析至关重要。

**2.2 用于冰川绘制的卫星数据**
自动绘制冰川轮廓在很大程度上依赖于卫星遥感获取的数据。近年来,一系列运行在电磁频谱范围内的空间传感器在推进冰冻圈科学方面发挥了关键作用。本综述分析的文献主要使用了来自一系列卫星任务的图像,通常还会结合地貌学数据来完善冰川提取。为了分析所使用的多样化数据集,我们将它们分为五类:光学图像、SAR图像、SAR与光学的混合图像、地貌学与光学的组合,以及地貌学、光学和SAR数据的完整融合。

**2.2.1 光学卫星图像**
光学传感器捕捉从地球表面反射的太阳辐射,是最广泛用于冰川绘制的数据来源。长期运行的Landsat计划(由NASA和美国地质调查局联合发起)是最重要的资源,提供了无与伦比的历史档案,用于监测长期的冰川变化。被审查的研究经常使用Landsat-5上的专题制图仪(TM)、Landsat-7上的增强型专题制图仪Plus(ETM+)以及Landsat-8上的操作陆地成像仪(OLI)的数据。这些传感器提供的全光谱波段,特别是在可见光/近红外(VNIR)和短波红外(SWIR;波段5-7),对于区分高海拔地区的冰川和周围地形非常有效,因为这些地区的温度较低。然而,覆盖有碎屑的冰川在VNIR和SWIR波段的光谱特征与周围的终年积雪相似,这降低了它们在光学图像中的可区分性。当结合热红外(TIR;Landsat波段10-11)来利用表面温度差异,以及合成孔径雷达(SAR;Sentinel-1、ALOS PALSAR)来捕捉表面粗糙度和结构时,其检测效果更好,尤其是在中高海拔地区(3000-5000米),那里的融化速率较高。覆盖有积雪的冰川在可见光波长(尤其是蓝光和绿光波段)具有非常高的反射率,在SWIR波段有强烈的吸收,使得NDSI等指数在制图时非常有效。然而,低海拔地区的季节性积雪覆盖可能会掩盖冰川边界,需要多时相光学和基于DEM的分析。混合表面冰川包括冰川上的湖泊、植被斑块和碎屑层,呈现出复杂的光谱特征。融水体在近红外(NIR)波段有强烈的吸收,在SWIR波段反射率较低,而植被在NIR波段显示出特征性峰值;因此,需要结合VNIR、SWIR和热波段。这些复杂的冰川类型常见于较低(<3000米)到中等(3000-5000米)海拔地区,那里的较高温度会加速融化。

**3 冰川绘制技术**
冰川绘制是冰冻圈研究的关键组成部分,为理解气候变化、海平面上升、区域水文提供了重要数据,尤其是在理解冰川动态、质量平衡以及气候变化的影响方面。过去几十年,遥感已成为实现这一目标的主要工具,导致了多种方法的发展。这些技术可以大致分为光谱指数、光谱解混,以及越来越多的机器学习和深度学习方法。本综述综合了当前的冰川绘制方法,强调了它们的优势及其应用背景。

**3.1 光谱指数在冰川绘制中的应用**
光谱指数是最常见且计算效率最高的冰川绘制方法。这些技术利用冰和雪与其他土地覆盖类型在光谱上的显著差异。核心原理是应用数学公式,通常是波段比值(BRs),到多光谱图像上。图4展示了如何使用光谱指数进行冰川绘制。一个经典的例子是NDSI,它利用雪和冰在可见光绿波段的高反射率以及在短波红外(SWIR)波段的强吸收[44,45]。随后,研究人员开发了许多专门的指数来应对挑战。一些研究开发了新的光谱指数,并报告了比NDSI更高的准确性[46,47,48,49,50,51,52,53]。例如,参考文献[52]开发了调整后的标准化差异雪指数(ANDSI),以克服NDSI的不足,准确区分冰川和水体。传统的NDSI难以区分冰川和水体,因为它们在绿光和短波红外波段看起来相似。ANDSI通过加入额外的红光和近红外波段解决了这个问题,使其成为在多湖泊地区绘制冰川的更可靠指数。结果显示ANDSI具有明显的优势,平均总体准确率约为95%,Kappa系数为0.92,而NDSI的准确率为91%,Kappa系数为0.85。同样,参考文献[47]在中国四个测试区域(从西藏到新疆)进行了一项研究,提出了一种新的指数——自动冰川提取指数(AGEI),以提高无碎屑冰川的绘制精度。该研究使用Landsat和Sentinel-2图像,旨在改进冰川轮廓的绘制,特别是在有阴影和水体的区域。AGEI是一种加权比值指数,计算方式为αa=0.5,其中α是需要根据不同研究地点进行校准的经验参数。这个指数旨在克服现有方法如NDSI和其他简单BRs(如红/SWIR和近红外/SWIR)的局限性。该方法包括选择纯冰川和非冰川像素来开发指数,然后使用2 ± 0.5的阈值进行冰川测绘。 AGEI的有效性通过各种方法进行了验证,包括混淆矩阵、子像素分析和与Google Earth影像及手动边界的比较。结果表明,AGEI在所有测试区域中的整体准确率始终高于其他指数,范围从86%到90%,与参考数据有很强的相关性(r2 = 0.878)。表2总结了相关研究,重点介绍了用于冰川测绘的指数技术。表2. 1995–2025年间用于冰川测绘的光谱指数研究总结。

3.2. 机器学习模型在冰川测绘中的应用
超越光谱指数的固定阈值限制,机器学习(ML)通过将遥感图像映射到多维特征空间,为冰川分类提供了一种根本不同的方法。与依赖于预定义的波段比率不同,ML模型将每个像素视为一个特征向量,其中包含光谱波段(例如VNIR和SWIR)、派生指数以及海拔、坡度和朝向等补充变量。这种方法有效地将图像“扁平化”为表格格式,每个像素对应一行,每个变量或波段对应一列。这种设置使ML算法能够检测传统基于指数的方法无法捕捉到的复杂非线性关系。同时处理多种输入的能力相对于光谱指数具有显著优势。虽然像NDSI这样的指数依赖于几种光谱对比度,但机器学习模型可以整合多个光谱波段、DEM地形特征以及热数据甚至纹理度量。因此,ML方法在包括碎屑覆盖的冰川、阴影区域和混合表面在内的复杂环境中表现优异。例如,加入SAR后向散射可以在多云或光照不足的条件下提高性能,而DEM衍生的特征有助于区分碎屑覆盖的冰和周围岩石。此外,结合地形变量(如坡度、曲率和海拔)和热信号可以帮助ML模型通过物理上下文而不是仅通过光谱差异来区分冰川表面和周围地形。图5展示了基于机器学习的冰川提取典型工作流程。

Amsssong ML算法、SVM [65,66,67,68,69,70,71]和随机森林(RF)[65,66,67,68,72,73,74,75,76,77]在冰川测绘中表现出强大的性能。SVM在高维特征空间中尤其有效,因为它能够构建最佳的决策边界(超平面),即使在训练数据有限的情况下也能最大化类别分离,这使其非常适合训练样本稀缺或不平衡的遥感应用。相比之下,RF作为一种集成学习方法,构建多个决策树并聚合它们的输出,从而提高鲁棒性并减少过拟合。它的优势在于处理异构数据集并捕捉变量之间的复杂交互作用,特别是在结合光谱、地形和纹理特征时尤为强大。此外,一些研究还成功使用了决策树(DT)[70,78]和k-最近邻(k-NN)[68,70,79]等基础算法进行包括冰川特征在内的土地覆盖分类,由于数据输入的多样性而取得了良好的结果。尽管这些模型的有效性取决于训练数据的质量和代表性,但ML仍然比基于指数的方法更具可扩展性和适应性。它作为传统静态指数和完全自动化的深度学习技术之间的重要中介,促进了在多种环境中测绘冰川所需的基于特征的学习。表3列出了1995–2025年间用于冰川提取的各种ML算法和数据集。

3.3. 深度学习模型在冰川测绘中的应用
深度学习在冰川测绘中的出现标志着从传统基于特征的分类向端到端表示学习的重大转变。与依赖手动设计输入的早期方法不同,DL模型直接从原始影像中自动提取分层空间-光谱特征,从而能够精确地划分复杂的冰川特征,如碎屑覆盖的冰川和混合表面的冰川。DL在冰川测绘中的应用最初由CNNs引领,这些模型能够有效地从影像中提取空间层次结构(例如,参考文献[82,83,84,85])。这些模型处理图像张量,在学习局部和全局上下文的同时保持空间结构。该机制使用可学习的核进行卷积操作:低级滤波器捕获边缘,中级滤波器检测裂缝等纹理,高级滤波器编码冰川范围等结构。局部加权操作帮助网络学习平移不变的模式,这对于跨不同位置映射特征至关重要。卷积后,ReLU等激活函数引入非线性以建模光谱关系,而池化(最大值或平均值)降低分辨率,扩展感受野,减少计算成本,并提高对噪声、阴影和变异性的鲁棒性。

随着在具有挑战性的环境中边界划分的需求增加,该领域采用了U-Net及其变体的编码器-解码器架构。编码器通过卷积和池化提取特征,而解码器通过上采样构建分割图。跳跃连接将深层语义特征与浅层细节结合在一起,这对于冰川分割非常有效。研究人员[86,87,88,89,90,91,92,93,94,95,96,97,98]使用这些架构在全球范围内绘制冰川并监测格陵兰和南极冰盖上的特征,如接地线。认识到冰川环境的独特光谱和形态特征,科学界已从通用模型转向特定领域架构。一个典型的例子是GlacierNet[99],它专为高山冰川测绘而设计,后来在GlacierNet2[100]中得到了改进。通过结构设计选择进一步优化了性能,而DeepLabv3+等模块利用扩张卷积捕获多尺度的空间特征,从融池到整个冰川盆地,而不会丢失分辨率,这对于管理冰川景观的异质性至关重要。最近的进展更倾向于使用基于Transformer的模型,而不是专注于局部特征的CNNs。Transformer使用自注意力捕捉长距离依赖关系,帮助它们识别大规模模式,如冰川连续性。混合模型如LGT-U-Net [92]和GlaViTU [101,102]结合卷积层用于局部特征和Transformer模块用于全局上下文。像AMD-HookNet [103]这样的注意力门控架构改善了复杂崩解前沿的特征表示。与ML一样,DL融合了多模态数据,使用深层特征进行更好的分类。典型的DL冰川分类工作流程(图6)从通用CNN转向专门的混合模型(表4),体现了AI在冰川科学中的重要作用。需要注意的是,由于DL相关研究数量众多,有关冰川湖的研究已被移至补充文件S1。

4. 讨论和未来研究方向
从遥感数据中提取冰川面临着相当大的挑战,因为山地景观的复杂性和冰川表面的异质性,包括阴影、碎屑覆盖、积雪、融水、可变反照率和频繁的云层遮挡。近年来,从传统光谱比率技术到更先进的ML和DL框架,冰川提取方法已经发生了显著演变。每种方法都有其独特的优势,但也存在固有的局限性,特别是在应用于不同的冰川环境时。然而,由于研究区域和数据集的差异,比较所有研究的结果是具有挑战性的。尽管如此,评估选定的光谱指数、ML和DL技术仍能为该领域的研究人员提供全面的概述。使用深度学习的研究约占所审查研究的56%,其次是用于冰川测绘的光谱指数(24%),最后是涉及机器学习的研究(约20%),如图7所示。研究重点在不同冰川特征上的分布揭示了明确的方法论层次结构。图8显示了冰川特征研究的关注点层次。深度学习是最通用的方法,在所有领域都处于领先地位,尤其是在清洁冰川测绘(19项研究)和冰川湖检测(11项研究)方面。对于清洁冰川(10项研究)和积雪覆盖的冰川(4项研究),光谱指数至关重要,因为它们具有高反射率。对于像碎屑覆盖的冰川这样的复杂任务,机器学习(5项研究)和深度学习(8项研究)比指数(3项研究)更受青睐,以区分光谱相似性与地形。监测崩解前沿主要依赖于深度学习,强调了其处理冰架边缘复杂性的能力。

4.1. 光谱指数:性能、挑战和未来方向
基于光谱指数的技术仍然是最广泛使用的冰川提取方法之一,特别是因为它们在计算上的简单性和识别清洁或积雪覆盖冰川的有效性。像NDSI这样的BR利用雪和冰在可见光谱中的强反射率以及它们在短波红外(SWIR)中的吸收,使其特别适合使用Landsat和Sentinel等中等分辨率传感器的大规模监测。尽管它们很受欢迎,但传统光谱指数在应用于碎屑覆盖或混合表面冰川时存在显著局限性,因为光谱与周围地形的混淆会降低分类精度。为了克服这些挑战,研究人员提出了修改后的指数、替代BR和光谱解混方法,通常与DEM和LST等辅助数据集结合使用。在所审查的文献中,65%的研究使用归一化差分雪指数(NDSI)作为主要的冰川划分方法,并经常将其性能与其他新提出的指数进行基准测试。这凸显了NDSI作为区分雪和冰的基准工具的长期作用。然而,大约42%的研究引入了新的指数,显示出更高的准确性,而更少的一部分研究将光学数据与数字高程模型(DEM)、LST或合成孔径雷达(SAR)数据结合起来以提高分类可靠性。贯穿所审查研究的一个一致主题是阈值校准的关键作用——阈值的微小变化可能会显著改变冰川范围的估计,尤其是在碎屑覆盖或阴影区域。大约25-30%的研究将光谱指数与DEM和LST等辅助变量结合使用,以提高复杂地形的测绘精度,这强调了仅靠光谱信息不足以进行稳健冰川测绘的认识。大约三分之一的研究提出了新的或改进的指数(例如ANDSI、AGEI、SWI、RDRI)以克服NDSI的局限性,特别是在区分冰川和水体、积雪或冰川上覆碎屑方面。虽然传统指数如NDSI在清洁冰条件下表现可靠,但它们在混合或碎屑覆盖的环境中的有效性较低,而混合或新开发的指数始终表现更好。在各种研究中,普遍认为光谱指数仍然快速且计算效率高,但它们在不同地区和传感器之间的可转移性仍然是一个挑战,许多指数被证明高度依赖于上下文。这些发现共同表明了一种向特定上下文的多指数方法以及整合地形和热变量的趋势,以提高精度。为了说明这些趋势,几项关键研究提供了代表性的例子。例如,在中国,参考文献[46]使用多角度BRDF观测开发了归一化差分冰-雪指数(NDISI),以增强对雪、冰和变质冰-雪之间的区分。该指数基于560–580 nm和1600–1680 nm波段的反射率,使用阿尔泰、青海湖和八宝河流域的光谱测量进行了验证。实地调查证实,NDISI在分离雪、冰和冰-雪类型方面优于传统指数。

同样,参考文献[51]评估了多种BR方法(NIR/SWIR和Red/SWIR)、NDSI以及多传感器数据(Landsat-9和Sentinel-2)。他们报告称,在清洁冰川冰测绘中,2.75的阈值对于这两种BR都是最佳的,而NDSI在0.40的阈值下表现最佳。在所有测试方法中,Sentinel-2 MSI NIR/SWIR BR的表现始终最好,特别是在阴影和碎屑覆盖区域,因为它具有更高的空间分辨率和更好的辐射校准。其他研究并行比较了多种自动化方法[51,55]。例如,参考文献[63]使用ASTER影像、历史航拍照片和实地调查研究了新西兰中部南阿尔卑斯山(1978–2002年)的冰川面积变化。该研究测试了三种自动化分类技术——NDSI、ASTER BR(3/4)和监督最大似然分类。其中,ASTER 3/4 BR实现了最高的准确率(97.01%),而NDSI达到了96.74%。尽管整体表现优异,自动化方法在处理碎屑覆盖的冰川时仍存在困难,需要手动数字化进行细化。与基于照片的解释和GPS的实地测绘进行验证后,确认冰川面积减少了约17%,这突显了多光谱方法的有效性和局限性。一些研究进一步将光谱指数与DEM、LST和SAR数据结合起来,以细化分类结果[53,58,63]。例如,参考文献[63]利用Landsat-5影像、DEM数据和气象记录,研究了1975年至2010年间秘鲁Nevados冰川群的冰川退缩情况。通过NDSI值大于0.5来识别干净冰面,而通过决策树规则(涉及NDSI值小于0.5、坡度小于24°以及特定的LST阈值)来划分被碎屑覆盖的区域。与秘鲁国家水资源管理局(ANA)提供的数据集进行对比后,结果证实无论是在干净冰面还是总冰川面积上都存在一致的退缩现象,这证实了白山脉(Cordillera Blanca)在过去几十年中经历了显著的冰川缩小。总体而言,这些研究强调了尽管光谱指数仍然是冰川测绘的核心,但综合性和适应性方法对于捕捉冰川环境的复杂性越来越重要。未来的研究应着手解决文献中指出的几个关键问题,包括开发能够在多种冰川环境中可靠使用的通用稳健指数,特别是针对被碎屑覆盖和阴影区域的冰川,以及建立标准化阈值协议以提高不同地区和传感器之间的可重复性和可比性。此外,整合高光谱、光学和地貌测量数据的多源数据集可以显著提高测绘精度和跨传感器的一致性。通过高分辨率或基于实地的地面真实数据来进行系统验证也至关重要,以减少对视觉解译的依赖并提高自动分类的可靠性。最后,利用云计算平台(如Google Earth Engine (GEE))实施长期冰川监测框架将支持高效的时间序列分析和自动化。通过关注这些重点,未来的研究可以提高冰川测绘方法的准确性、可转移性和实际应用性,从而有助于更深入地了解并在持续的气候变化背景下更有效地监测冰川变化。

4.2 机器学习:性能、挑战和未来方向
机器学习(ML)技术在方法论上相较于传统的光谱指数有了显著进步,为冰川分类提供了更加稳健和数据驱动的框架。通过利用监督学习算法,ML模型能够学习光谱数据、地形变量和土地覆盖类别之间的复杂非线性关系,比固定阈值方法提供更加细致和准确的结果。这些模型在处理冰川环境的固有复杂性方面表现尤为有效,因为在这些环境中,被碎屑覆盖的冰川和阴影区域常常导致光谱混淆。回顾的文献中,ML的应用从基础的基于像素的分类器逐渐发展到更复杂的集成和基于对象的方法。早期的或比较性研究通常使用SVM、DT和K-NN等算法,虽然有效,但这些单一分类器对噪声数据较为敏感。随着集成方法的大规模采用,性能取得了重大飞跃,其中随机森林(RF)成为最为主流和成功的算法。大约60%的ML研究使用了RF分类器。其优势在于能够处理高维数据,并有效地整合多源输入(如光学波段、SAR数据和DEM衍生的参数),从而产生高度准确的分类结果。文献中普遍认为,ML分类器,尤其是RF,在复杂地形中始终优于传统光谱指数方法。例如,在青藏高原绘制冰川相和南极半岛土地覆盖的研究中,使用RF和SVM模型的总体准确率分别超过了98%和97%。一个明显的趋势是辅助数据的日益集成;超过80%的ML研究将来自DEM的地形变量(如坡度、朝向、曲率)作为关键输入特征,这表明仅依赖光谱信息不足以进行可靠的冰川测绘。尽管报告了高准确率,但仍存在分歧和挑战。关于最佳输入特征组合没有普遍共识,不同研究使用不同的光谱、纹理和地形数据组合取得了成功。ML模型的性能高度依赖于训练数据的质量和代表性,而创建这些数据集所需的手动工作是一个重要的瓶颈。此外,准确绘制被碎屑覆盖的冰川的持续挑战仍然是主要限制,即使对于先进的ML模型也是如此。一个重要的研究空白是缺乏标准化的验证协议和基准数据集,这阻碍了不同研究之间模型性能的直接比较。

4.3 深度学习:性能、挑战和未来方向
深度学习(DL)代表了当前冰川测绘的最先进技术。通过使用深度神经网络,这些方法可以直接从原始影像中自动学习复杂的空间和光谱层次结构,使其在处理困难的语义分割任务(如被碎屑覆盖的冰川、深山阴影和动态冰川前端)时表现出色。回顾的研究表明,DL模型的发展迅速且清晰。最初的研究使用了基础的CNN,但很快标准化为编码器-解码器架构,U-Net成为最普遍和最有影响力的模型。其独特的架构具有保留细粒度空间信息的跳跃连接,非常适合精确的边界划分。超过50%的DL研究使用了U-Net或其变体,确立了其作为冰川分割事实标准的地位。在此基础上,更高级的架构(如DeepLabv3+,它利用卷积来捕捉多尺度上下文)也得到了成功应用,在比较研究中经常表现出顶级性能。例如,一项在中喀喇昆仑山的研究对七种不同的DL模型进行了基准测试,发现DeepLabv3+在绘制被碎屑覆盖的冰川时的交并比(IoU)达到了86.23%。文献中的一个显著趋势是开发高度专业化、针对特定领域挑战的模型。研究人员已经超越了简单地调整现成模型,创建了像GlacierNet及其后续版本GlacierNet2这样的定制架构。这些模型专门设计用于处理干净冰川、被碎屑覆盖的冰川和雪覆盖冰川的独特特征,通过整合多源数据实现了高达88.39%的IoU分数。最近的研究开始结合Transformer架构(如GlaViTU、LGT-U-Net)和专门的注意力机制(如AMD-HookNet),以更好地捕捉全局上下文并细化特征表示,进一步推动了分割准确性的边界。在回顾的研究中,普遍认为DL模型始终优于光谱指数和传统ML分类器。几乎所有DL研究(超过90%)都将地貌测量数据与光学影像结合使用,以实现最先进的结果。然而,仍然存在重大挑战。所有监督式DL模型的主要瓶颈是它们依赖于大量、标注精确的训练数据集,而这需要大量时间和专业知识来创建。此外,训练这些复杂模型的计算成本也是一个重要因素。虽然模型在其特定研究区域通常表现优异,但它们在不同地理特征的新区域的适用性仍是一个主要研究空白。关于哪种特定架构更优越仍存在争议,表明模型性能往往取决于任务和数据本身。DL模型在复杂的冰川学条件下表现良好,而传统方法常常失效。在光谱对比度高的干净冰区域,它们对光谱指数的改进有限。然而,在被碎屑覆盖的冰川上,由于冰和碎屑之间的光谱相似性限制了基于指数的技术的有效性,DL模型依赖于从卷积滤波器中学到的空间纹理和形态学线索来提高分类准确性。同样,在有地形阴影的区域,DL模型利用周围地形的信息来识别冰川,克服了光谱限制。它们能够结合多种数据源(包括来自DEM的坡度和朝向等因素),进一步提高了性能,考虑了影响冰川分布的物理因素。尽管需要更多数据和计算能力,但这些特点使DL在多样化和变化的冰川系统中特别有效。在这种情况下,方法的选择主要取决于冰川特征和数据的复杂性。对于光谱对比度高的干净、定义明确的冰川表面,光谱指数已经足够。机器学习技术通过结合各种特征在中等复杂情况下提高准确性,而在高度多样化的条件下,如被碎屑覆盖、有阴影或活跃变化的冰川系统,深度学习方法则是必不可少的。

展望未来,有几个机会可以推进冰川提取技术的发展。首先,结合光谱指数、解混技术和DL的混合方法,在光学、热成像、SAR和LiDAR数据集中的应用具有解决单一技术局限性的强大潜力。其次,多时相和时间序列分析可以通过区分永久性冰川和季节性积雪以及捕捉与气候变率相关的年际变化来改进边界检测。第三,DL方法的进步,包括迁移学习和半监督学习,可以减少对大型标注数据集的依赖,而可解释AI框架的发展将提高这些模型的可解释性和可信度。最后,开放获取的高分辨率卫星数据(如Sentinel-1/2、Landsat-9、ICESat-2、GEDI)与云计算平台(如GEE)的结合,为实现自动化的近实时冰川监测系统提供了前所未有的机会。这样的系统将对支持科学理解、水资源管理和区域到全球范围内的气候变化适应策略至关重要。

4.4 地貌-分类难题
除了干净、被雪覆盖的冰川、被碎屑覆盖的冰川和冰川上的湖泊外,岩石冰川也是一种重要的冰冻圈地貌,应在冰川测绘框架中予以明确考虑。在被碎屑主导的环境中,区分几种相关但不同的表面类型非常重要,包括具有活跃连续冰核的被碎屑覆盖的冰川、埋藏在碎屑中的冰或残余冰、死冰体以及岩石冰川。岩石冰川是被碎屑覆盖的冰体,通常包含大量的冰,并且在许多山区,它们起源于被碎屑覆盖或停滞的山谷冰川,而不仅仅是永久冻土过程的结果。尽管最近的机器学习文献大多将岩石冰川主要视为永久冻土的指标[115,116,117,118],但越来越多的冰川学证据表明,冰川、被碎屑覆盖的冰川和富含冰的岩石冰川在冰含量和演化路径上存在遗传联系[119]。然而,这些特征在冰的连续性和动态性上有所不同,被碎屑覆盖的冰川通常保持活跃,而埋藏的冰和死冰则代表停滞或退化的残留物,而岩石冰川则以蠕动驱动的运动为特征。从遥感的角度来看,这种区分至关重要,因为大多数方法(包括光学、SAR和ML/DL方法)主要检测表面特征(如纹理、反射率和形态),而不是直接识别地下冰的连续性。因此,这些不同的冰相关地貌在影像中可能看起来相似,高分类准确率并不一定意味着冰川学的有效性。与GLIMS框架[24,25,26]提供的指导一致,岩石冰川应包括在全面的冰川测绘工作中。排除它们可能导致系统性地低估冰川相关的冰体积,并误解长期的冰冻圈变化,而错误的分类突显了仔细解释自动测绘结果的必要性。光学影像特别受到被碎屑覆盖的冰与周围冰碛之间光谱相似性的限制,而SAR数据可以捕捉表面结构,但不能可靠地确认内部冰的连续性,ML/DL模型主要学习表面模式而非地下属性。

4.5 自动化历史冰川清单用于测绘
尽管最近的ML和DL方法在自动冰川划分方面表现出色,但文献中反复提到一个限制是历史冰川记录的整合不足。一些研究开发了特定地区的模型,但没有明确参考过去的清单数据,尽管冰川学历史(包括长期退缩趋势、高程测量和受朝向控制的融化模式)对于理解冰川对气候变化的响应至关重要。将自动化方法与GLIMS和RGI等既有的清单相结合,可以确保时间一致性,便于跨区域比较,并允许在更广泛的气候和地貌背景下解释新的冰川轮廓。最近的专注于冰川的研究开始通过将基于ML的分类与现有清单和长期数据集相结合来解决这一空白。例如,Alifu等人[68]和Baraka等人[120]将多传感器卫星数据与基于清单的验证结合起来用于被碎屑覆盖的冰川测绘,而Bouchayer等人[121]和Qiu等人[122]强调了使用基于历史轮廓的自动化方法进行长期冰川变化分析。最近的工作[123]进一步展示了清单链接深度学习的价值,以确保模型在不同地区和不同年代间的可转移性。这些研究清楚地表明,未来自动冰川测绘的进步应优先考虑与现有冰川清单和历史记录的紧密整合。

4.64.7 数据融合对模型性能的影响
输入数据的选择是任何用于冰川测绘的机器学习(ML)或深度学习(DL)模型性能的决定性因素。回顾的研究表明了一个清晰且一致的趋势:多源数据融合通过克服单一传感器类型的固有局限性显著提高了分类准确性。本节分析了基于五种数据输入类型的模型性能:仅使用光学数据、仅使用合成孔径雷达(SAR)数据,以及这些数据与地貌测量数据的各种组合。

- **光学数据集**:仅使用光学数据(如Landsat或Sentinel-2图像)训练的模型可以实现高准确性,特别是在清晰冰面的划分上。例如,使用仅Landsat或Sentinel-2输入的U-Net架构的研究报告的F1分数高达94.65%,总体准确率超过95% [87,90,109]。尽管有效,但仅依赖光学数据的模型性能受到气象条件(如云层覆盖)的根本限制,并且由于光谱相似性,它们往往难以准确区分被碎屑覆盖的冰舌和周围地形。
- **SAR数据集**:SAR数据(如Sentinel-1的数据)的主要优势在于能够穿透云层并且不受太阳光照的影响。这种全天候能力使得这些数据对于持续监测非常宝贵。仅依赖SAR的研究显示出强劲的结果,其中一个U-Net模型实现了87.7%的交并比(IoU) [124],另一个使用Sentinel-1 SAR数据的研究达到了93.3%的F1分数 [125]。然而,仅使用SAR的方法容易受到散斑噪声、陡峭地形中的重叠效应和由于表面湿度变化导致的后向散射信号模糊等挑战。
- **地貌测量数据与光学数据的融合**:将光学图像与来自数字高程模型(DEM)的地貌参数相结合,在性能上取得了显著提升,尤其是在绘制被碎屑覆盖的冰川时。坡度、曲率和海拔等地形特征提供了关键的信息,有助于区分光谱上模糊的被碎屑覆盖的冰和稳定的岩石碎屑。这种方法取得了优异的结果,例如GlacierNet2模型使用Landsat和ALOS DEM数据实现了88.39%的总体准确率 [100]。
- **光学数据与SAR数据的融合**:结合光学和SAR数据结合了前者的丰富光谱信息与后者的结构和纹理敏感性,产生了一个更具适应性的输入堆栈,部分补偿了每种传感器类型的弱点。光学图像为清晰冰面的区分提供了高光谱分辨率,而Sentinel-1 SAR的后向散射能够实现不依赖于云层的观测,并捕捉到有助于区分被碎屑覆盖的冰和周围地形的表面粗糙度对比。Lin等人 [82] 的研究展示了这种互补性,他们使用Sentinel-2、Landsat-8和Sentinel-1图像的组合训练了一个CNN,用于绘制喜马拉雅中部和喀喇昆仑山脉的被碎屑覆盖的冰川,实现了89.2–93.7%的F1分数。在更大范围内,Maslov等人 [101] 表明,将SAR的相干性和后向散射信息添加到光学Sentinel-2/Landsat输入中,一致提高了所有测试区域的准确性,他们的GlaViTU模型在全球范围内的IoU超过了0.85%,在以清晰冰为主的区域超过了0.90%。

4.8 关键挑战和未来研究需求
文献综述强调了几个相互关联的挑战,这些挑战为未来的冰川测绘研究设定了关键优先事项。这些挑战包括获取可靠、标准化真实数据的困难;整合多源数据集(如DEM、SAR和InSAR)的挑战;以及维护FAIR(可发现、可访问、可互操作和可重用)数据原则的问题。其他障碍还包括有限的地理定位精度、对衍生数据集的访问受限,以及绘制被碎屑覆盖和过渡性冰川的复杂性。这些问题共同影响了模型在不同地区的可靠性、可重复性和可移植性。尽管个别研究侧重于特定问题,但综合这些挑战为推进自动化冰川监测的方法和数据实践提供了更清晰的框架。

4.9 冰川测绘方法的操作准备情况
尽管在冰川测绘方法上取得了重要进展,但其实际应用范围仍然很广。基于光谱指数的方法仍对大规模和近实时监测最为有用,因为它们成本低廉、需要较少的训练,并且与Google Earth Engine(GEE)等平台配合良好。机器学习方法可以在中等复杂的环境中提高准确性,但它们需要组织良好的训练数据集和仔细的特征选择,这可能限制了它们的应用范围。深度学习方法在困难条件下(如被碎屑覆盖和混合表面的冰川)显示出最佳结果。然而,由于计算需求高、依赖大型标记数据集以及在不同区域之间的转移能力有限,实际应用仍然具有挑战性。因此,许多深度学习应用仍处于研究或实验阶段,尚未完全投入运行。
实际上,结合光谱指数、机器学习或深度学习模型以及基于云的平台提供了可扩展且近实时的冰川监测的最佳途径。未来的努力应旨在减少数据需求、提高模型泛化能力,并将自动化工作流程整合到操作系统中。

5. 观点和观点
- 尽管机器学习和深度学习现在主导了这一领域,但不应忽视光谱指数的基础性作用。对于快速的大规模评估,特别是对于清晰冰和积雪的监测,像NDSI这样的指数在计算上仍然高效且易于实施。然而,文献清楚地显示了向开发更强大的指数的趋势,例如ANDSI,以解决区分冰和水等特定挑战。指数的未来可能不再是独立的工具,而是作为更复杂的机器学习和深度学习模型的强大输入特征,为这些模型提供光谱信息的基线,以便进一步优化。
- 监督式机器学习和深度学习模型在冰川测绘中的有效性在很大程度上取决于训练数据的质量、一致性和代表性。大多数研究使用手动划分的冰川边界或现有的冰川清单(如RGI和GLIMS)作为“真实值”。然而,这些并不是真正的真实值,因为它们基于半自动化或专家方法,具有不同的空间分辨率、时间一致性和假设。一个关键问题是被碎屑覆盖的冰川在光学图像中难以检测,导致训练数据中遗漏或错误分类冰川区域。这会造成偏差,使模型从不准确的标签中学习,无法反映冰川的真实范围和状态。虽然现场调查提供了更精确的参考数据,但其范围有限且难以实施。因此,当前的方法依赖于不完美的参考数据集,这限制了可靠的模型比较、区域泛化和准确的冰川清单开发。因此,开发符合FAIR原则的标准化、高分辨率和物理一致性的基准数据集是科学界的优先事项。
- 深度学习表格显示U-Net及其变体(如Res-Unet、R2UNet、SAU-Net)明显占据主导地位。虽然U-Net是一种强大的图像分割架构,但该领域可以从探索其他模型架构中受益。例如,计算效率更高的模型(如Mobile-Unet)对于大规模的运营型冰川监测系统来说可能至关重要。此外,还需要进一步研究超参数优化以及针对冰川测绘特定挑战设计的新损失函数,例如冰川与非冰川像素之间的不平衡问题。虽然许多研究现在已经结合了多种数据源,如光学影像、SAR和DEM,这是一个克服每种传感器类型局限性的积极趋势,但在这个领域仍有许多值得探索的地方。未来的研究应该关注如何最好地融合具有不同空间和时间分辨率的数据,如何在深度学习框架中整合较少使用的数据类型(如高光谱或热成像),以及开发超越简单数据堆叠的更复杂的数据融合技术。大多数研究都集中在为特定区域开发模型上,但还需要更多关于这些模型在不同冰川类型和环境条件下的可迁移性的研究。例如,在喜马拉雅山脉训练的模型可能在安第斯山脉或阿尔卑斯山脉的冰川上表现不佳,因为这些地区的冰川形态、气候条件和训练数据分布存在差异[102]。覆盖有碎片的冰川是最难绘制的类型之一,因为它们的光谱特征与周围地形相似,并且其表现受碎片厚度、热绝缘性和表面动态的影响。未来的研究应侧重于结合热数据、表面速度和地貌指标的基于物理的方法,以更好地检测碎片下的活跃冰层。尽管许多研究展示了机器学习和深度学习在自动化冰川测绘方面的潜力,但实际将其应用于操作型、接近实时的监测系统的例子却很少。缩小研究与实际应用之间的差距是未来的关键挑战。

6. 冰川测绘中的偏差和不确定性
6.1. 定义遥感中的偏差
在冰川测绘中,偏差指的是系统性地错误地使结果朝某个方向偏移,导致对冰川大小的过高或过低估计。与随机噪声不同,偏差通常源于数据收集、环境因素或算法设计本身的固有局限性。识别和测量这些偏差对于确保观察到的冰川质量变化真正反映气候趋势而非由方法引入的误差至关重要。

6.2. 偏差和系统不确定性的来源
从手动划线到自动化深度学习(DL)模型的转变引入了特定形式的偏差,本综述将其分类如下:
- 数据集和地理偏差:大多数最先进的模型是在高质量、标准化的数据集上训练的,这些数据集往往集中在特定区域(例如欧洲阿尔卑斯山脉),这导致了模型的可迁移性差距,即模型在具有不同特征的冰川(如热带或高纬度北极冰川)上的表现较差。
- 真实值和标注偏差:冰川测绘的进展受到获取准确真实值数据的难度限制。许多研究依赖于RGI和GLIMS等库存数据,这些数据虽然重要但带有不确定性。由于绘图方法、分辨率和解释的差异,这些库存数据往往与专家划线结果不一致。覆盖有碎片的冰川经常被低估或错误分类,因为表面碎片遮挡了光学图像中的冰层。这些问题引入了偏差,影响了监督式机器学习和深度学习模型的准确性。
- 大气和地形偏差:Landsat和Sentinel-2等光学传感器常常受到云层和阴影的影响,导致部分冰川区域被遗漏。SAR传感器减少了云层干扰,但在陡峭地形中引入了几何变形,可能会使冰川测量结果产生偏差。
- 覆盖有碎片的冰川测绘偏差:这类冰川的独特不确定性在于其表面特征通常无法反映冰层下的实际情况。光学和SAR技术主要检测表面特征,可能无法准确反映冰层存在、范围或活动情况,尤其是在碎片厚度变化大和地貌动态复杂的区域。因此,分类结果和库存数据可能包含标准准确度指标无法完全捕捉到的系统误差。因此,结合热观测、表面速度数据和实地验证对于减少这种不确定性至关重要。
- 模型架构偏差:过度依赖有限的模型架构(如标准U-Net变体)可能导致无法准确检测细小特征或短暂的冰川表面湖泊。这些模型倾向于偏好平滑的边界,从而低估了高度破碎的冰川前端。

7. 结论
本综述追踪了使用遥感数据进行冰川测绘技术的演变过程,从传统的光谱指数发展到当前以复杂的机器学习和深度学习模型为主导的时代。我们的分析揭示了一个明显且显著的趋势:自动化、数据驱动方法的日益采用显著提高了冰川测绘的准确性、效率和范围。方法已经从NDSI等指数式的计算简单性发展到RF和支持向量机等机器学习算法的精细分类能力。然而,当前的技术格局明显受到深度学习的影响,U-Net及其衍生模型在语义分割方面展现了无与伦比的性能,特别是在识别覆盖有碎片的冰川和冰川崩解前沿等具有挑战性的任务中。此外,尽管该领域已经接受了数据融合(结合光学、SAR和DEM数据),但仍有很大的空间可以开发更复杂的数据融合技术,并探索未充分利用的数据源的潜力。目前对有限模型架构(主要是U-Net)的过度依赖突显了需要更多样化的模型探索,包括关注计算效率和超参数优化,以实现从研究到实际监测的转化。文献中的一个主要挑战是高质量、透明且可重复使用的真实值数据的持续短缺。这个问题不仅涉及数量问题,还包括数据可访问性、详细文档记录和准确地理定位等问题。许多研究缺乏具体的地理定位细节(如精确的十进制坐标),这妨碍了数据的可重复性并降低了数据集的实用性。为特征提供机器可读的地理坐标(如十进制纬度和经度)将增强互操作性,便于跨研究比较,并能与大型语言模型和自动化地理空间推理等新兴框架集成。模糊的空间参考或地图边界坐标效果较差,不符合FAIR(公平、开放、可重复使用和透明度)标准。未来的冰川测绘不仅依赖于机器学习的进步,还依赖于向开放、文档齐全且地理位置精确的数据集的文化转变。应用FAIR原则、提高真实值数据的透明度并严格执行地理空间标准对于实现可扩展、可信的气候相关冰川监测至关重要。

总之,机器学习和深度学习的应用彻底改变了冰川测绘,提供了强大的工具来监测这些气候变化的关键指标。该领域的发展将不仅依赖于更先进算法的开发,还依赖于整个社区对创建稳健验证数据集的关注,改进模型可迁移性和不确定性量化,以及架设桥梁以创建操作型、接近实时的冰川监测系统。通过将前沿人工智能与改进的数据实践相结合,遥感社区可以提供理解并应对全球气候变化影响所需的关键数据。

补充材料
以下支持信息可在此网址下载:https://www.mdpi.com/article/10.3390/rs18101496/s1,表S1:关于用于冰川测绘的深度学习研究的总结,重点关注冰川湖泊检测。参考文献[124,125,126,127,128,129,130,131,132,133,134]在补充材料中引用。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号