利用Sentinel-1 SAR影像开展建模,估算秘鲁通贝斯河流域的水文预警洪水阈值
胡安·卡洛斯·布雷尼亚·阿利亚加(Juan Carlos Bre?a Aliaga)、
詹姆斯·维达尔(James Vidal)、
奥斯卡·费利佩(Oscar Felipe)、
吕克·布雷尔(Luc Bourrel)、
佩德罗·劳(Pedro Rau)和
瓦尔多·拉瓦多-卡西米罗(Waldo Lavado-Casimiro)
《Remote Sensing》:Estimation of Flood Thresholds for Hydrological Warning Purposes Using Sentinel-1 SAR Imagery-Based Modeling in the Tumbes River Basin (PERU)
Juan Carlos Bre?a Aliaga,
James Vidal,
Oscar Felipe,
Luc Bourrel,
Pedro Rau and
Waldo Lavado-Casimiro
【字体:
大
中
小
】
时间:2026年05月11日
来源:Remote Sensing 4.1
编辑推荐:
**亮点**
- **主要发现是什么?**
通过将合成孔径雷达(SAR)卫星观测数据与实地水文记录相结合,通过统计阈值估计确定了基准洪水激活值为743.49立方米/秒,并绘制了不同流量水平下受影响区域的分布图。这些衍生阈值的可靠性得到了优化映射方法(使用Bmax和Edge
**亮点**
- **主要发现是什么?**
通过将合成孔径雷达(SAR)卫星观测数据与实地水文记录相结合,通过统计阈值估计确定了基准洪水激活值为743.49立方米/秒,并绘制了不同流量水平下受影响区域的分布图。这些衍生阈值的可靠性得到了优化映射方法(使用Bmax和Edge Otsu算法)的保障,该方法实现了95.8%的整体空间精度。
- **主要发现的意义是什么?**
这种方法填补了空间遥感与操作水文学之间的关键空白,将离散的卫星观测数据转化为连续的、可预测的早期预警阈值。这种可扩展的基于云的技术为灾害风险管理者提供了一种经过验证的、低成本的工具,有助于他们在数据匮乏的地区预测洪水影响并优化应急资源的分配。
**摘要**
在干旱的热带盆地(如秘鲁的Tumbes河)进行洪水监测面临着严峻挑战,因为持续的云层覆盖限制了光学传感器在极端事件中的运行能力,加之卫星产品与传统的 hydrological 监测之间存在操作上的差距。为了解决这些限制,本研究在 Google Earth Engine 中开发了一个综合的方法框架,该框架结合了自动图像阈值处理和 Sentinel-1 SAR 时间序列分析,用于洪水检测和早期预警阈值的估算。评估了 Bmax Otsu 和 Edge Otsu 算法,这些算法之前使用高分辨率影像(PlanetScope)作为参考数据进行了校准,并通过 HAND(Height Above the Nearest Drainage)模型进行了地形约束,并与已建立的变化检测算法进行了验证。2017 年至 2024 年间对七次水文事件的分析证实了 Bmax Otsu 的统计优越性;尽管两种方法都实现了较高的整体精度(Bmax 95.8% 对比 Edge 95.7%),但 Bmax Otsu 在空间一致性方面表现更优(Kappa 66.1% 对比 63.7%;IoU 45.6% 对比 45.0%)。基于此,应用时间序列分析来区分永久性水体并隔离洪水动态。随后,通过将 SAR 传感器捕捉的瞬时洪水范围与其对应的峰值流量联系起来,评估了功能性的流量-影响响应。经 INDECI 官方损失报告验证,当流量激活值达到 743.49 立方米/秒时,就会开始产生显著影响(151 公顷的农田被淹没,157 名居民受到影响),并且这一影响会线性扩展到极端峰值流量 1629.02 立方米/秒,导致 1234 公顷的农田受损和 749 名居民受到影响。这种方法为数据匮乏地区提供了一种经过验证的、低成本的工具,可以将 SAR 观测数据转化为早期预警系统的关键阈值。
**1. 引言**
全球范围内,气候变化加剧的洪水造成了严重的社会经济影响[1,2],南美洲太平洋沿岸地区尤其容易受到厄尔尼诺-南方涛动(ENSO)及其相关洪水的严重影响[3]。在像 Tumbes 河这样的跨界流域中,实施监测系统对于灾害风险管理至关重要[4]。这一优先事项源于区域水文气候的复杂性,这种复杂性受到全球 ENSO 以及沿海厄尔尼诺现象(Ni?o 1 + 2 区域的突然局部升温)的驱动,后者通常会触发最具破坏性的洪水[7,8]。鉴于这种双重驱动因素,以及水文网络无法快速捕捉水文变化的情况[9,10],验证卫星监测技术以填补这些时空数据空白显得尤为紧迫[11,12]。
传统的基于实地水文网络的洪水监测方法存在重大局限性:这些网络分布稀疏,且在极端高峰流量期间容易受损,从而中断关键的数据收集[13]。此外,这些点测量无法捕捉到洪水的实际空间范围,而这对于应急响应和损失量化至关重要[14,15]。虽然卫星遥感能够通过绘制水面图像来克服这些限制,但其大规模的应用长期以来一直受到精度不确定性和高昂计算需求的限制[16]。如今,像 Google Earth Engine (GEE) 这样的基于云的平台有效地解决了这些挑战,实现了大规模且可扩展的卫星数据处理,而无需昂贵的本地基础设施。尽管光学遥感(Landsat、Sentinel-2、MODIS、VIIRS[17,18,19,20,21,22]以及阈值、决策树、时间序列和机器学习[23,24,25,26,27,28,29,30]等方法可以克服实地监测的障碍,但由于云层覆盖的影响,它们在热带洪水中的有效性大大降低[31,32]。为了填补这些空白,人们使用了合成孔径雷达(SAR),它能够穿透云层进行连续观测[33,34],成为当今最强大的洪水映射工具[15,16,35,36,37,38]。得益于 Sentinel-1[39,40,41] 和 GEE[42,43] 等云平台提供的海量 SAR 数据,可以使用类似于光学方法的技术进行水体提取[44,45,46,47,48,49,50,51]。然而,SAR 图像面临诸如斑点噪声、地形引起的失真和干扰[52],以及由后向散射行为引起的光谱歧义等问题。这些歧义会导致在平坦裸露表面上产生误报,在密集植被覆盖下或在风引起的波浪增加表面粗糙度的水面上产生漏报[53]。减轻这些误差需要自动化强大的预处理流程,包括辐射强度地形校正(RTC)和空间滤波[15,54],以避免手动解释并确保数据的时间一致性[55]。
在快速灾害制图中,变化检测方法通过将事件与历史基线进行比较来识别洪水,利用 Z 分数等统计指标[16];然而,它们对密集图像档案的依赖性限制了其在数据不规则或土地利用频繁变化地区的应用。为了缓解这一限制并简化处理过程,经常使用 Otsu 方法[56]及其优化变体(如 Bmax Otsu 和 Edge Otsu[29,57])进行单场景阈值处理。即便如此,仅仅获得一个简单的二值掩码是不够的;为了有效区分永久性水体和实际洪水,时间序列分析通过成功减去基础水文数据而优于静态掩码[58]。尽管取得了这些进步,但在安第斯-亚马逊热带流域中,这些方法的可适应性仍存在方法论上的空白,需要使用非常高分辨率的影像(如 PlanetScope)进行参数校准,并根据已建立的变化检测方法进行验证[16]。最后,这种方法与操作水文学之间存在重要脱节,因为很少有研究能够将这些 SAR 时间序列转化为可以直接整合到早期预警系统(EWS)中的具体流量阈值,以用于灾害风险管理。
本研究的主要目标是使用 Google Earth Engine (GEE)[42] 和 Python(版本 3.8.20)开发一个自动化的基于云的处理框架,旨在利用 Sentinel-1 SAR 图像对 Tumbes 河的洪水进行操作性检测并估算关键水文阈值。具体而言,本研究提出了四个方法论目标:(1)使用非常高空间分辨率的 PlanetScope 影像作为参考数据,校准 Bmax Otsu 和 Edge Otsu 阈值算法的参数;(2)通过与传统变化检测算法[16] 相比来评估这些自动化方法的性能;(3)实现接近实时的洪水监测算法以实现时间序列重建;(4)生成 Tumbes 河关键河段(从 El Tigre 测量站到太平洋)不同峰值流量水平下的洪水阈值。
**2. 研究区域和数据**
- **2.1 研究区域**
研究区域包括从 El Tigre 测量站延伸至太平洋的 Tumbes 河洪泛区。为了优化结果和讨论的可视化,该区域被划分为低区和中区(图 1)。该河段属于跨界 Puyango-Tumbes 流域(5530 平方公里),其中 1935.5 平方公里和 140 公里的主河道位于秘鲁[59,60]。2014 年至 2024 年间,该河流展现出极端的水文活动,流量在 12.32 到 1833.38 立方米/秒之间波动(洪水期间平均为 202.51 立方米/秒[61])。这种极端差异直接威胁到 224,863 名居民[62] 和广阔的农业区域;它们的空间分布和土地利用类型(LULC)类别[63] 详细显示在图 2 中。值得注意的是,这些农业和水产养殖类别构成了后续时间建模方法中使用的排除掩码的空间基准。
- **2.2 使用的数据**
- **2.2.1 水文气象数据**
作为主要的水文气象输入,使用了来自 El Tigre 测量站的日流量(Q)记录和来自 Cabo Inga 测量站的降水量数据。这些数据集涵盖了 2016 年至 2024 年的时期,由秘鲁国家气象和水文服务局(SENAMHI)提供并进行了验证。为了评估洪水风险,将这些实地信息与 Sentinel-1 的连续卫星监测相结合(图 1)。此外,为了阐明极端事件的时间动态,还将地面记录与 ONI 和 ICEN 气候指数进行了整合(图 3)。
- **2.2.2 Sentinel-1 数据**
本研究使用了 Sentinel-1(C 波段)干涉宽幅(IW)模式和 GRD 格式的图像,分辨率为 10 米。这些产品在 Google Earth Engine (GEE) 中可以直接使用,提供商已经应用了标准预处理,包括热噪声去除、辐射强度校准和使用 SRTM DEM 的几何校正[64]。在此基础上,我们通过应用 Lee-Sigma 滤波器和辐射强度地形校正(RTC)[66] 来减轻斑点噪声和地形失真。关于极化,虽然交叉极化的 VH 波段对体积散射更敏感[34],但在密集植被中的有限穿透性是 C 波段传感器的一个固有限制,这会影响 VV 和 VH 极化;一旦植被密度超过特定深度,无论使用哪种极化方式,信号都会饱和。因此,由于包括 VH 波段会增加计算复杂性并且可能在裸露土壤或稀疏植被上产生误报[16,43],我们决定仅依赖 VV 极化来避免因误报而高估洪水面积。该波段提供了更好的辐射强度一致性、更低的错误率[37],以及在平静风条件下的高精度[67]。在单维度(VV)下工作简化了阈值计算,确保了提取水面信息的保守且可靠的基础[表 1]。
- **2.2.3 航天雷达地形任务(SRTM)**
由于地表水倾向于在盆地的高程低洼处积聚,因此纳入高程数据对于空间限制洪水检测算法的适用范围至关重要[68]。本研究使用了 30 米 SRTM 数字高程模型(DEM)[64],该分辨率因其与 Sentinel-1 原生网格的最佳空间兼容性和高计算效率而受到青睐,适用于连续的流域规模监测。根据 [69] 中描述的方法,从中推导出了高度高于最近排水口(HAND)模型,从而将分析范围限制在相对于最近排水口高度小于 30 米的区域。
- **2.2.4 PlanetScope**
PlanetScope 卫星星座由超过 120 颗 CubeSat 组成,提供可见光和近红外光谱的每日高分辨率光学数据(大约 3 米地面采样距离[70]。由于云层覆盖导致光学观测很少与洪水事件同时发生,参数校准阶段战略性地限制在仅有的两个与 Sentinel-1 重合的时间点:2023 年 4 月 28 日和 2024 年 2 月 23 日。尽管存在这种大气限制,两个场景仍然捕捉到了研究区域水文变化的极端情况(严重和中等程度的洪水),因此可以将其作为地面真实参考数据[15],以严格确定Bmax Otsu和Edge Otsu算法的最佳配置,特别是核大小和阈值敏感性(详细过程见第3.3节)。一旦这些操作参数被定义为能够抵抗极端辐射强度波动,它们就被一致地应用于所有七个识别的事件中。最后,为了确保所提出方法相较于现有技术具有可行性,通过系统地将结果地图与使用传统变化检测方法生成的产品进行基准测试[16],来验证整个时间序列的准确性和一致性。
3. 方法论
3.1. 方法论框架
图4展示了使用Sentinel-1 SAR影像在Tumbes河流域进行操作性洪水检测的方法论框架。这一架构在概念上被定义为一种低成本解决方案,因为它整合了Copernicus开放数据政策与Google Earth Engine(GEE,JavaScript API,美国加利福尼亚州山景城)的免费基于云的处理环境,从而消除了与商业软件购买和高性能硬件要求相关的经济障碍。
图4. 提出方法论的总体流程图。工作流程分为六个主要阶段:SAR数据预处理、参数校准、地表水检测算法(Bmax和Edge Otsu)、评估设计、洪水制图算法和洪水阈值确定。工作流程从SAR数据预处理开始,并使用高分辨率PlanetScope影像对Bmax和Edge Otsu算法进行初步参数校准。利用这些优化后的参数,执行图像分割,结合HAND指数[69]来过滤由地形引起的误报。该方法的鲁棒性通过K折交叉验证针对基准变化检测算法[16]进行评估。最后,应用[58]中的时间监测方法来绘制七个历史事件,将淹没区域与El Tigre站点的流量相关联,以确定洪水阈值。
3.2. SAR数据预处理
Sentinel-1影像(IW模式,GRD格式)是通过Google Earth Engine(GEE)获取的,该平台执行标准的预处理步骤,包括轨道校正、热噪声去除和辐射校准,以获得以分贝为单位的后向散射系数[42]。为了提高辐射质量并减少斑点噪声,同时不影响结构边缘的清晰度,应用了一个自适应的Lee Sigma滤波器,其窗口大小为[具体数值未提供]。最后,使用30米SRTM数字高程模型(DEM)实施了辐射地形校正(RTC)。这一步骤根据局部入射角度对后向散射信号进行了标准化,有效修正了由地形引起的几何扭曲,如folding和layover[66]。
3.3. 参数校准的方法论设置
为了确保方法论的鲁棒性,而不依赖于在极端事件期间由于持续云层覆盖而严重受限的连续光学影像,使用了仅有的两个与SAR重叠的PlanetScope场景(2023年4月28日和2024年2月23日)进行了一次性初始参数校准。这些图像捕捉了极端和中等程度洪水之间的变化,通过精确的手动数字化生成了参考地面真实掩模,这一过程得到了光谱指数(NDWI、NDVI)和真彩色(RGB)组合计算的技术支持。使用总体准确率作为优化指标,对每个算法进行了系统测试,以确定最佳参数:Bmax Otsu进行了9次迭代(结合了不同的栅格分辨率和双峰阈值),而Edge Otsu则进行了详尽的18次迭代(交替使用不同的Canny阈值、缓冲区宽度以及最小边缘长度)。一旦确定了最佳参数集(详细结果见第4.2节),它们就被静态地应用于整个SAR数据集,从而实现了一个自主和自动的地表水检测系统。
3.4. 地表水检测算法
为了绘制地表水分布,将两种无监督算法——Bmax Otsu和Edge Otsu——应用于SAR GRD数据。这两种算法都基于Otsu的阈值方法[56],该方法假设双峰分布以最大化类间方差。为了克服标准方法在复杂场景或单峰直方图中的局限性,这些方法采用选择性子采样,仅将阈值计算限制在保证双峰性的区域(详细内容见第3.4.1节和第3.4.2节)。关键的是,它们的操作参数是通过一次性初始校准使用的PlanetScope影像来确定的(见第3.3节),确保系统不依赖于连续的光学数据。最后,通过应用来自HAND模型[69]的30米垂直阈值来整合得到的地表水掩模,以过滤由地形引起的误报。
3.4.1. Bmax Otsu算法
通过Python适配到Google Earth Engine的Bmax Otsu算法[57]的实现,确保了双峰直方图的鲁棒性,从而实现准确的阈值划分。工作流程首先将图像分割成网格。然后使用[系数未提供]评估每个子区域的统计双峰性,需要事先设定一个以分贝为单位的类别估计值(基于2017年32幅Sentinel-1图像的历史平均值)。应用严格的过滤标准,只保留满足条件的瓦片。最佳空间分辨率[值未提供]和双峰性阈值[值未提供]是在使用PlanetScope影像进行初始参数校准期间确定的(见第3.3节)。最后,汇总这些经过验证区域的统计数据来计算最终的Otsu阈值,生成一个二值掩模,其中低于此限度的后向散射值被分类为地表水。
3.4.2. Edge Otsu算法
同时实施了Edge Otsu算法[29],利用Canny滤波器[72]来划分水体的物理边界。为了避免与城市结构或密集植被的误分类,首先应用了相同的以分贝为单位的参考阈值来创建一个初始搜索掩模[15]。然后应用在PlanetScope校准期间定义的几何滤波器[见第3.3节]到检测到的边缘:丢弃小于150米的段以减少噪声,并在有效边缘周围生成一个400米宽的缓冲区(每侧200米)。最后,仅使用该缓冲区内的后向散射值(dB)构建Otsu阈值计算的直方图。将分析限制在这些水域/陆地过渡区,确保整个场景的分类高度准确。
3.5. 评估设计
一旦定义了操作参数(使用第3.3节中详细的光学PlanetScope校准方法,并确定了时间映射日期(见表2),就使用Bmax和Edge Otsu算法为七个事件生成了地表水掩模(见表3)。为了严格评估这些自适应阈值方法相对于需要长时间序列的传统技术的操作性能,使用了一种与初始光学校准概念上不同的比较验证方法——采用统一的SAR变化检测算法作为基准[16]。在整个研究区域进行的评估采用了10折分层交叉验证[73],以保持原始的水/非水比例并准确估计误差分布。基于这些划分,计算了关键的遥感指标(总体准确率、Kappa和F1分数)[73,74],同时还分析了精度(漏检误差)和召回率(漏报误差)的平衡[75]。最后,为了确定Bmax和Edge Otsu之间的性能差异是否是统计上的真实差异而非偶然,应用了McNemar检验[76]。通过在5%显著性水平下评估误差矩阵[77]中的差异,该检验确认了两种分类器之间的统计区别。
3.6. 洪水制图算法
遵循[58]中的方法论,图5展示了基于Sentinel-1 SAR时间动态的洪水制图工作流程。在时间t,选择性能更好的Bmax Otsu算法应用于VV极化图像,以生成二值的水/非水掩模。基于这个输入,使用以下决策树得出时间t的最终洪水地图:
图5. 基于Sentinel-1 SAR影像时间动态分析的洪水监测算法流程图:
- 如果一个像素在时间t被分类为非水,则自动归类为未淹没。
- 如果一个像素在时间t被分类为水,则与之前的掩模进行比较:
- 如果在之前的时间点它是非水,则被归类为淹没(新水域的出现)。
- 如果在之前的时间点它是水,则检查它在洪水地图中的历史记录:如果在之前的时间点它是淹没的,则在时间t仍然是淹没的(持续性洪水);否则,它被归类为未淹没(永久性或季节性水体)。
- 一旦所有像素都被分类,时间t的洪水地图就被整合并递归地作为处理时间的基线参考。
这一时间分析是针对七个事件独立执行的(2017年三个,2023年三个,2024年一个),具体时期见表2。为了初始化算法,需要一个“零洪水”基线地图。这是通过选择每年事件发生前后水位最低的日期来确定的:2017年为2016年10月30日,2023年为2022年7月25日,2024年为2023年8月25日。然而,考虑到Tumbes地区的水文复杂性和水稻、香蕉等作物的广泛存在,假设这些基线日期上完全没有淹没像素可能会导致误差,因为一些永久性水体可能对应于饱和的农业区域。为了减轻这种影响,使用官方土地使用层[63]明确地屏蔽了农业和水产养殖区。
3.7. 洪水阈值
空间程序是通过一阶经验建模来实现的,该方法在没有执行二维水动力路由的情况下,将每个SAR洪水范围与El Tigre站点记录的24小时内的最大流量配对。这种方法假设空间捕捉是最大暴露的累积情景。为了建立流量(Q)和淹没面积(A)之间的基本关系,评估了不同的回归模型(线性、对数和幂函数)。由于事件数量有限(覆盖了代表性的流量范围),评估采用了留一法交叉验证(LOOCV)。这种迭代技术对于小样本非常稳健,通过多次训练模型并用被排除的事件进行验证来减少过拟合的风险,并通过均方根误差(RMSE)量化误差。在使用LOOCV和RMSE进行比较统计分析后,选择了预测误差最低的回归模型来估计洪水面积。根据这个最优模型的功能关系,建立了一个系统的生成方案,用于750至1650立方米/秒的区间,分辨率为25立方米/秒,从而在实际操作中优化了预警系统。认识到向量格式的缩放存在固有的物理限制,缺乏明确考虑详细地形在流动传播中作用的水动力建模成分。为了减轻这种空间不确定性,该方法没有假设与物理现实无关的几何扩展。在第一个空间缩放阶段,选择了与模拟值最接近的历史SAR事件的向量文件作为拓扑锚点。对这个基础几何图形应用了形态学缩放因子——该几何图形已经包含了山谷条件的真实宏观地形特征。这种调整根据其质心重新调整了范围大小,以匹配选定的回归模型计算的插值表面,作为初始的空间代理。
为了克服这种严格几何缩放带来的失真,并为多边形提供严格的空间地形意义,引入了一个基于HAND(高度高于最近排水口)模型的细化阶段。为了提取每个观测SAR事件的代表性地形阈值,排除了淹没掩模内的绝对最大HAND值,因为这个统计量容易受到数字高程模型(DEM)中的高度异常和雷达斑点噪声的虚假正类的影响。相反,采用了每个多边形内HAND值的第95百分位数([值未提供】。这种统计方法作为一种稳健的空间滤波器,能够抑制异常值,定义了一个更加稳定和具有代表性的有效洪水高度([值未提供])。从方法论上讲,利用这些值构建了一条经验曲线,将观测到的流量与其相应的有效淹没高度相关联,从而得出了一个经验幂函数形式。该功能允许对每次模拟排放的最大地形阈值进行解析计算。使用这个控制值,对先前缩放的多边形进行了空间细化处理。通过分析HAND P95阈值,调整了合成洪泛区的边界,强制插值几何形状保持在HAND模型幂方程规定的相对高度范围内。这种严格的地形质量控制确保了水的扩散遵循地形起伏,防止了不典型的外推。最后,工作流程生成了一个混合空间数据库,该数据库近似地展示了洪水的渐进演变过程。需要明确的是,这些合成场景并不旨在取代二维水动力模型,而是构成了一个为早期预警系统优化的数据驱动的运行解决方案。这种方法假设了一种有意识的技术折中,该折中得到了研究的支持,这些研究验证了30米全球SRTM地形数据适用于运行SAR检测框架和HAND阈值推导[15,64,69]:它牺牲了通过微观地形对洪水路径的确定性表示,以换取较高的计算效率,为风险管理者提供了一个快速且经过地形验证的工具。
**4. 结果**
**4.1. 洪水事件选择**
基于历史数据系列,识别并描述了七个洪水事件,这些事件满足了水文代表性、同步强度以及与Sentinel-1卫星观测时间重合的严格标准。由此产生的数据集有效地捕捉了流域内的水资源压力范围。前三个事件记录了2017年海岸厄尔尼诺现象的完整演变过程,包括其起始、高峰和消退阶段(E1至E3)。随后,结果涵盖了2023年的复杂水文气候动态,这些动态由飓风Yaku的异常影响引发(E4),并立即因新的海岸厄尔尼诺现象的巩固而加剧(E5和E6)。时间序列以2024年2月全球厄尔尼诺现象成熟阶段的事件(E7)结束。对这些不同事件的描述为评估在不同气候条件下的检测阈值的运行稳定性提供了坚实的基础。所有选定事件的详细参数总结在表3中。
**4.2. 参数校准结果**
在Tumbes流域极端事件期间,持续存在的云层覆盖限制了可用光学数据,仅得到两个同时期的PlanetScope图像。因此,进行了一次性的初始校准,以确定所有后续SAR数据采集的稳健静态参数。图6说明了地面真实情况划分的过程:通过视觉解释真彩色合成图像(图6a),并结合NDWI(图6b)进行水体提取和NDVI(图6c)进行植被掩蔽,生成了高精度的洪水区域矢量化结果(图6d)。根据这些参考掩模,确定了最佳算法配置。Bmax Otsu算法在某个网格尺寸和双峰阈值下达到最佳效果,这反映了需要减少空间窗口以捕捉局部异质性并确保双峰直方图的清晰度。对于Edge Otsu算法,使用某个Canny阈值、150米的最小边缘长度和200米的缓冲宽度实现了最高精度,突显了过滤SAR斑点以分离明显陆地-水域转换的重要性。使用这些最终参数,为七个Sentinel-1事件自主计算了具体的后向散射阈值(表4)。
**4.3. 提出算法的比较评估结果**
针对SAR事件生成的地表水图(表3)与传统的变化检测基准[16]进行了对比评估。验证结果(表5)及其K-Fold分布(图7)表明,Bmax Otsu相比Edge Otsu具有轻微但持续的优越性。Bmax Otsu实现了更高的时空稳定性,总体准确率在95%到97%之间,同时Kappa值和F1分数也较为稳定。其平均精度-召回率为0.837,表明性能平衡,但略有误报倾向。相比之下,Edge Otsu的精度-召回率较低,反映出漏报错误较为普遍。尽管准确度提升不大,McNemar检验确认两种分类器之间的误差分布存在统计学上的显著差异,从而验证了Bmax Otsu作为更稳健的运行选择。
**4.4. 洪灾监测模型的时间动态结果**
时间分析涵盖了三个时期(2017年、2023年和2024年)的七个洪水事件,这些事件分别针对表2中详细列出的日期进行独立映射。总共使用动态Bmax Otsu算法生成了45幅地表水图。图9展示了2017年系列在下游洪泛区(Zone 1)的空间动态变化,各面板按影响程度排列。2017年3月11日,全球流域覆盖率达到6.10%的峰值,随后进入持续下降阶段(到5月22日降至2.56%)。
**4.5. 水文阈值建模与验证**
为了模拟流量(Q)与淹没面积(A)之间的功能关系,最初排除了最小规模的事件(流量为m3/s),因为该事件既没有引起河道溢出也没有检测到可识别的淹没区域(公顷)。因此,使用剩余的六个事件对三个经验回归模型进行了评估。拟合优度指标和预测误差总结在表8中。尽管幂模型在训练指标上表现略好(调整后的决定系数和RMSE),但通过留一法交叉验证(LOOCV)评估预测能力时显示出不同的行为:线性模型记录了最低的泛化误差(RMSE LOOCV =),显著优于幂模型(RMSE LOOCV =)。这表明,由于SAR事件的样本量有限,幂模型容易过拟合,而线性模型在空间和数学上对于预测未观测流量下的淹没区域更为稳健。因此,选择了线性模型,其控制方程如下所示。图13展示了三种评估模型与实证观测数据的对比拟合情况,详细说明了它们各自的95%置信区间和预测区间。图13. 水文影响模型的比较分析。各面板展示了(a)线性、(b)对数和(c)幂回归模型,这些模型将El Tigre站的峰值流量与总淹没面积相关联。每个模型都显示了基于六个SAR检测事件的95%置信区间(蓝色带)和95%预测区间(灰色带)。所选线性模型的一个基本特点是它与横轴的交点。从数学上讲,当流量达到[具体数值] m3/s时,该方程预测淹没面积为零,这代表了理论上的河道溢流阈值。然而,对于早期预警系统的实际操作而言,已经确定从[具体数值] m3/s的记录流量开始会有显著影响,因为这是第一个有SAR卫星证据支持的实证事件(淹没面积为151公顷)。采用这一验证过的阈值可以确保预警基于可核实的物理影响,而不仅仅是数学推断。为了保证与这种推断相关多边形的物理一致性,使用HAND模型计算了相对地形阈值。从历史淹没图中提取的95百分位数[具体数值],得出了流量与有效淹没高度[具体数值]之间的实证曲线。如图14所示,山谷中的水动力行为最佳地符合幂函数。在空间编辑过程中应用这一基于曲线的地形控制,确保了模拟出的洪泛区的增长严格遵循地形的起伏。根据这种方法,并在对基础几何形状应用HAND地形限制后,通过整合六个分析事件进行了线性插值。这一程序允许确定流量在750 m3/s到1650 m3/s范围内的淹没区域的空间范围,以及人口和农业受到的影响,插值间隔为25 m3/s。图15详细展示了洪泛区演变的图形结果,而影响量化则在表9中总结。表9. 模拟流量与HAND地形阈值[具体数值]之间的实证关系。该曲线代表了用于插值洪泛区空间细化的物理限制的高度限制。图15. 流量在750至1650 m3/s范围内的插值洪水情景的时空演变,以100 m3/s为间隔可视化。最终,为了外部验证和验证模型的操作适用性,对国家民防研究所(INDECI)[78]发布的官方损害报告与所提出算法得出的结果进行了比较分析,针对2024年2月21日的事件。表10详细列出了在各区域的观察差异和一致性。表10. 本研究与INDECI报告(2024年2月21日)[78]之间受影响人口和农业区域的比较。结果显示与实地记录高度一致。在Corrales或San Jacinto等地区,模型略微高估是预期之中的,并且与SAR检测的性质一致,因为SAR检测绘制了包括未在实地报告的临时积水在内的整个水域范围,从而为预防性风险管理提供了一个保守且非常有价值的情景。
5. 讨论
5.1. 洪水动态中全球与局部ENSO信号的解耦
我们的分析指出,Tumbes河的极端洪水事件不能仅通过ONI(Ni?o 3.4区域)[5,6]监测到的全球典型ENSO遥相关来解释。相反,全球与局部信号的解耦表明,最大流量主要由ICEN [7,8]捕捉到的Ni?o 1 + 2区域的突然局部变暖驱动。这种动态在历史水文气候格局中得到了明确体现(图3),它展示了峰值流量与局部沿海升温的精确同步,而仅依赖ONI往往会低估水文气候强迫[9,79]。在太平洋斜坡流域,深层大气对流对最大海表温度(SST)异常的接近度非常敏感。通过结合这两个指数,我们的框架成功区分了Central(Modoki)和Coastal(Eastern)El Ni?o事件的水文影响[12,80],确认了局部海洋热异常——如水文图中所证明的——是Puyango-Tumbes系统中极端径流产生的主要调节因素。
5.2. 参数校准
此外,对这些参数进行的敏感性分析揭示了算法性能对空间尺度的关键依赖性。在Bmax Otsu的情况下,瓦片分辨率起到了决定性作用:网格大小增加超过[某个数值]倾向于使景观中的辐射变异性和谐化,降低了算法在农田破碎区域分离清晰双峰直方图的能力。相反,对于Edge Otsu方法,观察到了灵敏度与特异性之间的直接权衡;减小最小边缘长度和Canny阈值显著增加了误报率。这种现象归因于SAR固有的斑点噪声(或密集植被纹理)与水体物理边界之间的混淆。因此,选定的值(分别为150米和[另一个数值])确认了过滤误报同时保持淹没区域几何完整性的操作平衡点。
5.3. 对所提出算法的比较评估讨论
尽管统计分析确认了算法之间存在显著差异,但检查它们的基本采样机制至关重要。Bmax Otsu通过宏观尺度的分割隔离了局部双峰分布,由于其参数的简洁性和高可转移性,因此具有明显的操作优势。相反,Edge Otsu将直方图生成限制在检测到的边缘周围的缓冲区内,对这一条带的几何形状非常敏感,并需要详尽的校准以防止欠采样或包含非水噪声。这些自动阈值算法与传统变化检测方法在视觉和定量上表现出中等的一致性,平均IoU低于50%,这突显了它们在辐射机制上的根本区别。变化检测表现出强烈的时间依赖性,捕获了相对于参考图像的瞬态土壤湿度异常,忽略了第1区中存在的广泛水产养殖池塘等永久性水体。相比之下,基于直方图的方法具有时间独立性,提取了绝对的开放水体,包括这些水产基础设施。必须强调的是,这种视觉差异和原始地图中的低IoU并没有在最终的水文建模中放大错误。任何最初的过高估计或检测偏差随后通过时间分析过程中应用特定的农业和水产掩模以及通过HAND模型执行的严格地形掩蔽来消除,后者过滤了辐射噪声并限制了最终多边形的物理一致性。从几何上看,Bmax Otsu与Edge Otsu相比识别的水域范围更大,这一点通过第1区增加了7%得到证实,主要是由于其捕捉上述水产池塘和介电梯度不明显的过渡区的敏感性。Edge Otsu往往过于保守,忽略了浅水或河岸植被。虽然阈值算法之间的整体性能差异很小,但Bmax Otsu有效地捕获了这些区域,最小化了遗漏错误,同时没有牺牲整体精度。这种操作韧性在小提琴图中得到了视觉上的巩固(图7)。Bmax Otsu分布的形态显示出明显的峰度,结果紧密聚集在中位数周围,显示出独立于特定场景特征的稳健性。相比之下,Edge Otsu显示出显著的垂直分散,表明随机脆弱性,以及精确度/召回率比超过2.5的不规则分布。这种方差验证了Edge Otsu在边缘缓冲区未能捕捉到完整双峰性时容易系统性欠分割。因此,Bmax Otsu并非表现出压倒性的优越性,而是以其最高效的指标和几何描绘与辐射灵敏度之间的最佳平衡而脱颖而出,证明了它是Tumbes河流域自动化多时相洪水监测的最优选择。
5.4. 直方图双峰性分析
方法之间的差异在 backscatter 直方图中显而易见,这些直方图揭示了每种算法对场景局部组成的敏感性。图16展示了2023年4月15日事件的比较。Bmax Otsu的总面积直方图显示了明显的分双峰性;然而,在分析第1区时,水和非水峰值之间的分离度最大(图16a)。这是因为分析集中在水域较多的区域,类平衡得到了优化,从而产生了更明显的分双峰性。相比之下,在第2区(图16b),由于陆地像素占主导地位,双峰性减弱了。图16. 使用Bmax Otsu和Edge Otsu对2023年4月15日事件的总面积与第1区和第2区进行比较的backscatter直方图。(a) 总面积Bmax与第1区的比较。(b) 总面积Bmax与第2区的比较。(c) 总面积Edge与第1区的比较。(d) 总面积Edge与第2区的比较。另一方面,Edge Otsu算法产生的直方图具有更对称的峰值,这是其采样仅限于边缘缓冲区的直接结果。虽然这种技术隔离了过渡区,但它倾向于生成的系统阈值低于Bmax Otsu。这种辐射位移是Edge Otsu中观察到的遗漏错误的主要原因:通过设置过低的阈值,算法排除了表面粗糙度较高的水像素。总之,直方图分布证实了Bmax Otsu的优越性;其基于仅选择具有明显双峰性的瓦片(“棋盘”瓦片)的方法确保了更保守和稳健的阈值,避免了Edge Otsu中噪声引入的偏差。
5.5. 合成与最佳算法的选择
尽管比较分析提供了关于不同SAR数据集上算法性能的差异化视角,但发现了一些支持空间观测的显著收敛模式。主要地,评估表明Bmax Otsu在阈值计算的稳定性和复杂场景中水域范围的空间一致性方面提供了更好的性能。尽管算法之间的整体准确性数值差异很小,但在误差分布和操作韧性方面验证了统计显著性。这一发现至关重要,因为它证实了Bmax Otsu具有更大的能力来捕捉过渡区,而不受斑点噪声或系统性欠分割的影响。基于所有进行的评估,结论是Bmax Otsu算法提供了最高效和最平衡的指标,最佳适应了研究区域的辐射特性。因此,该算法被选为所提出方法的核心阈值引擎,其最终准确性通过随后应用地形和土地利用掩模得到了完全保证,实现了自动化和可靠的洪水检测。
5.6. 动态阈值行为
图17展示了Bmax Otsu算法在三个Sentinel-1时间序列中确定的动态阈值的时间演变。观察到显著的时间变化,标准差[具体数值]从2017年的[具体数值] dB变化到2023年的[具体数值] dB。这种行为可归因于农业覆盖(水稻和香蕉)的物候动态;种植阶段的水层(<5厘米)的存在引起了镜面反射,减弱了backscatter强度。图17. 来自Sentinel-1图像的阈值时间序列。(a) 2017年事件。(b) 2023年事件。(c) 2024年事件。对序列的详细检查揭示了极端水文事件引发的临界辐射动态。例如,2023年的序列(图17b)表现出最高的波动性([具体数值] dB)和最高的平均阈值([具体数值] dB)。在洪水季节的高峰期(2023年3月至4月),阈值突然转向更高的值,达到了最大值[具体数值] dB。此行为表明,随着洪水范围的扩大,“水体”类别在统计上变得占主导地位,并且在辐射测量上更加明亮(由于风引起的表面粗糙度或沉积物负荷),迫使算法放宽阈值以捕捉整个水域。相反,在过渡期间观察到了阈值的显著下降。值得注意的是,在2024年的数据系列中(图17c),12月份的阈值降低到了最低水平。如果在这一时期应用一个固定的经验阈值(例如,标准的某个数值),将会出现严重的欠分割现象。因此,从绝对最大值(2023年的某个数值)到绝对最小值(2024年的某个数值)之间观察到的近某个数量的波动,明确证明了静态阈值的不足。Bmax Otsu算法的自适应特性对于补偿这些特定场景下的辐射变化至关重要,确保在低流量和极端洪水情况下都能进行一致的检测。
5.7. 洪水监测模型的时间动态讨论
利用Sentinel-1图像生成的地表水体地图在检测深水体方面表现出高效性,能够识别河流附近洪泛区的洪水以及水稻田中的积水。因此,在这些农业区域需要应用排除掩膜,以避免映射算法中出现误报,正如2017年3月11日的图9所示,其中在水流主通道远离的区域检测到了水体存在[63]。尽管如此,水稻田的某些部分仍然存在残余噪声,这可能是由于作物生长成熟阶段后向散射强度降低所致。
地表水体比例的时间分析揭示了Tumbes河流域水文制度的显著年际变化,验证了采用自适应初始化策略的必要性。如图10所示,从旱季到雨季的转变并不遵循严格的日历模式。例如,2017年事件系列的水文基线是在10月下旬确定的(图10a),而2023年系列的最佳初始化点则移至7月下旬(图10b)。这种时间上的异质性表明,使用固定的日历日期进行算法初始化会导致偏差,可能会将早期洪水信号误认为是背景噪声。
此外,检测到的水体范围的幅度突显了2023年水文时期的异常强度。虽然2017年的事件与沿海厄尔尼诺现象有关,记录的最大水体比例为6.09%,但2023年系列的峰值显著高于此,达到了8.58%,发生在3月10日。这一增长与yclone Yaku发生期间记录的极端降水异常一致。2024年系列(图10c)的峰值达到了6.48%,属于中等情况。所提出方法能够捕捉从最低基础值(<3%)到洪水高峰的各种幅度,证明了使用相对像素比例作为标准化指标来监测不同气候年份下的洪水演变是可靠的。
尽管时间分析有效捕捉了事件的发展过程,但空间划分的精确度依赖于土地覆盖特征。在最大洪水期间,由于深水特有的低后向散射强度导致镜面反射,地表水体在河床和水稻田中都能被有效划分。然而,在作物生长的活跃阶段,映射精度会下降。Sentinel-1 SAR传感器在播种和苗床期对土壤-水混合条件非常敏感,此时种植床的准备工作会产生不均匀的介电响应,从而妨碍自动化分割[58]。
5.8. 水文阈值建模
根据洪水地图,水文激活的起点为743.49立方米/秒,此时在主河道外检测到显著的水体异常。尽管线性模型预测的初始理论阈值为663.74立方米/秒,但实际采用了743.49立方米/秒作为早期预警系统(EWS)的基准,这一数值是基于SAR图像的物理证据而不是数学推导。为了防止偏差,排除了较小的事件(588.31立方米/秒),并将剩余六个事件的线性插值间隔定为25立方米/秒(表9)。
选择线性插值的原因在于其预测优势和对过拟合的抵抗力,这一点通过RMSE LOOCV指标得到了证明。为了补偿几何向量缩放的物理限制,引入了HAND模型作为地形锚点。使用HAND高度的百分之九十五分位数而不是绝对最大值作为关键的空间过滤器,以抑制DEM高度异常和斑点噪声误报,确保合成多边形严格遵循实际的山地地形。
这种连续且受地形约束的估计方法相对于传统的离散监测具有显著的操作优势。尽管流量-面积关系是一致的,但仍可以识别出明显的非线性跳跃,例如在1200至1250立方米/秒之间,受影响的人口从408突然增加到463人。识别这些拐点以及初始激活阈值对于Tumbes地区政府从被动监测过渡到主动警报至关重要。能够预测1650立方米/秒的流量恰好对应1234.78公顷,为决策者提供了精确、可量化的风险融资和紧急资源分配方案。
与2024年2月21日INDECI报告的对比分析(表10)揭示了SAR算法的可靠性和局限性。空间差异并非源于单一错误来源;相反,它们的起源严格受土地覆盖动态和现场物流的制约,可以归结为三个关键因素:
- 空间一致性与概念分歧:在Corrales地区,算法的估计与INDECI的243.68公顷相符,相差+21%,这反映了预期的概念分歧:SAR算法客观地检测到了水面,而现场评估报告的是农业经济损失,排除了未导致作物完全损失的积水区域。
- 未报告区域的检测(INDECI物流限制):在San Jacinto和San Juan de la Virgen地区观察到了关键差异,算法检测到的影响面积(分别为52.88公顷和42.75公顷)未被官方报告。这种行政上的遗漏完全归因于紧急高峰期间偏远地区的不可到达性[78]。在这里,SAR传感器没有产生误报,但克服了人类物流障碍,提供了更全面的映射。
- 密集植被下的低估(物理传感器限制):相反,在Tumbes地区,算法低估了影响面积(254.57公顷),而INDECI报告为405公顷。这种差异归因于Sentinel-1 C波段的物理波长限制。在成熟作物中,植被产生体积散射,掩盖了下方的水体。此外,INDECI还考虑了因降雨导致土壤饱和但没有深水体的区域,这些区域超出了Bmax Otsu算法的阈值敏感性。
总之,虽然行政记录为经济评估提供了真实依据,但所提出的SAR算法提供了更高的空间客观性和时间分辨率,对于纠正基于现场的损害评估中的潜在物流偏差至关重要。
5.9. 方法论局限性与操作可靠性
必须承认本研究的一个基本局限性是缺乏在流量-面积(Q-A)关系中纳入滞后效应的经验数据。在Tumbes河流域的洪泛区,即使在大流量减少之后,洼地存储和缓慢的农业排水也会维持广泛的积水区域。由于Sentinel-1的离散时间分辨率(6至12天), capturing这一现象是不可行的。这种相同的采集频率对于每小时发生的快速洪水动态构成了挑战,增加了因未能实时捕捉到事件峰值而低估阈值的风险。
然而,该卫星传感器适用于早期预警系统(EWS)并不是因为它可以直接进行每小时监测,而是因为它能够回顾性地校准经验影响曲线。在操作阶段,通过将系统与新的SAR数据解耦来减轻卫星的时间延迟。警报将根据El Tigre站的连续水文读数触发,这些读数直接输入到预先建立的Q-A曲线中。在这种背景下,忽略滞后效应可能会在仅依据河流退水情况假设事件结束时产生误报。因此,所提出的方法主要作为一种工具,在预防和初级响应阶段预测最大影响范围,而不是用来模拟干燥过程或确定警报的安全解除。
然而,这种对单一测量站(El Tigre)的操作依赖性在极端故障情况下存在潜在的脆弱性。不过,流域更广泛的监测网络本身提供了冗余保障。上游(Cabo Inga)和下游(Puente Tumbes)站的设置允许通过已建立的流量路径和旅行时间关系可靠地估计El Tigre的流量。
此外,基于SAR的框架虽然绕过了复杂的2D水动力学路径以优化计算效率,但它与正在进行的机构工作高度兼容。例如,国家水资源局(ANA)系统性地识别关键洪水点,并通过水资源观测站集中水文数据。同时,SENAMHI正在推进分布式水文-水力建模,如RRI模型,该模型结合降水输入和人工智能预测来处理关键支流。多站点观测路径的整合以及这些互补技术确保了峰值流量的连续估计。目前的方法在技术上做出了有意识的妥协,牺牲了微观地形的确定性表示,以便使用地形验证过的、计算效率高的工具来保障EWS的操作连续性。
6. 结论
本研究成功地利用Google Earth Engine和Sentinel-1 SAR图像开发了一种用于Tumbes河流域下游洪水检测的操作方法论框架。通过验证自动双峰阈值算法,该研究克服了在持续云层覆盖下的光学传感器限制。SAR数据、无监督分类和地形建模的混合集成提供了一个稳健的解决方案,用于估计关键的早期预警系统(EWS)阈值。根据研究目标和分析结果,得出以下结论:
- 校准和算法弹性:使用高分辨率PlanetScope图像的参数校准证实,Bmax Otsu算法在0.01网格大小和0.65双峰阈值下,能够最佳地捕捉农业区域的异质性。统计K折评估显示其在总体准确性(95.8%)和Kappa系数(66.1%)方面优于Edge Otsu算法,并且对斑点噪声具有较高的抗性,减少了在辐射测量复杂区域的遗漏错误。
- 时空动态重建:序列监测算法重建了2017年至2024年间的七次水文事件,有效区分了洪水异常和永久性水体以及灌溉作物。系统通过准确映射零影响低流量事件且不产生误报,在所有洪水阶段都表现出高度可靠性。
- 受地形约束的流量-影响建模:使用线性插值建立了一个经验预测函数,其通用能力得到了LOOCV RMSE指标的验证。为确保物理一致性,应用了HAND模型并使用第九十五百分位数来过滤DEM异常。在操作上,确定了743.49立方米/秒的验证基线激活阈值,在极端流量情景下,这一阈值分别对应1234.78公顷和749名受影响居民。
- 操作验证和内在局限性:与INDECI官方记录的对比突显了系统的双重能力。虽然SAR传感器通过检测未报告偏远地区的洪水克服了现场物流障碍,但由于C波段的体积散射限制,它低估了密集成熟植被下的影响。此外,尽管当前方法能够准确估计最大影响范围,但未来需要与2D水动力学模型结合,以捕捉洪泛区干燥过程中的滞后效应。
总之,所开发的方法在技术上做出了有意识的妥协,牺牲了微观地形的确定性表示,以换取高计算效率和卫星数据的客观性。它为灾害风险管理者提供了定量、地形验证且成本效益高的工具,帮助他们从被动观察过渡到主动预测洪水灾害。