将基于SWOT和Landsat遥感数据得到的径流信息整合到全球水文模型中的对比研究

《Water Resources Research》：Comparing Assimilation of Remotely Sensed Discharge Derived From SWOT and Landsat Into a Global Hydrological Model

【字体：大中小】 时间：2026年05月04日 来源：Water Resources Research 5

编辑推荐：

　　**摘要** “地表水和海洋地形”（SWOT）卫星使得包括未设测量站的地区在内的全球河流流量估算成为可能。这种基于遥感的流量估算（SwRSQ）是通过SWOT对河流宽度、水面高度和坡度的穿透云层测量得出的，预计其准确性和时空覆盖范围将优于使用Landsat数据得出的河流宽度估算方

　　**摘要**

“地表水和海洋地形”（SWOT）卫星使得包括未设测量站的地区在内的全球河流流量估算成为可能。这种基于遥感的流量估算（SwRSQ）是通过SWOT对河流宽度、水面高度和坡度的穿透云层测量得出的，预计其准确性和时空覆盖范围将优于使用Landsat数据得出的河流宽度估算方法（LsRSQ）。先前的研究表明，将LsRSQ数据整合到全球水文模型中可以提高河流流量的估算精度，但迄今为止尚未探索SwRSQ的整合应用。因此，本研究将SwRSQ数据整合到全球水文模型中，并以密苏里河流域作为水文条件复杂的测试案例，评估了其整合效果与LsRSQ的对比情况。结果显示，与仅使用模型数据或仅使用SwRSQ数据相比，SwRSQ整合后的模型性能有所提升。具体而言，PBIAS（平均绝对偏差）降低了34.1%，NRMSE（均方根误差）降低了0.435%。此外，在74%的测量站中，SwRSQ在NSE（净统计误差）和KGE（Kling-Gupta效率）方面优于LsRSQ。在基线模拟效果较差的区域，SWOT的更高观测频率显著提升了估算精度。相比之下，在基线模型能够较好反映河流特征的区域内，LsRSQ有时表现更优。同时整合SwRSQ和LsRSQ的数据在基线模型效果较差的河流上进一步提高了估算精度。这些发现突显了SWOT衍生流量估算数据的价值，以及它与其他卫星产品结合在推进全球尺度水文建模和监测方面的协同潜力。

**通俗语言总结**

河流对生态系统和社会至关重要，但测量其流量——尤其是在未设测量站的地区——长期以来一直是一个挑战。2022年底发射的“地表水和海洋地形”（SWOT）卫星利用先进的雷达技术，能够穿透云层观测全球河流，并比现有的光学卫星（如Landsat）更频繁、更准确地从太空中估算河流流量。本研究通过将SWOT衍生的流量估算数据整合到全球水文模型中，利用真实世界数据定期修正模型，从而提高了河流流量估算的准确性。与基于Landsat的数据相比，SWOT方法在改善估算效果方面表现更佳，尤其是在模型本身性能不佳的区域。这主要归功于SWOT更高的观测频率，使得模型更新更加及时和准确。当结合两种卫星的数据时，模型在表现较差的区域精度进一步提高。这些发现表明，SWOT衍生流量估算数据在推动全球尺度水文建模和监测方面具有巨大潜力。

**1 引言**

“地表水和海洋地形”（SWOT）卫星于2022年12月发射，这是一颗革命性的卫星，它首次提供了全球范围内的二维河流水面高度测量数据，能够同时提取被淹没区域和水面坡度信息，适用于宽度超过100米的全球河流（Biancamaria等人，2016年）。尽管由于站点密度有限和运行限制，许多地区的现场流量监测仍然不足（Gleason & Hamdan，2015年；Riggs等人，2023年），但通过SWOT卫星同时绘制河流水力变量图谱，我们可以独立于现场观测数据估算遥感流量（RSQ）（Durand等人，2016年、2023年；Frasson等人，2021年），从而推进了对包括数据稀缺的未设测量站流域在内的全球水流条件的监测。SWOT任务采用了六种河流流量估算算法来生成RSQ产品（以下简称SwRSQ），这些算法基于质量守恒流量反演（McFLI，Gleason等人，2017年）或数据同化技术（Andreadis等人，2020年；Brinkerhoff等人，2020a、2020b；Durand等人，2014年、2023年；Larnier等人，2020年；Oubanas等人，2018年）。其中，geoBAM算法（Brinkerhoff等人，2020a、2020b）仅需要河流宽度作为卫星观测输入即可生成RSQ。即使在SWOT卫星发射之前，geoBAM算法就已经被用于利用Landsat和Sentinel-2等光学卫星的河流宽度数据测试RSQ的准确性和不确定性。例如，Lin等人（2023年）使用geoBAM算法根据Landsat提取的河流宽度数据计算了大约3000个全球河流测量站的RSQ，结果显示39%的测量站具有较高的Kling-Gupta效率（Gupta等人，2009年），并且通过数据过滤后效率进一步提高。然而，由于卫星重访时间有限，LsRSQ无法完全监测河流的动态变化（Biancamaria等人，2016年）。为了弥补这一局限性，LsRSQ也被整合到水文模型中，通过数据同化实现大陆和全球尺度的日流量估算（Feng等人，2021年；Feng & Gleason，2024年；Ishitsuka等人，2021年）。在密苏里河流域和北极河流的案例中，LsRSQ的整合显著提高了流量估算精度（Ishitsuka等人，2021年；Feng等人，2021年），并增强了我们对不同规模河流长期流量变化的理解（Feng & Gleason，2024年）。虽然LsRSQ在提高全球水文理解方面取得了进展，但其空间和时间分辨率以及光学数据的局限性仍然存在。另一方面，SWOT卫星上的Ka波段雷达干涉仪（KaRIn）能够穿透云层观测河流，捕捉到传统光学卫星常遗漏的水动力变化（Allen等人，2018年）。SWOT的轨道周期最长为21天，根据纬度不同，最多可进行7次观测（Altenau等人，2021a、2021b）。此外，与仅依赖河流宽度观测的LsRSQ相比，SwRSQ还利用了水面高度和坡度观测数据，因此预计具有更高的精度。SWOT的第一个公开版本的河流流量产品于2024年5月30日发布（SWOT流量算法工作组，2024年），其准确性和不确定性仍在研究中。Andreadis等人（2025年）在2023年4月对德国和美国的四个河流段进行了SwRSQ的初步验证，结果显示标准化均方根误差在0.046至0.675之间，相关系数在0.42至0.89之间。尽管观测时间和验证地点有限，但这些结果与Durand等人（2023年）提出的不确定性水平大体一致。在SWOT卫星发射之前，已有研究尝试将模拟的SWOT水面高度数据整合到大规模河流或水动力模型中，以改进流量估算和相关参数（Emery等人，2020年；Li等人，2020年；Revel等人，2021年）。Wongchuig-Correa等人（2020年）将模拟的SwRSQ数据整合到亚马逊河主要支流Purus流域的水动力模型中，成功将模型流量误差降低了约40%。这些研究表明，SWOT数据同化在提升河流流量模拟方面具有巨大潜力。因此，与LsRSQ相比，SwRSQ在精度、不确定性和时空覆盖范围上具有不同优势，预计其在整合到水文模型后也能产生更准确的流量估算结果。鉴于基于实际观测数据的LsRSQ整合已经证明有效（Feng & Gleason，2024年；Feng等人，2021年；Ishitsuka等人，2021年），评估现有SwRSQ数据如何提升模型性能是一个及时且重要的研究课题。因此，本研究将SwRSQ数据整合到全球水文模型中，并评估了其与LsRSQ整合的效果。

**2 方法**

**2.1 研究区域**

我们选择了水文条件复杂的密苏里河流域作为研究区域（图1a）。密苏里河全长约3767公里，流域面积约为137万平方公里。其水文特征受多种气候条件影响，从西部的半干旱到东部的湿润大陆性气候不等，导致流域内的流量模式多样。人类活动（如Fort Peck和Oahe大坝）对河流流量进行调节，用于水力发电、防洪和灌溉，从而改变了自然流量模式（Erickson等人，2008年）。尽管由于站点密度和运行限制，许多地区的现场流量监测仍然不足（Gleason & Hamdan，2015年；Riggs等人，2023年），但通过SWOT卫星同时绘制河流水力变量图谱，我们可以独立于现场观测数据估算遥感流量（RSQ）（Durand等人，2016年、2023年；Frasson等人，2021年），从而推进了对包括数据稀缺的未设测量站流域在内的全球水流条件的监测。SWOT任务使用了六种河流流量估算算法来生成RSQ产品（以下简称SwRSQ），这些算法基于质量守恒流量反演（McFLI，Gleason等人，2017年）或数据同化技术（Andreadis等人，2020年；Brinkerhoff等人，2020a、2020b；Durand等人，2014年、2023年；Larnier等人，2020年；Oubanas等人，2018年）。其中，geoBAM算法（Brinkerhoff等人，2020a、2020b）仅需河流宽度作为卫星观测输入即可生成RSQ。因此，在SWOT卫星发射之前，geoBAM算法就已经被用于利用Landsat和Sentinel-2等光学卫星的河流宽度数据测试RSQ的准确性和不确定性。例如，Lin等人（2023年）使用geoBAM算法根据Landsat提取的河流宽度数据计算了大约3000个全球河流测量站的RSQ，结果显示39%的测量站具有较高的Kling-Gupta效率（Gupta等人，2009年），并且通过数据过滤后效率进一步提高。然而，由于卫星重访时间有限，LsRSQ无法完全监测河流的动态变化（Biancamaria等人，2016年）。为了弥补这一局限，LsRSQ也被整合到水文模型中，通过数据同化实现大陆和全球尺度的日流量估算（Feng等人，2021年；Feng & Gleason，2024年；Ishitsuka等人，2021年）。LsRSQ的整合在密苏里河流域（Ishitsuka等人，2021年）和北极河流（Feng等人，2021年）成功提高了流量估算精度，并增强了我们对不同规模河流长期流量变化的理解（Feng & Gleason，2024年）。尽管LsRSQ在提高全球水文理解方面取得了进展，但其空间和时间分辨率以及光学数据的局限性仍然存在。另一方面，SWOT卫星上的Ka波段雷达干涉仪（KaRIn）能够穿透云层观测河流，捕捉到传统光学卫星常遗漏的水动力变化（Allen等人，2018年）。SWOT的轨道周期最长为21天内的7次观测（Altenau等人，2021a、2021b）。此外，与仅依赖河流宽度观测的LsRSQ相比，SwRSQ还利用了水面高度和坡度观测数据，因此预计具有更高的精度。SWOT的第一个公开版本的河流流量产品于2024年5月30日发布（SWOT流量算法工作组，2024年），其准确性和不确定性仍在研究中。Andreadis等人（2025年）最近在2023年4月对德国和美国的四个河流段进行了SwRSQ的初步验证，结果显示标准化均方根误差在0.046至0.675之间，相关系数在0.42至0.89之间。尽管观测时间和验证地点有限，但这些结果与Durand等人（2023年）提出的不确定性水平基本一致。在SWOT卫星发射之前，已有研究尝试将模拟的SWOT水面高度数据整合到大规模河流或水动力模型中，以改进流量估算和相关参数（Emery等人，2020年；Li等人，2020年；Revel等人，2021年）。Wongchuig-Correa等人（2020年）将模拟的SwRSQ数据整合到亚马逊河主要支流Purus流域的水动力模型中，成功将模型流量误差降低了约40%。这些研究表明，SWOT数据同化在提升河流流量模拟方面具有巨大潜力。因此，与LsRSQ相比，SwRSQ在精度、不确定性和时空覆盖范围上具有不同优势，预计其在整合到水文模型后也能产生更准确的流量估算结果。鉴于基于实际观测数据的LsRSQ整合已经证明有效（Feng & Gleason，2024年；Feng等人，2021年；Ishitsuka等人，2021年），评估现有SwRSQ数据如何提升模型性能是一个及时且重要的研究课题。因此，本研究将SwRSQ数据整合到全球水文模型中，并评估了其与LsRSQ整合的效果。具体而言，本研究旨在回答以下三个研究问题：

- 哪种RSQ整合方法更好：SWOT还是Landsat？
- 哪些因素影响RSQ整合效果？
- 同时整合SwRSQ和LsRSQ是否比单独整合更有效？如果某个河段的测量结果不符合这一标准，Confluence系统将使用SWORD中的先前坡度数据进行替代。此外，位于最低点附近以及外部区域边缘的SWOT数据通常质量较低，会被舍弃；同时，由于雷达回波信号较弱，超过40%的暗水区域也无法被检测到。其他河段和节点的质量参数被编码为位标志，进一步通过过滤来确保校准结果的准确性，要求没有冰层覆盖、每个节点有超过10个像素的数据，并且总体上会移除所有“不良”测量结果，还会使用额外的节点过滤器来处理数据量不足的情况。最后，使用Tukey方法（Tukey, 1949）去除剩余的异常值。本文中描述的所有过滤器都在产品说明文档（JPL内部文档，2024年）中有详细说明。第二阶段称为“算法特定过滤”，用于剔除对每个算法稳定运行不必要的输入数据。这种过滤的标准因所使用的算法而异。虽然第二阶段过滤器的完整描述超出了本文的范围（详见Durand等人，2023年的研究），但值得注意的算法特定行为包括MOMMA算法（Bjerklie等人，2018年），该算法要求河段宽度与坡度之间存在正相关关系才能生成流量估计值；以及geoBAM算法（Brinkerhoff等人，2020a, 2020b），如果SWOT数据无法成功反演，则该算法会默认使用先前的流量估计值。由于采用了这种双层过滤过程，并非每天SWOT观测到水面数据时都会生成SwRSQ。此外，SWOT卫星在2023年12月和2024年2月因数据下行链路服务器的运行问题而丢失了数据。因此，从2024年1月到3月，观测到的河宽和水面坡度的质量有所下降。结果，通过这些质量过滤的输入数据数量显著减少，导致生成的SwRSQ数量大幅减少（见图2）。总体而言，SwRSQ是基于六个算法估计值，并利用时空详细的SWOT数据得出的共识流量，但经过了严格的质量过滤，并且偶尔存在观测间隙。需要注意的是，自2023年12月底以来，Landsat数据服务器也暂停了Landsat场景的处理，导致2024年1月的可用观测数据减少（见图2）。

图2显示了密苏里河流域每月SWOT和Landsat的RSQ数据数量。对于LsRSQ，使用geoBAM（Brinkerhoff等人，2020a, 2020b）算法根据从Landsat提取的河宽时间序列来计算河流流量。geoBAM是一种质量守恒的流量反演算法，它利用AMHG方程（Gleason & Smith, 2014）作为内部流量定律来概率估计河流流量。

公式如下：
$$
\begin{array}{c}
\log \,{w}_{x}={b}_{x}\left(\log \,Q-\log \,{Q}_{c}\right)+\log \,{w}_{c}+{\epsilon}
\end{array}
$$
其中
$w_x$ 和 $b_x$ 分别表示遥感得到的河宽和横截面的水力几何宽度-流量指数；
$Q$ 表示给定河段的河流流量；
$Q_c$ 是AMHG算法的全球参数；
$\epsilon$ 是误差项。geoBAM通过贝叶斯推断，基于观测到的宽度及流量先验来估计AMHG参数和目标河流流量，从而得到流量估计值及其不确定性。有关geoBAM的详细信息，请参考Hagemann等人（2017年）和Brinkerhoff等人（2020a, 2020b）的研究；关于在不同应用场景下的性能示例，可参考Lin等人（2023年）和Feng等人（2019年）的研究。Landsat的河宽数据由RivWidthCloud（Yang等人，2020a, 2020b）根据2023年7月至2024年10月间获取的Landsat 8和9 Collection 2 Tier 1图像计算得出。RivWidthCloud是一种基于Google Earth Engine的算法，可以自动从Landsat表面反射率图像中提取河流中心线和宽度点。在使用RivWidthCloud提取河宽时，仅使用了云覆盖率低于25%的Landsat图像。RivWidthCloud通过评估山影、雪冰、云层和云影对宽度准确性的潜在影响来判断提取宽度的置信度，并移除了被错误判断的宽度数据。在每个MERIT-Basins Hydrography河段中，河宽数据是根据GLOW数据集（Feng等人，2022年）定义的200米间隔横截面提取的。geoBAM还需要先前的流量估计值来进行贝叶斯更新。我们使用GRADES-hydroDL（Yang等人，2023a, 2023b）作为流量先验，该数据库包含了1980年1月至2023年9月期间大约294万个河段的日流量数据（Lin等人，2019a, 2019b）。由于该数据集不提供2023年10月之后的流量数据，因此使用数据集覆盖期间的平均月流量作为之后相应月份的先验值。总之，SwRSQ和LsRSQ在数据来源和处理方法上有显著差异：SwRSQ基于SWOT对水面高度、坡度和宽度的穿透观测，并经过两阶段过滤后，由六个流量算法的共识得出；而LsRSQ则是利用Landsat获取的河宽时间序列通过geoBAM算法计算得出，但受到云层覆盖的限制，仅基于宽度进行估计。这些观测和方法上的差异导致了两种RSQ在准确性、不确定性和时空覆盖范围上的区别（见图2）。

2.3 水文模型
我们使用了全球水资源模型H08（Hanasaki等人，2008a, 2008b, 2018）来模拟密苏里河流域的日流量。H08模型旨在描述陆地水循环，包括自然水文过程（如地表和河流流动）与人类用水（如水库运行和灌溉、工业及家庭用水）之间的相互作用。由于模型中包含了水库运行和灌溉方案，因此适用于模拟像密苏里河流域这样水文复杂的区域。地表过程采用简单的单层土壤渗漏桶模型，河流流动过程基于总径流积分路径模型（Oki & Sud，1998）。水库运行和取水方案分别遵循Hanasaki等人（2006, 2018）的规定。我们采用了Hanasaki等人（2018）描述的默认全局统一参数，无需针对特定地点进行校准。H08是一个基于网格的分布式模型，分辨率为5弧分，其基础水文图基于MERIT Hydro（Yamazaki等人，2019）。因此，需要将河段级别的RSQ分配到相应的网格上，以便进行模型流量与观测流量的比较和同化。我们使用了最近开发的点-网格分配方案（Zhou等人，2025）来确定每个河段的对应网格。图1b展示了密苏里河河口处河段-网格分配的示例：首先提取目标河段最下游点的地理坐标，并将该点分配到1弧分的MERIT-Hydro地图上；然后选择与目标河段上游面积误差最小且与原始地理坐标点偏差最小的网格位置；接着将1弧分网格位置进一步分配到粗略的5弧分河流网格上。根据细网格和粗网格之间的对应关系，1弧分网格可能被分配到附近的（例如绿色河段）或上游的（例如红色、蓝色和黄色河段）5弧分网格（详见Zhou等人，2025）。当两个或多个河段被分配到同一网格时（例如黄色和绿色河段），这些河段的RSQ平均值被视为该网格上卫星观测到的流量。驱动H08模型需要八个气象强迫变量：地表空气温度、地表压力、风速、比湿、向下短波辐射、向下长波辐射、降雨率和降雪率。这些气候数据来自ERA5陆地再分析数据集（Mu?oz Sabater，2019），其空间分辨率为6弧分，这些数据被线性插值到5弧分分辨率。关于H08的详细分析，可参考Hanasaki等人（2018, 2022）的研究。

2.4 同化策略
我们使用了Local Ensemble Transformed Kalman Filter（LETKF）（Hunt等人，2007）将SwRSQ和LsRSQ数据同化到H08模型中。LETKF是一种数据同化技术，能够处理非线性水文过程，并通过局部化利用有限的集合数据高效更新模型状态。这种局部化通过减少基于虚假集合的相关性来避免错误更新，同时通过并行化提高计算效率。在本研究中，我们使用了一个包含八个相邻网格的固定局部区域作为局部化范围，以避免远距离观测带来的错误更新。LETKF通过考虑模型和观测误差的协方差来产生分析集合。为了保持集合的多样性，我们对气候强迫数据施加了高斯分布的随机扰动，并考虑了强迫数据之间的相关性（详见支持信息S1中的表S1），并使用了30个集合模型预测结果。在没有数据同化的情况下，这30个集合输出被视为“基线”。SwRSQ和LsRSQ的观测不确定性分别在第2.2节和第2.3节中有描述。本研究的数据同化过程包括两个步骤：(a) 通过H08模型进行时间积分预测集合模型状态；(b) 当SwRSQ和/或LsRSQ可用时，通过LETKF更新模型状态。通过同化得到的模型状态称为“SwRSQ-DA”和“LsRSQ-DA”。除了“基线”模拟外，我们还进行了双重RSQ数据同化模拟，即“DuRSQ-DA”，它同时将SwRSQ和LsRSQ同化到H08模型中。这项模拟旨在探讨结合使用两种具有不同时空覆盖范围和准确性的RSQ是否比使用单一卫星数据更有效。当SWOT和Landsat在同一日期在同一网格上有RSQ数据时，使用这两种RSQ的平均值来更新模型状态。重要的是，我们的数据同化工作与之前的LsRSQ研究不同：Ishitsuka等人（2021）提出了用于LsRSQ同化的LETKF方法，Feng等人（2021）和Feng与Gleason（2024）曾成功利用该方法进行全球日流量估计。然而，在这些方法中，LsRSQ是在模型的流动路径步骤中进行同化的，基本上形成了水文模型与RSQ之间的“离线”耦合。在这里，我们使用了不同的水文模型（H08），并且以不同的方式使用LETKF（基于网格而非网络，如Ishitsuka等人（2021）的方法），因此我们可以将我们的结果与之前的研究进行比较，但由于结构上的差异，这种比较的严格性较低。

2.5 评估
我们通过与美国地质调查局（USGS）的水文站数据进行对比，评估了RSQ数据同化的有效性。我们选择了上游集水面积大于10,000平方公里的50个USGS水文站，这些水文站符合我们定义RSQ提取/计算目标河段的阈值（见第2.1节）。我们使用了两类技能指标来评估四种不同河流流量模拟的性能：“绝对技能指标”和“比较技能指标”。
绝对技能指标用于评估模拟流量与实际观测流量的“绝对”差异。在这里，我们使用了五个技能指标来诊断流量模拟的各个方面（详见支持信息S1中的表S2）。百分比偏差（PBIAS）用于衡量模拟流量相对于观测流量的平均偏差趋势。标准化均方根误差（NRMSE）通过观测平均值进行归一化，评估模拟值与观测值之间的平均偏差。Spearman等级相关系数（Spearman's r）量化了模拟模式与观测模式之间的单调关系，对异常值的敏感性较低。Nash-Sutcliffe效率（NSE）（Nash & Sutcliffe，1970）衡量模拟值相对于观测平均值的准确性。Kling-Gupta效率（KGE）（Gupta等人，2009）通过结合相关性、偏差和变异性来评估模拟的整体性能。这些指标是根据30个集合模拟的日流量平均值计算得出的。除了绝对评估之外，我们还使用了Zhou等人（2025年）提出的“比较”技能指标来比较一个模拟与其它模拟的改进或恶化情况。比较两个模拟的直接方法是计算这两个模拟的绝对技能指标之间的差距。我们将这个差距称为“delta指数”，在特定验证指标下，模拟a与模拟b的delta指数表示为：

Δmi = mi^a - mi^b

其中mi是一个绝对技能指标。对于Spearman's r、NSE和KGE来说，它们的最优值是1，正的Δmi表示模拟a的表现优于模拟b。对于PBIAS和NRMSE来说，它们的最优值是0，delta指数是通过绝对技能指标的模计算得出的，负的Δmi表示模拟a相对于模拟b的改进。

然而，在NSE和KGE的情况下，delta指数在公平衡量模拟a相对于参考模拟b的相对改进方面存在局限性。例如，将NSE从-0.1提高到0比从0.7提高到0.8要容易得多。因此，我们还使用了以下改进指数，该指数参考了最优值：

IMIi = (mi^a - mi^b) / (mopt - mi^b)

其中mopt是目标绝对技能指标的最优值，在NSE和KGE的情况下为1。正的IMIi表示模拟a相对于模拟b有所改进。尽管同化与验证期是从2023年7月到2024年10月，如2.2节所述，但SWOT卫星在2024年1月至3月期间无法获得足够质量的水面信息（见图2）。由于这一时期并未完全反映SWOT的原始观测能力，因此2024年1月至3月的同化结果被排除在技能指标的计算之外。

3 结果

3.1 绝对评估

首先，我们比较了有卫星观测数据的日期上的流量估计值，重点关注同化方案相对于基线模拟和卫星衍生RSQ本身的表现（见图3）。由于RSQ数据仅在卫星测量河流表面的日期才有，因此比较仅限于这些日期，并且模型模拟的技能指标也在相同日期计算，以确保一致性。为了避免样本量过小，我们进一步将分析限制在至少在验证期间有5天LsRSQ和SwRSQ数据的15个测量点。鉴于每个站点观测天数有限，我们使用PBIAS和NRMSE作为主要性能指标，因为它们直接量化了系统偏差和误差幅度，并且在小样本设置中更为稳健。我们还检查了Spearman's r、NSE和KGE作为补充指标，以评估流量动态和整体性能。

3.2 比较评估

到目前为止，我们使用绝对评估指标比较了RSQ-DA模拟与基线模拟的表现。这些分析表明，总体而言，SwRSQ-DA模拟相比LsRSQ-DA模拟取得了更大的改进。为了进一步研究SwRSQ-DA在目标流域内哪些地方的表现优于LsRSQ-DA，我们分析了比较评估指标的空间分布，如图5所示。由于本节的主要目的是比较SwRSQ-DA与LsRSQ-DA，除非另有说明，所有比较评估指标都表示SwRSQ-DA相对于LsRSQ-DA所取得的改进程度。在图5中，蓝色（红色）表示SwRSQ-DA（LsRSQ-DA）模拟的技能指标更优，颜色越深表示改进越大。虽然仅从50个测量点的数据中很难概括空间模式，但有足够的证据值得讨论。请注意，我们应用了Wilcoxon符号秩检验来统计评估SwRSQ-DA和LsRSQ-DA在所有比较指标上的差异。这些检验确认了PBIAS、NRMSE、NSE和KGE的差异在统计上是显著的（p < 0.05），而Spearman's r的差异则不显著。

3.3 综合评估

综上所述，所有同化模拟都明显优于基线模型和仅使用卫星数据的RSQs。同化使得PBIAS和NRMSE的均值更接近零，并且也改善了NSE和KGE，而Spearman's r的差异相对较小。总体而言，图3表明即使在有限的评估中，RSQ同化也增加了明显的价值。图4展示了三种DA模拟的绝对技能指标的累积密度函数（CDF），这些指标是根据50个USGS测量点的实地流量观测数据每日评估的。总体而言，三种同化方法都在减少偏差方面显著改进了基线模型，尤其是在NSE和NRSME方面。所有方案的同化模型之间的相关性相同，这导致KGE的改进不如NSE显著，因为KGE的相关系数是其计算项之一。考虑到PBIAS是驱动所有其他指标的“原始”项，我们首先讨论它。最佳结果的特点是CDF在零附近的增加幅度更大，而较大的正负值分别表示高估和低估的趋势。绝对PBIAS的CDF也显示了接近零时的改进。基线模拟表现出相对于实地观测的流量高估倾向。相比之下，SwRSQ-DA和LsRSQ-DA在CDF接近零时的增加更为明显，PBIAS的平均减少幅度分别为-34.1%和-14.3%。SwRSQ-DA在减少严重高估的地点数量方面特别有效。另一方面，如图4b所示，LsRSQ-DA增加了PBIAS接近零的地点数量。DuRSQ-DA相对于基线的平均减少幅度接近SwRSQ-DA（-32.9%），但有更多的测量点可能低估了流量。Spearman's r衡量了模拟流量变化与观测流量变化的一致性，CDF向右偏斜表示与观测流量模式的相关性更强。同样，LsRSQ-DA在NSE（0.384对比-0.142）和KGE（0.430对比0.318）上也显示出更有利的平均值，这与PBIAS和NRMSE的结论一致，即LsRSQ-DA在这组有限的测量点和日期内的表现优于SwRSQ-DA。尽管基于Landsat和SWOT的系统之间存在这些差异，但最稳健和一致的特征是每个同化模拟都明显优于基线模型和仅使用卫星数据的RSQs。为了研究为什么SwRSQ-DA模拟在这些基线KGE较差的测量站能够获得有利的结果，我们进一步分析了基线模拟的KGE分数、SWOT和Landsat（包括上游区域）的RSQ观测数量差异与KGE之间的关系（见图6）。这里的RSQ观测数量不仅包括测量站所在网格的观测数据，还包括在一天行程距离内对该站流量有贡献的上游网格的观测数据。H08模型假设恒定流速为0.5米/秒进行河流路径计算，得出每日行程距离为43.2公里。考虑到河流的蜿蜒程度，这大约相当于5分钟分辨率下的五个网格单元。这种上游计数方法仅用于图6，并不反映LETKF同化系统的结构。在同化步骤中，LETKF使用来自本地网格及其八个相邻网格单元的RSQ观测数据来更新河流存储量，遵循预定义的定位规则。因此，图6中计算上游RSQ观测数据只是因为它们通过路径计算影响了同化后的流量，而不是因为它们在测量站被直接同化。这使得诊断分析能够反映流量的物理传播过程，同时确保了足够的样本量。

图6展示了SwRSQ-DA模拟相对于LsRSQ-DA模拟的KGE改进指数、基线KGE以及SWOT和Landsat之间的RSQ数据频率差距之间的关系。纵轴上的正值表示SWOT在测量站及其上游的RSQ观测数量多于Landsat。散点图分为四个象限：(i) 基线KGE为正且SWOT观测数量多，(ii) 基线KGE为负且SWOT观测数量多，(iii) 基线KGE为负且Landsat观测数量多，(iv) 基线KGE为正且Landsat观测数量多。象限编号旁边的蓝色（红色）文本表示该象限内SwRSQ（LsRSQ）观测数据的百分比。图6根据基线KGE和SwRSQ及LsRSQ的观测数量将数据分为四个象限。在象限(ii)中，基线KGE为负（背景为橙色），且SwRSQ的观测数量多于LsRSQ，96.2%（26个测量站中的25个）显示出正的KGE值。这表明SwRSQ-DA在模型最初表现不佳的区域具有更好的同化性能，这是由于SWOT的观测频率更高，与Landsat相比提供了更多的同化更新机会。如图5f和随后的图8所示，SWOT同化模拟的改进在上游集水区较小的地点更为显著。在这些区域，RSQ同化的直接影响可能超过了模型模拟中固有的流量误差累积。因此，SWOT观测频率的增加在提高流量估计精度方面更为有效。支持信息S1中的图S2e和S2f进一步支持了这一解释，显示KGE为正的地点与SwRSQ提供的观测数量明显多于LsRSQ的地点在空间上是一致的。

另一方面，在象限(i)和(iv)中，基线KGE大于0（背景为绿色），并未确认RSQ观测数量与KGE改进之间存在显著关系。在50个测量站中，共有13个站点显示出负的KGE值（见图5e和图6中的红色圆圈），表明LsRSQ-DA的表现优于SwRSQ-DA。对RSQ准确性的额外分析显示，这些站点，尤其是位于主河道下段的站点，LsRSQ的PBIAS和NRMSE明显低于SwRSQ（见支持信息S1中的图S2a–S2d）。这种模式表明，同化具有较大偏差的RSQ数据，尤其是在数据量较大的情况下，可能会导致重复的错误更新，最终降低模型性能。图7展示了两个选定测量站的水文图，以突出数据同化性能如何根据当地观测的可用性和质量而有所不同。在Near Oacoma站点，基线模拟的KGE为负（-0.246），表明与观测流量的一致性较差（见图7a）。然而，SwRSQ-DA模拟的KGE为正（0.213），意味着在该站点SwRSQ-DA的表现优于LsRSQ-DA。在该站点，SWOT有40次RSQ观测，而Landsat只有1次。SwRSQ较高的观测频率使得同化更新更加频繁，这可能有助于提高模拟性能。相比之下，在Boonville站点，基线KGE为0.170，但LsRSQ-DA的KGE为-0.750，表明LsRSQ-DA产生的结果更接近观测值（见图7b）。尽管SWOT在该站点的观测次数（38次）多于Landsat（20次），但SwRSQ数据倾向于低估流量，导致SwRSQ-DA的模拟性能下降。Boonville的这个例子与上述同化具有较大偏差的RSQ数据的问题一致（见支持信息S1中的图S2），进一步强调了当基线模型已经表现良好时，RSQ的准确性可能起主导作用。尽管站点样本量有限，难以得出稳健的结论，但这表明在水文模型最初表现良好的地点，RSQ的质量影响了同化的有效性。

图8显示了对数刻度上的上游集水面积与NSE和KGE改进指数之间的关系，以及95百分位置信区间。需要注意的是，这里两种RSQ-DA模拟的改进指数是相对于基线模拟计算的，以展示与原始H08模拟（未进行同化）相比的总体改进情况。对于NSE和KGE而言，SwRSQ-DA和LsRSQ-DA模拟都与对数上游集水面积呈正相关，表明模型在较大集水区域的性能提升更为显著。特别是NSE的改进与集水面积的相关性分别为0.73和0.85。这一结果与Ishitsuka等人（2021年）的研究结果一致，他们将LsRSQ同化到同一流域的河段尺度河流路径模型中。比较两种同化方案的回归线时，SwRSQ-DA在集水面积较小的流域中表现出更大的性能提升。如图5e所示，基线水文模型在较小支流中难以准确模拟流量，通常导致基线KGE值较差。因此，如图6和7a所讨论的，SwRSQ可用的观测数量较多可能有助于在较小集水区域看到更显著的改进。相比之下，在基线模型通常表现良好的较大集水区域，LsRSQ同化的优势与其较低的RSQ偏差相吻合，表明在这种设置中RSQ的质量相对比观测频率更为重要。

4.1 SWOT RSQ同化的有效性
在本研究中，我们将最近可获得的SwRSQ数据同化到密苏里河流域的全球水文模型H08中。与50个实地流量测量站的对比显示，包含SwRSQ的模拟（SwRSQ-DA）显著优于基线模拟，PBIAS和NRMSE分别减少了34.07%和0.435（见图4）。先前的研究已经证明了同化LsRSQ数据可以提高河流流量估计的潜力（例如，Feng & Gleason, 2024; Feng et al., 2021; Ishitsuka et al., 2021）。我们的结果证实，实际SwRSQ数据的同化同样有效。在实际SwOT数据可用之前，Wongchuig-Correa等人（2020）在亚马逊河的一条支流Purus流域（上游集水面积370,000平方公里）使用合成SwOT类RSQ进行了同化研究。他们采用集成卡尔曼滤波器将合成SwRSQ同化到大规模水文-水动力模型MGB中（Collischonn et al., 2007）。虽然他们的建模框架和目标流域与我们的不同，但他们报告称相对于基线，RRMSE平均减少了约40%，大约相当于NRMSE减少了0.40%。在他们的研究中，合成SwRSQ的不确定性假设在-15%到-18.8%之间（基于Bartelli et al., 2018; Durand et al., 2016的研究）。这些值与SWOT河流流量产品设计阶段预期的30%不确定性（Durand et al., 2023）和初步验证工作中报告的最大67.5%不确定性相比相对乐观。尽管如此，我们基于实际SwRSQ数据的结果仍然显示出类似的NRMSE改进水平。此外，仅在有卫星观测数据的日期进行评估时，SwRSQ-DA模拟的表现仍然优于单独使用SwRSQ的情况，中位数PBIAS从中位数-32.7%减少到-17.7%，中位数NRMSE从中位数0.674减少到0.659（见图3）。LsRSQ-DA模拟相对于单独使用LsRSQ的改进更为显著，中位数PBIAS从中位数4.7%减少到-1.06%，中位数NRMSE从中位数0.703减少到0.528。尽管LsRSQ-DA的改进幅度略小，但其表现仍优于单独使用LsRSQ的情况。这些发现，加上与基线模型的比较，表明基于RSQ的数据同化可以提供比水文模型或单独使用RSQ数据更准确的流量估计。

4.2 基线性能与观测频率和质量
NSE和KGE的比较显示，SwRSQ-DA在74%和76%的流域测量站改善了流量估计（见图5）。这些改进主要集中在基线KGE最初较低的区域，尤其是在全球水文模型表现不佳的支流区域（Hanasaki et al., 2022; Hoch et al., 2023）。在这些区域，SWOT较高的观测频率提供了更频繁的同化更新，从而带来了显著的性能提升（见图6和图7a）。在之前使用合成数据集的SWOT同化研究中也报告了类似的关系，即在重访间隔较短、观测密度较高的区域，改进更为显著（Li et al., 2020; Revel et al., 2021）。这支持了我们的结论，即特别是在水文模型性能较差的区域——例如在小流域——同化更多的观测数据可以显著提高流量估计，只要RSQ数据的质量不是极低。这与我们的结果一致，即同时同化SwRSQ和LsRSQ的DuRSQ-DA在基线KGE表现较差的地点特别有效（见支持信息S1中的图S3）。最近的研究还集中在使用Sentinel-2和CubeSat图像估计RSQ（Feng et al., 2019）。这些来源提供的空间分辨率高于SWOT或Landsat，正如本研究所示，结合来自多个卫星的RSQ对于提高观测密度和改善同化性能具有很大潜力，特别是在小流域中。同时，SWOT河流流量算法工作组正在开发基于Mean Optimization Integrator（MOI）的河段尺度插值流量产品，该产品利用流量守恒将不规则的SWOT过境数据合并成更连续的时间序列（Durand et al., 2023）。这样的基于MOI的产品可以作为跨任务数据同化的基础，高分辨率但频率较低的Sentinel-2、Landsat或CubeSat的RSQ可以动态融合到其中，进一步增强大河流和小河流的流量监测。另一方面，在基线模型已经表现良好的站点（KGE > 0），尽管SWOT提供了更多的观测数据，LsRSQ-DA偶尔仍优于SwRSQ-DA。例如，在布恩维尔（Boonville）站点，SwRSQ系统性地低估了流量估计值，与LsRSQ相比，这种有害的SwRSQ重复同化导致性能相对于LsRSQ-DA有所下降（见图7b）。在基线模型已经表现良好的地点进一步改进模拟的难度也在先前的研究中有所预期（Feng等人，2021年；Ishitsuka等人，2021年）。Dasgupta等人（2021年）也指出，当模型误差较小时，同化观测数据的准确性成为实现改进结果的主要因素。因此，在这些情况下，观测数据的准确性对于获得更好的同化结果变得更加重要。实际上，我们的站点级比较（支持信息S1中的图S2）表明，LsRSQ-DA表现更好的地点在LsRSQ中的PBIAS和NRMSE显著较低。然而，2026年10月在法国阿尔卡雄（Arcachon）举行的SWOT科学团队会议上展示的SWOT数据表明，SWOT版本D的数据在高度尤其是宽度上的误差比这里使用的版本C的数据有所减少。因此，我们怀疑未来的SwRSQ版本将比Andreadis等人（2025年）的研究结果具有更低的偏差。因此，需要进一步研究以确定在不同地貌和水文条件下，哪些SWOT衍生变量对流量估计的准确性影响最大，因为这些变量与河流大小、地貌和水文状况相互作用。

4.3 未来SWOT流量同化的局限性和建议

本研究展示了将SwRSQ同化到水文模型中的有效性，并强调了SwRSQ观测的高时间频率相比LsRSQ同化可以带来更大的流量估计改进。然而，仍有几个方面需要改进，以便在未来应用中充分发挥SwRSQ同化的潜力。首先，有必要通过更好地理解全球范围内SwRSQ的准确性和不确定性，更有效地将观测信息整合到水文模型中。目前，SwRSQ准确性的验证仅限于Andreadis等人（2025年）对德国和美国四条河流进行的短期评估。他们的初步结果显示NRMSE介于4.6%到67.5%之间，这还不构成一个全面的评估。因此，在本研究中，我们将六个算法输出的中位数定义为观测值，将范围（最大值和最小值之间的差异）定义为观测不确定性。然而，正如使用合成SwRSQ数据的先前评估所显示的，最可靠的算法可能因地区和季节而异（Durand等人，2016年；Frasson等人，2021年）。因此，不仅仅是简单地取中位数，评估每个算法的准确性和不确定性非常重要，要么为每个地点选择最合适的算法，要么应用加权平均方法来提高整体观测可靠性，并量化观测不确定性范围，从而有效地更新模型状态。特别是，识别哪些类型的河流段在气候变化、环境和地貌条件下能够产生高精度的SwRSQ估计也很重要，这类似于Lin等人（2023年）评估LsRSQ性能的方法。这样的研究将有助于在缺乏现场测量的地区提取可靠的观测数据用于同化。其次，除了传统的基于集合的方案（如LETKF）之外，新兴的基于机器学习的数据同化框架提供了另一种利用多任务观测数据的途径。例如，生成式深度学习方法（如HydroGEnDA方法）已被提出，用于学习流量依赖的更新操作符，并通过结合模型模拟和多样化观测数据来改进流量估计（Foroumandi & Moradkhani，2025年）。同样，变换器允许LSTM结合每日气象强迫数据和稀疏卫星数据，而不会让气象数据主导卫星数据（Langhorst等人，2025年），直接的“图像到流量”模型（Hao等人，2024年）也开始出现。Tarpenelli等人（2013年、2017年、2019年）也长期展示了MODIS数据在流量预测方面的能力，尽管是在一个校准的框架内。我们的结果证明了通过两个任务的多任务融合增加覆盖范围的潜力，我们已经讨论了这种做法对超出粗略传感器观测范围的网络的好处。此外，正如第2.2节所提到的，当前版本的SWOT Sword of Science River Discharge产品应用了两阶段过滤过程来选择可靠输入。然而，正如本研究所示，在水文模型单独难以准确再现流量的地点，即使过滤不太严格，结合更高频率的观测数据也可以显著提高同化结果。河流流量监测的最终目标不是完善模型或RSQ的独立估计，而是最优地结合所有可用的水文信息，以获得最准确和一致的估计。因此，着眼于未来的同化应用，重新考虑并可能调整SwRSQ产品中使用的过滤阈值，以实现观测频率和数据质量之间的最佳平衡是很重要的。应当注意的是，SWOT数据的质量评估尚未像Landsat那样成熟。目前，SwRSQ产品使用的是SWOT Level 2 High-Rate River Single-Pass Product Version C（JPL内部文档，2024年）作为输入数据。鉴于流量算法及其质量控制程序的快速发展，预计未来的版本将提供更准确和稳定的SwRSQ估计，这将进一步加强本研究中记录的基于SWOT的同化优势。随着评估这些输入数据准确性的努力不断进展，预计将出现更有效的全球预过滤策略。

5. 总结与结论

在这项研究中，我们将来自最新SWOT卫星产品（SwRSQ）的遥感流量（RSQ）数据同化到全球水文模型H08中，该模型涵盖了2023年7月至2024年10月期间的密苏里河流域。我们研究了SwRSQ与LsRSQ在数据同化方面的表现，哪些因素解释了它们之间的差异，以及将它们结合是否能够改善结果。我们的研究结果表明，在74%和76%的现场测量站点上，SwRSQ同化（SwRSQ-DA）在NSE和KGE方面的表现分别优于LsRSQ同化（LsRSQ-DA）。对这些测量站点的空间分析显示，SwRSQ-DA在基线模型表现较差的地点（通常是在支流区域）特别有效，这得益于SwOT的高观测频率。相比之下，在基线模型已经表现良好的站点（KGE > 0），使用偏差较小的LsRSQ进行同化往往能产生更好的结果。同时，双重同化实验（DuRSQ-DA）的整体表现与SwRSQ-DA相当，但在基线模型表现较低的领域有更大的改进。综合这些结果表明，尽管SwRSQ在常见测量站点上并不总是比LsRSQ更准确，但其显著更高的观测频率在流域的许多部分实现了更有效的数据同化。因此，这项研究提供了基于证据的指导，说明SwRSQ在水文数据同化中的实用性，并突出了其相对于现有RSQ产品（如LsRSQ）的优势。除了这些发现之外，这项研究还有两个值得注意的贡献。首先，它证实了将RSQ数据同化到水文模型中可以增强流量估计，超越了模型或RSQ观测单独所能达到的效果。虽然之前的研究已经证明了相对于基线模型模拟的改进，但它们并没有明确比较数据同化与卫星观测本身的表现。我们的结果显示，在许多情况下，同化优于原始卫星数据，这表明卫星观测和水文模型不应被视为独立的替代品。相反，它们应被视为互补的信息来源，结合使用可以产生更可靠和稳健的河流流量预测。其次，我们展示了实际SwRSQ数据的同化产生了与之前使用合成SwRSQ的实验（Wongchuig-Correa等人，2020年）报告的类似改进。尽管我们的研究仅限于密苏里河流域作为测试案例，因此不能声称具有普遍适用性，但这些发现表明SwRSQ同化可以在实际环境中带来预期的好处。此外，因为这里使用的SwRSQ产品对应于一个仍在不断改进的早期公共版本，随着未来版本在准确性上的提高，同时保持SWOT在观测密度上的优势，可以合理预期同化性能的进一步提升。通过识别SwRSQ数据及其同化性能的优势和当前局限性，这项研究有助于最大化SWOT观测在河流流量监测中的价值，并为基于卫星的水文数据同化的未来提供了令人鼓舞的前景。

致谢

本项工作得到了日本学术振兴会（JSPS）研究员资助项目23KJ0709（Y. I.）、JSPS KAKENHI项目21H05002（D. Y.、N. H.和S. K.）、文部科学省气候预测高级研究计划（SENTAN）JPMXD0722680395（Y.I.和D.Y.）以及NASA资助项目80NSSC24K1646（C. J. G.和E. F.）的财政支持。

利益冲突

作者声明与本研究无关的利益冲突。

数据可用性声明

用于定义河流段的SWORD（Altenau等人，2021a，2021b）和MERIT-Basins Hydrography（Lin等人，2019a，2019b）数据集可在SWOT River Database网站（https://www.swordexplorer.com/）和Reach Scale Hydrology网站（https://www.reachhydro.org/home/params/merit-basins）上获得。本研究中使用的SWOT河流流量产品可在Zenodo数据存储库中找到（Ishikawa等人，2025年；https://doi.org/10.5281/zenodo.18050392）。用于计算基于Landsat的RSQ的geoBAM算法（Brinkerhoff等人，2020a，2020b）、RivWidthCloud算法（Yang等人，2020a，2020b）和GRADES-HydroDL（Yang等人，2023a，2023b）可在Github上找到（https://github.com/craigbrinkerhoff/geoBAMr；https://github.com/seanyx/RivWidthCloudPaper），以及Reach Scale Hydrology网站（https://www.reachhydro.org/home/records/grades-hydrodl）。全球水文模型H08（Hanasaki等人，2008a，2008b，2018）可在Github上找到（H08模型开发团队，2023年；https://github.com/h08model/H08）。

参考文献

Revel, M., Ikeshima, D., Yamazaki, D., & Kanae, S. (2019). 一种基于物理的实证方法，用于同化大陆尺度河流的合成SWOT观测数据：以刚果河流域为例。《Water》，11(4)，829。https://doi.org/10.3390/w11040829

热点排行