Q-CLASS:一个基于观测的中国大型水坝站点径流重建数据集

《Journal of Hydrology》:Q-CLASS: an observation-based reconstruction dataset for streamflow at China’s large dam sites

【字体: 时间:2026年04月15日 来源:Journal of Hydrology 6.3

编辑推荐:

  大型水库径流数据重建:整合观测与多模型模拟,采用随机森林方法校正偏差,揭示1961-2014年中国907个大型水库径流时空分布特征及 drying-to-wetting 比例演变。

  
贾苗宇|王凯文|李宇琪|李欣宇|姜海宁|罗秋雨|刘长明|刘晓芒
中国科学院地理科学与自然资源研究院水循环及相关地表过程重点实验室,北京,中国

摘要

大坝所在处的径流动态(Q)对于确定大坝尺寸、水库蓄水量和供水可靠性至关重要。然而,由于大量大坝缺乏径流数据(Q),现有的关于径流变化的研究仅限于少数知名大坝,导致大多数大坝的研究尚未充分展开。在这里,我们通过整合中国各地的径流观测数据与多源径流模拟模型来填补这一空白。通过将323个水文站的数据叠加到数字河流网络上,我们获得了326个大型大坝的基于观测的径流数据,并利用这些数据评估了来自地球系统模型、地表模型、全球水文模型和机器学习算法的53个模拟结果。评估结果表明,大多数模型在再现年平均径流方面表现尚可,但在捕捉年际变化方面表现较差。为了使这些存在偏差的模拟模型能够用于重建中国所有大型大坝的时空连续径流,我们进一步评估了五种常用的偏差校正方法。其中,随机森林模型的表现最佳,其校正结果在泰勒图中与基于观测的数据最为接近。通过十折交叉验证验证模型的稳健性并选择表现最佳的模拟结果后,我们重建了1961年至2014年中国907个大型大坝的时空连续径流数据。与原始模拟数据相比,重建数据集揭示了长期径流变化的显著空间模式和频率分布变化,包括自然径流的干湿比从1:1转变为2:1。我们的数据集可在以下链接公开获取:https://figshare.com/s/b5b7f1e3443f40a60367

引言

从古代的河流障碍物到现代的巨型结构,人类长期以来一直在建造大坝以创建用于储存和调节径流的水库(Dynesius和Nilsson,1994;Lehner和D?ll,2004)。在大坝规划阶段,一旦选定地点,就会根据大坝所在处的径流数据(Q)来确定大坝尺寸、水库蓄水量和供水潜力(所有符号详见附表A1)。大坝建成后,会持续监测Q值,以评估水库入流的大小和变异性以及供水的可靠性。随着气候和景观条件的不断变化,Q值预计将不再保持稳定,从而威胁到供水安全(Milly等人,2008;Steffen等人,2018)。例如,在过去的二十年里,科罗拉多河流域的长期干旱、降雪量减少和积雪减少导致胡佛大坝的径流(Q)大幅下降,使米德湖的水位下降,威胁到该地区的供水安全(Udall和Overpeck,2017;Milly和Dunne,2020)。受降水减少和植被绿化导致的蒸散量增加的影响(Wang等人,2025a),中国南水北调工程的源头——丹江口大坝的径流(Q)也显著减少,削弱了该工程的有效性(Zhang等人,2021)。因此,研究大量大坝的径流动态非常重要,但由于数据缺乏,这方面的研究仍不充分。
水文站的流量测量提供了径流动态的真实观测数据。如果一个水文站位于大坝所在的同一条河流上且没有其他支流,其观测数据可以可靠地代表Q值。如果水文站和大坝之间有多条支流,可以通过调整观测数据来考虑支流的流入和流出量来推算Q值(如图S1所示)。然而,中国径流观测数据的稀缺限制了对少数知名大坝(如三峡大坝和丹江口大坝)的研究(Cheng等人,2024;Xu等人,2024)。实际上,中国已经建造了900多个大型水库,每个水库的蓄水量均超过0.1立方公里,总蓄水量达811立方公里(Li等人,2025)。这些水库对于养活14亿人口、灌溉超过1.2亿公顷的农田以及支持全球最大的工业产出和粮食生产至关重要。在这里,我们关注中国大型水库属性和排水边界(CLEAR)数据集中记录的907个大型大坝。CLEAR数据集提供的大坝坐标与现实世界和基于DEM的河流网络高度对齐,能够准确识别流入或流出水库的附近水文站(Li等人,2025)。此外,Wang等人(2025b)最近汇编了来自中国1046个水文站过去六十年的两种基于观测的径流数据。第一种是实际径流,即河流横截面测量的流量;第二种是自然径流,是通过将实际径流与人类活动(包括取水、调水和调节)的影响相加得到的(Miao等人,2022)。利用这些数据,我们推算了中国各地大型大坝的基于观测的自然径流(Qn)和实际径流(Qa)。在Wang等人(2025b)记录的1046个水文站中,有323个符合补充文件S1中描述的代表性标准,因此被用来推算326个大坝的Qn和Qa。其余581个大坝由于缺乏代表性水文站而无法获得基于观测的数据。
为了在没有基于观测数据的大坝处重建Qn和Qa,有必要结合径流模拟。最近的水文建模进展产生了多种径流模拟结果,这些模拟通常由地球系统模型(ESMs)、地表模型(LSMs)、全球水文模型(GHMs)和机器学习算法(MLAs)生成(Pokhrel等人,2016;Beck等人,2017;Hou等人,2023)。ESMs通过整合地球系统多个组成部分的物理过程并量化它们的相互作用和反馈来模拟自然径流(Clark等人,2015)。作为ESMs的陆地组成部分,LSMs通过模拟陆地水和能量平衡框架内的水分、能量和动量交换来模拟自然径流(Rodell等人,2004)。GHMs通过排除或考虑人类活动对自然水文过程的影响来模拟自然或实际径流(Frieler等人,2024)。当前的MLAs主要基于小型原始流域的径流观测数据和相应的气象数据训练,利用连续的时空气象信息来模拟自然径流(Gudmundsson和Seneviratne,2016;Ghiggi等人,2021)。在这里,我们收集了来自参与第六阶段耦合模型比较项目(CMIP6)(Eyring等人,2016)的22个ESMs的53个径流模拟结果、4个LSMs(包括来自全球陆地数据同化系统第二版(GLDAS)的3个模型(Rodell等人,2004)以及一个使用200个中国水文站的自然径流数据校准的可变入渗能力模型生成的模型(Gou等人,2021)、参与第三轮跨部门影响模型比较项目(ISIMIP3a)的26个GHMs(Frieler等人,2024)以及1个MLA(Ghiggi等人,2019)的径流模拟结果(表1)。
尽管水文建模取得了进展,但由于物理过程的简化、参数的不准确以及驱动数据的不确定性,径流模拟结果仍与观测数据存在一定偏差(Gnann等人,2023;Reinecke等人,2025;Tiwari等人,2025)。在使用这些模拟结果进行Qn和Qa重建之前,开发一种稳健且准确的偏差校正方法至关重要。在这里,我们通过将校正后的模拟结果与基于观测的基准数据进行比较,评估了326个大坝的五种常用偏差校正方法。其中,随机森林模型的准确性和稳健性最高。因此,我们在326个大坝上训练了一个随机森林模型,以基于观测的径流作为响应变量,以径流模拟结果、基于观测的气象条件、人类取水量、土地利用和覆盖情况以及地形作为特征变量。利用表现最佳的模拟结果,我们重建了1961年至2014年中国907个大型大坝的自然和实际径流数据集(Q-CLASS)。

大坝位置和排水边界

我们使用了CLEAR数据集(Li等人,2025)中公开的907个中国大型水库的地理参考大坝位置和排水边界信息。CLEAR为每个大坝提供了两种坐标:一种与现实世界的河流对齐,另一种与基于DEM的河流对齐。这些坐标有助于在卫星生成的河流网络(如地表水和海洋地形任务河流数据库(Altenau等人,2021)和基于DEM的河流网络上准确放置大坝。

评估径流模拟

图2中的泰勒图将模拟结果(彩色标记)与基于观测的径流数据(黑色星号)进行了比较,模型标记与黑色星号越接近,表示性能越好。结果显示,大多数模型在再现年平均径流方面表现尚可,但在捕捉年际变化方面表现较弱。从图2a和c中大多数模拟结果围绕基于观测的星号聚集的情况可以看出这一点的体现。

澄清径流概念

本研究重点关注大型大坝处的径流重建,这是确认设计参数、水库蓄水量和供水潜力的重要概念。然而,大坝建成后,这种径流不再可以直接测量,而是由入流和出流替代。入流是指从上游河流流入水库的水量,而出流是指在控制下从水库流出的水量。

结论

在这项研究中,我们为1961年至2014年中国907个大型大坝的自然和实际径流开发了一个基于观测的重建数据集(Q-CLASS)。通过将径流模拟结果与大坝处的基于观测的基准数据进行整合,该框架能够在大自然和实际条件下实现长期径流的大规模重建。结果表明,现有的径流模拟方法通常可以捕捉到长期径流的年平均值。
< />
Yu等人(2026)。
< />
贾苗宇:撰写——初稿、可视化、验证、方法论、调查、数据分析、概念化。王凯文:撰写——初稿、验证、监督、软件开发、方法论、资金获取、数据分析、概念化。李宇琪:撰写——审稿与编辑、软件开发、调查、数据分析。李欣宇:撰写——审稿与编辑、数据分析。姜海宁:撰写——审稿与编辑。
< />
本研究得到了中国国家重点研发计划(编号2024YFC3013404和2023YFC3206600)、国家自然科学基金(编号52209040)以及中国科学技术青年精英科学家资助计划(编号YESS20220331)的支持。
< />
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
< />
我们感谢参与第六阶段耦合模型比较项目、第三轮跨部门影响模型比较项目、全球陆地数据同化系统第二版、全球径流重建数据集和中国自然径流数据集的工作组,他们负责生成、协调并公开分享了这些径流模拟结果。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号