《Journal of African Earth Sciences》:Improving daily streamflow prediction using a coupled SWAT-MLP model: A case study of the Gilgel Abay watershed, Ethiopia
编辑推荐:
准确日径流预测是数据稀缺流域(如埃塞俄比亚基尔格尔阿拜流域)的关键挑战。本研究提出SWAT-MLP混合框架,通过集成物理模型SWAT的土壤含水量、侧向径流等水文参数与气象数据,结合MLP神经网络捕捉非线性动态,显著提升预测精度(NSE=0.94,R2优化),尤其改善峰值流量模拟,为类似数据稀缺区的水资源管理提供新方法。
作者:Shelay Taye、Mayank Raturi、Manita、Deepak Khare
印度理工学院水资源开发与管理系,鲁尔基,247 667,印度
摘要
在数据稀缺的流域(如埃塞俄比亚上尼罗河地区的Gilgel Abay流域),准确的日流量预测是一个主要挑战。以数据为导向的模型缺乏物理上的可理解性,而基于物理的模型往往难以捕捉到峰值流量。本研究通过引入一种混合框架来解决这一限制,该框架将基于过程的SWAT模型与多层感知器(MLP)相结合,以提高预测的可靠性。利用土地利用、土壤、地形和每日天气记录数据集,首先对SWAT模型进行了校准(2000–2010年),然后进行了验证(2011–2014年)。接下来使用降雨量、温度和滞后流量数据训练了MLP模型。通过将SWAT模拟的水文成分与气象变量和基于滞后的预测因子相结合,实现了混合模型的优化,从而提高了对流量动态的学习能力。SWAT模型表现良好(NSE = 0.77),但低估了峰值流量;而MLP模型表现更好(NSE = 0.92),因为它能够捕捉到非线性的时间模式。SWAT-MLP组合模型的NSE和R2值为0.94,误差显著降低,证明了其稳健性和可靠性。研究结果强调了混合建模在类似数据受限流域中加强日流量预测的潜力,建议将其应用于实际水资源管理,并扩展到附近的子流域。
引言
上尼罗河(UBN)流域起源于埃塞俄比亚的高地,是尼罗河的重要支流(Allam和Eltahir,2019;Zargar等人,2025),对尼罗河的季节性和年际流量变化具有显著影响(Mohammed等人,2025)。了解流域内的水文动态对于有效决策至关重要,尤其是在气候变化和城市化问题日益紧迫的背景下(Ande等人,2025;Dallison等人,2022)。因此,准确预测流量对于有效的水资源规划和管理至关重要,特别是在易受洪水和干旱等极端水文事件影响的地区(Cho和Kim,2022),因为这关系到灌溉规划、水电发电、灾害准备和政策制定(Fang和Shao,2022;Romanowicz,2017)。流量变化通常通过基于模拟的方法进行研究(Kasiviswanathan等人,2016),这些方法根据其假设和对水文过程的表示方式,通常被分为基于物理的、概念性的和经验性的模型(Devia等人,2015)。虽然基于物理的模型能够详细表示水文过程,但经验性模型完全依赖于从观测数据直接得出的输入-输出关系(Pang等人,2020;Tegegne等人,2017)。然而,这些模型的性能往往受到数据可用性、模型结构和研究区域自然复杂性的限制(Chen等人,2023)。
美国农业部(USDA)开发的土壤和水资源评估工具(SWAT)是一种广泛认可的基于物理的半分布式模型,适用于流域尺度的水文和环境模拟(Arnold等人,1998)。由于其全面的基于过程的框架,SWAT模型已被广泛用于评估气候变化、土地利用变化和农业实践对流域内流量、泥沙产量和养分动态的影响(Dwivedi等人,2024;Gassman等人,2007;Shekar等人,2023)。确保这些应用的成功需要仔细的模型实施。SWAT模拟的准确性取决于系统的敏感性分析、校准和验证程序(Arnold等人,2012)。敏感性分析可以识别最具影响力的参数,指导有效的校准以减少模型与数据之间的不匹配,而验证则在独立数据上评估预测性能。这些过程通常使用SWAT-CUP平台进行,该平台有助于参数优化和不确定性分析(Abbaspour等人,2007;Polanco等人,2017)。尽管SWAT应用范围广泛,但它也存在一些局限性,包括对输入数据的高要求以及由于参数众多、值范围广泛和相互依赖性强而导致的复杂的校准和验证过程(Belina等人,2024;Bihon等人,2024;Shekar等人,2023)。此外,有效的实施需要大量的技术专长,并且经常受到地区环境复杂性的挑战(Bourdin等人,2012)。作为另一种建模方法,人工神经网络(ANNs)是一种受生物神经系统启发的数据驱动模型,由能够直接从数据中学习和识别模式的互连节点或神经元组成(Adnan等人,2017;Mei等人,2023)。
多层感知器人工神经网络(MLP-ANN)使用反向传播算法进行训练,在水资源领域得到了广泛应用(E. K. Onyari & F. M. Ilunga,2013;Enung等人,2023)。与通过数学方程表示实际物理过程的基于物理的水文模型不同,MLP-ANN模型直接从历史数据中的关系和模式中学习,无需详细了解潜在的水文过程(Khan等人,2023;Noori和Kalin,2016)。由于其灵活性和适应性,ANNs在水资源领域有广泛的应用,包括模拟降雨径流过程、预测短期流量变化和洪水预报(Dawson和Wilby,1998;Sonowal等人,2024;Tamiru和Dinka,2021)。Ali和Shahbaz(2020)通过测试不同的前期降雨输入,展示了基于ANN的模型在日流量预测方面的潜力。他们发现使用前四天的降雨量可以获得最佳结果,这强调了输入选择和模型架构的重要性。Oad等人(2023)和Khan等人(2023)的最新研究进一步证实了ANN模型在模拟流量方面的有效性,能够高精度地捕捉复杂的水文动态。尽管ANNs具有强大的预测能力,但也存在一些挑战,包括调整超参数的难度、过拟合的脆弱性(Shrestha和Solomatine,2006)以及有限的可解释性(Tikhamarine等人,2020)。由于它们的黑箱性质,很难理解输入变量如何影响输出,从而降低了其在需要物理一致性和模型可解释性的水文研究中的可靠性(Beven,2012)。
为了克服基于过程和数据驱动模型的局限性,最近的研究越来越多地关注将物理模型与机器学习技术相结合的混合方法(Chen等人,2023;Huang和Zhang,2024)。这些方法结合了像SWAT这样的水文模型的可解释性和过程表示能力,以及机器学习算法(如MLP-ANN)的模式识别和非线性映射优势(Noori等人,2020;Noori和Kalin,2016)。在这种对混合模型日益增长的兴趣基础上,研究其在Gilgel Abay流域的应用性非常重要,因为已经有很多使用SWAT模型的研究(Abuhay等人,2023;Betrie等人,2011;Dile等人,2013;Gashaw等人,2020;Setegn等人,2008),但探索机器学习或集成SWAT-ML框架的努力有限(Antar等人,2006;Eshetie等人,2023;Mesele,2020)。Gichamo等人(2024)的研究使用包括SWAT、HEC-HMS和HBV在内的三种半分布式水文模型进行了集成降雨-径流建模,结果表明在Gilgel Abay流域中,神经网络集成模型具有最高的准确性。在相关工作中,A. M. Ali等人(2025)提出了一种混合流量预测框架,该框架结合了概念性水文建模、信号分解和机器学习,利用基于卫星的降雨数据,特别是在低流量期间显著提高了模拟精度。这些改进清楚地表明,混合模型非常适合数据有限的地区。尽管SWAT和ANN模型各自有所贡献,但将这两种方法结合起来(特别是在Gilgel Abay流域中,将SWAT模拟的水文输出如土壤含水量、侧向流动、渗透、地下水排放、地表径流和蒸散作用与基于地面的气象变量相结合,用于与MLP-ANN的混合以预测日流量)的努力仍然有限,这限制了准确性和稳健性。本研究旨在通过开发一种结合基于物理的SWAT模型和数据驱动的MLP-ANN的混合建模框架来提高Gilgel Abay流域的流量模拟能力。这种耦合利用了SWAT模型表示流域过程的能力和MLP-ANN捕捉复杂非线性模式的优势。作为基础步骤,通过校准(训练)、验证(测试)和统计评估来评估SWAT和MLP模型的独立性能。这些评估的见解指导了混合SWAT-MLP模型的构建,其中SWAT的关键水文输出被用作MLP模型的输入。该方法旨在改善数据稀缺和水文复杂地区传统建模方法难以实现的预测可靠性。
尽管许多研究独立应用SWAT或机器学习模型进行上尼罗河流域的流量模拟,但仍存在显著的限制。基于物理的模型(如SWAT)往往难以捕捉非线性的降雨-径流动态和峰值流量,尤其是在数据稀缺的地区。相反,机器学习模型提供了高预测精度,但缺乏物理一致性和可解释性。最近的研究探索了混合建模方法来解决这些限制(Jabar等人,2023;Jassam等人,2024a,2024b)。然而,在Gilgel Abay流域系统地将SWAT衍生的内部水文状态与机器学习模型结合起来的努力仍然有限。此外,现有研究通常依赖于有限的特征选择策略或忽略了不确定性和稳健性分析。
本研究通过提出一种基于物理的混合SWAT-MLP框架来解决这些限制,该框架将多个SWAT模拟的水文成分与气象输入和短期记忆效应相结合。与以往的研究不同,本研究应用了基于相关性的特征筛选、滞后优化和贝叶斯超参数调整来提高模型的泛化能力。本研究的核心问题是:将基于物理的水文输出与数据驱动的MLP模型相结合,能否显著提高数据稀缺流域的日流量预测准确性和稳健性?
本研究的主要贡献包括:
开发了一种用于日流量预测的稳健SWAT-MLP混合建模框架。
将物理可解释的SWAT输出整合到机器学习架构中。
与独立模型相比,展示了改进的准确性、可靠性和峰值流量表示能力。
将该框架应用于上尼罗河流域的一个关键支流。
研究区域
研究区域
Gilgel Abay流域(图1)起源于Gish Abay附近,是UBN流域Tana湖子流域的主要支流(Uhlenbrook等人,2010)。地理上,它位于北纬10°56′至11°51′和东经36°44′至37°23′之间,覆盖了Tana湖子流域的南部地区,并延伸到UBN流域的北部。Gilgel Abay流域的排水面积约为5000平方公里,海拔范围从1737米到3533米不等。
结果与讨论
研究结果表明,将基于物理的水文信息与机器学习相结合可以显著提高数据稀缺环境中的日流量预测。混合SWAT-MLP模型的性能优于单独的SWAT和MLP模型,因为它减少了结构偏差,改进了峰值流量模拟,并保持了物理一致性。与之前在Gilgel Abay流域使用单独SWAT的研究相比(例如,Setegn等人,2008;Dile等人,2013)
结论
本研究提出了一种新的混合SWAT-MLP建模框架,用于改进上尼罗河流域Gilgel Abay流域的日流量预测。该研究的新颖之处在于系统地将基于物理的SWAT水文成分与机器学习架构相结合,并通过基于相关性的特征选择和贝叶斯超参数优化进行了支持。
结果表明,虽然单独的SWAT模型提供了物理意义上的模拟
作者贡献声明
Shelay Taye:撰写——原始草稿、可视化、资源、方法论、正式分析、数据整理、概念化。Mayank Raturi:撰写——审阅与编辑、可视化、监督。Manita:撰写——审阅与编辑、可视化、监督。Deepak Khare:撰写——审阅与编辑、监督。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。