基于物理知识的深度学习用于山坡地下水流预测:整合土壤水分亏缺约束条件
《Journal of Hydrology》:Physics-informed deep learning for hillslope subsurface flow prediction: integrating soil moisture deficit constraints
【字体:
大
中
小
】
时间:2026年03月24日
来源:Journal of Hydrology 6.3
编辑推荐:
准确模拟坡面下垫面径流(SSF)对理解集水区径流生成机制至关重要,但SSF动态具有间歇性和阈值依赖性。本研究提出基于物理约束的深度学习框架,通过LSTM网络结合硬约束(输入门控)和软约束(损失正则化)有效捕捉SSF的阈值特性,验证了物理约束对模型可靠性的提升作用,特别是在数据稀缺或非稳态环境下。
韩晓乐|高曼|刘金涛|杨海|林浩明|沈旭辉
中国江苏省南京市河海大学国家水灾防治重点实验室,邮编210098
摘要
准确模拟山坡地下暴雨径流(SSF)对于理解源头流域的径流生成、调节洪水响应以及限制生物地球化学通量至关重要。然而,SSF的动态本质上是间歇性的,并且受到严格阈值控制,只有在前期土壤湿度和降雨量共同超过临界储存条件时才会发生。尽管深度学习可以处理这些复杂过程,但纯数据驱动的模型往往缺乏物理一致性,导致预测不准确,尤其是在数据稀缺或环境变化的情况下。在这项研究中,我们开发了一个基于物理知识的深度学习框架,以更好地表示山坡降雨-径流动态中的水分控制激活过程。利用来自鹤桥水文实验站的独特高频十年数据集(2015–2025年),我们系统评估了多种深度学习架构,并确定长短期记忆(LSTM)网络是表示间歇性SSF的最可靠框架,其性能优于基于Transformer和卷积的模型。我们还发现,前期土壤湿度指数(ASI)是控制流量启动的关键变量。因此,我们通过两种互补策略嵌入了基于ASI的物理约束:一种硬约束,作为基于土壤湿度缺口的机制输入转换;另一种软约束,通过基于物理知识的损失正则化引入。结果揭示了它们在有效性上的显著状态依赖性。在干燥条件下,硬约束特别有益,因为严格的缺口阈值可以抑制错误的流量预测;而在湿润状态下,软约束通过保持模型捕捉非线性高流量响应的灵活性而表现更好。基于事件的分析进一步表明,与大型降雨事件相比,小型降雨事件在PIDL建模中起着基础性作用,因为它们对于识别地下暴雨径流生成的阈值非常重要。总体而言,这些发现强调了将物理约束嵌入深度学习模型可以显著提高预测能力和水文一致性。
引言
山坡地下暴雨径流(SSF)是潮湿源头流域中主要的径流生成机制,对洪水响应(Freer等人,2002年;Liu等人,2016年)和山坡尺度溶质传输(Creed和Band,1998年;Heathwaite和Dils,2000年;Tang等人,2010年)具有强烈控制作用。尽管其具有水文重要性,但SSF的生成特征是明显的非线性和阈值行为。通常只有当前期土壤湿度、降雨强迫和可用地下储存量共同超过临界状态时,才会激活侧向地下流动,从而导致突然且高度间歇性的响应(Sivapalan,2003年;Blume和Van Meerveld,2015年;Singh等人,2021年;Nanda和Safeeq,2023年;Fu等人,2025年)。这些由阈值主导的动态还受到地下异质性、优先流动路径和复杂基岩地形的进一步调节(Detty和McGuire,2010年;Beven和Germann,2013年),这些因素共同使得山坡SSF的可靠模拟和预测始终具有挑战性。
基于物理的模型,如HYDRUS-2D/3D,通过显式求解Richards方程(Simunek等人,2005年),提供了变饱和流的严格机制描述。尽管这些模型具有坚实的物理基础,但它们需要大量的参数化和高质量的地下数据,并且计算强度高,这严重限制了它们在陡峭、异质山坡或数据稀缺环境中的实际应用(Paniconi和Putti,2015年;Fatichi等人,2016年)。此外,它们往往难以真实地表示优先流动路径和细尺度地下异质性——这些过程已知对山坡地下暴雨径流的生成具有第一阶控制作用(Jarvis,2007年)。因此,已经开发了多种概念性方法,包括TOPMODEL、储存-位移框架和基于阈值的径流模型,使用集中或半分布式表示来模拟SSF(Beven和Kirkby,1979年;McDonnell等人,2021年)。虽然这些模型计算效率高且简洁,但它们依赖于预定义的功能关系(例如,线性水库或固定的激活阈值)。这样的结构假设可能过于简化了SSF动态的强非线性、状态依赖性和事件驱动性质(Beven和Germann,2013年;Shen等人,2025年)。
深度学习模型提供了一种替代范式,能够从原始输入中自动提取层次化表示,并学习复杂的降雨-径流关系,而无需显式参数化地下异质性(Shen,2018年;Xiang等人,2020年;Tursun等人,2024年)。特别是,长短期记忆(LSTM)网络在表示流域记忆效应和时间依赖性方面表现出强大能力,经常优于传统的概念模型(Kratzert等人,2018年)。深度学习工具箱进一步扩展到包括卷积神经网络(CNNs),用于捕捉短期局部响应模式(Van等人,2020年),以及使用自注意力机制的Transformer架构,用于模拟长期时间依赖性(Vaswani等人,2017年;Yin等人,2025年;Han等人,2025年)。然而,大多数成功的数据驱动水文建模应用都集中在流量相对连续和衰减的河流流域,例如CAMELS数据集中所代表的流域(Kratzert等人,2018年;Xie等人,2021年;Feng等人,2022年;Yin等人,2022年)。相比之下,山坡SSF表现出明显的间歇性行为,其快速激活和停用受降雨和前期湿度条件控制。因此,目前尚不清楚为大型流域开发的先进深度学习架构是否能够稳健地捕捉控制源头山坡径流生成的突然切换过程。
尽管深度学习模型在统计上表现优异,但它们本质上是相关性驱动的,常被批评为缺乏物理因果关系的黑箱模型(Reichstein等人,2019年;Nearing等人,2021年)。当模型应用于训练数据范围之外的条件时,这种物理一致性的缺失尤其成问题,因为纯数据驱动的方法可能会违反基本守恒原则或产生物理上不可信的响应(Karniadakis等人,2021年)。在山坡水文学中,这种限制在频繁出现错误径流预测时最为明显,即在降雨事件期间模拟了本应由于前期土壤湿度不足而不产生流量的情况。从过程角度来看,这种行为是因为标准神经网络没有显式编码土壤湿度缺口或地下储存状态,通常依赖降雨和蒸散作为主要输入(Yu等人,2023年;Dolatabadi和Zahraie,2024年)。这种学习困境因水文数据集的不平衡性质而加剧(Reichstein等人,2019年;Frame等人,2022年)。例如,由于规模较大,大型事件在损失函数优化中占主导地位,而与非导电、储存填充阶段相关的丰富的小型事件则受到有限关注。目前尚不清楚更频繁的小型事件是否提供了识别地下暴雨径流激活阈值所需的关键信息。然而,不同降雨制度对这些物理激活阈值学习的贡献程度仍需进一步探索。这种未能稳健学习阈值驱动的动态限制了模型表示从干燥状态到湿润状态转换的能力,从而限制了在数据稀缺或非稳态条件下纯数据驱动方法在水文过程解释和预测方面的可靠性。
为了弥合物理可解释性和数据驱动准确性之间的差距,基于物理知识的深度学习(PIDL)已成为一个有前景的方向(Karniadakis等人,2021年;Bindas等人,2024年;Xie等人,2024年;Chen等人,2025年)。这种方法利用领域知识约束神经网络,以防止物理上不可能的预测。当前研究将将物理知识整合到深度学习中的策略大致分为两大类:软约束(学习偏差)和硬约束(归纳偏差)(Karniadakis等人,2021年;Willard等人,2022年)。软约束作为指导,向损失函数中添加惩罚项,以在训练期间阻止物理违规,例如那些控制土壤水分运动的违规(Bandai和Ghezzehei,2021年;Gong和Zha,2025年)和热传递问题(Cai等人,2021年;Xie等人,2024年)。相比之下,硬约束方法通过将物理规则嵌入模型架构、参数空间或输入-输出结构来严格执行这些规则(Beucler等人,2021年;Hoedt等人,2021年)。尽管这两种策略在理论上都得到了很好的建立,但尚不清楚显式的基于输入的强制执行或隐式的基于损失的正则化哪种方法更有效地表示山坡地下暴雨径流特征的干燥和湿润状态之间的尖锐阈值控制转换。
本研究提出了一个全面的基于物理知识的深度学习框架,专门用于捕捉山坡地下流动的阈值主导动态,使用了来自鹤桥水文实验站的独特高频十年数据集(2015–2025年)。具体而言,本研究的目标有三个。首先,我们系统地对比了多种深度学习架构——包括LSTMs、CNNs、Transformers及其混合形式,以确定建模间歇性和高度间歇性流动制度的最佳框架。其次,我们明确比较了基于输入门控的硬约束策略与基于损失正则化的软约束策略在强制前期土壤湿度约束方面的有效性。第三,我们采用可解释性技术来诊断这些物理约束如何在不同降雨模式下改变模型行为。最终,这项工作旨在超越黑箱预测,提供一种可转移的方法,将物理阈值机制嵌入数据驱动模型中,以确保高准确性和水文一致性。
章节片段
研究地点描述
该研究在中国东南部太湖盆地的鹤桥水文实验站(北纬30°34′,东经119°47′)的H1区域进行,该区域是一个陡峭的0.31公顷零级流域(图1)。该流域的特点是没有渠道化的洼地,地形呈汇聚状。从地貌学上看,H1由一个平坦的顶峰、一个线性的背坡、一个短的凹形脚坡和一个平坦的趾坡组成。海拔范围从312米到367米,平均坡度为31%。坡度变化
降雨事件和SSF响应特征
在研究期间共识别出356次降雨事件(参见表1和表S2)。水文气象条件差异显著,总降雨量从5.0毫米到387.2毫米不等。在这些事件中,有153次事件产生了可测量的地下暴雨径流(SSF > 0.001毫米),而其余203次事件没有产生流量。这表明SSF表现出高度间歇性的行为,而不是连续的过程(图3b)。流量在响应降雨时急剧增加
间歇性源头系统的架构选择
本研究的首要目标是确定“突发性”间歇性山坡系统的最佳深度学习框架。尽管最近的水文研究越来越多地采用复杂的架构,如Transformers(Wang等人,2024年;Yin等人,2025年)和混合模型(Deng等人,2022年;Li等人,2024年;Wang和Zha,2024年),但我们的基准测试结果(表2)清楚地表明,标准LSTM在这种应用中提供了最稳健的性能。LSTM
结论
本研究通过开发基于物理知识的深度学习(PIDL)框架来解决模拟间歇性地下暴雨径流(SSF)的挑战。我们的基准测试确定标准LSTM是最优的框架,由于其归纳偏差与流域的储存-排放记忆相一致,显著优于复杂的Transformers
CRediT作者贡献声明
韩晓乐:撰写 – 审稿与编辑,撰写 – 原稿,软件,方法论,资金获取,正式分析,数据管理,概念化。高曼:撰写 – 审稿与编辑,监督,概念化。刘金涛:撰写 – 审稿与编辑,监督。杨海:撰写 – 审稿与编辑。林浩明:撰写 – 审稿与编辑,调查。沈旭辉:撰写 – 审稿与编辑,调查,数据管理。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
致谢
本研究得到了中国地质调查局(DD202607203003)和国家自然科学基金(NSFC)(42371042,41901019)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号