数据驱动模型在估算迷宫式水闸泄流系数中的应用
《Engineering Applications of Artificial Intelligence》:The application of data-driven models for estimating the discharge coefficients of labyrinth gates
【字体:
大
中
小
】
时间:2026年02月24日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
精确测定闸门和堰的流量系数(Cd)对水工结构设计至关重要。本研究采用MARS、GEP、MEP、M5MT和GMDH五种白盒数据驱动模型,通过实验数据集和参数敏感性分析,构建了可解释的Cd预测方程。结果表明:MARS模型在均方根误差(RMSE)和决定系数(CC)指标上最优,其次为GEP、MEP、M5MT和GMDH;SHAP值分析揭示了水头比、闸门开度、几何形状参数对Cd的主导影响;10折交叉验证和不确定性分析验证了模型泛化能力。研究为水工结构设计提供了可操作的数学模型和物理机理解释。
本研究聚焦于 labyrinth(迷魂阵式)水闸的流量系数(Cd)建模,通过对比分析五类白盒数据驱动模型(WDDMs)在解决水力学复杂问题中的适用性。研究团队由伊朗科技大学土木工程学院的多位学者组成,其核心创新在于采用可解释性强的数据驱动方法替代传统黑箱模型,同时构建了多维度验证体系确保成果可靠性。
在方法学层面,研究突破了传统回归模型和数据驱动黑箱模型的局限。首先,选取MARS(多变量自适应回归样条)、GEP(基因表达编程)、MEP(多表达式编程)、M5MT(M5模型树)和GMDH(群体数据驱动处理法)五大白盒模型,这些方法具备两大核心优势:其一,能通过符号回归生成显式的数学表达式,如MARS的基函数组合或M5MT的决策树结构,工程师可直接理解变量间物理关系;其二,采用自适应算法和可解释的决策流程,避免深度学习模型常见的"黑箱"缺陷。这种技术路线特别适用于需要人工干预和参数调整的水工结构优化场景。
实验验证部分采用分层递进式评估体系:基础层通过10折交叉验证消除随机误差,进阶层引入外部验证数据(来自不同实验条件)检验泛化能力,最终层运用不确定性分析量化模型置信区间。具体实施中,研究团队整合了前人实验数据(包含150组样本),重点考察了水力要素(如水头H、闸门开度A、闸室宽度B)对Cd的影响机制。通过SHAP值解析和敏感性分析发现,水头H和闸门开度A的交互作用对Cd影响最为显著(贡献度达68%),这与传统水力学理论中能量损失与过流能力正相关的规律一致。
在模型性能对比方面,研究构建了多维评估框架。定量指标显示MARS模型在测试集上表现出色,其相关系数(CC)达0.9872,均方根误差(RMSE)控制在0.03以内,优于其他白盒模型。定性分析则揭示GMDH在处理非线性边界条件时具有独特优势,其生成的分段多项式表达式能有效捕捉水头变化对Cd的非线性影响。特别值得关注的是,M5MT模型通过决策树的可视化结构,直观展示了水头与开度的阈值效应,为工程调试提供了理论依据。
研究进一步建立了与传统方法的对比基准。通过与传统回归方程(由Hashem等2024年提出)的交叉验证,发现白盒模型在复杂工况下的预测精度提升约15%-20%。例如在极端水头(H>3m)条件下,传统方程的预测误差达到32%,而MARS模型通过自适应样条调节,误差降至7.8%。这种性能优势源于白盒模型对多变量耦合关系的动态建模能力,能够自适应调整各物理参数的权重分配。
在工程应用维度,研究特别强调模型的实用转化价值。生成的数学表达式均可直接嵌入Excel等计算工具,无需编程基础即可实现Cd的快速估算。例如GMDH模型输出的分段三次多项式,其形式完全符合水力学工程师的常规计算习惯。这种设计理念使研究成果能快速转化为工程实践,特别是在现场条件限制或数据采集不便的情况下,模型可提供理论支撑。
研究还深入探讨了模型的可解释性优势。通过SHAP值分解发现,当水头H超过1.2m时,闸门开度A的影响系数呈指数级增长,这与实际工程中闸门开度调整对过流能力的非线性影响高度吻合。敏感性分析进一步揭示,在闸室宽度B变化±10%的工况下,Cd的波动幅度控制在±3%以内,验证了模型参数鲁棒性。这些发现为设计规范提供了新的理论支撑,特别是在多变量耦合作用下的参数优化空间。
在技术对比方面,研究揭示了不同白盒模型的优势领域:MARS擅长处理高维非线性关系,GEP在符号回归精度上表现突出,M5MT在结构可视化方面具有独特价值。值得关注的是,GMDH模型通过自组织特征提取,成功将原始的8个输入参数简化为3个关键变量(H、A、B的比值关系),这种降维处理显著提升了计算效率,同时保持了92%以上的原始预测精度。
研究还建立了长效验证机制:除常规的K折交叉验证外,特别设计了外部验证环节,将模型应用于2018-2022年间伊朗三个不同流域的实测数据(涉及12种不同结构的水闸),验证结果显示模型预测误差在工程允许范围内(±5%)。这种多场景验证体系有效解决了传统模型验证中"数据茧房"问题,增强了成果的普适性。
最后,研究团队通过物理机制验证,发现模型生成的表达式与经典水力学理论存在内在一致性。例如,当闸门开度趋近于零时,模型预测的Cd趋近于理论极限值0.62,这与水力学基本方程吻合。这种理论衔接性为模型的工程应用提供了重要保障,避免了纯数据驱动模型可能出现的理论矛盾。
本研究为水工结构设计提供了创新方法论:一方面,通过白盒模型的可解释性优势,工程师能清晰识别各物理参数的作用路径,便于参数优化;另一方面,模型生成的显式公式突破了传统黑箱模型的操作壁垒,使理论计算与工程实践实现无缝对接。特别是在新型 labyrinth水闸的设计中,研究建立的数学模型可快速评估不同几何参数组合的效能,为结构优化提供决策支持。该成果不仅完善了水力学数据驱动建模的理论体系,更为工程实践中的参数优化和结构改进开辟了新路径。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号