准确的短期流量预测对于有效的洪水管理至关重要,能够及时准备和响应,以减轻突发洪水事件和强降雨的影响[4,7,33,34,36,53,54]。然而,现有预测模型的有效性往往受到其对高质量数据、复杂结构和特定参数依赖的限制,导致预测性能、鲁棒性和可转移性的不确定性增加。这种不确定性经常被忽视,尤其是在使用不同的输入变量或将模型应用于具有不同水文条件的地区时。此外,这些模型的复杂性和数据依赖性可能导致性能不一致,尤其是在预测范围延长时。这些局限性突显了需要开发不仅使用精确时间步长,还结合全面评估和优化预测因子的流量预测模型的迫切需求,以提高其在不同水文场景下的可靠性和泛化能力。
除了基于物理的模型(通常涉及大量变量)外,机器学习模型由于其灵活性、速度和更高的准确性潜力而在流量预测中越来越受欢迎[20,38,57]。然而,这些数据驱动的模型存在显著的限制,包括它们依赖于通常难以获取和维护的大型数据集,以及可解释性有限,这使得研究人员和从业者难以完全理解和信任它们的预测[44]。因此,已经开发了各种数据驱动的模型,如自回归积分移动平均、支持向量回归(SVR)、k最近邻回归(KNR)、多层感知器(MLP)、卷积神经网络(CNN)、混合模型和梯度提升(GB),以提高准确性[8,11,14,15,30,43,48,51,52,59,60,62]。尽管取得了这些进展,但在不同水文条件和地理区域推广这些模型仍然存在挑战,它们的复杂性可能会阻碍实时预测的实际应用。
鉴于这些限制,混合模型在流量预测中变得越来越重要,因为结合多种建模技术可以帮助克服单一模型的缺点并提高预测准确性[39]。通过结合不同方法的优点,混合模型能够更全面地表示复杂的水文过程并增强特征提取。例如,变分模态分解和改进的完全集成经验模态分解结合自适应噪声已被证明可以产生更精确的子序列,从而提高预测准确性[54]。此外,优化算法在调整模型超参数方面发挥着关键作用,以适应混合模型组件的多样化特性。包括粒子群优化(PSO)和灰狼优化(GWO)在内的优化算法已成功应用于选择最佳输入滞后和超参数,从而提高了预测性能[32,55]。
当与机器学习技术结合时,优化算法在提高流量预测性能方面显示出强大的潜力。Jia等人[28]强调了蚁群优化和GWO在通过优化包括决策树、SVR和长短期记忆在内的机器学习方法组合来提高预测准确性方面的有效性。同样,Martinho等人[35]展示了受生物启发的算法(如PSO)在为极端梯度提升等模型选择最佳超参数方面的成功,从而提高了短期多步预测性能。然而,优化算法的有效性通常高度依赖于问题背景和参数配置,这在复杂的高维空间中可能计算密集且具有挑战性。这些局限性突显了需要具有改进收敛效率、降低计算成本和更高鲁棒性的优化算法。最近开发的受生物启发的优化算法,如HBA和ARO,旨在提高收敛速度,平衡探索和利用,并减少复杂高维优化问题中的过早收敛风险[26,55]。这些特性对于需要快速模型更新和计算效率的短期每小时流量预测尤为重要。因此,本研究通过将两种新的受生物启发的优化方法HBA和ARO与MLP和GB模型相结合,引入了创新的混合流量预测模型,用于每小时多步预测。本研究旨在解决以下研究问题:
–在流量预测中使用混合模型有哪些潜在的好处和挑战?
–优化方法(如HBA和ARO)如何提高流量预测模型的准确性和效率?
–不同的输入配置如何影响流量预测模型的性能,这对它们的广泛应用有何影响?
–所提出的模型与NWM预测相比表现如何?
尽管许多研究人员关注美国的流量预测,但据我们所知,这是首次尝试将新颖的HBA和ARO技术应用于优化MLP和GB模型,以实现多个短期预测范围(1-6小时)的每小时流量预测。我们关注MLP和GB模型,因为它们在流量预测方面具有独特的优势。MLP与元启发式算法结合使用时表现出色[28],而GB在流量预测和气候影响分析中已被证明优于几种机器学习和统计方法[9,29]。为了确定最佳预测因子组合并超越现有方法提高预测能力,使用了不同的降水量、温度、风速和流量数据组合开发了五种模型配置(M1-M5)。基础配置(M1和M2)仅包括基本输入,而升级配置(M3-M5)则纳入了额外的变量,以评估扩展输入信息带来的性能提升。
近年来,国家水模型(NWM)在美国广泛用于流量预测,利用基于物理的方法来预测水文过程[1,10,19,47]。虽然NWM在国家层面提供了有价值的预测,但其性能可能受到局部水文条件复杂性和变化性的限制,特别是在极端天气事件期间。该模型倾向于高估实际径流,表明需要改进以提高准确性,特别是在捕捉局部水文动态方面[25]。在这项研究中,包括了国家水模型的预测结果,以便与所提出的基于机器学习的模型进行比较,从而评估Chehalis流域内相对的短期流量预测性能。
本文的其余部分组织如下:第2节概述了方法论,并指定了算法和性能指标。第3节描述了模型开发和案例研究。第4节和第5节展示了结果并进行了讨论。第6节总结了我们的研究贡献。