湖泊建模与校准的实践探索:来自文献和行业实践的见解

《Ecological Modelling》:Navigating lake modelling and calibration: insights from literature and community practice

【字体: 时间:2026年02月15日 来源:Ecological Modelling 3.2

编辑推荐:

  过程模型校准面临数据不足、目标冲突及过拟合风险,提出五步准备法:明确建模目标、评估数据适用性、配置模型参数、预演校准及敏感性分析,强调混合迭代策略结合先验知识约束参数合理性,验证需评估模型实际效用。

  
作者:Shajar Regev、Jorrit P. Mesman、Ma. Cristina Paule-Mercado、Martin Schmid、Maud Siebers
以色列米格达尔(Migdal)的Kinneret湖沼学研究所及以色列海洋与湖沼学研究机构

摘要

校准基于过程的湖泊模型可能具有挑战性,尤其是对于新手而言。现有文献虽然丰富,但通常需要具备深厚的统计学知识,并且分散在各种模型和学科中,这使得新从业者难以获取。本文概述了建模工作流程,重点介绍了校准这一资源密集型任务。我们没有提供通用的解决方案,而是提出了一些应对常见挑战的方法,包括数据测量有限、目标冲突以及过拟合风险。基于文献、调查结果以及我们自身的经验,我们列出了五个准备步骤:明确模型目标、评估数据适用性、配置模型、进行校准准备以及执行敏感性分析。我们讨论了手动校准与自动校准的区别,强调了结合先验知识以将参数限制在合理范围内的混合迭代策略的价值。验证过程用于评估模型是否能够实现其预期目的。通过概述这些步骤和考虑因素,我们旨在减少工作量、提高建模效果,并推动湖泊模型的发展与应用。

引言

湖泊生态系统是全球环境的重要组成部分,对生物多样性有重要贡献,调节水循环,并提供支持自然和人类系统的关键生态系统服务(Lehner和D?ll,2004)。这些淡水水体为从微生物到鱼类和水生植物等多种物种提供了栖息地,从而在更大的生态网络的健康和稳定性中发挥着关键作用(Dudgeon等人,2006)。此外,湖泊在水文系统中起到缓冲作用,调节水储存、流动、分布和养分保持。它们能够提供饮用水、农业灌溉和娱乐机会等重要资源,凸显了其对人类社会和福祉的重要性(Trolle等人,2012)。然而,湖泊生态系统正面临气候变化、污染和土地利用变化的日益严重威胁,这凸显了有效管理和保护策略的迫切需求(Jenny等人,2020;Weyhenmeyer等人,2024)。
为了解决湖泊生态系统的复杂动态,湖泊模型已成为研究人员和政策制定者不可或缺的工具。这些模型模拟湖泊内部的物理、化学和生物过程(Janssen等人,2015),具有多重目的:(i)描述和理解生态系统;(ii)回溯或预测系统状态;(iii)预测情景影响;(iv)为管理提供决策支持(Kelly等人,2013;Geary等人,2020)。具体而言,湖泊模型通常旨在为水资源管理和生态系统保护提供科学依据。通过识别养分循环、温度分层和沉积物传输等关键过程,模型揭示了自然过程与人类活动之间的相互作用,从而有助于制定更有根据的政策干预措施,以保护湖泊及其周边环境(Hipsey等人,2015)。
湖泊模型通常分为经验模型和基于过程的模型(Hipsey等人,2015;Janssen等人,2015)。经验模型依赖观测数据来建立关系并预测湖泊行为,常使用统计方法分析过去趋势;而基于过程的模型则侧重于模拟控制湖泊动态的潜在机制,如物理、化学和生物过程(Hipsey等人,2015;Janssen等人,2015)。基于过程的模型使研究人员能够探索气象条件、土地利用模式和养分输入等各种因素如何相互作用,从而影响湖泊生态系统(Woolway等人,2017)。由于它们明确阐述了基于过程的关系和相互作用,因此被认为更适合于训练数据范围之外的模拟,成为有效湖泊管理的重要工具(Robson等人,2018)。然而,这些模型无法完全捕捉湖泊生态系统的全部复杂性,因此仍包含大量的经验元素,使得两种模型类型之间的界限变得模糊。最近,提出了结合基于过程模型和机器学习的混合框架(称为知识引导的机器学习,Piccolroaz等人,2024),以利用两种方法的优势。
基于过程的湖泊模型在计算能力、数据可用性和建模技术的进步推动下取得了显著进展(Janssen等人,2019a;Soares和Calijuri,2021;Piccolroaz等人,2024)。它们现在能够有效模拟湖泊内部物理、化学和生物过程的复杂相互作用,利用来自遥感、现场传感器和气象站的高分辨率数据来提高准确性和响应性(Bucak等人,2018;Lehmann和Hamilton,2019;Siebers等人,2025)。流体动力学建模的进步使得水运动、温度分层和养分传输的模拟更加精细,更有效地捕捉湖泊系统的动态特性(Mesman等人,2020;Zhou等人,2024)。模型集合越来越多地用于为单个湖泊尺度(例如Regev等人,2024;Shikhani等人,2024)和全球尺度(Golub等人,2022)的管理或气候情景模拟生成更稳健的结果。尽管取得了这些进展,但即使对于经验丰富的研究人员来说,指导湖泊建模项目仍然具有挑战性。这些挑战涉及从定义模型目标到数据和参数不确定性等一系列科学问题,以及项目管理方面的问题,包括规划阶段和做出关键决策以有效应对所涉及的科学复杂性(Sun等人,2026)。
模型校准在提高代表现实世界系统的模型性能方面起着关键作用,这些系统涵盖从工程学到生态系统科学等多个学科。在湖泊建模中,校准通常是建模工作流程中资源最密集和技术要求最高的阶段(Hill和Tiedeman,2007a;Sun和Sun,2015)。基于过程的模型通常包含数十到数百个参数,其中许多参数因湖泊而异,无法直接测量,因此必须进行估算。这些参数代表了各种物理、化学和生物过程及其相互作用,增加了系统的复杂性。由于这些相互作用,建模者必须同时校准至少几个参数。参数的同时校准正是校准的难点所在,因为参数数量增加时,可能的参数值组合呈指数级增长(Xia和Shoemaker,2022)。虽然手动校准由于需要细致的理解而常被视为一种“艺术”,但对于参数数量较少的情况来说是可行的,但当可能组合的数量随参数数量增加而急剧增加时,手动校准变得不切实际(Gupta等人,1999)。因此,自动校准方法成为首选,允许系统性和高效地探索庞大的参数空间。然而,这些方法仍然是一项计算要求较高的任务,并存在将参数值扩展到不现实范围或组合的风险,可能会削弱模型的基于过程的本质。鉴于校准的核心作用,湖泊建模者可以从更广泛的建模文献中借鉴方法论进展(例如Kennedy和O’Hagan,2001;Berger等人,2011;Vliet等人,2016;Nanda和Kirschner,2023;Sung,2024)。
开始建模项目的研究人员往往面临如何进行下去的不确定性,需要在众多研究团队使用的方法中寻找方向。关于模型设置和校准有许多指南可供参考(例如Jackson等人,2000;Hill和Tiedeman,2007b;Sun和Sun,2015;Mai,2023;Jakeman等人,2024),但这些指南通常是针对经验丰富的建模者和高级方法的。此外,模型设置和校准的一些关键步骤具有学科特定性,因此一个学科的指南可能只能部分适用于另一个学科。在这里,我们特别针对新用户提供建模指导,特别是水生生态系统建模,并概述了基于过程的湖泊生态系统建模中的常见挑战。我们的主要关注点是校准这一通常耗时且资源密集的步骤。我们提出了实用的建议,旨在减少工作量并提高结果,从而支持更广泛的科学界推进湖泊模型的发展与应用,并采用良好的建模实践(Jakeman等人,2024)。
本文的结构如下:第2节简要介绍了所使用的方法。第3节概述了湖泊建模项目的典型阶段。该节还包含一个“定义框”,以帮助理解全文中使用的术语。第4节深入探讨了模型校准,首先介绍了五个准备步骤,然后在第5节中介绍了不同的校准方法。最后,第6节总结了全文。

方法

本文提出的指南基于三个来源:一项调查、文献综述以及作者自身的建模经验。

湖泊建模项目的典型阶段

Jakeman等人(2024)提供了建模项目阶段的全面概述;本节总结了这些阶段在湖泊建模中的典型应用(图1)。在确定了建模目的(例如浮游植物群落的气候模拟)之后,下一步是选择适合该目的的模型或以某种方式相互作用的多个模型。模型选择取决于模型模拟变量、过程和时间的能力。

模型目标及其影响

模型目标可能在模型选择阶段就已经确定,但在设置和校准模型之前应重新审视。根据预期应用的不同,校准工作量可能会有很大差异,从宽泛探索性问题的最小或无需校准到针对特定湖泊详细生态动态的广泛校准不等。预期应用直接影响模型的组成和复杂性。

校准指南

完成这五个初步步骤后,可以开始校准阶段——通常是建模过程中最耗时的阶段。校准方法因建模项目的性质以及研究人员的经验和偏好而异。由于没有唯一正确的方法,本节不规定固定的操作步骤。相反,我们提出了一系列与校准相关的考虑因素,这些考虑因素基于调查结果

总结

湖泊建模项目的范围和复杂性各不相同,对于该领域的新手来说,校准过程可能会感到令人生畏。在本文中,我们概述了整个建模工作流程,重点介绍了校准这一资源最密集的阶段。只有少数参数的简单模型通常仅通过手动或自动方式进行校准。相比之下,复杂模型通常需要结合自动化程序和专家指导的手动细化的迭代混合策略。

生成式AI使用声明

在准备这项工作时,图1和图2的概念生成使用了Napkin AI。某些段落的表述通过ChatGPT和Microsoft Copilot进行了改进。使用这些工具后,作者根据需要进行审查和编辑,并对发表文章的内容负全责。

软件和/或数据可用性

本研究回顾了各种模型的校准,但并未直接使用任何模型,因此软件可用性不适用。调查结果仅以汇总形式呈现。

CRediT作者贡献声明

Shajar Regev:写作——审阅与编辑、撰写初稿、可视化、监督、项目管理、方法论、正式分析、数据管理、概念化。Jorrit P. Mesman:写作——审阅与编辑、撰写初稿、可视化、方法论、正式分析、数据管理、概念化。Ma. Cristina Paule-Mercado:写作——审阅与编辑、撰写初稿、可视化、方法论、正式分析、数据管理、概念化。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号