《Journal of Hydrology》:A multi-objective simulation-optimisation model for managing saltwater intrusion in a coastal aquifer of the Pacific Island of Vanuatu
编辑推荐:
为解决太平洋岛国滨海含水层面临的气候变化、自然灾害和人类活动导致的海水入侵(SWI)威胁,研究人员针对瓦努阿图塔加比含水层,开发了集成数值模拟、机器学习替代模型与多目标优化的盐咸水入侵管理模型。研究利用SEAWAT构建三维数值模型,并训练十二种机器学习替代模型,集成最优的五种模型与CEMOGA优化算法,形成了模拟优化(S-O)管理框架。结果显示,集成替代模型的预测精度在复杂数值模型的7%误差范围内,并为管理决策提供了Pareto最优解集。该研究首次在瓦努阿图应用集成替代模型和S-O管理模型,证明了其在全球滨海含水层SWI管理中的适用性,可为决策者制定有效的地下水使用政策提供科学依据。
想象一下,你生活在一个被湛蓝海水环绕的美丽岛屿上,日常饮用水却可能变得越来越咸。这不是科幻场景,而是许多太平洋岛国(PICs)正在面临的严峻现实——海水入侵(Saltwater Intrusion, SWI)。在气候变化的背景下,海平面上升、极端天气事件频发,加上人类对地下水资源的过度开采,使得滨海含水层中的淡水与海水之间的脆弱平衡被打破,咸水不断向内陆推进,威胁着宝贵的淡水资源。位于南太平洋的岛国瓦努阿图便是其中之一,其首都维拉港的主要水源地——塔加比(Tagabe)滨海含水层,正承受着SWI的巨大压力。如何科学、高效地管理这一复杂且动态的入侵过程,在保障供水需求的同时控制海水入侵,成为一个紧迫而棘手的多目标管理难题。
传统上,管理SWI可以依靠调整开采策略、建造物理隔水墙或利用水力屏障(如注水井、截流井)等方法。然而,这些方法或成本高昂,或效果短暂,或面临咸水处置难题。更为核心的挑战在于,管理者往往需要在多个相互冲突的目标间做出权衡:既要最大化生产井的开采量以满足用水需求,又要最小化屏障井的抽水量以降低成本和处置难度,同时还需将含水层中关键位置的盐度浓度控制在安全阈值以内。这种多目标优化问题,通常需要借助模拟优化(Simulation-Optimisation, S-O)技术来解决。然而,将描述地下水流动和溶质运移的复杂三维数值模拟模型直接与优化算法耦合,计算成本极其高昂,一次求解可能耗时数月,难以应用于实际管理决策。
为了破解这一瓶颈,一项发表在《Journal of Hydrology》上的研究提出了一种创新的多目标模拟优化管理框架。该研究以瓦努阿图塔加比滨海含水层为案例,巧妙地融合了数值模拟、多种机器学习(Machine Learning)替代模型(Surrogate Models)、集成学习(Ensemble Learning)以及先进的多目标遗传算法,旨在为类似岛屿含水层的SWI管理提供一个高效、精准且实用的决策支持工具。
研究人员首先利用SEAWAT(一种耦合了MODFLOW和MT3DMS的变密度地下水流与溶质运移模拟代码)构建了塔加比含水层的三维数值模型,并利用有限的现场监测数据(2019-2021年的电导率和开采量数据)对模型进行了校准和验证。这个经过校准的数值模型被用来模拟不同开采情景下含水层的响应。研究人员定义了包含8口生产井和6口屏障井、模拟期为5年的决策空间,并采用Halton序列生成了130组时空随机开采方案(输入模式),运行数值模型后获取了四个监测位置(ML1, ML2, ML3, ML4)的盐度浓度(输出模式),从而形成了用于训练机器学习模型的数据集。
一个关键创新在于,研究没有使用海量数据,而是仅用这130组有限的输入-输出数据集,来训练和测试多达12种不同的机器学习模型,以构建能够快速、准确预测盐度浓度的替代模型。这些模型涵盖了广泛的机器学习算法,包括:
- •
人工神经网络(Artificial Neural Network, ANN)
- •
支持向量回归(Support Vector Regression, SVR)
- •
遗传编程(Genetic Programming, GP)
- •
多元自适应回归样条(Multivariate Adaptive Regression Splines, MARS),包括分段线性(MARS-L)和分段三次样条(MARS-C)版本
- •
概率线性回归(Probabilistic Linear Regression, PLR)
- •
随机森林回归(Random Forest Regression, RFR)
- •
数据处理分组方法(Group Method of Data Handling, GMDH)
- •
长短期记忆网络(Long Short-Term Memory, LSTM)和双向长短期记忆网络(Bi-directional LSTM, Bi-LSTM)
- •
自适应神经模糊推理系统(Adaptive Neuro-Fuzzy Inference System, ANFIS)
- •
异步连续减半算法调优的自动模型选择(Asynchronous Successive Halving Algorithm tuned Automatic Model Selection, AMS-AHSA)
- •
贝叶斯优化调优的自动模型选择(Bayesian Optimisation tuned Automatic Model Selection, AMS-B)
为了从这些模型中选出最优的预测器,研究采用了基于香农熵(Shannon's entropy)的决策理论,对每个监测位置的12个模型进行综合性能评估和排序。随后,选取每个位置排名前五的替代模型,通过加权平均的方式构建了四个集成模型(每个监测位置一个)。性能评估表明,这些集成模型在大多数监测位置上的预测精度(通过皮尔逊系数R、一致性指数IoA、Kling-Gupta效率系数KGE、Nash-Sutcliffe效率系数NSE等指标衡量)显著优于单个替代模型,并且它们对盐度浓度的预测结果与复杂的SEAWAT数值模型结果之间的误差在7%以内,验证了其作为高精度、高效率模拟器的可靠性。
研究的最终步骤是将训练好的集成替代模型与优化算法进行耦合,构建完整的S-O管理模型。研究采用受控精英多目标遗传算法(Controlled Elitist Multiple Objective Genetic Algorithm, CEMOGA)作为优化引擎。管理模型被形式化为一个双目标优化问题:目标一是最大化整个管理期内所有生产井的总开采量;目标二是最小化所有屏障井的总抽水量。优化过程需要满足的约束条件包括:由集成替代模型预测的、各监测位置在管理期末的盐度浓度不得超过预设的最大允许值;同时,每口井的开采量需在其技术可行的上下限范围内。通过运行这个S-O模型,可以获得一系列Pareto最优解,即“非支配解集”。这些解代表了在给定盐度约束下,生产井开采量和屏障井抽水量之间所有可能的最佳权衡方案,为水资源管理者提供了清晰的决策空间。
主要研究结果揭示的结论如下:
- 1.
数值模型情景分析:基于SEAWAT的数值模拟表明,在现有开采模式下,塔加比含水层的SWI将持续加剧。增加生产井开采(模拟人口增长)会显著加速海水入侵。而增设屏障井,或结合使用屏障井与注水井构成水力屏障,则可以有效遏制海水向内陆的推进。海平面上升(研究模拟了20年内上升25厘米的情景)也会加剧SWI,但影响程度相对小于开采增加的情景。这凸显了采取主动管理措施的必要性。
- 2.
替代与集成模型性能:使用有限数据集训练的多种机器学习替代模型,在预测盐度浓度上表现出了差异。通过香农熵决策理论筛选出的Top 5模型构建的加权平均集成模型,在各个监测位置(ML1, ML2, ML4)的预测精度普遍优于最好的单个模型,证明了集成策略在提升预测鲁棒性和准确性方面的优势。尤其是在ML2位置,集成模型的预测性能指标(R=0.946, IoA=0.950, KGE=0.753, NSE=0.848)表现优异。
- 3.
模拟优化管理方案:将集成替代模型与CEMOGA耦合后,成功生成了用于管理塔加比含水层SWI的Pareto最优前沿。这个前沿清晰地展示了生产井总开采量与屏障井总抽水量之间此消彼长的权衡关系。决策者可以根据实际的水资源需求、经济成本(如咸水处理成本)和环境容忍度,从这个解集中选择最合适的管理方案。例如,可以选择一个在允许盐度略有升高的情况下大幅增加淡水开采的方案,或者选择一个需要增加屏障井抽水以更严格控制盐度的方案。
研究结论与意义:本研究成功开发并验证了一个针对太平洋岛国滨海含水层的、基于机器学习集成替代模型的多目标模拟优化管理框架。该框架的创新性在于:首次在瓦努阿图这样的数据稀缺地区,系统性地训练和评估了大量机器学习模型作为SWI模拟的替代品;首次将香农熵决策理论应用于SWI预测中替代模型和集成模型的选择;首次利用CEMOGA算法为该地区生成SWI管理的Pareto最优策略。更重要的是,研究证明了即使使用有限的训练数据集,也能构建出高精度的集成替代模型,这大大降低了S-O模型的计算负担,使其能够用于快速的方案比选和实时决策支持。
这项研究的成果具有全球意义。它为全球众多面临SWI威胁的滨海和岛屿含水层提供了一套可移植、高效且稳健的管理建模方法论。所构建的管理模型能够为政策制定者、水资源工程师和规划者提供量化的科学依据,帮助他们在水资源可持续利用、基础设施建设投资和气候变化适应性规划等方面做出更明智的决策,从而保障脆弱地区的饮水安全和生态安全。