摩洛哥Bin El Ouidane大坝的水质评估:结合机器学习与多元分析方法

《Environmental Nanotechnology, Monitoring & Management》:Water quality assessment in Bin El Ouidane dam (Morocco): Integrating machine learning and multivariate analysis

【字体: 时间:2026年03月09日 来源:Environmental Nanotechnology, Monitoring & Management CS13

编辑推荐:

  半干旱地区Bin El Ouidane大坝水质研究显示夏季硝酸盐(15.99?mg/L)、铵盐(5.32?mg/L)及总大肠菌群(1.06 log CFU/100?mL)显著升高,PCA和机器学习模型(KNN 96.2%/Random Forest 89.1%)有效识别水质驱动因素,但样本量较小(84份)可能限制模型泛化。

  
Bouchra Bourhabi | Latifa Mouhir | Souad Tayane | Jaafar Gaber
摩洛哥卡萨布兰卡哈桑二世大学科学与技术学院过程工程与环境实验室

摘要

在半干旱地区,水质量的季节性变化一直是水坝水库面临的关键问题,因为这些地区的水文压力和人为压力同时存在。本研究采用结合现场测量、多元统计和机器学习算法的方法,评估了摩洛哥Bin El Ouidane水坝的水质(包括物理化学和微生物方面)。在冬季和夏季进行了两次采样,共收集了84个水样,并分析了25个环境参数。
研究结果表明,水质存在明显的季节性变化:夏季硝酸盐(最高达15.99毫克/升)、铵(5.32毫克/升)和总大肠菌群(1.06 log CFU/100毫升)的含量显著升高。主成分分析(PCA)和方差分析(ANOVA)表明,温度、电导率和营养物质负荷是影响水质的主要因素。机器学习分类器的分类性能优异(KNN:96.2%;随机森林:89.1%),能够有效预测水质并识别关键影响因素。水质指数(WQI)显示夏季水质明显下降,大多数样本被归类为“差”或“非常差”。
这些发现强调了需要制定适应季节变化的监测策略,并展示了数据驱动工具在改善水坝水库水质管理方面的价值。同时,基础回归模型的预测能力较弱,这反映了水库水质动态的复杂性;因此,基于WQI的解读应谨慎进行,因为某些参数的权重可能过大。

引言

水资源的可持续管理已成为全球性的重大挑战,尤其是在水文变化和人为压力加剧的半干旱和干旱地区(Salem, Pudza, 和 Yihdego 2022)。水坝和水库在水资源调节、饮用水供应、农业灌溉和水电发电中发挥着核心作用(Schmitt 和 Rosa 2024)。然而,这些基础设施正受到沉积物输入、富含营养物质的农业径流、生活污水和工业排放以及气候驱动的季节性变化等因素导致的水质退化的严重影响(Pamidimukkala 等,2021;Anh 等,2023)。
土地利用变化和人类活动的扩大进一步加剧了这些压力。最新研究表明,城市化、农业集约化和地质条件显著影响了地表水和地下水的质量,尤其是在干旱和半干旱环境中(Gad 和 El Osta, 2020;Al-Mashreki 等,2023;Nagarathinam 等,2024)。类似的环境破坏也发生在受基础设施开发和侵蚀过程影响的脆弱生态系统中,导致水文制度和污染物传输路径发生变化(Gao 等,2024;Zhao 等,2025;Mondal, Alshehri 等,2025;Mondal, Jha 等,2025)。这些累积的压力直接影响了水生系统的生态、经济和社会功能,凸显了在脆弱地区实施可持续水资源管理的紧迫性。
位于摩洛哥Tadla-Azilal地区的Bin El Ouidane水坝是一项重要的基础设施,支持灌溉、水电生产和水生生态系统(Ouhakki, Zerraf, 和 El Mejdoub 2024)。然而,该水库正面临日益严重的环境压力,包括沉积物逐渐积累、营养物质富集以及物理化学和微生物参数的季节性波动(Ait M’Barek 等,2024)。这些过程促进了富营养化、氧气耗竭和病原体增殖,从而威胁到水质的可用性和生态系统的稳定性(Sherif 等,2023)。
在如此复杂的系统中评估和监测水质需要综合性和多维度的方法(Sitzenfrei 2021)。传统的评估方法,包括水质指数(WQI)和常规统计分析,已被广泛用于提供综合指标和识别总体趋势(Uddin, Nash, 和 Olbert 2021)。最近的一些研究结合了WQI、多元统计和地球化学方法来评估水质适宜性和污染风险(El Osta 等,2022;Al-Mashreki 等,2023;Gad 等,2023)。最新研究还强调了结合水质指数和可持续性指标的综合性评估框架在环境管理中的重要性(Mondal, De 等,2024;Mondal, Hossain 等,2024)。尽管这些方法对区域监测仍有用,但由于固定的权重方案和基于阈值的公式,它们可能简化了复杂的水化学相互作用(Gad 等,2024)。此外,经典统计模型往往难以捕捉环境变量之间的非线性关系和多变量依赖性。
近年来,机器学习(ML)技术作为强大的工具出现,能够通过建模复杂关系、识别隐藏模式和提高预测性能来克服这些局限性(Huang 等,2021;Shu 和 Ye,2023)。最新研究表明,混合和集成机器学习模型可以显著提高复杂环境系统中水质预测的准确性和可解释性(Bar 等,2023)。此外,还有研究强调了将ML与遥感和可持续性指标相结合,以增强空间评估和管理决策支持(Karmakar 等,2024)。
最近的应用表明,结合机器学习、遥感和GIS框架的方法在预测水质指数和支持可持续水资源管理方面具有巨大潜力(Mondal 等,2021;Karmakar 等,2024;Hfaiedh, Gaagai, Moussa 等,2025;Eid 等,2025)。最近的综述和书籍章节进一步强调了人工智能和混合建模在改善环境监测和决策过程中的作用(Mondal 等,2021;2022)。综合监督学习、聚类和混合方法的全面评估进一步展示了ML在水质分类和风险评估方面的潜力(Lap 等,2023;Gad 等,2024;Hfaiedh, Gaagai, Petitta 等,2025)。尽管取得了这些进展,但在半干旱地区将此类方法应用于水库系统方面仍存在重要的知识空白。特别是,大多数现有研究集中在河流和地下水系统上,而针对半干旱地区(尤其是北非)的水库水质的集成机器学习评估仍然相对较少。
在此背景下,本研究提出了一个综合框架,用于评估Bin El Ouidane水坝的水质,结合了季节性现场调查、物理化学和微生物分析、多元统计以及机器学习技术。主成分分析(PCA)用于探索变化结构,而监督学习算法(包括随机森林和决策树模型)用于识别关键参数并分类水质状况。
本研究的主要目标是:(i)描述水质的季节性和多变量动态;(ii)识别主要污染源;(iii)评估机器学习在操作分类和管理支持方面的附加价值。因此,本研究提出了以下研究问题:统计和机器学习模型能否改善半干旱水坝水库的水质季节性评估和预测分类?

研究区域

Bin El Ouidane水坝位于摩洛哥Béni Mellal-Khénifra地区,是Oued El Abid河和Oued Assif Ahansal河交汇处的一个关键水利基础设施。其集水区面积约为6,000平方公里,地形以山地为主。气候从地中海型到半干旱型不等,年降水量在500至1,200毫米之间。
该水库的蓄水量为15亿立方米,是该地区最大的人工水体。

物理化学和微生物参数的季节性变化

表7显示了按季节划分的物理化学和微生物参数的描述性统计数据(最小值、最大值、平均值和标准差)。
研究结果表明,分析的物理化学和微生物参数存在明显的季节性变化。例如,夏季的平均温度(26.09°C)与Miyittah等人(2020)报告的温度范围(28.89至29.91°C)相当。

局限性与展望

尽管本研究提供了有价值的见解,但仍需承认一些局限性。
首先,样本量相对较小(84个样本),这对机器学习应用构成了限制,可能影响模型的泛化能力。尽管采用了交叉验证来降低过拟合的风险,但未来的研究应依赖更大的多季节和多年数据集,以提高模型的稳健性并进行独立的外部验证。
其次,

总体结论

本研究提出了一种综合框架,通过结合物理化学和微生物分析、多元统计以及机器学习技术来评估Bin El Ouidane水坝的水质。研究结果表明,夏季水质显著恶化,硝酸盐(最高达15.99毫克/升)、铵(5.32毫克/升)和总大肠菌群(1.06 log CFU/100毫升)的含量升高,反映了多种因素的共同影响。

未引用的参考文献

ADAMU, MUSTAPHA, 2012; M’Barek 等, 2024; Anastasopoulos 和 Christos, 2025; Reskinah 和 D, Marhawati Najib, 以及 Muhammad Ashdaq, 2025; Chedadi 等, 2023; Dwivedi 和 Rakhi, 以及 Prof. Abha Dubey, 2023; Hfaiedh 等, 2025a; Hfaiedh 等, 2025b; Kang 等, 2025; Albaggar 和 Ali, 2021; Mondal 等, 2025a; Mondal 等, 2024a; Mondal 等, 2024b; Mondal 等, 2025b; Mondal 等, 2022; Schmitt 和 Pablo, 以及 Lorenzo Rosa, 2024; Uddin 等, 2021; Zohud 等, 2023.

CRediT作者贡献声明

Bouchra Bourhabi:撰写——审稿与编辑;撰写——初稿;方法论;数据整理。
Latifa Mouhir:可视化;验证;方法论。
Souad Tayane:可视化;验证;方法论。
Jaafar Gaber:可视化;验证;方法论。

利益冲突声明

作者声明他们没有已知的利益冲突或个人关系可能影响本文所述的工作。

致谢

作者感谢所有为这项研究的成功做出贡献的人士和机构,特别是他们在技术、科学和后勤方面的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号