水资源的可持续管理已成为全球性的重大挑战,尤其是在水文变化和人为压力加剧的半干旱和干旱地区(Salem, Pudza, 和 Yihdego 2022)。水坝和水库在水资源调节、饮用水供应、农业灌溉和水电发电中发挥着核心作用(Schmitt 和 Rosa 2024)。然而,这些基础设施正受到沉积物输入、富含营养物质的农业径流、生活污水和工业排放以及气候驱动的季节性变化等因素导致的水质退化的严重影响(Pamidimukkala 等,2021;Anh 等,2023)。
土地利用变化和人类活动的扩大进一步加剧了这些压力。最新研究表明,城市化、农业集约化和地质条件显著影响了地表水和地下水的质量,尤其是在干旱和半干旱环境中(Gad 和 El Osta, 2020;Al-Mashreki 等,2023;Nagarathinam 等,2024)。类似的环境破坏也发生在受基础设施开发和侵蚀过程影响的脆弱生态系统中,导致水文制度和污染物传输路径发生变化(Gao 等,2024;Zhao 等,2025;Mondal, Alshehri 等,2025;Mondal, Jha 等,2025)。这些累积的压力直接影响了水生系统的生态、经济和社会功能,凸显了在脆弱地区实施可持续水资源管理的紧迫性。
位于摩洛哥Tadla-Azilal地区的Bin El Ouidane水坝是一项重要的基础设施,支持灌溉、水电生产和水生生态系统(Ouhakki, Zerraf, 和 El Mejdoub 2024)。然而,该水库正面临日益严重的环境压力,包括沉积物逐渐积累、营养物质富集以及物理化学和微生物参数的季节性波动(Ait M’Barek 等,2024)。这些过程促进了富营养化、氧气耗竭和病原体增殖,从而威胁到水质的可用性和生态系统的稳定性(Sherif 等,2023)。
在如此复杂的系统中评估和监测水质需要综合性和多维度的方法(Sitzenfrei 2021)。传统的评估方法,包括水质指数(WQI)和常规统计分析,已被广泛用于提供综合指标和识别总体趋势(Uddin, Nash, 和 Olbert 2021)。最近的一些研究结合了WQI、多元统计和地球化学方法来评估水质适宜性和污染风险(El Osta 等,2022;Al-Mashreki 等,2023;Gad 等,2023)。最新研究还强调了结合水质指数和可持续性指标的综合性评估框架在环境管理中的重要性(Mondal, De 等,2024;Mondal, Hossain 等,2024)。尽管这些方法对区域监测仍有用,但由于固定的权重方案和基于阈值的公式,它们可能简化了复杂的水化学相互作用(Gad 等,2024)。此外,经典统计模型往往难以捕捉环境变量之间的非线性关系和多变量依赖性。
近年来,机器学习(ML)技术作为强大的工具出现,能够通过建模复杂关系、识别隐藏模式和提高预测性能来克服这些局限性(Huang 等,2021;Shu 和 Ye,2023)。最新研究表明,混合和集成机器学习模型可以显著提高复杂环境系统中水质预测的准确性和可解释性(Bar 等,2023)。此外,还有研究强调了将ML与遥感和可持续性指标相结合,以增强空间评估和管理决策支持(Karmakar 等,2024)。
最近的应用表明,结合机器学习、遥感和GIS框架的方法在预测水质指数和支持可持续水资源管理方面具有巨大潜力(Mondal 等,2021;Karmakar 等,2024;Hfaiedh, Gaagai, Moussa 等,2025;Eid 等,2025)。最近的综述和书籍章节进一步强调了人工智能和混合建模在改善环境监测和决策过程中的作用(Mondal 等,2021;2022)。综合监督学习、聚类和混合方法的全面评估进一步展示了ML在水质分类和风险评估方面的潜力(Lap 等,2023;Gad 等,2024;Hfaiedh, Gaagai, Petitta 等,2025)。尽管取得了这些进展,但在半干旱地区将此类方法应用于水库系统方面仍存在重要的知识空白。特别是,大多数现有研究集中在河流和地下水系统上,而针对半干旱地区(尤其是北非)的水库水质的集成机器学习评估仍然相对较少。
在此背景下,本研究提出了一个综合框架,用于评估Bin El Ouidane水坝的水质,结合了季节性现场调查、物理化学和微生物分析、多元统计以及机器学习技术。主成分分析(PCA)用于探索变化结构,而监督学习算法(包括随机森林和决策树模型)用于识别关键参数并分类水质状况。
本研究的主要目标是:(i)描述水质的季节性和多变量动态;(ii)识别主要污染源;(iii)评估机器学习在操作分类和管理支持方面的附加价值。因此,本研究提出了以下研究问题:统计和机器学习模型能否改善半干旱水坝水库的水质季节性评估和预测分类?