融合水文地球化学诊断、反向模拟与可解释机器学习预测中国西南榆林河流域饮用水水质

《Journal of Hydrology: Regional Studies》:Integrating hydrogeochemical diagnostics, inverse modeling, and explainable machine learning to predict drinking water quality in the Yulin river basin, southwestern China

【字体: 时间:2026年05月22日 来源:Journal of Hydrology: Regional Studies 4.7

编辑推荐:

  研究人员针对中国重庆市榆林河流域地下水化学演化及饮用水水质指数(DWQI)变化的驱动机制尚未充分约束的问题,整合了水文地球化学诊断、PHREEQC反向地球化学模拟,以及基于层次分析法(AHP)与熵权法(EWM)结合灵敏度分析的DWQI评估体系,并引入线性回归与

  
研究人员针对中国重庆市榆林河流域地下水化学演化及饮用水水质指数(DWQI)变化的驱动机制尚未充分约束的问题,整合了水文地球化学诊断、PHREEQC反向地球化学模拟,以及基于层次分析法(AHP)与熵权法(EWM)结合灵敏度分析的DWQI评估体系,并引入线性回归与多种非线性模型(CatBoost、随机森林(RF)、支持向量机(SVM)、XGBoost)预测DWQI,比较模型性能并揭示该指数的线性特征。结果表明,地下水化学主要受水-岩相互作用控制,多数样品位于岩石风化场并沿碳酸盐-硅酸盐混合趋势分布,表明碳酸盐溶解占主导,硅酸盐风化次之,蒸发岩溶解作用微弱。阳离子交换广泛存在(93.8%)。DWQI范围为4.453~273.622(均值78.715),整体以优-良为主,但COD、Fe、Mn、F?、NO3?存在超标现象,反映局部人为影响。复合权重与灵敏度分析一致显示NO3?、Mn、F?为DWQI变化的主要贡献因子。线性回归预测性能最佳(R2=0.999,RMSE=0.004,MAE=0.001),CatBoost在非线性模型中表现最优。SHAP分析表明Mn是最重要预测因子(平均SHAP=15.95~25.28),其次为Fe和F?,pH、总硬度(TH)、SO42?贡献较小。复合权重、灵敏度指数与SHAP排序的一致性支持将Mn、Fe、F?及局部NO3?作为监测与治理优先对象,为区域地下水管理与饮用水保护提供依据。
榆林河流域位于重庆市渝北区东部,属长江与嘉陵江支流区,受快速城市化与人类活动影响显著。地下水作为全球淡水资源的重要组成部分,其隐蔽性和滞后性使得一旦污染便难以修复,对农业灌溉、城市供水及生态系统稳定构成风险。当前,饮用水水质评价多采用水质指数(WQI),但权重设置易受主观偏差或数据驱动掩盖健康风险的影响。同时,复杂的水文地球化学过程与非线性耦合关系增加了水质预测难度。联合国可持续发展目标(SDGs)中强调水质管理的重要性,但技术资源限制使得高效预测体系的建立仍具挑战。因此,研究人员在该流域开展了地下水水质演化机制识别与饮用水水质指数预测的综合研究,成果发表于《Journal of Hydrology: Regional Studies》。
研究人员采用了若干关键技术方法:在干季采集49组地下水监测井样本,涵盖pH、总溶解固体(TDS)、总硬度(TH)、主要阴阳离子及微量金属等指标;结合水文地球化学图解(Gibbs图、Gaillardet图)、饱和指数(SI)计算与PHREEQC反向模拟量化矿物溶解-沉淀及阳离子交换过程;采用层次分析法(AHP)与熵权法(EWM)构建复合权重,计算饮用水水质指数(DWQI);并利用线性回归(LR)、CatBoost、随机森林(RF)、支持向量机(SVM)、XGBoost五种模型预测DWQI,辅以SHAP可解释性分析与灵敏度分析。
水文地球化学分析结果
统计显示地下水呈弱碱性(均值pH=7.84),TDS均值为453.22 mg/L,主要离子顺序为Ca2+>Na+>Mg2+>K+和HCO3?>SO42?>Cl?>NO3?>F?。COD、Fe、Mn超标率分别为26.5%、55.1%、59.2%,F?与NO3?亦存在局部超标。空间分布显示,Ca2+、HCO3?富集于背斜轴部,反映碳酸盐岩溶解;Na+、Cl?、COD高值集中于城市居住区,NO3?高值则对应农田区,显示农业与城市活动的双重影响。
饮用水水质评估与灵敏度分析
DWQI分为五级:优(0~25)、良(25~50)、中等(50~100)、差(100~200)、极差(>200)。大多数样品属优-良级别,均值78.715。复合权重与灵敏度分析均表明NO3?、Mn、F?对DWQI变化贡献最大,分别为29.82%、26.20%、24.06%。
水质预测模型构建与性能
线性回归因DWQI为输入变量的加权线性组合而表现最佳(R2=0.999,RMSE=0.004,MAE=0.001)。非线性模型中CatBoost最优(R2=0.998,RMSE=1.485,MAE=0.739),RF与SVM表现中等,XGBoost最弱。SHAP分析进一步验证Mn、Fe、F?为关键驱动因子,pH、TH、SO42?贡献较小。
讨论与结论
研究认为地下水化学演化主要受碳酸盐岩溶解控制,伴随硅酸盐风化与广泛的阳离子交换;局部人为活动导致Fe、Mn、NO3?、F?超标。DWQI预测的优异线性表现源于其构造方式,而非数据中存在强非线性。复合权重、灵敏度分析与SHAP结果的一致性提高了优先管控因子的可信度。研究人员建议将Mn、Fe、F?及局部NO3?作为监测与治理重点,以提升区域饮用水安全保障水平。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号