机器学习在青藏高原南部雅鲁藏布江水质适宜性评估中的应用

《Environmental Research》:Machine learning driving water suitability assessment of the Yarlungzangbo River, southern Tibetan Plateau

【字体: 时间:2026年02月07日 来源:Environmental Research 7.7

编辑推荐:

  雅鲁藏布江表面水质量评估采用自然背景水平与新型灌溉、饮用水质量指数结合机器学习模型,发现中游人类活动对水质影响显著,CNN模型预测精度最优(DWQI R2=0.9993)。

  
展谢|袁星成|姚荣文|Md Galal Uddin|王颖|王阳双|徐中原|张云辉
中国西南交通大学地球科学与工程学院,成都611756

摘要

地表水的可获取性使其容易受到污染,尤其是在环境敏感性和生态脆弱性较高的高山河流中。雅鲁藏布江(YR)是青藏高原南部最大的区域流域。随着近年来人类活动的增加,河流水质问题变得日益重要,需要加以研究。本研究利用自然背景水平(NBLs)、新型水质指数和机器学习方法全面评估了高山地表水的适宜性。NBLs的结果表明,各水化学指标的差异既受自然过程影响,也受人类活动影响。新型灌溉水质指数(IWQI)显示,上游(UR)64%、中游(MR)85%、下游(LR)48%的地表水适合用于农业灌溉。值得注意的是,Na+浓度对IWQI的影响最大(UR为7.82%,LR为10.01%)。而在中游(MR),钠吸附比(Sodium Adsorption Ratio)是主要影响因素,占IWQI的4.53%。新型饮用水质指数(DWQI)表明,95%的样本适合饮用。NO3?浓度是决定UR(9.63%)、MR(8.25%)、LR(8.96%)水质的最重要因素。在四种机器学习模型中,卷积神经网络(CNN)在预测YR流域的IWQI(R2=0.9358)和DWQI(R2=0.9993)方面表现最佳。研究结果表明,人为活动对中游(MR)的水质恶化有显著影响。这项研究为青藏高原(亚洲水塔)的水资源管理提供了宝贵的信息。

引言

地表水占全球淡水资源的三分之二(Han等人,2023年;Xiao等人,2022年),对人类生存和生态平衡至关重要(Liu和Guo,2023年;Yang等人,2023年)。然而,地表水的可管理性和可获取性使其容易受到污染,导致水资源短缺和质量下降(Rahaman等人,2024年;Uddin等人,2021年;Uddin等人,2022年)。位于中国西南部的青藏高原被誉为“亚洲水塔”,拥有超过5×109立方米的水资源,是长江、黄河、印度河和雅鲁藏布江等河流的源头(Tan等人,2021a)。青藏高原独特的自然环境和地理位置使其成为一个生态脆弱的高山地区(Huang等人,2026a;Yuan等人,2025年;Wang等人,2022年)。近年来,人口增长加剧了该地区水资源的利用,从而增加了生态和环境压力。对水资源需求的增加使得水资源安全面临不确定性,对该地区的长期可持续性构成明显威胁(Huang等人,2026b;Yu等人,2022年;Zhao等人,2024年)。鉴于这些挑战,准确评估地表水的适宜性在青藏高原及其他高山地区变得至关重要(Li等人,2020年)。
自然背景水平(NBLs)表示在没有显著人为影响的情况下水体中水化学成分的自然水平(Yao等人,2024年;Zhang等人,2024b)。NBLs被广泛用于判断地下水化学是否受到人类活动污染(Li等人,2021年;Zhang等人,2024b)。然而,由于地表水的脆弱性,关注其NBLs尤为重要。特别是在河流流域中,应用NBLs可以清晰地描绘不同河段的水化学特征。基于NBLs制定的阈值(TVs)进一步揭示了各种用途的水风险(Devi等人,2021年)。因此,获取NBLs和TVs的结果比水化学参数的离子图更有效地识别污染。
基于专家和科学指导,已经建立了许多评估地表水质量的标准(Yan等人,2022a;Yang等人,2025年)。水质指数(WQI)被证明非常有效且具有说明性(Goswami和Rai,2025年;Uddin等人,2023a;Yang等人,2023年)。它将各种水质监测参数转化为一个综合数值,准确反映水体的整体状况(Akhtar等人,2021年;Mukherjee等人,2022年;Susmita和Kumar,2023年;Uddin等人,2022年)。WQI的构建包括四个阶段:水质参数选择、质量函数确定、指数聚合和敏感性分析(Akhtar等人,2021年;Goswami和Rai,2023年;Uddin等人,2022年)。然而,这些方法存在一些局限性,如模型偏置、模糊性、不确定性等(Uddin等人,2021年;Uddin等人,2023b)。特别是在质量函数确定阶段,依赖单一算法可能无法获得可靠和精确的WQI结果(Yan等人,2022a;Zhang等人,2021b)。为了解决这个问题,结合熵加权和因子分析方法为处理包含水化学参数的大型数据集提供了创新视角(Han等人,2023年;Tang等人,2023年;Zhang等人,2021b)。这种新颖的结合方法可以识别影响观测参数的共同因素,同时消除主观不确定性(Islam等人,2020年;Zeng等人,2023年;Zhang等人,2021a)。因此,应将这种新颖且优化的方法应用于地表水质量的适宜性评估。
然而,传统的水质评估方法仍存在一些不可避免的缺点,包括水质计算权重的复杂性、新型水质模型的不确定性以及构建地表水适宜性评估框架的耗时性(Singha等人,2021年;Uddin等人,2023a)。为了解决这些问题,机器学习作为一种有前景且成本效益高的解决方案应运而生。水质预测的机器学习模型可分为三类:传统线性回归方法、传统机器学习方法和深度学习方法(Hao等人,2024年)。尽管传统线性回归方法简单易建模,但在噪声数据环境中的预测能力有限,因此较少用于水质预测(Wang等人,2019年)。相比之下,传统机器学习和深度学习方法在水文学领域受到了广泛关注,显示出在各种水环境中的预测效果(Uddin等人,2024年;Xia等人,2024年)。通过结合这两种方法,可以弥合水质表示方面的差距,确保更全面和准确的水质评估。
雅鲁藏布江(YR)是发源于青藏高原的主要源头河流之一。它提供了由冰川融水和降雪融水形成的径流,以及高海拔地区的降水,为中国的下游地区、印度和孟加拉国提供水源。因此,它是向南亚和东亚近20亿人供应淡水的关键河流系统组成部分(Shi等人,2021年;Wu等人,2023年)。中国“西部大开发”政策导致近年来大量人口迁移到YR流域,使得人类活动增加(Li等人,2022年;Liu等人,2021年;Tan等人,2021a)。因此,YR的水化学特征发生了显著变化,可能对水质造成潜在的环境危害(Liu和Guo,2023年;Xia等人,2022年)。在以往的研究中,许多学者致力于研究YR的水化学特征和补给来源(Han等人,2023年;Jiang等人,2015年;Wu等人,2023年)。一些研究简要概述了YR的整体水质,但未能揭示不同河段水质差异的根本原因(Huang等人,2009年;Jiang等人,2025年;Qu等人,2019年;Zhang等人,2024a)。此外,整个YR流域地表水质的变化趋势仍不清楚,阻碍了青藏高原南部的可持续水资源管理。因此,为YR流域建立成熟的地表水适宜性评估框架对于确定灌溉和饮用水质量的适宜性至关重要。
本研究的新颖之处在于首次为YR流域的每个水化学指标创建了NBLs和TVs,开发了用于灌溉和饮用水质量评估的创新算法,并基于每种新型水质指数寻找最佳预测模型。因此,本研究旨在实现以下目标:(1)确定YR流域的自然背景水平和阈值;(2)评估YR流域地表水用于家庭用途的空间适宜性;(3)开发适用于YR水质预测的机器学习方法。研究结果将通过利用机器学习驱动的方法,填补对整个YR流域地表水质变化趋势理解的空白,为亚洲水塔及其他高山地区的水资源可持续管理提供重要参考。

地质条件

雅鲁藏布江(YR)流经中国南部、印度和孟加拉国,最终注入印度洋。YR的主流长度为2229公里,根据中国的区域地貌分为三个河段(图1)。从源头到萨加(Saga)的河段为上游(UR),是一个高寒河谷区,平均坡度为4.4‰(Tan等人,2021a)。中游(MR)从萨加到桑格里(Sangri)的长度超过1100公里,坡度为1.12‰。

数据来源

评估基于在YR各河段收集的145个地表水样本进行。其中87个样本来自下游(LR),47个来自中游(MR),11个来自上游(UR)(图1)。在这145个地表水样本中,77个样本是在现场采集的,其余样本来自之前的研究(Shi等人,2021年;Xiao等人,2023年;Yan等人,2022b)。收集的地表水储存在预先清洗过的500毫升容器中。

一般水化学特性

YR上游(UR)、中游(MR)和下游(LR)的一般水文地球化学特征描述见表S2和图4。pH值是评估饮用水和灌溉适宜性的关键指标(Wang等人,2023年)。UR、MR和LR的平均pH值分别为7.9、8.8和8.4,存在空间差异。上游地表水呈中性,而中游和下游略呈碱性。变异系数(CV)的结果显示...

控制地表水化学的因素

吉布斯图(Gibbs diagrams)被认为是区分地表水化学成分的有效工具(Gibbs 1971)。来自UR和LR的样本分布在一个以岩石为主导的区域,表明两个河段的水岩相互作用强烈(图5)。在中游(MR),大多数样本属于岩石主导区,其余样本属于降水区。因此,水岩相互作用是控制YR流域地表水化学的主要过程。

结论

本研究构建了雅鲁藏布江(YR)流域地表水适宜性评估的全面框架。自然背景水平(NBLs)的结果揭示了自然来源和农业活动对地表水化学的影响。农业肥料施用的空间差异导致了YR流域内NO3?的空间差异。灌溉水质评估表明,在上游和...

作者贡献声明

Md Galal Uddin:撰写 – 审稿与编辑。Rongwen Yao:正式分析。Xingcheng Yuan:软件开发。Zhan Xie:撰写 – 初稿,方法论。Yunhui Zhang:撰写 – 审稿与编辑,资金获取,概念化。Yangshuang Wang:验证。Ying Wang:资源,方法论

未引用参考文献

Qi wenqi, 2022; Zhang等人,2024; Zhang等人,2025.

资助

本研究得到了国家自然科学基金(42572396,42102334, 42072313)、西藏自治区重点研发项目(XZ202201ZY0021G)、四川省科技计划(2025YFHZ0269,2025ZNSFSC0307)、宜宾市科技计划(YBSCXY2023020006, YBSCXY2023020007, 2024MZ001)以及中央高校基本科研业务费(2682024CX068, A0920502052501–23)的支持。我们感谢创新实践基地的支持。

利益冲突声明

? 作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文的研究工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号