《Journal of Hydrology》:Improving water quality prediction through landscape patterns in Euclidean distance-based drainage areas for plain river networks
编辑推荐:
景观-水质关系研究在平原河流网络中面临传统空间划分方法(如缓冲区)的局限性,本研究提出基于欧氏距离的汇水区划分方法,通过机器学习模型验证其有效性。在太湖流域应用中,该方法较传统方法提升预测精度至0.72,并识别出不同水质区驱动因素组合(景观-人类主导/景观-气象主导/景观-人类增强)及生态阈值(水体破碎度>4.9%、城市聚集度<78%、人口密度>8.6人/公顷)。
蒋晓宇|谢东丽|黄轩|潘永春|夏永秋
中国江苏南京河海大学农业科学与工程学院,邮编210098
摘要
平原河流网络的复杂地理特征和人类活动导致水流方向及流域边界不明确。这种水文复杂性使得准确评估景观与水质之间的关系变得困难,尤其是在确定合适的分析空间尺度时。传统的水域划分方法在这些地区存在显著局限性:由于缺乏流量数据,无法实施河岸缓冲区;而圆形缓冲区则忽略了水文连通性。本研究基于“地表污染物会沿着最小阻力路径迁移”的原理(该路径可由到最近水体的欧几里得距离近似得出),开发了一种基于欧几里得距离的流域划分方法,将每个陆地网格单元分配给其最近的河段。这种方法无需依赖不可靠的流向数据即可有效划分贡献区域,同时自然考虑了水文连通性。以太湖流域为例,利用86个监测站的水质数据,通过自组织映射(Self-Organizing Map)将水质分为三个等级(高质量、中等质量、低质量)。通过四种机器学习算法(LightGBM、随机森林、XGBoost和支持向量机)进行水质预测,结果表明基于欧几里得距离的方法优于传统的圆形缓冲区方法,其中LightGBM的预测准确率达到0.72。SHAP分析揭示了空间差异化的驱动因素模式:高质量区域以“景观-人类活动为主”(解释了80.3%的模型方差),过渡带以“景观-气象条件为主”(81.9%),低质量区域则以“景观-人类活动增强”为主(93.8%)。研究还确定了关键生态阈值:水体斑块面积(LPI_40 > 4.9%)、城市聚集程度(PLADJ_20 < 78.0%)和人口密度(>8.6人/公顷)。该方法通过景观模式提升水质预测能力,并识别关键生态阈值,为平原河流网络的水生生态系统保护提供有针对性的管理策略。
引言
平原河流网络具有平坦的地形和密集复杂的河网,支撑着全球密集的人口和集约化的农业,因此有效的水质管理成为重要的研究课题(Wang和Gao,2020;Ding等人,2022)。然而,人类塑造的景观格局、自然地理特征(如平坦地形、密集的水道)以及人工调控的水文流动之间的复杂相互作用大大加剧了水质的变异性,带来了独特的管理挑战(Wang等人,2024b)。这种复杂性体现在水质分布的空间异质性以及景观格局对水质的阈值效应上——超过某些景观指标的临界值会导致水质的突然变化(Groffman等人,2006)。因此,识别在不同水质条件下的关键影响因素及其阈值,有助于准确预测水质变化,并为优化管理提供依据(Gonzales-Inca等人,2015;Liu等人,2021;Xu等人,2023a)。进行此类识别的基本前提是准确划分水文影响区域。然而,在平原河流网络中,平坦的地形以及众多水闸和泵站的密集分布使得传统的流域划分方法(甚至先进的D-infinity算法)效果不佳。这导致确定水质影响范围存在很大不确定性,从而给识别影响因素和生态阈值带来了挑战。鉴于这些挑战,研究人员提出了替代的空间单元,如人类活动对水质影响最直接的河流邻近区域(Wang等人,2024a)。虽然已经开发了多种河流邻近区域划分方法,但河岸缓冲区和圆形缓冲区仍是分析景观与水质关系最常用的方法(Han等人,2023;Mi等人,2024;Zhao等人,2015)。然而,这些传统方法在应用于平原河流网络时存在显著局限性。河岸缓冲区的划分通常基于上游流域对下游监测点具有主要水文影响的原理,因此通常仅限于上游区域。但在平原河流网络中,双向流动使得无法明确界定“上游”方向(Han等人,2023)。相比之下,圆形缓冲区不需要流量数据,但忽略了河流网络结构,在监测点周围划定固定半径的区域而不考虑水文连通性,可能导致包含生态上不相关的区域而排除重要连通区域(Dou等人,2022;Zhao等人,2015)。例如,在一个河流网络密集的典型平原上,500米的圆形缓冲区可能同时覆盖多条不相连河流的影响区域,从而扭曲了景观与水质之间的相关性(Zhang等人,2022)。这些方法论限制在量化平原河流网络的景观与水质关系方面存在重大研究空白。
为克服这些方法论局限,需要一种新的空间划分方法,该方法能在无需流向数据的情况下有效运作,并保持水文相关性。同时,它应符合污染物在平坦地形中的迁移规律——污染物倾向于沿着最小阻力路径向最近的水体移动,而非遵循传统的上游-下游路线(Han等人,2013)。基于这一设计理念,欧几里得距离方法利用最短路径原理,提供了有前景的解决方案。该方法已成功应用于多种空间分配场景,包括城市规划中的设施选址、交通网络设计和资源分配,其中最小化距离可以有效降低成本并提高可达性(You等人,2019;Yenisetty和Bahadure,2021;Ma等人,2025)。该方法的成功表明其在水文系统空间划分挑战中的潜力。因此,本研究基于最小阻力传输原理,并借鉴欧几里得距离在空间分配问题中的实用性,提出了一种基于欧几里得距离的流域划分方法,将陆地区域分配给最近的河流(Liberoff等人,2019)。与因缺乏流量数据而无法实施的河岸缓冲区或忽略河流网络结构的圆形缓冲区不同,该方法在保持空间相关性的同时解决了传统方法的方法论局限。
本研究以太湖流域为例,该流域是一个典型的平原河流网络区域,具有复杂的水文条件和显著的水质问题(Huang等人,2020)。为克服已识别的方法论局限并通过景观模式分析改进水质预测,本研究旨在:(1)开发并验证一种基于欧几里得距离的平原河流网络流域划分方法;(2)将该方法与机器学习技术结合,以识别不同水质区域之间的景观与水质关系及驱动因素;(3)根据识别出的驱动因素确定关键生态阈值,制定有针对性的管理策略。通过将新的流域划分方法与可解释的机器学习技术相结合,本研究通过基于欧几里得距离的流域内的综合景观模式分析,推进了水质预测,从而支持平原河流网络的有效水质管理。
研究区域
太湖流域位于中国东部,长江下游(北纬30°55′-31°32′,东经119°52′-120°36′)。该流域面积达36,900平方公里,涵盖江苏、浙江、安徽三省及上海市(图1)。研究区域的东部主要为平原,海拔高度在2至8米之间;而西部则以丘陵和山区为主,海拔高度约为200–500米。
河流水质的空间分布模式
根据使用SOM和K-means算法计算的簇内平方和(WCSS)值,研究区域的监测站被划分为三个不同的簇(图S1)。五个水质指标的成分平面显示在图S2中,综合聚类结果如图S3所示。图4展示了太湖流域水质的空间异质性:具体而言,第一簇中的72.73%的监测站...基于欧几里得距离的流域划分方法的方法论优势
基于欧几里得距离的流域划分方法解决了平原河流网络分析中传统方法的基本局限。在这些地区,由于地形平坦、河道网络密集以及广泛的水利调控,传统的流域划分方法往往效果不佳。为应对这一挑战,研究人员开发了多种基于河流邻近性的方法。然而,这些方法也存在明显缺点:河岸缓冲区需要...结论
本研究开发了一种基于欧几里得距离的流域划分方法,有效解决了平原河流网络分析中传统方法的局限。该方法根据最小阻力路径将每个陆地网格单元分配给最近的水体,通过景观模式分析提高了水质预测的准确性,准确率达到了0.68–0.72,而传统圆形缓冲区的准确率为0.56–0.68。将该方法与机器学习技术结合...
CRediT作者贡献声明
蒋晓宇:撰写——初稿、方法论、概念构建。谢东丽:撰写——审稿与编辑、监督、资金获取、数据整理。黄轩:撰写——审稿与编辑、可视化、资源获取、方法论、资金获取、概念构建。潘永春:软件开发、概念构建。夏永秋:撰写——审稿与编辑、方法论、概念构建。利益冲突声明
作者声明没有已知的财务利益或个人关系可能影响本文的研究结果。致谢
本研究的资金支持来自国家自然科学基金(42477448)和国家重点研发计划(2024YFD1700300)。