将多算法机器学习与锆石稀土元素(REE)地球化学相结合,用于追踪湄公河流域元素从源区到汇区的迁移路径

【字体: 时间:2026年03月14日 来源:Geomorphology 3.3

编辑推荐:

  本研究整合随机森林、K近邻和极端梯度提升三种机器学习算法与锆石稀土元素地球化学,分析湄公河流域沉积物来源。通过训练集(70%)和测试集(30%)验证,模型准确率达0.93-0.97,SHAP分析揭示S型花岗岩主导来源,且下湄公河沉积物主要来自下侵蚀带,为复杂流域溯源提供新方法。

  
Fangbin Liu|Zhaohan Guo|Xiaoming Shen|Zhe Wang|Min Wang|Yanying Wang|Xin Ma|Honghua Liu
齐鲁师范学院地理与旅游学院,中国济南250200

摘要

解析大型河流系统中的沉积物来源对于理解地壳演化、侵蚀动力学以及流域尺度的地球化学循环至关重要。传统的地球化学方法难以准确区分沉积物来源并厘清复杂的混合过程。在这里,我们整合了三种监督机器学习算法——随机森林(RF)、K-最近邻(KNN)和极端梯度提升(XGBoost),并结合锆石稀土元素(REE)地球化学特征,对湄公河沿岸的花岗岩类岩石来源进行了分类。我们使用了包含3780个已发表的锆石REE数据的训练集(70%)和测试集(30%),以及我们自己从13个现代河床样本中提取的4122颗锆石的数据进行分类。结果表明,所有模型的表现都很好,准确率在0.93到0.97之间。此外,我们采用了SHapley Additive exPlanations(SHAP)方法来评估地球化学特征对模型预测的贡献,从而揭示了控制沉积物来源的关键特征,并确认模型捕捉到的输入-输出关系与已建立的岩石学过程一致。研究还发现,在整个湄公河范围内,S型花岗岩类岩石是沉积物的主要来源。输送到湄公河下游的沉积物主要来自下游侵蚀带,这是一个以强烈侵蚀为特征的沉积物产生区。这些发现凸显了将机器学习模型与地球化学数据相结合在解决沉积物传输路径方面的强大能力,为复杂河流流域的来源研究提供了一个稳健的框架。

引言

了解沉积物来源不仅对于重建地貌和构造历史至关重要,而且对于评估人为影响以及预测环境变化下的未来沉积物动态也非常重要(Clift等人,2014;Garzanti等人,2005;Giosan等人,2012;Jonell等人,2017;Mason等人,2019)。因此,来源研究为理解地表过程及其对自然和人为驱动因素的响应提供了重要的见解。
在可用的来源示踪剂中,碎屑锆石颗粒因其地球化学稳定性和保留特定来源信息的能力而成为最有效的工具之一(Shi等人,2023;Thomas,2011;Wang等人,2025)。锆石稀土元素(REE)的化学成分受岩浆过程和构造环境控制,为区分花岗岩类岩石来源提供了诊断性特征(Babu等人,2021;Bayon等人,2015;Hoskin和Ireland,2000;Roberts等人,2024;Sawaki等人,2024;Shi等人,2023;Wang等人,2025)。例如,火成锆石通常被分为I型、S型和A型,每种类型反映了不同的构造环境和地球化学特征(Chappell和White,1974,Chappell和White,1992;Eby,1992;Loiselle和Wones,1979)。它们的形成环境和诊断标准总结在表1中。这些地球化学标志物使得锆石REE成为追踪河流系统中沉积物来源的不可或缺的工具(Hoskin和Ireland,2000;Wang等人,2012)。
然而,传统的地球化学来源分析方法,包括双变量判别和统计分类,在处理复杂的高维数据集时存在局限性。这些方法往往无法检测到混合沉积物群体中的细微成分变化或相互作用(Clift等人,2006;Lin等人,2025;Vermeesch和Garzanti,2015)。在多源河流流域中,这种局限性尤为突出,因为沉积物特征高度异质,受到变化的构造、侵蚀强度和循环过程的影响。因此,迫切需要更先进的数据驱动方法,能够结合成分复杂性和稳健的分类准确性。
机器学习的最新进展为来源研究带来了变革潜力,使得能够解释大型多变量数据集中的复杂模式(Huang等人,2025;Lin等人,2020;Zhong等人,2023a,Zhong等人,2023b)。监督学习算法,如随机森林(RF)、K-最近邻(KNN)和极端梯度提升(XGBoost),在分类地球化学信号和识别沉积物来源方面表现出色(Breiman,2001;Chen和Guestrin,2016;Lee等人,2019;Olden等人,2008)。当应用于锆石REE成分时,这些方法可以揭示传统统计技术常常忽略的非线性关系和微妙的地球化学特征(Doucet等人,2022;O’Sullivan等人,2020;ZhangZhou等人,2024;Zhong等人,2023a,Zhong等人,2023b)。此外,像SHapley Additive exPlanations(SHAP)这样的工具可以通过量化单个地球化学变量的贡献来提高解释性,从而更清晰地了解机器学习模型中区分不同沉积物来源的关键特征(Lundberg和Lee,2017)。
尽管这些技术具有很大潜力,但它们在沉积物来源研究中的应用仍然有限,尤其是在大型和地质复杂的河流系统中。湄公河从青藏高原延伸至越南的三角洲平原,全长近5000公里,是世界上最广阔和地质多样性最丰富的河流系统之一(Clift等人,2006;Jiwarungrueangkul等人,2019;Kuenzer,2014;Nie等人,2018;Zhang等人,2022)。其流域面积约为8.1×10^4平方公里,接收来自多种岩石构造类型的沉积物,年沉积物排放量达1.6×10^11公斤(Milliman和Meade,1983)。这种多样性使得湄公河成为研究沉积物来源及其支撑河流地貌演化的源-汇过程的理想自然实验室(Clift等人,2014;Liu等人,2016;Shi等人,2023)。
本研究旨在通过采用多算法机器学习框架分析锆石REE成分来填补这一空白。通过结合先进的计算工具、地球化学分析和全面讨论,我们旨在揭示湄公河流域详细的沉积物传输路径,并识别不同的来源区域。从这项研究中获得的见解有助于加深我们对河流沉积过程的理解,并为河流地貌学、沉积地质学和环境管理等领域提供更广泛的应用。

新样本采集与实验

本研究从湄公河收集了13个现代河床沉积物样本(图1)。其中包括来自上游主河道的4个样本(MK21、MK25、MK27、MK30)和一个来自支流的样本(MK23)。此外,从中游不同地点获得了7个样本(MK02、MK06、MK09、MK12、MK15、MK18、MK19)。还有一个样本来自下游主河道(MK31)。每个河床样本由...

锆石U-Pb年龄和Th/U特征

从湄公河流域的13个现代河床样本中获得了4270个一致性的锆石U-Pb年龄数据,为沉积物来源分析奠定了坚实的基础。图4展示了锆石年龄与Th/U比值的分布,揭示了岩浆和变质源的贡献。Th/U比值范围很广,从接近零到超过2.5,在某些情况下甚至超过5.0(例如MK31)。值得注意的是,大多数锆石(约92%至99%)...

超参数优化对模型性能的影响

超参数优化对于提高机器学习模型在高维地球化学分类任务(如基于锆石REE的来源分析)中的预测准确性和泛化能力至关重要(Bergen等人,2019;Fleming等人,2021)。在本研究中,经过优化的模型(包括RF、KNN和XGBoost)在解析湄公河源-汇系统中的微妙地球化学变化方面表现出更好的性能(图9,S1–S3)。
对于RF...

结论

本研究结合了机器学习技术和锆石REE地球化学,研究了湄公河流域的沉积物来源路径。结果表明,S型花岗岩类岩石在整个湄公河流域的沉积物来源中占主导地位,上游湄公河中约有一半的锆石来源于S型花岗岩。最终输送到下游湄公河的沉积物主要来自下游侵蚀带,这是一个关键的沉积物产生区...

CRediT作者贡献声明

Fangbin Liu:撰写——初稿、方法论、资金申请、正式分析、概念构思。Zhaohan Guo:撰写——初稿、方法论。Xiaoming Shen:撰写——审阅与编辑。Zhe Wang:方法论、正式分析、数据管理。Min Wang:可视化、验证。Yanying Wang:验证、概念构思。Xin Ma:撰写——审阅与编辑、概念构思。Honghua Liu:撰写——审阅与编辑。

资助

本工作得到了国家自然科学基金(资助编号:42301006和42301105)、山东省高等学校青年创新团队科技支持项目(资助编号:2024KJG052)以及齐鲁师范学院科学研究基金和横向基金(资助编号:107002001342001和2021HX002)的资助。

利益冲突声明

作者声明没有利益冲突。

致谢

我们衷心感谢Achim A. Beylich和Rong Yang在编辑方面的帮助,以及两位匿名审稿人提供的富有洞察力和建设性的反馈。同时,我们也感谢Chengyu Liu博士、Hongtao Wang博士和Tian Ma教授在数据处理方面的协助。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号