利用机器学习预测全球土壤中重金属的分布系数:矿物异质性的影响

《Environmental Research》:Predicting heavy metal distribution coefficient in global soil via machine learning: the effect of mineral heterogeneity

【字体: 时间:2026年02月07日 来源:Environmental Research 7.7

编辑推荐:

  全球土壤重金属吸附能力基于矿物含量与机器学习模型预测,发现Fe_oxide、chlorite和kaolinite分别显著提升As、Cd、Cr的Kd值,亚洲农田污染风险最高达72%。

  
左文平|顾黄玲|廖秦鹏|赵金超|齐重冲|刘俊勤|吕远才|陈天|张琳
中南大学冶金与环境学院,中国长沙410083

摘要

土壤颗粒对重金属的吸附能力显著影响其在全球土壤中的污染风险。然而,由于难以获得大规模的吸附数据,目前仍缺乏全球范围内土壤吸附能力的分布信息。本文提出了一种新方法,通过机器学习和大数据预测重金属在土壤中的分配系数(Kd),从而在全球范围内评估土壤的吸附能力。基于选定的数据(包括土壤性质、吸附性质和矿物成分),随机森林(RF)模型对砷(As)、镉(Cd)、铬(Cr)和铅(Pb)的Kd值分别实现了0.91、0.85、0.90和0.87的预测准确率。研究发现,影响Kd值的主要因素是矿物成分。氧化铁(Fe_oxide)、绿泥石(chlorite)和高岭石(kaolinite)的含量分别与砷、镉和铬呈显著正相关。根据美国环保署(U.S. EPA)的Kd标准,进一步划定了污染风险区域。值得注意的是,各大洲农田的环境风险区域占比均超过20%,其中亚洲的砷、镉和铬污染风险区域占比分别为72%、64%和58%,明显高于其他大陆。此外,这些高风险区域的分布与相应矿物的全球平均含量一致或接近。本研究提出的方法能够预测全球土壤的Kd值并进行污染风险评估,揭示了矿物异质性对Kd值的影响。这些结果对于评估环境风险和制定土壤修复策略具有重要意义。

引言

重金属(HMs)在土壤中的污染是一个重大的全球环境问题,因为它们具有迁移性和在生物体内的富集性。据估计,在过去几十年的人类活动中,已有超过3万吨铬和80万吨铅被排放到全球土壤中(Yong等人,2018年;Shi等人,2023年)。在土壤中,重金属的各种环境行为中,吸附是控制其迁移和固定化的关键因素(Bradl等人,2004年)。吸附能力反映了重金属在土壤颗粒上的固定化强度,从而显著影响其在土壤中的稳定或释放(Arunakumara等人,2013年;Zhu等人,2019年),进而影响土壤生态、食品安全和人类健康(Wang等人,2023年)。尽管土壤污染主要是通过自然过程和人为活动造成的,但了解土壤对重金属的“临界负荷”吸附能力仍然很重要(Zhang等人,2020年;Qi等人,2024年)。因此,准确评估重金属的吸附能力对于评估土壤环境安全性以及制定标准和预测土壤环境风险至关重要。
通过现场采样、吸附实验和统计分析等方法,已经广泛研究了土壤的区域吸附能力,但针对全球范围的研究较少(Zuhairi等人,2003年;Sohn等人,2004年;Zhang等人,2021年)。最近,Yang等人利用梯度提升决策树(GBDT)模型,基于土壤的物理化学性质,计算了六种重金属在全球土壤中的相对吸附能力(Yang等人,2021年)。Qi等人还利用光谱数据和机器学习方法评估了欧盟和美国土壤中重金属的相对吸附能力(Qi等人,2024年)。这些研究使用平衡吸附能力(Qe)作为不同重金属吸附能力的指标。然而,Qe仅能反映与吸附位点数量相关的吸附能力,无法体现吸附位点强度带来的吸附能力差异(Na等人,2024年)。此外,分配系数(Kd)被用来表示重金属在土壤固液相之间的分布,反映了重金属与土壤颗粒之间的吸附力强度(Sheppard等人,2011年)。而且,Kd主要取决于土壤颗粒的固有物理化学性质,而非自然和人为环境因素,因此比Qe更能反映土壤的固定化能力(Degryse等人,2003年;Degryse等人,2009年)。实际上,美国环保署早在1996年就制定了重金属的Kd标准,认为较高的Kd值表示较高的吸附能力和较低的环境风险(de Souza Braz等人,2013年)。因此,全球范围内Kd的预测有望全面揭示不同土壤类型的重金属吸附能力。
然而,由于难以获得大规模样本数据,目前仍缺乏全球不同土壤中重金属的Kd值。另一种方法是利用土壤性质来估算Kd。矿物作为土壤的主要成分之一(占土壤组成的15-22%),是重金属的主要载体和反应中心(Xu等人,2020年)。研究表明,铁矿物可以通过单齿/双齿配位作用强烈固定砷,其Kd值较高(258 L/kg)(Mamindy-Pajany等人,2011年;Aredes等人,2013年)。同时,镉和铬可以通过离子交换和络合作用被绿泥石和高岭石吸附,其Kd值分别为6140 L/kg和11 L/kg(Li等人,2020年;Wang等人,2022年)。因此,预计可以利用矿物成分来估算吸附能力。然而,全球各地的矿物组成差异较大,难以探讨不同土壤类型对重金属吸附的影响。幸运的是,我们之前的研究利用协调世界土壤数据库(HWSD)和极端梯度提升(XGB)算法,建立了全球土壤中六种硅酸盐矿物的分布图,从而可以通过矿物异质性预测土壤的吸附能力和重金属污染风险(Liao等人,2024年)。以往的研究主要集中在区域范围内探讨矿物对重金属吸附机制的影响,忽视了全球范围内的空间分布研究(Aredes等人,2013年;Xu等人,2020年)。此外,当前的区域或全球吸附研究主要评估了土壤的相对吸附能力(Qe),忽略了矿物异质性的影响(Yang等人,2021年;Qi等人,2024年)。因此,选择更具代表性的Kd值对于全面评估全球土壤吸附能力至关重要。更重要的是,使用Kd标准值比Qe更有效地识别重金属污染区域,并为评估污染风险提供了新方法。然而,目前尚未有研究基于Kd值和矿物异质性来探讨全球范围内的土壤吸附能力。
在本研究中,我们基于Kd值开发了一种评估全球土壤吸附能力的新方法。由于砷、镉、铬和铅的毒性较高,我们选择它们作为经典探针。通过利用HWSD数据库和随机森林算法,生成了一张显示Kd值分布的全球地图。我们从112篇相关文献中收集了近3000个吸附数据点,包括11个预测变量组成的全球数据集。结合多种建模和解释方法,揭示了矿物成分和类型对重金属分配系数的影响。随后,为了确定全球土壤风险管理的重点区域,将预测值低于Kd标准值的区域定义为环境风险区。最后,在全球范围内识别出受重金属污染影响的农田后,进一步评估了受影响最严重的前10个亚洲国家。研究还揭示了相应矿物成分在预测不同重金属Kd值及其对土壤环境风险中的关键作用。这些发现有助于评估土壤环境安全性、规划区域土地利用和修复受污染的土壤。

土壤矿物成分数据

先前的研究预测了六种硅酸盐矿物的含量,并制作了全球分布图,包括伊利石(illite)、蒙脱石(smectite)、高岭石(kaolinite)、绿泥石(chlorite)、蛭石(vermiculite)和长石(feldspar)(Liao等人,2024年)。值得注意的是,这六种在土壤中常见的矿物在重金属吸附中起着重要作用(Georgiou等人,2023年)。实际上,氧化铁(尤其是赤铁矿和针铁矿)在土壤环境中广泛分布

重金属分配系数的全球分布

我们首先使用XGB算法预测了全球范围内赤铁矿和针铁矿的含量,预测准确率分别为0.36和0.66(图S3),考虑到全球范围内的异质性,这一结果是可以接受的。在本研究中,对巴西土壤的针铁矿含量预测准确率高于Rosin等人的研究(R2=0.40)(Rosin等人,2023年)。上述结果表明,优化的XGB模型在预测赤铁矿含量方面是可靠的

讨论

与以往的土壤吸附能力评估相比,我们预测了四种重金属的全球Kd值,以评估土壤的吸附能力。通过使用美国环保署(U.S. EPA)提出的Kd标准值,我们可以有效评估区域土壤的重金属环境风险。此外,矿物成分被证实是影响Kd值的重要因素,为评估全球土壤的吸附能力提供了新的视角。值得注意的是,全球范围内的Kd值

结论

通过整合大量的土壤性质、矿物成分和吸附性质数据,利用随机森林模型,首次在全球范围内生成了土壤对重金属的吸附能力数据。选择了砷(As)、镉(Cd)、铬(Cr)和铅(Pb)的Kd作为预测目标。特别是,首次利用全球土壤中的矿物成分填补了土壤性质数据的空白,使预测模型的精度提高了14%。Kd的空间分布结果显示

CRediT作者贡献声明

赵金超:验证、方法论、数据整理。廖秦鹏:方法论、数据整理、概念化。顾黄玲:可视化、方法论、数据整理、概念化。左文平:撰写初稿、方法论、数据分析、数据整理、概念化。张琳:撰写与编辑、监督、资金筹集、概念化。陈天:撰写与编辑、监督、方法论、资金筹集、概念化。吕远才:

未引用的参考文献

Bradl, 2004; Deng et al., 2025; Georgiou et al., 2022; Goldberg, 2002; Hüllermeier and Waegeman, 2021; Jain and Tandon, 2003; Johnston and Chrysochoou, 2014; Jose Gonzalez-Costa et al., 2017; Lu and Xu, 2009; Matis et al., 1999; Sohn and Kim, 2005; Sheppard, 2011; Shi et al., 2023; Vodyanitskii, 2009; Yang et al., 2018; Zuhairi, 2003; Zhang and Selim, 2005; Zhang and Wang, 2020.

利益冲突声明

? 作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。

致谢

本工作得到了国家自然科学基金(编号22336006、22222612)和国家自然科学基金创新研究群体基金(编号52121004)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号