《Ecotoxicology and Environmental Safety》:Improved prediction of heavy metal concentration in typical agricultural soil in Hainan by Machine Learning method
编辑推荐:
本研究针对传统土壤重金属预测模型忽视空间分层异异性与母质影响的问题,创新性地整合空间分层异质性指数(SHI)与母质指数(PMI)至10种机器学习模型中。结果显示,SHI显著提升模型预测精度(R2达0.706–0.954),PMI对驱动因子贡献率达2.3%–40.1%。研究明确了不同土地利用类型下Cr、Cu、Ni、Pb的分布差异,为热带农业区土壤污染精准防控与风险管理提供了新方法。
随着工业化与农业现代化的快速发展,土壤重金属污染已成为全球性环境问题。据统计,全球约16%的农田受到重金属污染威胁,其中铬(Cr)和镍(Ni)的超标率分别达3.2%和5.8%。传统重金属检测方法成本高昂,而现有预测模型多忽略空间异质性及成土母质的影响,导致预测精度受限。海南岛作为中国重要的热带农业区,其土壤质量直接关系农产品安全与生态可持续性。因此,开发能够同时兼顾地理空间特征与成土过程的预测模型迫在眉睫。
为突破这一瓶颈,海南大学研究团队在《Ecotoxicology and Environmental Safety》发表研究,通过融合空间分层异质性指数(SHI)与母质指数(PMI),系统评估了10种机器学习模型对土壤中Cr、Cu、Ni、Pb的预测效能。研究选取澄迈县南渡江北岸农业区为研究区域,基于2258个表层土壤样本,结合遥感数据、数字高程模型(DEM)、气象资料与土壤属性等15类环境协变量,构建了涵盖随机森林(RF)、梯度提升决策树(GBDT)、神经网络(bpNN)等多元模型体系。
关键技术方法包括:利用反距离权重(IDW)插值生成SHI与PMI指标;通过平均最近邻(ANN)算法与半方差函数确定空间自相关有效范围(143?m);采用地积累指数(Igeo)评估污染程度;使用7折交叉验证优化模型参数,以均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)作为评估指标。
3.1 土壤样本数据特征
研究区土壤呈弱酸性(pH均值5.46),重金属浓度变异系数介于41%–89%,表明数据离散度高且受人为活动影响显著。与1991年海南背景值相比,Cr、Cu、Ni均值分别超出5倍、4.5倍和40倍,而Pb浓度略低于背景值。
3.2 土地利用类型对重金属分布的影响
通过Pearson相关性分析发现,Cr、Cu、Ni在旱地、果园等土地利用类型中显著正相关(R?>?0.85),而Pb与三者呈负相关。水稻田中Cr、Cu、Ni浓度显著低于旱地、果园等其他类型,而Pb含量则相反,可能与灌溉水稀释效应及作物吸收差异有关。
3.3 模型性能评估
仅使用环境协变量(ECs)时,模型R2仅为0.1–0.38;引入SHI后,预测精度大幅提升至0.706–0.954。以Cr为例,RF模型的测试集R2从0.374升至0.95。泰勒图分析显示十种模型性能接近,LightGBM与RF表现最优。
3.4 驱动因子重要性分析
地形属性(TP)对四种重金属预测贡献率超20%,坐标信息(CI)、植被指数(VI)等次之。PMI在除Cu外的三种元素中均为关键因子,印证成土母质对表层重金属分布的基线控制作用。
3.5 空间预测优化与污染评估
基于143?m分辨率的空间制图显示,Cr、Cu、Ni在东北部浓度较高,Pb则呈南高北低分布。根据GB15618-2018标准,Ni超标面积比例最高(47%–60.7%),Cr次之(35.2%–38.6%),Pb无超标样本。
3.6 地积累指数评价
Igeo分析表明,99.1%的Pb样本处于无污染至轻度污染水平,而Cr、Cu的中度至强污染比例分别为45%与30.6%,Ni的强污染及以上级别占比达42%。
4.1–4.4 讨论
研究强调SHI是提升模型精度的核心因子,其贡献率超90%,弥补了传统机器学习模型对空间异质性的忽视。PMI作为第二重要因子,反映研究区土壤重金属继承自基性火山岩母质的特性(如Ni富集)。土地利用差异进一步调控重金属分布:水稻田通过长期灌溉稀释Cr、Cu、Ni,而Pb因大气沉降在低洼区累积。该模型框架为协调成土过程与人类活动影响提供了可推广的工具。
5 结论
本研究证实SHI与PMI的引入显著优化了重金属空间预测精度,明确了Ni为研究区主要污染元素。模型在多土地利用场景下的稳健性,为热带农业区土壤污染防控政策制定提供了数据支撑与方法创新。