《Soil and Tillage Research》:Network analysis and machine learning-aided soil quality index prediction: Insights from a wind-eroded region in northeastern China
编辑推荐:
土壤质量指数评估方法在东北风蚀区应用研究,通过网格采样316份土壤样本,网络分析筛选出土壤水含量、有机碳和持水能力为核心指标,结合14种环境因子及SVM、随机森林、LightGBM、XGBoost模型构建SQI预测体系。结果表明LightGBM最优(MAE=0.10,RMSE=0.12,R2=0.72,CC=0.81),环境因子中纬度(19.5%-40.6%)、年均温(12.8%-19.1%)和近地表风速(10.1%-12.5%)主导SQI空间变异,土壤质量呈现东北至西南递减趋势,低纬、高温、强风区需重点关注。该体系为风蚀区土壤质量评估提供了有效框架。
Xue Zhang|Shuren Wang|Meng Li|Wei Hu
中国科学院东北地理与农业生态研究所,哈尔滨 150081,中国
摘要
土壤质量退化威胁着全球33%的陆地粮食和生态安全,因此迫切需要有效的评估系统。本研究旨在明确导致土壤质量退化的多因素相互作用,并开发出一个准确的评估框架。在中国东北部一个典型的风蚀地区,采用网格采样方法收集了316个表层土壤样本(0–20厘米),并测试了20个物理化学和生物指标。通过网络分析确定了最小数据集的核心指标,并结合4种机器学习算法——支持向量机、随机森林、Light梯度提升机(LightGBM)和极端梯度提升机——以及14个高分辨率环境因素来预测土壤质量指数(SQI)。结果表明,土壤含水量、土壤有机碳和田间持水能力是构建SQI的核心指标。LightGBM具有最高的预测准确性(平均绝对误差=0.10,均方根误差=0.12,决定系数=0.72,一致性相关系数=0.81),并且最适于去除冗余的环境因素。纬度(19.5%–40.6%)、年平均温度(12.8%–19.1%)和近地表风速(10.1%–12.5%)是影响SQI空间变异性的主要因素。土壤质量从东北向西南呈现下降趋势,在低纬度、高温和强风速地区,SQI值较低(<0.4,27.2%)。网络分析、高分辨率环境因素和机器学习的结合为评估土壤质量提供了一个有效的框架。值得注意的是,在未来全球变暖的背景下,应特别关注低纬度、高温和强风速地区的土壤质量。
引言
土壤质量退化是全球生态系统可持续性的重要制约因素。根据联合国粮食及农业组织(2015年)的数据,土壤侵蚀是全球土壤质量的主要威胁,影响了84%的退化土地。特别是在中国,风蚀现象尤为严重。例如,大约1807400平方公里的沙漠、戈壁和荒漠化土地占全国总面积的18.8%(Zan等人,2023年)。在中国北部干旱和半干旱气候区的风蚀核心区域,年平均风蚀模量通常超过2500平方公里每年,甚至在局部强风区域达到8000平方公里每年(Song等人,2016年)。根据《全球土地退化经济评估》,风蚀造成的北方干旱地区农作物年均经济损失约为23亿美元(联合国环境规划署,2018年)。风蚀会降低作物产量,威胁粮食安全,并削弱土壤的生态服务功能。因此,我们必须准确评估风蚀地区的土壤质量,以便制定及时和科学的决策,从而支持可持续的土地管理和长期生态平衡。
土壤质量的动态极其复杂,受到其自身性质(如母质、有机质、pH值和质地)和环境因素(如气候波动、地貌模式和植被演替)的影响(Bronick和Lal,2005年)。这种复杂性导致在不同地理或生态条件下缺乏统一的土壤质量指标选择标准,从而限制了土壤质量评估的准确性(Bayrakli等人,2023年;Karaca等人,2021年)。因此,科学选择土壤质量指标是构建准确评估系统的关键步骤(Fan等人,2025年)。然而,目前大多数土壤质量评估系统具有高度主观性,普遍缺乏公认的标准(Bünemann等人,2018年),因为指标选择受到研究目的和空间规模的限制(Monsalve Camacho等人,2021年;Zhu等人,2021年)。例如,以往的研究中常用传统的物理化学性质指标,如土壤有机质、pH值和有效磷(Chen等人,2022年)。这种基于以往经验的指标选择方式容易产生偏倚的评估结果,因为缺乏客观的定量基础。此外,这些依赖实验室的指标由于成本高昂,在大规模应用时面临挑战(Nabiollahi等人,2021年)。因此,应重视科学的方法来选择指标、减少指标数量,并快速且低成本地探索新指标(Gao等人,2025b)。除了土壤性质外,环境因素也能提供土壤性质无法反映的重要信息,在准确评估土壤质量方面发挥重要作用。尽管一些研究人员认为地形因素(如坡度)不应纳入土壤质量评估,但在地形变化显著的地区(如沟蚀区),这一因素可以直接或间接影响土壤质量指数(SQI)(Chen等人,2023年;Serda Kaya和Dengiz,2024年),因此应将其视为关键影响因素。然而,多维环境因素与土壤性质的交互作用尚未得到全面探讨。一些研究仅关注土壤物理化学性质,而未考虑环境因素的影响(P. Li等人,2020年)。还有研究仅关注一个或两个因素的组合,如气候、地形和植被因素,忽略了其他元素的协同作用(Isong等人,2022年;Pham等人,2018年)。因此,构建一个整合土壤性质和环境因素的综合性评估系统对于准确描述复杂环境中土壤质量的空间异质性是必要的。
此外,传统的土壤调查方法需要收集大量样本点,耗时且成本高昂,且无法直接反映许多环境因素对土壤变化的影响。因此,数字土壤制图(DSM)技术提供了一种高效的评估方法。具体而言,DSM可以通过整合土壤性质、地理、地形、气候和植被数据作为协变量或辅助变量来预测SQI或土壤质量等级(Diaz-Gonzalez等人,2022年;Fathololoumi等人,2020年)。目前,常见的机器学习方法(如随机森林和支持向量机)在低维和小尺度上预测土壤质量方面取得了良好效果(Paul等人,2020年)。然而,这些方法在大尺度上预测SQI的空间效率较低(Nabiollahi等人,2018年)。它们计算效率低下,模型可解释性有限,并且在处理高维空间特征时对参数过于敏感(Chapelle,2007年;Teschendorff,2019年)。因此,探索一种适用于机器学习的土壤质量评估方法,能够高效整合土壤性质和环境因素,对于解释中国北部风蚀地区土壤质量退化与气候、地理、地形和植被因素之间的功能关系非常重要。
因此,我们将网络分析与机器学习模型相结合,建立了一个综合的SQI评估系统,将土壤性质与环境因素联系起来,系统地评估风蚀地区的土壤质量空间变异性。研究目标包括:(1)通过Gephi网络分析软件构建非线性SQI模型并选择关键土壤指标;(2)利用机器学习结合高分辨率环境因素建立土壤质量的空间预测模型,并通过比较SVM、随机森林、Light梯度提升机(LightGBM)和极端梯度提升机(XGBoost)的性能来筛选最优模型;(3)量化地理、地形、气候和植被因素对SQI的贡献。研究结果可以显著提高中国风蚀地区土壤质量评估的准确性,并为应对区域土壤质量退化提供科学依据。
研究区域
研究区域位于中国东北部的科尔沁和松嫩沙地(41° 50′ N–48° 8′ N,116° 32′ E–126° 30′ E),总面积为3.152×10^5平方公里(图1)。年平均降水量(MAP)从东北向西南逐渐减少,年平均温度(MAT)逐渐增加。在过去的二十年里,东北地区的MAT为4.6±0.9°C(1.5–6.1°C),MAP为325±25.8毫米(261.6–389.5毫米),属于半湿润气候。
SQI指标的汇总统计
表2总结了用于评估中国东北风蚀地区土壤质量的20个物理化学和生物性质的描述性统计信息。指标变异性的大小直接影响数据分析的准确性。因此,我们评估了偏度、峰度和变异系数(CV),以确认连续随机变量的概率正态分布并预测异常值的出现(Zuur等人,2010年)。
影响SQI的因素
土壤水分含量(SWC)、土壤有机碳(SOC)和肥力(FC)是主成分分析(MDS)的核心指标,它们的空间变异性(CV≤62.66%)和网络中心性特征(最高特征向量中心性)直接决定了它们对SQI的显著影响。这一点在干旱地区得到了证实(Raiesi和Salek-Gilani,2020年)。SWC(CV=62.66%)是反映土壤水文健康状况的关键因素(Mai等人,2023年),通过调节
结论
我们采用网格采样方法收集了316个表层(0–20厘米)土壤样本,结合网络分析和机器学习方法来评估和预测中国东北部典型风蚀地区的土壤质量。根据Gephi网络分析,SWC、SOC和FC是表征土壤质量空间变异性的核心指标。纳入环境因素提高了SQI预测的准确性和可操作性,尤其是纬度(LAT)和年平均温度(MAT)。
作者贡献声明
Xue Zhang:撰写——原始草案、可视化、验证、方法论。Shuren Wang:调查、概念化。Meng Li:撰写——审稿与编辑、监督、项目管理、资金获取、数据管理。Wei Hu:软件、资源、概念化。
利益冲突声明
作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。
致谢
本研究得到了国家重点研发计划(2024YFD1501400)和黑龙江省重点研发计划(创新基地)项目(JD24A012)的资助。