《ACS Environmental Au》:Spatiotemporal Heterogeneity of Surface Soil Organic Carbon in China: Novel Insights from Interpretable Machine Learning Coupled with Google Earth Engine
编辑推荐:
本文综述了利用可解释机器学习(XGBoost)结合Google Earth Engine平台,系统研究1986–2023年中国表层土壤有机碳(SOC)的时空异质性。研究通过整合多源卫星数据与实地观测,构建了高精度(R2= 0.71)的1公里分辨率SOC动态图谱,并利用SHAP(Shapley Additive Explanation)和分段结构方程模型(piecewiseSEM)揭示了关键驱动因子(如全氮TN、温度Temp、土壤有机质SOM)及其因果路径。研究强调了中国SOC分布的显著区域差异(划分为四个碳区),并提出差异化碳管理策略,为“双碳”目标下的土壤固碳提供科学依据。
研究背景与意义
土壤有机碳(SOC)在全球碳循环和气候变化缓解中扮演关键角色,约82.9%的陆地生态系统碳储存在土壤碳库中。中国作为地理环境复杂的国家,其SOC时空格局及驱动机制尚不明确。传统模型(如过程模型CENTURY)受数据与计算限制,难以实现大尺度动态模拟。本研究通过融合多源环境数据与遥感技术,构建了可解释的机器学习框架,旨在揭示中国SOC的长期变化规律及区域特异性。
材料与方法
研究基于4263个表层(0–20 cm)土壤样本(2000–2023年),结合61个环境变量(包括土壤属性、气候、地形、人类活动等),利用XGBoost算法进行建模。变量选择遵循SCORPAN方程(土壤属性、气候、生物、地形、母质、年龄与空间位置),并通过Google Earth Engine提取遥感指数(如NDVI、LST、WET、NDBSI)。模型采用5折交叉验证优化超参数,最终以R2= 0.71、RMSE = 1.73 kg C m–2的精度完成SOC制图。时空分析采用Theil-Sen斜率和Mann-Kendall检验,驱动机制解析结合SHAP(量化变量边际贡献)与piecewiseSEM(揭示因果路径)。
结果与讨论
1. 空间分布与区域异质性
中国SOC密度(SOCD)平均值为3.57 kg C m–2,碳储量(SOCS)达35.37 Pg C,呈现显著空间异质性。通过K-means聚类将全国划分为四个碳区:
- •
区域I(富碳区):SOCD最高(5.29 kg C m–2),集中于东北黑土区与西南山地,占全国SOCS的17.52%。
- •
区域II(高碳区):SOCD为4.48 kg C m–2,形成东西向带状分布,贡献最大SOCS(39.46%)。
- •
区域III(中碳区)与区域IV(低碳区):SOCD分别为2.89 kg C m–2和2.37 kg C m–2,面积占比高但碳储量较低。
区域I与II合计以43.24%的土地面积储存56.90%的全国SOCS,凸显核心保护区价值。
2. 时空动态特征
1986–2023年间,全国SOCS以0.015 Pg C yr–1的速率缓慢增加,但区域趋势分化:
- •
区域I因冻土退化与升温驱动的矿化作用,成为净碳源(趋势下降);
- •
区域II作为主要碳汇,受益于温暖湿润气候与农业管理措施(如施肥);
- •
区域III(含青藏高原)受植被扩张与升温共同作用,呈微弱增加;
- •
区域IV受干旱化限制,碳储量下降但被生态工程部分抵消。
像素级分析进一步揭示区域内部的细微变化,如西南部局部碳损失。
3. 驱动机制解析
- •
全国尺度:土壤属性(直接效应0.42)和气候(总效应最强)为主导因子。全氮(TN)、温度(Temp)与土壤有机质(SOM)为前三关键变量:TN与SOM促进SOC积累,而升温(Temp)加速分解。
- •
区域特异性:
- •
区域I:由NDBSI(干湿指数)、纬度(Lat)与近红外波段(B4)主导,强调水分与植被覆盖的调控作用;
- •
区域II:纬度(Lat)、温度(Temp)与pH为核心,中纬度冷湿环境利于碳保存;
- •
区域III:经度(Lon)、SOM与pH受农业活动影响显著,东西部需差异化管理;
- •
区域IV:GDP、长波辐射(Lrad)与海拔(DEM)共同作用,经济适度发展可促进碳汇。
piecewiseSEM进一步揭示人类活动通过气候与遥感变量间接影响SOC,而地形通过调控水热条件间接作用。
研究启示与局限
本研究首次在全国尺度耦合可解释机器学习与因果推断,明确了SOC管理的优先区(如保护富碳区)及区域策略(如东北黑土保育、南方酸化土壤改良)。局限性包括未涵盖微生物指标、历史遗留效应未显式建模等。未来可融合过程模型与机器学习,提升机制透明性与预测能力。