《Geoderma》:Mapping soil property classes over a large territory with multiple soilscapes by digital extrapolations of legacy detailed soil maps: A case study in Karnataka -South India
编辑推荐:
为应对大尺度数字土壤制图(DSM)中土壤数据稀疏、难以准确捕捉局部土壤格局的问题,研究人员提出利用高精度历史土壤图替代传统点状观测数据来校准DSM模型。他们以南印度卡纳塔克邦为研究区,开发了一种结合土壤景观距离评估的DSM方法,有效识别了土壤图可外推的区域,并实现了对土壤质地和石质性分类的高精度预测(分别达94%和90%)。这项工作为实现高精度、低成本的大区域土壤制图提供了一种新颖的混合(hybrid)方法路径。
想象一下,要为一片广袤的土地绘制一张详细的“土壤体检报告”,以便更好地管理农业、保护环境。数字土壤制图(DSS)技术的初衷,就是希望结合大范围覆盖、高空间分辨率和精准预测这三项优势。全球范围内,像SoilGrids这样的产品已经能以250米的分辨率呈现全球土壤概貌。然而,一个普遍且棘手的问题逐渐浮出水面:这些大尺度产品在局部地区的预测精度往往不尽如人意,难以支撑精细化的决策。问题的根源之一,在于模型校准所依赖的土壤数据——它们通常是来自全球各地土壤调查积累的、空间分布极为稀疏的离散点状观测。这些“星星点点”的数据,很难完整描绘出土壤在短距离内的复杂变化图案。
那么,有没有其他更丰富的数据源可以利用呢?研究者们将目光投向了那些已经存在的、详细的“历史土壤图”。这些地图由土壤学家通过大量实地勘察绘制而成,不仅包含观测点的信息,更凝聚了调查者对当地土壤与地形、气候等环境因子之间关系的深刻理解。用它们来校准模型,理论上可以更准确地捕捉局部土壤格局。然而,挑战同样存在:这类高精度土壤图本身数量稀少,在大区域内分布零散,像几片孤岛散落在广阔的未知海洋中。如果直接将一个地方的土壤图关系应用到另一个环境迥异的地方,预测结果很可能谬以千里。因此,核心问题变成了:如何准确判断哪些未测绘区域与已有土壤图区域具有足够相似的“土壤景观”关系,从而安全、可靠地将土壤图信息外推过去?
为了回答这个问题,由Philippe Lagacherie和S. Dharumarajan领导的研究团队,在南印度卡纳塔克邦的一片广阔区域(156,499 km2)进行了一项探索性研究。他们手头拥有91幅覆盖总面积为464 km2的微流域高精度土壤图(比例尺1:8,000),这些图就像91个已知的“土壤密码本”。研究的目标是,以这些图为起点,预测整个研究区的土壤属性(深度、质地和石质性)分类。他们创新性地引入了“土壤景观距离”这一概念来衡量不同微流域之间土壤组合模式的相似性,并开发了一套完整的数字土壤制图方法。该方法首先利用随机森林(Random Forest)算法预测任意两个微流域间的土壤景观距离,然后基于此距离,为每个待预测点选择最合适的土壤图来建立预测模型,同时划定出预测不确定性最低的“外推区域”。
研究团队为开展此项工作,主要运用了以下关键技术方法:1) 数据处理与建模:研究使用R语言环境下的ranger和TuneRanger包,采用分位数回归森林(Quantile Regression Forest)算法来预测转化为连续值的土壤属性,并将预测结果回转为分类变量。2) 土壤景观距离量化与预测:通过计算微流域间土壤属性分类分布的欧氏距离来定义“真实”土壤景观距离;进而构建另一个随机森林模型,利用微流域间环境协变量(如地形、气候、遥感数据)的分布差异、变差函数差异以及地理距离,来预测未知区域间的土壤景观距离。3) 模型验证策略:采用“留一微流域交叉验证”方法,逐一将91个有土壤图的微流域作为验证集进行评估。4) 研究区域与数据:研究聚焦于卡纳塔克邦的南德干高原,土壤数据来源于印度ICAR-NBSS&LUP机构在Sujala III和REWARD项目中统一调查绘制的91个微流域土壤图。
研究结果
4.1. 土壤景观距离的预测
预测土壤景观距离的模型决定系数(R2)为0.45,预测结果总体无偏,但对较小的真实距离存在高估。在最重要的预测因子中,气候和地形相关的协变量差异贡献最大,其次是协变量变差函数的差异。地理距离和小比例尺土壤图单元分布的差异虽然位列前15,但重要性相对较低。
4.2. 比较DSM整体模型性能
总体来看,使用全部土壤图校准的单一模型,其预测性能优于使用多个模型(每个模型基于一幅土壤图,并通过最小土壤景观距离选择)。对于土壤质地和石质性分类,单一模型的预测准确度较高(分别为73%和71%),不确定性较低;而对于土壤深度分类,预测准确度较低(46%),不确定性较高。使用预测的土壤景观距离(而非真实距离)来选取模型,会进一步降低多模型方法的性能。
4.3. 预测性能与土壤景观距离的关系
无论使用哪种模型,当目标微流域与有图微流域的土壤景观距离较小时,预测准确度显著更高,不确定性显著更低。在土壤景观非常相似的区域,单一模型与基于真实距离选择的多模型性能差异消失,两者对质地和石质性的预测准确度都大幅提升。
4.4. 土壤图的外推
通过设定预测土壤景观距离的阈值(例如31),可以在地图上圈定出一个“外推区域”。在此区域内,土壤属性预测的准确度明显高于整个研究区的平均水平,不确定性则更低。以阈值31为例,得到的外推区域面积为10,892 km2,占研究区总面积的7%,是现有土壤图总面积(464 km2)的23倍多。在该区域内,单一模型对质地和石质性分类的预测准确度分别高达94%和90%,不确定性仅为6%和7%;深度分类的预测准确度为57%,不确定性为31%。研究还发现,不同土壤图的外推能力差异很大,大多数图的外推面积小于200 km2,但少数图的外推面积超过500 km2。
研究结论与讨论
本研究为在大区域范围内实现高精度土壤制图探索了一条可行的“混合”路径。主要结论如下:首先,在保证足够精度的前提下,使用高分辨率历史土壤图作为DSM模型的输入数据,是替代稀疏点状土壤剖面数据的有效方案,有助于捕捉局部土壤变异格局。其次,基于“土壤景观距离”可以成功识别出围绕现有土壤图、预测准确性高且不确定性低的外推区域。这一概念量化了土壤覆盖的高级组织层次,将其纳入DSM框架,不仅可用于划定可靠制图范围,也为改进预测不确定性的事前估计提供了新思路。最后,在卡纳塔克邦的案例中,仅利用覆盖0.3%区域的详细土壤调查资料,就能通过DSM方法将可靠制图范围扩展至7%的区域,特别是对质地和石质性分类实现了极高精度的预测。这证明将传统土壤详查与数字土壤外推技术相结合,能够在可控成本下显著扩大高精度土壤信息的覆盖范围。
讨论部分指出,尽管基于土壤景观距离选择单个模型进行外推的想法受限于距离预测的精度而未展现出优势,但未来可探索基于土壤景观距离概率加权的模型集成策略。此外,研究发现少数土壤图具有大得多的外推能力,这提示在未来土壤调查规划中,可以运用土壤景观距离的概念进行优化抽样设计,选择那些最具“代表性”的区域开展详查,从而以最高效的方式扩大可靠制图的领土。这项研究展示的方法有望应用于全球其他拥有类似详细土壤调查资料的地区,推动土壤调查从完全依赖传统野外工作向数字化、智能化方向演进。
该论文发表于土壤科学领域国际权威期刊《Geoderma》。这项工作的意义在于,它不仅在技术上验证了利用历史详图进行数字外推的可行性,更在理念上架起了传统土壤学知识(土壤景观)与现代数据驱动预测之间的桥梁,为在全球范围内经济高效地生产高分辨率、高可信度的土壤信息产品提供了崭新的解决方案蓝图。