基于物理信息神经网络的土壤粒径分布连续反演新方法：从可见-近红外光谱到连续颗粒分布

《European Journal of Soil Science》：A Physics-Informed Neural Network for Retrieving the Continuous Soil Particle Size Distribution From Vis–NIR Spectra

【字体：大中小】 时间：2026年01月20日 来源：European Journal of Soil Science 3.8

编辑推荐：

　　本文提出了一种创新的物理信息神经网络（PINN）方法，用于直接从可见-近红外（vis–NIR）光谱反演连续的土壤粒径分布（PSD）。该方法突破了传统仅预测砂粒、粉粒和粘粒等离散组分的局限，通过整合测量数据和物理约束，学习得到连续、可微且非参数化的累积PSD表征。研究在2777个土壤样本上的评估表明，该模型在预测累积PSD分数时RMSE为6.77%，R2达0.97。与忽略物理约束的模型相比，PINN即使在数据稀疏条件下也能保证预测的物理一致性（如非负性、单调递增性及在最大粒径处总和为100%），为跨纹理分类系统的大尺度土壤分析提供了新范式。

引言

土壤粒径分布（PSD）曲线定义了小于给定尺寸的土壤颗粒比例，在土壤科学、农业、水文学和环境研究中扮演着关键角色，因为它直接影响土壤持水性、养分有效性、土壤通气性、渗透性和力学行为等关键性质。传统的实验室PSD测量方法（如筛分-沉降法或激光衍射法）虽然应用广泛，但依然耗时且成本高昂。过去二十年，红外光谱和数字土壤测绘方法与各种机器学习（ML）技术相结合，显著加速了不同尺度下土壤质地的估算。然而，这些努力主要集中在预测土壤质地组分（即砂粒、粉粒和粘粒），而非估算整个连续的PSD。

估算土壤质地组分的方法存在显著挑战。一个主要限制源于多种土壤质地分类系统的并存，各系统对粒径组分的定义不同。此外，砂、粉、粘粒具有成分数据特性，其和必须为100%。为确保ML模型预测符合此约束，常需应用对数比变换等数学变换，但这可能影响模型精度。连续的PSD提供了比离散组分更详细、更全面的土壤性质表征，能为了解土壤水力特性和力学性质提供宝贵信息。

此前仅有Hermansen等人（2017）的研究尝试使用可见-近红外（vis–NIR）漫反射光谱估算完整的PSD，该研究采用了Rosin–Rammler和Fredlund两种参数化PSD模型，并侧重于预测其参数。然而，依赖预定义的PSD模型存在关键局限：土壤PSD的形状可能因土壤发生、母质和环境条件而表现出很大差异，这些形状未必总是符合固定的数学方程。

材料与方法

本研究使用了来自丹麦782个土壤剖面的2777个土壤样本组成的综合数据集。土壤质地通过筛分和比重计法测定，提供了在2、20、63、125、200、500和2000 μm处的累积粒径分布。光谱测量使用NIRS DS2500光谱仪在400至2500 nm波长范围内进行。光谱数据经过一阶Savitzky–Golay（SG）导数预处理以消除基线偏移，并应用主成分分析（PCA）进行降维，确定50个主成分（PCs）作为神经网络输入。

数据集按剖面级别随机划分为70%用于训练和验证，30%作为保留测试集。提出了一个物理信息神经网络（PINN）用于从vis–NIR测量中估算整个连续PSD。该PINN通过学习测量数据和训练期间施加的物理约束，来学习累积PSD的连续、可微且非参数化的表示。

神经网络架构是一个前馈网络，输入包括来自样本预处理光谱的PCs和粒径对数（log(d)），输出是对应粒径下的预测累积分数（F(d)）。该模型的关键优势在于仅需要（log(d), F(d)）测量对进行训练，而非完整的测量PSD。

在PINN中施加了三个物理约束：

1.
单调性约束：累积PSD必须是粒径的单调递增函数。通过使用由Runje和Shankaranarayana（2023）提出的方法设计单调神经网络架构来实现，该架构使用特定的单调激活函数组合来强制输出相对于log(d)输入单调递增。
2.
最大粒径处累积分数约束：在最大粒径（d_max= 2000 μm）处，累积分数必须为100%。通过在损失函数中添加一个惩罚项来实现，该项惩罚预测值F(d_max)与100%的偏差。使用拉丁超立方采样生成的残差点集来施加此约束。
3.
非负性约束：PSD预测值必须对所有粒径均为非负。通过在输出层使用修正线性单元（ReLU）激活函数来实现。

物理信息损失函数定义为数据损失（测量值与预测值之间的均方误差）和约束损失（在残差点上对偏离100%的惩罚）的加权和。还评估了不同数据稀疏性场景下的模型性能，即在训练集中每个样本可用的测量点数量逐渐减少的情况。

结果与讨论

PINN成功学习了各种形状的连续PSD，所有分布均保持单调递增、非负，并在2000 μm粒径处达到100%。通过对预测的PSD曲线关于log(d)求导，可以直接获得对数概率密度函数（PDF），这些PDF显示出从窄到宽、偏态分布等多种形状。

在测试集上，PINN预测颗粒累积分数（F(d)）的RMSE为6.77%，决定系数（R²）为0.97。对于质地组分，模型预测砂粒、粉粒和粘粒的RMSE值分别为4.72%、3.06%和2.75%。性能与之前使用vis–NIR光谱预测土壤质地组分的研究相当或更优。

在数据稀疏性场景下，随着每个样本训练数据点数量的增加，物理无知（physics-agnostic）模型和PINN的性能均有所改善。当只有两个测量点时，物理无知模型在RMSE上优于PINN，但以违反物理约束（如非单调性和出现负预测值）为代价。PINN由于受物理定律约束，灵活性较低，在低数据分辨率下拟合稀疏数据的能力较弱，导致误差和不确定性较高。随着测量点数量的增加（超过3个），PINN开始优于物理无知模型。重要的是，PINN在所有场景下始终满足单调性和非负性条件，而物理无知模型即使每个样本有7个测量点，仍有超过40%的样本违反单调性约束，超过6%产生负预测。

惩罚因子（λ）用于控制最大粒径处累积分数约束在总损失函数中的相对贡献。分析表明，当λ增加到1000时，预测的累积分数逐渐收敛到目标值100%。然而，超过1000后，偏差再次开始增加。鉴于λ=100和λ=1000时约束满足度几乎相同，且λ超过100时模型RMSE性能开始恶化，因此选择λ=100作为最优值。

结论与展望

本研究开发并实现了一种PINN，用于从vis–NIR光谱测量中估算整个连续土壤PSD。该方法不假设PSD的预定义函数形式，而是从测量值和施加的物理约束中学习最终形状，使其在捕捉土壤PSD的自然变异性方面具有高度灵活性。

与专注于预测依赖于土壤质地分类系统的土壤质地组分的传统方法不同，该模型通过将粒径作为显式输入直接预测整个累积PSD。新方法的一个关键优势是仅需要（粒径，累积分数）对进行训练，使得在训练过程中可以包含仅具有单个测量点的样本。这种灵活性对于大规模研究特别有益，因为样本间的数据可用性各不相同。

通过将重点从建模质地组分（其定义因纹理分类系统而异）转移到建模连续PSD，该方法消除了传统方法所需的插值、协调和变换需求。这对于跨国大尺度土壤制图应用尤其有利，因为这些数据集通常整合了来自具有不同组分定义的多个质地分类系统的信息。

本研究使用的数据集包含常规PSD测量，每个样本最多7个点。这种分辨率水平通常不足以捕捉复杂的特征（如双峰分布）。然而，预计将PINN方法应用于更高分辨率的PSD测量（如通过激光衍射法获得）将允许模型捕捉更复杂和详细的PSD形状。

未来的研究可以探索更高级的特征提取技术，如卷积神经网络自编码器。此外，在具有更广土壤类型和粒径分布（特别是更高粘粒含量）的数据集上应用新方法可能有助于提高其普适性。结合辅助预测变量（如表土与底土、土壤类型或矿物学）可能会进一步提升性能。虽然本研究侧重于将PINN框架应用于vis–NIR光谱进行PSD估算，但相同的方法学可以扩展到PSD的数字土壤制图，此时预测变量可以是环境协变量（如气候、地形等），而非源自光谱数据的主成分。

热点排行

新闻专题