基于单调权重约束的XGBoost模型，用于提升非饱和土壤中土壤-水分特性曲线的预测精度

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年02月13日 来源：Journal of Hydrology 6.3

编辑推荐：

　　土壤-水特征曲线（SWCC）预测中，传统机器学习模型存在物理单调性约束不足的问题。本研究基于UNSO DA 2.0数据库，通过遗传算法优化XGBoost模型，并引入单调性约束构建MGA-XGBoost模型，验证其物理一致性及预测精度（R2=0.825）。关键特征包括基质势、土壤质地、容重、曲率系数和异质性系数，经筛选后模型仍保持高精度（R2≈0.823）。研究提出物理约束与智能优化结合的建模框架，有效提升SWCC预测的可靠性和可解释性。

作者：王冲、蔡红红、吴玉莫、田佳琪、吴明红

单位：上海大学环境与化学工程学院有机化合物污染控制工程重点实验室（教育部），中国上海200444

摘要

土壤-水特征曲线（SWCC）是研究水文循环和农业水资源管理的基础。虽然传统的测量方法耗时较长，但现有的基于土传函数（pedotransfer functions）的机器学习（ML）方法往往无法确保水分含量（θ）和基质吸力（H）之间的物理单调性。本研究开发了一个受单调性约束的ML框架，以实现物理上一致且准确的SWCC预测。利用UNSODA 2.0数据库，评估了多种优化算法来调整ML模型。经过遗传算法优化的XGBoost（GA-XGBoost）获得了最高的预测精度（R2 = 0.825）。通过进一步加入单调性约束，构建了MGA-XGBoost模型。特征重要性分析表明，基质吸力、土壤质地信息、容重、曲率系数和不均匀系数是五个最具影响力的特征。仅使用这些特征的简化模型仍保持了较高的精度（R2 ≈ 0.823），提高了模型的泛化能力和可解释性。本研究提供了一个基于物理约束的机器学习建模框架，为模拟全球多源土壤数据场景中的水分传输提供了新的方法支持。

引言

土壤-水特征曲线（SWCC）是土壤水文学和非饱和土壤力学研究的基础，因为它定义了基质势能（?）与水分含量（θ）之间的关系（Yan等人，2021年；Zhang等人，2025年）。它不仅直接或间接地描述了非饱和土壤的入渗特性、抗剪强度和变形特性，还是模拟非饱和土壤水分、温度和溶质传输的关键工具（Aventian等人，2024年；Zhai等人，2017年）。因此，深入理解SWCC可以提高土壤-水系统中工程解决方案的可靠性。目前，确定SWCC的实验方法多种多样，常用的技术包括滤纸法、露点势能法、轴向平移法和离心法（Ding等人，2022年；Saha和Sekharan，2021年；Zhou等人，2021年）。然而，这些方法在原理和操作程序上存在显著差异，且每种方法仅适用于特定的吸力范围（Saha和Sekharan，2021年；Ma等人，2024年）。此外，地下SWCC的高异质性给获取可靠的SWCC带来了挑战（Chin等人，2010年；Zhou等人，2021年）。因此，利用易于测量的土壤物理化学性质（如土壤质地、孔隙度和容重）通过土传函数（PTFs）来估计SWCC的方法越来越受到关注（Abdelbaki，2021年；Saha和Sekharan，2021年）。主要有两种方法：（1）在特定的基质吸力（H）值处计算θ，称为点PTF（Obalum和Obi，2013年）；（2）为SWCC的数学模型（如van Genuchten模型、Brooks-Corey模型）计算参数，称为参数化PTF（Brooks和Corey，1964年；Van Genuchten，1980年；Zapata等人，2012年）。点PTF的局限性在于它无法直接确定模型预定吸力值之外的其他H条件下的θ。作为替代方法，参数化PTF使用具有特定参数数量的SWCC模型来描述θ和H之间的关系。然而，其精度取决于SWCC的预定义解析方程与实际曲线形状的吻合程度。除了上述两种传统的PTF外，Haghverdi等人（2012年）提出了一种伪连续PTF，将H作为额外输入变量来预测θ。这种方法不受预定义H的限制，也不依赖于SWCC解析方程的选择，具有很强的实际应用潜力。随着计算机技术和人工智能的快速发展，结合伪连续PTF的ML模型（即ML-PTFs）被广泛用于SWCC预测。这种方法不仅能够高精度地预测完整连续的SWCC，还能避免对特定数学模型的依赖，有效克服了传统PTF的局限性（Ding和El-Zein，2024年）。实施ML-PTF的关键挑战在于特征选择和数据挖掘算法（Pham等人，2023年）。大多数现有的SWCC PTF模型考虑了三个主要因素：土壤物理性质（如容重、孔隙度和粉砂、砂及粘土的比例）、化学和矿物学性质（如有机物、pH值、粘土矿物含量和阳离子交换容量）以及土壤应力状态（如H）（Zhan等人，2022年；Zhang等人，2024年）。获取多种土壤性质的成本较高，且引入额外独立变量对模型预测能力的提升仍不确定（Bakhshi等人，2023年；Ding和El-Zein，2024年）。此外，这些土壤性质之间可能存在多重共线性，进一步影响模型的稳定性（Qin和Fan，2021年）。因此，选择适当的独立变量可以简化建模过程并提高模型的预测精度。最近的研究表明，土壤质地和物理性质是基于PTF的SWCC研究中的主要因素（Abdelbaki，2021年；He等人，2025年；Qiao等人，2018年；Zapata，1999年）。基于这两个关键影响因素，一些学者探讨了不同人工神经网络（ANN）结构对SWCC预测性能的影响。研究表明，无论采用何种ANN结构，都能实现SWCC的准确预测（Ding和El-Zein，2024年；Pham等人，2019年）。一些研究人员使用ANN模型来预测SWCC模型中的参数（如Fredlund-Xing方程或van Genuchten方程），实现了任意饱和度水平下基质吸力的准确预测（He等人，2025年；Saha等人，2018年）。此外，研究人员还使用了多种算法来理解土壤性质与θ之间的复杂关系，如ANN、支持向量机、随机森林和极端梯度提升（XGBoost）。结果证明了ML方法在SWCC预测方面的显著优势（Achieng，2019年；Gunarathna等人，2019年；Nguyen等人，2017年；Pham等人，2023年；Senyurek等人，2020年）。纯粹基于数据的PTF模型往往由于忽视了物理原理而产生不符合物理规律的预测结果或外推能力较差。为了解决这个问题，本研究提出了一个结合物理约束的系统超参数优化框架：首先建立模型的物理基础和简洁结构。在输入选择方面，从多个角度选择具有明确物理意义的模型输入变量，包括土壤质地类型、初始条件和应力状态。使用皮尔逊相关系数和方差膨胀因子分析输入变量之间的相关性。在模型设计中，引入单调性物理约束以强制θ和H之间的递减关系，并采用分组交叉验证来评估模型的泛化能力。随后，在建立的物理和结构框架内进行模型超参数的比较优化。最后，使用数据库数据验证模型的预测性能，并利用SHapley Additive Explanation（SHAP）方法可视化输入特征的重要性，以探索不同特征选择下的模型性能。本研究开发的受物理约束的ML-PTF模型有效避免了土壤水分行为的非物理解释，这对于非饱和边坡、大坝和基础系统的稳定性分析至关重要。

数据收集与处理

本研究使用的数据来自UNSODA 2.0中的干燥SWCC数据库（Nemes等人，2001年），考虑到土壤在湿润和干燥循环期间的显著滞后效应，尤其是在细粒土壤中（Zhai等人，2020年）。因此，在数据库制备过程中仅收集了干燥过程中的SWCC曲线，未考虑滞后效应。这些数据主要通过实验方法获得，如测量仪、轴向平移技术等。

模型构建过程

模型构建过程包括四个主要部分：数据收集与处理、基础学习模型、智能优化算法和单调权重约束方法。所有数据预处理、模型开发和超参数优化均使用Python编程语言（版本3.9.18）完成。机器学习算法主要基于Scikit-Learn库（版本1.5.0）开发，而科学计算和数组操作则使用了其他工具。

模型验证与分析

为了评估模型的预测能力，将未经过训练阶段的测试集数据分别输入到使用遗传算法（GA）、贝叶斯优化（BO）和遗传随机森林（GS）优化的SVR、ANN和XGBoost模型中，以进行SWCC预测。同时，使用三种误差评估指标（R2、RMSE和MAE）定量评估模型的预测性能，如图4所示。 XGBoost基于梯度提升算法，通过迭代训练多个弱学习器来实现

结论

本研究提出了一个受单调性约束的机器学习框架，以实现物理上一致且高精度的土壤-水特征曲线（SWCC）预测。基于UNSODA数据库，评估了多种优化算法和机器学习模型组合的性能。成功将单调性约束纳入机器学习建模过程，建立了水分含量（θ）和

作者贡献声明

王冲：撰写初稿、方法论、资金获取、正式分析、数据整理。蔡红红：方法论、调查、正式分析。吴玉莫：撰写初稿、数据整理。田佳琪：撰写与编辑、数据整理。吴明红：方法论、正式分析、概念构建。

利益冲突声明

作者声明他们没有已知的可能影响本文工作的财务利益或个人关系。

致谢

本工作得到了中国建筑股票技术研究与发展计划（CSCEC-2024-Z-48）、兰州科学技术规划项目（2025-3-075）、甘肃省联合研究基金重点项目（24JRRA871）以及甘肃省杰出青年基金（22JR5RA392）的支持。

联系信箱：

粤ICP备09063491号

摘要

引言

数据收集与处理

模型构建过程

模型验证与分析

结论

作者贡献声明

利益冲突声明

致谢

热点排行