使用SVM和XGB方法预测腐蚀钢筋混凝土中的 bond 强度陈志强、陈壮、钟英姿

《Materials》：Prediction of Bond Strength in Corroded Reinforced Concrete Using SVM and XGB Methods Zhi-Qiang Chen, Zhuang Chen and Ying-Zi Zhong

【字体：大中小】 时间：2026年05月10日 来源：Materials 3.2

编辑推荐：

　　摘要腐蚀钢筋混凝土（CRC）结构的粘结强度对结构安全和长期耐久性至关重要。然而，腐蚀引起的粘结性能下降过程受到多种耦合因素的影响，表现出复杂的非线性行为，这使得传统理论模型难以提供准确的预测。为应对这一挑战，本研究提出了一种基于机器学习技术的新颖统一预测

　　摘要腐蚀钢筋混凝土（CRC）结构的粘结强度对结构安全和长期耐久性至关重要。然而，腐蚀引起的粘结性能下降过程受到多种耦合因素的影响，表现出复杂的非线性行为，这使得传统理论模型难以提供准确的预测。为应对这一挑战，本研究提出了一种基于机器学习技术的新颖统一预测框架。共收集并整理了391个实验数据集，涵盖了包括粘结强度、钢筋直径、屈服强度、混凝土保护层厚度、混凝土抗压强度、由于腐蚀导致的质量损失率以及箍筋存在与否等关键参数。使用了支持向量机（SVM）和极限梯度提升（XGBoost）算法来开发粘结强度的预测模型。模型的训练和测试采用了10折交叉验证方法。此外，还引入了SHapley Additive exPlanations（SHAP）方法来提高模型的可解释性，并量化评估每个输入特征的影响，结果表明质量损失率和钢筋直径是主要影响因素。本研究有效弥合了高精度黑箱算法与工程中对物理可解释性需求之间的差距。研究结果表明：（1）所提出的XGBoost模型显著优于传统的经验公式，在测试集上取得了较高的决定系数（R2 = 0.893）和较低的变异系数（25.85%）；（2）SHAP分析显示机器学习预测与已建立的物理机制高度一致，成功捕捉到了锈蚀膨胀引起的拉应力分叉的负面影响以及箍筋的正面约束效应。总体而言，所提出的模型表现出优异的准确性、鲁棒性和泛化能力，为评估粘结行为和设计耐用的CRC结构提供了有效的工具和理论基础。

1. 引言在腐蚀钢筋混凝土结构中，钢筋与混凝土之间的粘结强度是决定结构整体机械性能和耐久性的关键参数[1]。随着使用时间的长久，腐蚀性物质（如氯化物盐和海洋气溶胶）逐渐渗透并侵蚀钢筋，导致界面微裂纹的产生和横向膨胀。这些过程导致粘结性能逐渐退化，显著削弱了钢筋和混凝土之间的复合效应，最终降低了结构的承载能力和使用寿命[2,3,4]。这一问题在海洋环境或暴露于除冰盐的区域尤为严重。粘结强度的退化是一个高度复杂且非线性的过程，受多种因素的耦合效应控制，包括钢筋腐蚀程度、混凝土强度、混凝土保护层厚度、钢筋直径和钢筋屈服强度[5,6]。近年来，进行了大量的实验和数值研究来阐明钢筋-混凝土界面腐蚀劣化的机制。Lee等人[7]将加速腐蚀拔出试验与有限元分析相结合，发现粘结强度和刚度均随腐蚀程度的增加而显著下降，并提出了适用于数值模拟的预测方程。Lundgren[8]基于三维有限元模型发现，由腐蚀产物体积膨胀引起的拉应力分叉是粘结退化的主要机制。Lin等人[9]证明了表面裂纹宽度与腐蚀引起的粘结强度之间存在指数衰减关系，并开发了一个考虑箍筋约束效应的实用预测模型。在后续研究中，Lin等人[10]报告称纵向钢筋和箍筋的同步腐蚀会显著加剧粘结性能的退化，并提出了一个考虑双重腐蚀效应的粘结滑移模型。此外，最近的研究表明，氯化物引起的箍筋腐蚀会根本改变RC构件的失效模式，导致剪切性能严重退化[11]，突显了箍筋在腐蚀结构耐久性评估中的关键作用。Yalciner和Kumbasaroglu[12]系统研究了混凝土强度、轴荷载比和腐蚀程度对循环载荷下粘结滑移行为的影响，并开发了一个适用于腐蚀钢筋混凝土柱的经验模型。Feng等人[13]从施工技术的角度发现，不同的除锈方法对恢复腐蚀钢筋的粘结性能有不同的效果，机械研磨被证明是最有效的。Zheng等人[14]报告称，轻微腐蚀可能会由于表面粗糙度的增加而略微增强粘结强度，而严重腐蚀则会显著削弱界面性能。他们据此提出了一个改进的粘结滑移本构模型。此外，Zheng等人[15]指出，大多数现有模型基于理想化假设，无法完全捕捉真实结构中观察到的复杂多因素耦合行为。Li等人[16]开发了一个针对嵌入混凝土中的腐蚀钢筋的分析模型，能够有效预测不同腐蚀程度下的粘结性能。总体而言，尽管许多研究集中在开发理论推导的经验模型上，但这些模型往往难以准确捕捉多个影响变量之间的相互作用，从而限制了其在复杂工程条件下的适用性[17]。近年来，由于机器学习技术在处理高维和非线性问题方面的强大能力，如RC柱的剪切强度预测和材料属性评估，它们被越来越多地引入到结构工程和材料科学中，为克服传统经验和理论模型的局限性提供了有效手段[18]。《Structural Engineering International》上的最新研究也证明了这些方法的有效性；Mohan等人[19]使用SVM进行损伤分类，而Singh等人[20]应用数据驱动模型进行地震评估。在各种机器学习算法中，支持向量机和极限梯度提升在高维数据拟合和特征选择方面表现出色，显示出卓越的稳定性和预测准确性[21,22,23,24,25]。特别是，最近的研究强调了XGBoost在准确预测矩形RC柱的非线性结构参数方面的优势[26]，进一步验证了其在复杂混凝土工程问题中的适用性。一些学者应用机器学习方法预测混凝土材料的界面性能。例如，Chen等人[27]使用集成学习方法开发了纤维增强聚合物与混凝土之间粘结强度的预测模型。Nguyen等人[28]使用XGBoost算法构建了超高性能混凝土抗压强度的预测模型，其准确性与传统经验公式相比更高。Li等人[29]基于包含1056个实验样本的完整数据集，提出了一个用于预测钢筋混凝土粘结滑移关系的XGBoost模型。尽管这些研究取得了显著进展，但大多数研究主要集中在未腐蚀的钢筋或FRP-混凝土界面。专门针对腐蚀钢筋混凝土粘结性能的系统预测模型仍然很少。尽管先进的深度学习模型在自动缺陷检测方面取得了显著成功[30]，但这些方法通常作为“黑箱”运行。现有的粘结强度预测模型同样缺乏对其内部机制的透明解释，这限制了它们在实际工程诊断中的应用。

为了填补现有研究空白，本研究的主要目标是开发一种统一且高精度的机器学习框架，用于预测腐蚀钢筋混凝土结构的粘结强度，从而克服传统经验模型在处理复杂非线性退化行为方面的局限性。此外，本研究的新发现有两个方面：（1）所提出的XGBoost模型在预测准确性和鲁棒性方面明显优于传统公式；（2）通过将机器学习算法与SHAP方法成功结合，本研究有效地打破了“黑箱”限制，提供了与基本物理定律一致的力学解释。研究利用包含391个实验样本的数据库，其中采用了六个关键输入参数——钢筋的质量损失率、钢筋直径、屈服强度、混凝土保护层厚度、混凝土抗压强度以及箍筋的存在与否——来预测粘结强度。开发了一系列预测模型，并系统比较了SVM和XGBoost算法的性能和准确性。为了提高模型的可解释性，结合了SHAP方法来量化揭示每个输入参数对预测粘结强度的贡献和影响趋势。此外，所提出的模型还与三种经典理论公式进行了基准测试，以全面评估其预测准确性、鲁棒性和泛化能力。研究结果预计将为腐蚀钢筋混凝土结构的性能评估和加固优化提供理论见解和实际工具。

2. 实验数据集为了开发能够预测粘结强度的机器学习模型，本研究整理并整合了现有文献中的腐蚀钢筋混凝土实验数据[5,31,32,33,34,35,36,37,38,39,40,41,42]，得到了包含391个有效样本的数据集。该数据集涵盖了影响钢筋与混凝土之间粘结性能的主要因素，确保了良好的代表性和适用性。具体来说，从13个独立且具有代表性的研究中收集的391个数据样本涵盖了广泛的工程参数范围，例如混凝土强度从23.0 MPa到64.9 MPa，质量损失率高达57.0%，反映了多样的实际条件。输入和输出参数的分布如图1和表1所示。数据集包括六个输入变量：钢筋直径、钢筋屈服强度、混凝土保护层厚度、混凝土抗压强度、钢筋的质量损失率以及箍筋的存在与否（0 = 无，1 = 有，作为二进制分类变量，在后续图中用S表示）。输出变量是钢筋-混凝土界面的粘结强度，范围从0.704 MPa到36.070 MPa。最终粘结强度定义为沿嵌入长度的最大平均粘结应力，通过将峰值拔出力除以粘结钢筋的表面积来计算。所有数据均来自传统的拔出或改进的拔出试验，其中施加了单调的拉载荷直到粘结失效。原始参考文献经过仔细筛选，以确保实验条件的可比性和数据的一致性。这个数据集为构建高精度、强泛化的机器学习模型提供了坚实的基础。

图1. 数据集变量分析。（a–e）编译数据集中的输入和输出参数分布；（f）所有变量的皮尔逊相关矩阵。表1. 输入和输出参数统计。虽然钢筋腐蚀的根本原因（例如，氯化物攻击和碳化）显著影响起始阶段，但本研究特别关注腐蚀进展到可测量状态后的残余粘结强度。因此，质量损失率被用作腐蚀程度的综合宏观指标。此外，需要注意的是，现有实验文献中很少一致报告环境参数（如内部含水量），因此它们未被纳入当前数据集作为输入变量。解决这些环境因素是未来高保真数据驱动研究的关键目标。为了更深入地理解变量之间的相互作用及其对模型预测性能的潜在影响，本研究对构建的数据集进行了成分分布和相关性分析。使用皮尔逊相关系数方法评估输入变量之间的线性相关性及其与输出变量（界面粘结强度）的关系，并展示了相关矩阵。分析结果表明，输入变量之间的皮尔逊相关系数的绝对值范围为?0.34到0.61，未检测到显著的多共线性问题。特别是，钢筋直径、混凝土抗压强度、保护层厚度和质量损失率之间的相关性均低于经验阈值|r| = 0.7，表明它们可以在模型训练中作为独立特征。此外，输入变量与粘结强度之间的相关性范围为?0.50到0.26，未观察到显著的线性相关性。这进一步表明影响粘结强度的因素表现出复杂的非线性机制，使其适合用机器学习技术进行建模。因此，所有选定的变量都可以作为有效的输入特征用于模型构建，而不会因变量冗余而对模型的预测性能或可解释性产生负面影响。

3. 机器学习算法为了解决影响粘结强度的因素之间的固有高非线性和耦合效应，本研究采用了两种代表性的机器学习算法——即单学习器模型SVM和集成方法XGBoost——来构建一个稳定可靠的预测框架。3.1.支持向量机（Support Vector Machine，SVM）最初由Vapnik等人提出[43]，基于统计学习理论，已被广泛应用于分类和回归问题。支持向量回归（Support Vector Regression，SVR）是SVM的扩展，专为解决回归任务而设计。与分类中的SVM类似，SVR也旨在寻找一个最优超平面。然而，在回归问题中，其目标是找到一个尽可能接近目标输出的函数，同时确保模型具有良好的泛化能力。SVR的基本思想是允许一定的预测误差（由阈值ε决定），但超过ε边界的数据点数量应最小化。核心概念是在模型复杂性和预测准确性之间找到平衡。给定一个训练集，其中表示输入特征，表示目标值，SVR寻找一个函数f(x)，使其满足所有样本的以下条件：（1）在ε近似误差范围内，目标是最小化模型复杂性。最优函数通常表示为（2），其中是权重向量，是核函数映射，是偏置项。为了优化模型，我们引入松弛变量和来容忍超过ε的误差，问题通过以下优化目标来解决：（3）约束条件为（4）（5）（6），其中C > 0是正则化参数，用于控制模型复杂性和训练误差之间的权衡。通过应用拉格朗日对偶理论，可以得到对偶问题。解决方法使用核函数来替代的显式计算：（7）最终的优化问题转化为支持向量权重系数的计算，得到预测函数：（8），其中和是拉格朗日乘数。

在这项研究中，SVR模型采用径向基函数核（Radial Basis Function kernel），并通过初步实验确定最优参数组合：ε = 0.01，C = 4，γ = 0.8，其他所有参数均设置为其默认值。该模型在拟合债券强度的非线性趋势方面表现出良好的性能，并作为与集成算法比较的基准。

3.2. 极端梯度提升树（Extreme Gradient Boosting Tree）
为了提高拟合债券强度非线性关系的准确性，本文引入了XGBoost算法作为集成学习方法。XGBoost由Tianqi Chen等人于2016年提出[44]，是对传统梯度提升决策树（Gradient Boosting Decision Tree）的改进。其核心思想是迭代构建多个决策树，拟合前一个模型的残差，从而逐步优化整体预测性能。此外，XGBoost结合了L1和L2正则化项以减轻过拟合，并利用近似算法和并行处理来提高训练效率。在这项研究中，XGBoost模型的主要超参数设置如下：树的数量为148，学习率为0.2，最大树深度为3，子节点的最小实例权重和为3，训练样本和特征子样本的比例均为0.7，最小损失减少量设为0.5。其余参数设置为其默认值。这些参数通过交叉验证和网格搜索方法进行优化，以增强模型在预测债券强度方面的泛化能力。XGBoost预测模型由多个回归树组成。设训练集为，其中表示m个特征（影响因素），表示债券强度。模型的最终预测是所有树的预测值之和：（9），其中表示回归树集，表示分类和回归树的数量，表示第k个回归树的预测值。XGBoost算法的目标是使预测值，目标函数表示为（10），其中是用于评估预测值准确性的损失函数，表示防止过拟合的正则化项。设为第k次迭代后的预测值；目标函数可以表示为（11）。在方程中，C是一个常数。通过对损失函数进行泰勒展开并去除与无关的项后，方程可以简化为（12）（13）（14）。如果包含L个叶节点，是叶节点j的样本集，wj是叶节点j的权重，则可以表示为（15）。从方程中可以看出，是关于的二次函数。因此，目标函数的最优值可以表示为（17）。

4. 模型实现和结果分析
4.1. 模型训练和测试程序
本研究建立了一个基于机器学习的建模框架，用于预测腐蚀钢筋混凝土的强度。整个工作流程包括六个主要阶段：数据收集、数据预处理、模型训练、超参数优化、模型验证和模型解释。详细步骤如下：
步骤1—数据收集：系统地从现有文献中收集和整理了与腐蚀钢筋混凝土强度相关的实验数据。构建了一个包含391个样本的数据集，用于后续的模型训练和评估。
步骤2—数据预处理：在归一化之前，进行了适当的数据清洗处理，以处理潜在的异常值。采用统计方法（如四分位数范围IQR技术）来识别和排除由潜在测量误差引起的极端异常值，确保数据集的可靠性。随后，所有输入特征和输出变量使用最小-最大归一化方法进行归一化，将值映射到[0, 1]范围内，以消除维度效应。然后数据随机分为训练集（312个样本，80%）和测试集（79个样本，20%）。
步骤3—模型训练：基于训练数据集，使用Python（版本3.11.5）开发了两种机器学习模型——SVM和XGBoost。具体来说，SVM模型通过scikit-learn库（版本1.6.1）实现，XGBoost模型使用XGBoost包（版本2.1.4）构建。采用多种性能指标对模型的学习能力和稳定性进行初步评估。
步骤4—超参数优化：结合k折交叉验证的网格搜索方法系统地优化关键模型超参数，以提高模型的泛化能力和预测准确性。
步骤5—模型验证：在独立的测试数据集上评估训练好的模型。性能指标包括决定系数（R2）、均方根误差（RMSE）、平均绝对误差（MAE）和平均绝对百分比误差（MAPE）。全面分析和比较了不同模型的预测性能。
步骤6—模型解释：为了提高模型的可解释性，引入了SHAP方法。该方法提供了模型输出的全局和局部解释，揭示了每个输入特征对债券强度预测的影响机制，并解决了机器学习模型的“黑箱”性质。本研究的整体研究框架如图2所示。
4.2. 评估指标
为了系统地评估构建的机器学习模型在预测债券强度方面的性能，选择了四个常用的评估指标：R2、RMSE、MAE和MAPE。具体来说，R2用于衡量模型解释数据变异的能力，RMSE和MAE反映了模型预测值与实际值之间的偏差，MAPE提供了相对误差度量。这些指标的数学定义见表2。
4.3. 模型预测性能和验证分析
表3展示了SVM和XGBoost模型在训练集和测试集上的评估指标——R2、RMSE、MAE和MAPE。在训练集上，XGBoost模型的R2值为0.9460，显著高于SVM模型的0.8531，表明XGBoost对训练数据的拟合效果更好。同时，XGBoost模型的RMSE从2.5940降低到1.6125（相对减少了约37.84%），MAE从1.7703降低到1.1731（减少了约33.73%），MAPE从24.9984降低到15.4347（减少了约38.27%），这些都表明了更好的拟合性能和误差控制能力。在测试集上，XGBoost也优于SVM。其R2值为0.8934，高于SVM的0.8593。此外，RMSE从2.8182降低到2.2373（相对减少了约20.61%），MAE从2.1075降低到1.6802（减少了约20.28%），MAPE从24.3626降低到17.8607（减少了约26.69%）。这些结果表明XGBoost在训练和预测阶段都表现出更强的泛化能力和稳定性。总体而言，XGBoost在多个评估指标上优于SVM模型，显示出更强大的稳健性和准确的债券强度预测性能。第5节进一步讨论了相对预测比值的详细统计分析。此外，所提出的模型具有高度可扩展性，只需将新的实验数据集添加到训练矩阵中即可持续更新。
表3显示了SVM和XGBoost模型在训练集和测试集上的评估指标。图3展示了SVM和XGBoost模型预测债券强度的回归散点图。为了评估模型预测值与实际值之间的拟合程度，绘制了对角线和±30%误差限制的辅助线。可以看出，与SVM模型相比，XGBoost模型的预测值更紧密地分布在±30%误差范围内，更多的点落在这个范围内。这表明XGBoost模型提供了更准确的债券强度预测，具有更强的误差控制和更好的样本拟合性能。相对密集的散点图进一步验证了XGBoost算法在处理非线性多变量关系方面的适应优势。
图4比较了SVM和XGBoost模型在预测腐蚀钢筋混凝土强度方面的性能。它显示了预测值与实验测量值之间的关系（见图4）。从图中可以看出，两个模型都与实验数据有良好的拟合，表明它们适用于这个问题。进一步观察发现，XGB模型的预测值与对角线的吻合度更高，误差波动更小，表明更高的准确性和稳定性。这一结果进一步验证了集成学习方法在处理高维非线性回归问题中的优势。总之，与传统的单一算法（如SVM）相比，XGB模型表现出更强的预测性能和泛化能力，使其更适合在复杂环境中建模CRC的强度。
图4. 实际结果与预测结果的比较。（a）SVM模型。（b）SVM：训练集。（c）XGB：训练集。（d）XGB：测试集。
4.4. 模型解释
为了提高构建的机器学习模型的可解释性，本研究引入了SHAP方法[45]。SHAP是一种博弈论方法，用于计算每个特征对模型预测的贡献。具体来说，特征的SHAP值定义为其在所有可能特征子集上的边际贡献的加权平均值：（18），其中表示所有输入特征的集合，表示输入特征的总数，表示排除特征的任何特征子集。项表示特征对模型预测的边际贡献。对于特定的预测，SHAP值表示每个特征相对于预期模型输出的贡献。较大的绝对SHAP值意味着对预测有更大的影响，而接近零的值表示影响可以忽略不计。此外，SHAP值的符号反映了影响的方向：正值增加预测的债券强度，而负值则降低它。在这项研究中，使用了Tree SHAP算法高效地计算了XGBoost模型的SHAP值，有助于解释影响债券强度的因素。

4.5. 综合讨论
在第5节中进一步讨论了相对预测比值的详细统计分析。此外，所提出的模型具有高度可扩展性，只需将新的实验数据集添加到训练矩阵中即可不断更新。图3展示了SVM和XGBoost模型在预测债券强度方面的回归散点图。为了评估模型预测值与实际值之间的拟合程度，绘制了对角线和±30%误差限制的辅助线。可以看出，与SVM模型相比，XGBoost模型的预测值在±30%误差范围内分布得更紧密，更多点落在这个范围内。这表明XGBoost模型提供了更准确的债券强度预测，具有更强的误差控制和更好的样本拟合性能。相对密集的散点图进一步验证了XGBoost算法在处理非线性多变量关系方面的适应性优势。
图4. ML模型在预测债券强度方面的拟合结果。（a）SVM模型。（b）XGB模型。图4比较了SVM和XGBoost模型在预测腐蚀钢筋混凝土强度方面的性能。它显示了预测值与实验测量值之间的关系（见图4）。从图中可以看出，两个模型都与实验数据有良好的拟合，表明它们适用于这个问题。进一步观察发现，XGB模型的预测值与对角线的对齐度更高，误差波动更小，表明更高的准确性和稳定性。这一结果进一步验证了集成学习方法在处理高维非线性回归问题中的优势。总之，与传统的单一算法（如SVM）相比，XGB模型表现出更强的预测性能和泛化能力，使其更适合在复杂环境中建模CRC的强度。研究结果表明，质量腐蚀率和钢筋直径是两个对模型输出贡献最大的特征，突显了它们对受腐蚀钢筋混凝土粘结性能的显著影响。相比之下，混凝土保护层厚度的SHAP值相对较低，表明其在模型中的权重较小，对预测结果的影响有限。此外，图5b中的SHAP分布图揭示了影响趋势：随着质量腐蚀率的增加，其SHAP值变得更负，显著降低了预测的粘结强度。从力学角度来看，这是因为腐蚀产物的体积膨胀在混凝土保护层中产生了拉应力，导致纵向开裂。这种严重的开裂会降低约束效果，并大大削弱钢筋与周围混凝土之间的机械互锁。另一方面，钢筋强度、混凝土强度和箍筋的存在对预测值有积极影响。物理上，更高的混凝土强度提供了更强的握裹力，而箍筋的存在提供了有效的横向约束，限制了开裂的发展，从而增强了界面粘结能力。这些发现表明，XGBoost模型不仅能够进行数值拟合，还能准确捕捉腐蚀-粘结现象的物理和力学行为。

图5. 基于SHAP的特征重要性和模型可解释性分析。在局部解释方面，图5c展示了一个代表性样本的SHAP可视化分析。该样本的预测粘结强度为27.86 MPa（实际值为32.37 MPa），而基线值（即所有样本的平均预测值）为10.368 MPa。从可视化结果可以看出，预测主要受到钢筋直径、质量腐蚀率、钢筋屈服强度和保护层厚度的正面影响，而混凝土抗压强度和箍筋的缺失则对预测产生了负面影响。这些结果表明，该模型不仅具有很强的预测能力，还能在样本层面提供清晰的因果解释。这进一步验证了机器学习方法在预测受腐蚀钢筋混凝土粘结强度方面的科学性和可靠性。

5. 模型性能比较为了验证所提出模型的有效性，将XGB和SVM算法的预测结果与三种现有的经验公式进行了比较。表4展示了预测粘结强度与测量值之间的统计比较，包括最大值、最小值、平均值、标准差和变异系数。从表4可以看出，XGB模型的变异系数为25.85%，SVM模型的变异系数为48.93%，这两者都显著低于三种经验模型（Bhargava等人[46]：58.13%；Kivell [47]：61.15%；Lee等人[7]：65.29%），表明所提出的机器学习模型在预测准确性和结果稳定性方面具有明显优势。此外，XGB模型的平均预测比率最接近1.0（1.0524），进一步表明其具有良好的拟合能力。

表4. 不同模型对预测值与实际值比率的评估。表5展示了不同模型的回归性能评估指标的比较，包括决定系数、均方根误差、平均绝对误差和平均绝对百分比误差。结果显示，XGB和SVM模型的R2值分别为0.9354和0.8543，显著高于三种经验模型中的最高R2值（Kivell模型：0.7475），表明其拟合性能更优。在误差指标方面，XGB模型的RMSE、MAE和MAPE值分别为1.7388、1.2755和15.92，相比之下，XGB模型将RMSE降低了约50.1%，MAE降低了51.5%，MAPE降低了59.1%。SVM模型在这些指标上也优于经验模型，显示出优异的预测准确性和稳健性。

总之，本研究提出的机器学习模型——尤其是XGB模型——在预测准确性、误差控制和稳定性方面明显优于现有的理论公式，体现了这些模型在预测受腐蚀钢筋混凝土粘结强度方面的优越性能和工程应用潜力。为了评估不同模型对腐蚀率（η）变化的响应，对所提出的机器学习模型与三种经典经验公式进行了比较分析，如图6a,b所示。结果表明，所有模型都预测出随着腐蚀率的增加粘结强度呈普遍下降趋势，这与腐蚀引起的粘结退化的物理机制一致。然而，各模型之间的敏感性程度存在明显差异。经验公式表现出相对平滑且较平缓的下降趋势，表明对腐蚀变化的响应较低，而机器学习模型——特别是XGB模型——显示出更为明显且非线性的下降趋势，与实验观察结果更加吻合。为了理解这些不同的敏感性，分析两个案例的具体边界条件是必要的。这两个案例代表了具有不同几何和材料特性的实验样本。具体来说，案例1的特点是钢筋直径较小（mm）和保护层厚度较大（mm），抗压强度为MPa；而案例2则代表了更标准的配置。案例1中较高腐蚀率下的模型预测差异突显了传统经验模型的局限性：它们难以准确捕捉到由于保护层厚度极大导致的裂纹失效引起的急剧非线性粘结退化。在案例2中，参数更接近于通常用于校准经验公式的平均配置，机器学习预测与经验模型之间的差异明显较小。

总体而言，XGB模型对腐蚀率变化的敏感性最高，其预测结果与实验结果最为一致，突显了其在极端和多变边界条件下表示复杂非线性腐蚀-粘结关系的卓越准确性、泛化能力和稳健性。

6. 结论本研究提出了一个基于多算法比较的统一机器学习预测框架，采用支持向量回归（Support Vector Regression）和XGBoost算法来预测受腐蚀钢筋混凝土结构的粘结强度。此外，引入了SHAP方法来对模型结果进行可解释性分析。基于391个实验数据集，构建了粘结强度预测模型并评估了其准确性和稳定性。本研究的主要结论如下：所构建的两种机器学习模型在预测受腐蚀钢筋混凝土的粘结强度方面均有效。其中，集成模型XGB表现最佳，在训练集和测试集上都取得了更高的R2值和更低的误差指标，表现出更高的预测准确性和稳健性。通过使用SHAP方法对模型输出进行全局和局部解释，识别出关键影响因素，质量腐蚀率和钢筋直径是主要贡献因素。钢筋屈服强度、混凝土抗压强度和箍筋的存在也有显著的正面贡献，而质量腐蚀率对粘结强度有负面影响。与传统经验公式（Bhargava、Kivell和Lee）相比，所提出的机器学习模型在预测准确性和稳定性方面具有显著优势。XGB模型的预测值与测量值比率的变异系数为25.85%，显著低于SVM模型（48.93%）和经验模型（CV > 58.13%），表明其一致性和工程适用性更好。本研究成功地将XGBoost和SHAP相结合，不仅提供了高精度的预测，还提供了与力学一致的粘结退化现象的定量解释。这填补了将机器学习应用于土木工程时预测能力与物理可解释性之间的关键研究空白。对于未来的工作，可以通过纳入额外的环境参数（如混凝土含水量）以及利用现场测试数据来不断训练和优化算法，以使其适用于更广泛的实际应用。

总之，本研究提出的基于SHAP分析的混合机器学习预测框架不仅提高了受腐蚀钢筋混凝土粘结强度的预测准确性，还提供了模型内部机制的可解释性。它展示了在工程实践中的广泛应用潜力和价值。

热点排行