一种新颖的集成回归模型与因果分析方法,用于预测钢纤维增强混凝土的抗压强度
《Ain Shams Engineering Journal》:A novel ensemble regressor and causal analysis for predicting the compressive strength of steel fiber-reinforced concrete
【字体:
大
中
小
】
时间:2026年05月09日
来源:Ain Shams Engineering Journal 5.9
编辑推荐:
艾拜克·奥兹尤克塞尔·奇夫奇奥卢(Aybike ?zyüksel ?ift?io?lu)|穆尔塔达·恩维尔迪(Murteda Unverdi)|纳兹·马尔达尼(Naz Mardani)|阿里·马尔达尼(Ali Mardani)
土耳其马尼萨省马尼萨贾拉尔·巴亚尔大学(Mani
艾拜克·奥兹尤克塞尔·奇夫奇奥卢(Aybike ?zyüksel ?ift?io?lu)|穆尔塔达·恩维尔迪(Murteda Unverdi)|纳兹·马尔达尼(Naz Mardani)|阿里·马尔达尼(Ali Mardani)
土耳其马尼萨省马尼萨贾拉尔·巴亚尔大学(Manisa Celal Bayar University)土木工程系
**摘要**
添加了辅助材料的钢纤维增强混凝土(SRFC)具有更高的韧性和耐久性,但其抗压强度仍然难以预测,因为其性能受到混合物组成、纤维参数和固化过程的共同影响。本研究汇总了446篇关于添加矿物材料的SRFC的文献实验观察结果,记录了14个输入变量和抗压强度数据,并开发了一种名为HERO-R的异构堆叠集成回归模型。该模型结合了基于直方图的梯度提升(histogram-based gradient boosting)、极端随机树(extremely randomized trees)和随机森林(random forest)基础学习器,并通过对数变换和z分数标准化(z-score standardization)进行特征增强。HERO-R使用五折交叉验证协议与八种常用的回归算法进行了性能比较。结果表明,HERO-R在验证准确率方面表现最佳,平均R2值为0.9405,平均均方根误差(RMSE)为7.38 MPa,平均绝对误差(MAE)为4.88 MPa,并且在不同测试分组中展现了稳定的泛化能力。为了提高预测模型的可解释性,还利用因果结构学习(causal structure learning)推断出将混合物成分与抗压强度联系起来的有向无环图(directed acyclic graph),其中包括一个总粘结剂组分(total binder construct),该组分对水灰比(water to binder ratio)和强度有重要影响。通过将每个变量固定在其最小值、平均值和最大值并重复评估,反事实干预分析(counterfactual intervention analysis)表明,水含量和固化时间在各个强度范围内是主要的因果驱动因素,而钢纤维用量可以在研究范围内提高强度,但纤维几何形状的影响有限。总体而言,这种结合预测和因果分析的方法为加速混合物筛选、减少实验工作量以及支持添加矿物材料的SRFC的可持续性优化提供了坚实基础。
**1. 引言**
混凝土仍然是全球建筑实践中的主要材料,它通常与钢筋结合使用,以增强结构承载能力、使用性能和长期耐久性[1]、[2]。随着基础设施需求的增长,迫切需要提高混凝土的机械性能,以应对日益严格的结构和环境条件[3]。在水泥基体中添加不连续的钢纤维作为次要增强系统,已被广泛认为可以通过提高开裂后的韧性和延展性、增加耐久性以及提供裂缝桥接机制来延迟裂缝 initiation 和限制裂缝扩展,从而提升混凝土性能[4]、[5]、[6]。
纤维增强混凝土(FRC)通过随机分散的纤维来改善其机械性能和耐久性,这使得FRC成为多种结构应用的首选材料[7]、[8]。纤维的添加尤其在高应力条件下提升了裂缝控制能力和韧性[7]、[8]。裂缝桥接(cryack bridging)是这种性能背后的关键机制,纤维能够阻止微裂缝扩展为宏观裂缝,从而在受力时保持混凝土的结构完整性。特别是策略性使用钢纤维(steel fibers)已被证明可以显著提升混凝土性能,这一主题在材料科学和结构工程研究中成为重点[5]、[9]。这些性能优势共同促进了SFRC在各种基础设施和建筑系统中的广泛应用,包括隧道衬砌和分段隧道环、桥梁甲板和过渡板、重型工业地板和仓库地板、刚性铺装和覆盖层、机场停机坪和跑道、挡土和支护结构,以及高层结构框架中的关键承重部件,其中改进的裂缝控制、韧性和耐久性至关重要[10]、[11]。鉴于其多功能应用和已证明的好处,持续的研究工作对于优化纤维含量和分布、最大化机械性能以及解决特定结构挑战至关重要[12]。
除了机械性能外,混凝土对环境的影响,特别是其对温室气体排放的贡献,已成为一个全球性的关键问题[13]、[14]。为了符合欧洲绿色协议(European Green Deal)和巴黎气候协定(Paris Climate Agreement)等国际可持续性框架,建筑业正在逐步采纳注重可持续性的混合物设计策略。一种主要方法是添加辅助水泥基材料(SCMs),这些材料不仅提升了材料性能,还显著降低了基于水泥的复合材料的环境足迹[15]、[16]。
SCMs,如粉煤灰(fly ash)、矿渣(slag)、硅灰(silica fume)和纳米硅(nano silica),在提高水泥基系统的可持续性方面发挥着重要作用。它们的使用有助于减少与混凝土生产相关的碳排放,同时改善关键机械性能。这种双重效益凸显了在现代建筑中结合先进材料和实践以实现卓越性能和减少环境影响的关键性[17]、[18]、[19]、[20]、[21]。将钢纤维和SCMs结合到混凝土混合物中代表了现代建筑实践的一项重大进展,有效解决了结构完整性和环境可持续性的双重目标[3]、[5]、[22]、[23]。
基于实验室的研究对于理解混凝土的抗压强度(CS)以及高性能混合物中钢纤维和辅助材料之间的相互作用机制至关重要[24]。然而,此类配方的效果高度依赖于所选纤维和辅助成分的具体物理和化学特性。因此,实验研究面临实际限制,包括较长的测试时间、大量的原材料消耗、材料性质的固有变异性,以及对混合和固化条件严格控制的需求[25]。为了克服这些限制,越来越多地采用机器学习(ML)方法来合理优化混凝土混合物设计。ML模型根据输入参数和材料属性预测CS,提高了预测准确性和资源效率,同时支持混凝土生产的可持续性目标。通过使用先进算法,研究人员可以有效地分析复杂数据集,从而为各种混凝土配方提供更准确的CS预测[26]、[27]。
对文献的全面回顾显示,越来越多地关注对混凝土CS的建模以及将该领域与ML技术相结合[28]、[29]、[30]。这种不断发展的研究工作强调了ML在改变混凝土混合物设计方面的巨大潜力,为更高效和可持续的建筑实践奠定了基础[28]、[29]、[30]。表1总结了最近关于使用ML预测SFRC CS的研究中的关键发现,突出了预测准确性和混合物设计优化的进展。
**表1. 土木工程文献中报道的代表性基于AI的建模研究**
| 研究 | 混合物中加入的成分/副产品 | ML模型 | 数据集 | 最优CS模型(R2或RMSE) |
|-----------------|------------------|-------------|-----------------|二氧化硅烟的平均含量为122.52千克/立方米,而纳米硅的的使用量更为有限,平均含量为11.17千克/立方米。在骨料成分方面,砂的平均含量为1082.37千克/立方米,而粗骨料的平均含量仅为30.42千克/立方米,这表明数据集中包含了大量基于砂浆或超细级配的混合物。水分的平均含量为179.89千克/立方米,相对较低的标准差为20.57千克/立方米,反映了在整个混合物中对用水量的严格控制。超塑剂的平均含量为27.93千克/立方米,最高值达到52千克/立方米,这表明这些混合物是为获得良好的可操作性而设计的。钢纤维的使用量有限,平均用量为1.71千克/立方米。平均养护时间为27.49天,标准差为32.87天,说明数据集涵盖了从早期强度测量到长期性能评估的广泛测试范围。抗压强度值介于19.67至178.60兆帕之间,平均强度为109.45兆帕,表明该数据集主要代表了高性能混凝土。为了更详细地分析数据集结构,进行了直方图、核密度和相关矩阵分析,并可视化了各组成变量及其相互关系。图3中展示的分布分析表明了所有14个输入变量的频率分布。
水泥含量分布显示,观测值主要集中在600–900千克/立方米范围内,涵盖了大约200至1400千克/米米的广泛区间。诸如粉煤灰、GGBFS、纳米硅和石灰石粉等补充材料的分布主要集中在零附近,表明这些材料在大多数混合物中不存在,仅在特定的高性能配方中选择性地加入。二氧化硅烟的分布较广,浓度低于100千克/立方米。水分含量分布在大约150–225千克/米米的较窄范围内,表明在整个混合料设计中水胶比得到了严格控制。超塑剂的含量分布在0–60千克/米米的范围内,分布相对均匀,反映了不同混合物对可操作性要求的差异。砂的含量在大约400至1800千克/立方米之间,主要集中在800–1200千克/米米的范围内,而粗骨料的含量则主要集中在零附近,反映了数据集中以砂浆为基础和超细级配混合物的主导地位。钢纤维的用量主要集中在零附近,只有少数混合物包含较高的纤维含量。钢纤维的直径和长度在零附近有明显的聚集现象,直径值最大可达2.5毫米,长度值可达约150毫米。养护时间变量集中在0–100天范围内,大多数试样在早期和标准龄期进行了测试,这与现有的混凝土测试协议一致。相关分析结果总结在图4中,该矩阵量化了变量对之间的线性关系强度。
总体而言,研究结果揭示了一组与文献一致的组合成分之间的关系。水泥与矿渣之间的强负相关(系数为-0.49)反映了在混合物设计中部分用其他胶凝材料替代水泥的策略。二氧化硅烟与超塑剂之间的负相关(系数为-0.54)表明含有高比例二氧化硅烟的混合物需要减少化学外加剂的使用量。砂与粗骨料含量之间的负相关(系数为-0.53)与旨在保持总体骨料体积大致恒定的混合物优化实践一致。超塑剂与水之间的负相关(系数为-0.14)证实了化学外加剂具有减水的功能。钢纤维的直径与长度之间存在强正相关(系数为0.99),反映了标准纤维规格中的几何比例关系。水分含量与钢纤维用量之间存在中等程度的正相关(系数为0.49),表明富纤维混合物需要更高的水分含量以保持可操作性。从机械性能的角度来看,抗压强度与养护时间之间的强正相关(系数为0.51)在统计上支持了水化持续时间对强度发展的基本作用。抗压强度与二氧化硅烟含量之间的相关性也很显著(系数为0.23),反映了二氧化硅烟对强度增强的火山灰效应。相比之下,水泥含量与抗压强度之间的相关性非常弱(系数为0.10),表明在含有补充材料的高性能系统中,抗压强度受单一成分的影响较小,更多受到混合物参数之间复杂且往往是非线性的相互作用的影响。此外,总体较低的相关系数表明数据集内的关系过于复杂,无法完全用纯线性模型来捕捉,这进一步证明了在本研究中采用先进机器学习方法的有效性。
2.2. 提出的HERO-R集成技术
传统机器学习方法的回归性能可能受到模型假设和数据固有结构的限制。参数模型可能无法有效地表示非线性关系,而基于树的方法则可能表现出高方差和过拟合的风险。这些局限性使得异构集成策略成为一个强有力的替代方案,因为它们结合了不同算法的互补学习能力并汇总了它们不同的错误模式。在这项研究中,提出了一种新颖的堆叠集成学习架构,称为HERO-R(Hybrid Ensemble Regressor with an Optimized Ridge meta-learner),旨在实现更优的回归任务预测性能。HERO-R采用两阶段设计,在第一阶段整合了GB和基于树的集成方法的互补优势,并通过一个强大的Ridge回归元学习层在第二阶段巩固它们的输出。所提出方法的总体架构在图5中示意性地展示。
HERO-R架构的堆叠策略包括一系列操作步骤。所提出方法的程序框架如下:
2.2.1. 第一步:数据预处理和特征扩展
第一阶段包括数据准备和特征增强。在检查数据集中的缺失值并标准化数据格式后,数据被划分为用于交叉验证的训练集和测试集。HERO-R采用双重表示策略来丰富特征空间。设n表示样本数量,d表示原始特征的数量。原始输入数据表示为矩阵X ∈ ?n×d。对原始特征矩阵应用对数变换,根据公式(1)得到增强后的特征矩阵Xaug。(1)Xaug=[X,log(1+|X|)] 这种变换使特征空间的维度加倍,产生新的表示方式,即Xaug ∈ ?nx2d。随后,对增强后的矩阵应用z分数标准化,根据公式(2)计算标准化数据矩阵Xstd。(2)Xstd=(Xaug-μ)/σ 这里,μ和σ分别表示从训练数据计算出的均值和标准差向量。需要注意的是,对数特征增强和z分数标准化都是在每个交叉验证折叠中应用的。具体来说,变换参数仅从每个折叠的训练部分估计,然后应用于验证部分,确保验证数据的信息不影响预处理阶段。
2.2.2. 构建基础学习器集成
HERO-R的基础层是一个异构集成,包括总共12个回归器,代表不同的学习范式。具体来说,该集成包括五个基于直方图的GB模型(HistGB)、四个极端随机树模型(ExtraTrees)和三个RF模型。这种多样性旨在通过利用每种算法的优势来最大化预测多样性,从而提高集成的整体鲁棒性。GB是一种迭代策略,逐步减少预测误差。在这种情况下,每个新的决策树都是在前一个模型的残差上训练的。在迭代“t”时,模型学习一个表示函数ht(Xstd)的树,并根据方程(3)计算累积预测函数Ft。(3)FtXstd=Ft-1(Xstd)+η·htXstd 这里,η表示学习率,F表示累积预测函数。五个HistGB模型配置了不同的超参数集合,以引入学习动态的多样性。具体来说,学习率分别为η ∈ {0.02, 0.03, 0.04, 0.05, 0.06},最大树深度分别为{4, 5, 6, 7, 8},L2正则化系数分别为{0.3, 0.4, 0.5, 0.6, 0.7}。这种多样性使集成能够适应不同的数据特征。学习率较低的模型(即η = 0.02–0.03)进行较小且更保守的更新,有助于限制过拟合并增强泛化能力。相比之下,较高的学习率(即η = 0.05–0.06)提供了更快学习复杂模式的能力。深度为4–5的浅层树能够捕获主导交互作用,同时保持较低的方差,而深度为7–8的深层树则提供了更大的灵活性,用于建模多变量和非线性关系。集成中的四个ExtraTrees模型依赖于在每个节点选择完全随机的分割阈值,这使它们与RF不同。这种策略进一步减少了模型方差并增加了树之间的预测多样性,从而增强了集成强度。这些模型通过最大深度值{None, 50, 60, 70}、特征选择策略{'sqrt', 'log2'}以及节点分割的最小样本要求{2, 3, 4, 5}进行了多样化。没有深度限制的模型(表示为None)提供了最大的灵活性,而具有深度限制的模型引入了防止过拟合的结构正则化。'sqrt'策略在每次分割时随机选择相当于总特征数量平方根的特征数量,而'log2'策略应用了对数缩放。集成还包括三个RF模型,它们结合了自举采样和随机特征选择,有效减少了预测方差。这些模型也在最大深度值{None, 60, 70}和特征选择策略{'sqrt', 'log2'}方面进行了多样化。这些算法对数据结构的不同敏感性增加了它们的预测误差不太相关的可能性。这种相对独立性使得元学习器能够利用丰富的互补预测,每个基础模型都提供了不同的视角,从而构建出更强的最终预测模型。
2.2.3. 构建元特征矩阵
在训练基础学习器之后,每个模型在训练数据上生成一个预测向量。这些预测向量作为元学习器在后续阶段的输入特征,称为元特征。设M表示基础模型的数量,在本研究中M等于12。元特征矩阵Z根据公式(4)构建。(4)Z=[F1(Xstd),F2(Xstd),...,FM(Xstd)]∈Rn×M 由此产生的Z矩阵编码了每个基础模型产生的预测。使用这个矩阵,元学习器能够学习到比单个模型输出更具有信息量和准确性的组合预测。
2.2.4. Ridge回归元学习器
在元学习阶段,采用Ridge回归以最佳方式组合基础模型的预测,并产生最终的集成输出。Ridge回归在普通最小二乘目标中添加了L2正则化惩罚,这提高了系数估计的稳定性,特别是在多重共线性情况下,并降低了过拟合的风险。元学习器的优化问题根据公式(5)构建。(5)w?=argminw(‖y-Zw‖2+α‖w‖2) 这里,w ∈ ?M表示元学习器权重向量,y ∈ ?n表示包含测量抗压强度值的目标向量,α > 0表示正则化超参数。在获得最优权重向量w之后,HERO-R集成的最终预测是根据这些系数对基础模型输出进行线性组合得到的,如公式(6)所示。(6)y^=Zw?=ΣMj=1w?j·Fj(Xstd) 这里,Fj (·)表示第j个基础模型的预测函数。HERO-R架构应用了严格的嵌套交叉验证协议,以防止元学习过程中的数据泄露并保护泛化性能。对于外循环中的每个折叠,基础学习器仅在相应的训练分割[65], [66]上重新训练。然后使用重新训练的模型在同一折叠的未见验证分割上生成预测,这些预测作为元特征。元学习器仅基于这些未参与训练的验证预测进行训练。这种嵌套程序确保了元学习器永远不会使用基础模型在训练期间已经见过的数据生成的预测来拟合。因此,它防止了乐观偏差,并使得对模型在真实世界数据分布下的性能进行了更现实的估计。2.2.5. 第五步:超参数优化HERO-R模型的超参数配置是使用结合严格交叉验证协议的搜索策略确定的。超参数是指导模型学习行为的外部设置,但并不是直接从训练数据中学习得到的。适当选择这些参数对于预测准确性和最终模型对未见数据的泛化能力都至关重要。采用网格搜索进行优化。在这种方法中,为每个超参数指定一个预定义的值范围,并评估这些范围内的所有可能组合。使用k折交叉验证来评估每种组合的性能,以减少对任何单一数据分割的依赖,并获得泛化性能的可靠估计。在本研究中,k被设置为5,每次迭代时使用五分之四的数据进行训练,而剩下的五分之一用于验证。这种方法最小化了由于数据集的特定划分而导致模型性能受偶然因素影响的风险。
基础学习器的超参数搜索空间被设计为促进学习行为的最大多样性。对于Hist GB模型,学习率η从集合{0.02, 0.03, 0.04, 0.05, 0.06}中选择,最大树深度从集合{4, 5, 6, 7, 8}中选择。这种多样化旨在涵盖不同的学习特性。较低的学习率,特别是η等于0.02–0.03,产生更小、更保守的更新,有助于控制过拟合并提高泛化能力;而较高的学习率,特别是η等于0.05–0.06,则提供了更快学习复杂关系的潜力。树深度参数的处理原理也是如此。深度为4–5的浅层树能够捕捉主要交互作用,而深度为7–8的深层树则具有更大的能力来表示高维和非线性模式。对于所有基于树的基础学习器,包括HistGB、ExtraTrees和RF,决定集成中树数量的估计器超参数固定为600,以平衡计算效率和模型容量。Ridge元学习器的正则化参数α也是通过网格搜索优化的。搜索空间定义为α ∈ {0.0001, 0.0003, 0.0006, 0.001, 0.003},每个值都使用五折交叉验证进行评估。选择α等于0.0006的值作为最佳正则化强度,该值产生的平均验证误差最低。这个选择提供了一个足够强的惩罚项,以防止元学习器对基础模型的预测过度拟合,同时又足够弱,不会大幅限制预测能力,从而在模型拟合和系数稳定性之间实现了平衡。
这种基于全面交叉验证的优化过程有效地降低了过拟合的风险。因为每个参数组合都是在不同的数据分割上反复测试的,所以最终模型被鼓励捕捉数据的潜在结构,而不是特定于训练集的噪声或偶然模式。基础学习器层中超参数的多样化最大化了集成学习所必需的预测多样性,而Ridge元学习器使用最佳学习的权重结合了这些多样且互补的预测,没有数据泄露,从而实现了超越单个模型能力的泛化性能。总之,这种多层优化策略应用于基础学习器和元学习器,使得HERO-R架构能够以高精度建模复杂、多因素和非线性关系,例如钢纤维增强混凝土的压缩强度,同时保持对未见数据的强大和可靠的泛化能力。2.3. 传统机器学习方法选择了八种机器学习算法作为基准模型,以评估HERO-R框架的预测性能。这些算法是从混凝土强度预测文献中广泛使用的方法中挑选出来的。RF基于使用自助抽样和随机特征选择的决策树集成。通过平均单个树的预测,它减少了通常与单个决策树相关的高方差[67],[68]。XGB和GB采用了梯度提升原理。在这两种方法中,树是顺序添加的,每棵新树都在前一代模型的残差误差上训练,从而逐步提高预测性能。XGB还包括了计算效率和正则化机制方面的额外优化[69],[70]。EN是一个线性模型,结合了LASSO和Ridge回归的L1和L2惩罚项。它通过平衡正则化和特征选择来抵抗多重共线性,尽管在捕捉非线性关系时可能有限[71],[72],[73]。DT使用单一树结构递归地划分数据。它具有高度可解释性,但深层树结构容易过拟合[74]。KNN是一种非参数方法,通过平均最近邻居的响应来预测目标值。其行为直接受到距离度量和选择的邻居数量的影响[75]。SVR是支持向量机在回归任务上的一个变体[76]。它可以通过核函数建模非线性关系,尽管对于大型数据集来说计算需求可能增加。MLP是一种使用反向传播算法训练的多层人工神经网络。它具有强大的能力来捕捉复杂和非线性模式,但训练可能耗时且需要仔细调整超参数[77]。所有基准模型的超参数优化都是使用网格搜索和五折交叉验证进行的,与HERO-R采用的程序一致。优化后的超参数值在表3中报告。
表3. 机器学习模型的优化超参数。
模型名称 超参数
RF n_estimators, criterion, max_depth, min_samples_split 100, squared_error, None, 2
XGBoost n_estimators, max_depth, learning_rate, booster 100, 6, 0.3, gbtree
GB n_estimators, learning_rate, loss, max_depth 100, 0.1, squared_error, 3
ElasticNet alpha, l1_ratio, fit_intercept, max_iter 0.1, 0.5, True, 1000
DT criterion, splitter, max_depth, random_statesquared_error, best, None, 0
KNN n_neighbors, weights, p, algorithm 5, uniform, 2, auto
Support Vector kernel, gamma, C, epsilon linear, scale, 1.0, 0.1
MLP hidden_layer_sizes, max_iter, activation, solver (100, 50), 500, relu, adam
HERO-R Base: HistGB-1 max_iter, learning_rate, max_depth, l2_reg 600, 0.02, 5, 0.3
HERO-R Base: HistGB-2 max_iter, learning_rate, max_depth, l2_reg 600, 0.03, 6, 0.5
HERO-R Base: HistGB-3 max_iter, learning_rate, max_depth, l2_reg 600, 0.04, 7, 0.6
HERO-R Base: HistGB-4 max_iter, learning_rate, max_depth, l2_reg 600, 0.05, 8, 0.7
HERO-R Base: HistGB-5 max_iter, learning_rate, max_depth, l2_reg 600, 0.06, 4, 0.4
HERO-R Base: ExtraTrees-1 n_estimators, max_depth, max_features, min_split 600, None, sqrt, 3
HERO-R Base: ExtraTrees-2 n_estimators, max_depth, max_features, min_split 600, 50, log2, 4
HERO-R Base: ExtraTrees-3 n_estimators, max_depth, max_features, min_split 600, 70, sqrt, 2
HERO-R Base: ExtraTrees-4 n_estimators, max_depth, max_features, min_split 600, 60, log2, 5
HERO-R Base: RandomForest-1 n_estimators, max_depth, max_features, min_split 600, None, sqrt, 3
HERO-R Base: RandomForest-2 n_estimators, max_depth, max_features, min_split 600, 70, log2, 4
HERO-R Base: RandomForest-3 n_estimators, max_depth, max_features, min_split 600, 60, sqrt, 2
HERO-R Meta-Learner (Ridge) alpha, fit_intercept, solver, tol 0.0006, True, auto, 0.001
图6显示了所解释的机器学习模型的示意图。
下载:下载高分辨率图片(599KB)
下载:下载全尺寸图片
图6. 机器学习模型的示意图。
2.4. 因果推断方法
因果推断是一组统计和数学方法,旨在基于因果关系理解和推断变量之间的关系,而不是将解释限制在相关性上。从观测数据中识别因果关系对于在复杂工程系统中开发有效的干预策略至关重要[78]。Pearl [79]通过一个包含关联、干预和反事实查询的三层层次结构概念化了因果推断。
2.4.1. 贝叶斯网络和有向无环图
贝叶斯网络是使用有向无环图结构来表示变量之间概率依赖性的图形模型,通常表示为DAG。DAG定义为G = (V, E),其中V表示对应于变量的节点集,E表示表示潜在因果关系的节点之间的有向边集[80]。贝叶斯网络可以通过分解联合概率分布来紧凑地编码复杂的依赖结构,正如Friedman和Koller所示[80]。联合概率分布的分解如公式(7)所示。
(7) PX1,X2,...,Xn = ∏i=1nPXi|PAi
这里,PAi表示图中节点Xi的父节点集,对应于指向Xi的边的来源变量。在因果框架内解释时,DAG中的有向边X → Y表示X可能对Y产生直接的因果影响,而不仅仅反映相关性关联。
2.4.2. 因果发现和结构学习
因果发现是一个研究领域,旨在从观测数据中自动学习因果图的结构。Spirtes和Zhang[81]改进了基于约束的方法,包括PC或Peter Clark算法。相比之下,基于分数的方法使用评分函数评估候选图结构,并寻找最大化该分数的结构。
Hill Climb Search是一种常用的基于分数的结构学习算法。该算法从初始DAG开始,并通过添加边、移除边或反转边的方向等局部操作探索相邻的DAG。在这项研究中,使用了K2分数作为评分函数。K2分数是由Cooper和Herskovits开发的[82],它在贝叶斯框架内平衡了模型复杂性和数据拟合。
2.4.3. 领域知识和约束
通过在学习过程中结合特定问题的领域知识,可以显著提高结构学习算法的性能和可靠性。Tsamardinos等人[83]研究了如何通过约束将领域知识集成到结构学习中。在这种情况下,可以使用两种主要类型的约束。黑名单指定了禁止的有向边,例如A到B,并防止这些边出现在DAG中。白名单指定了必须存在的边,并要求这些边出现在图中。
在这项研究中,因果结构学习被应用于识别影响混凝土压缩强度的混合成分之间的因果关系。工作流程是使用pgmpy库实现的,并基于Hill Climb Search算法。数据集中的连续变量根据算法的要求进行了离散化。
在优化过程中,采用了K2分数函数,将到达节点的最大边的数量(即最大入度)限制为4,并进行了200次迭代。连续变量被离散化为五个相等宽度的区间,前提是数据分布允许;对于具有有限唯一值的变量,应用了三个区间以避免空区间。这种离散化是必要的,因为K2分数在离散的贝叶斯框架内操作,并需要分类输入[82]。选择五个区间是在保持数据集中广泛混合成分值的足够分布分辨率和避免结果列联表过度稀疏之间的平衡;过于稀疏的列联表会产生不可靠的条件频率估计,从而影响K2分数在结构搜索期间的有效性。最大入度被设置为4,以限制组合搜索空间并减少在446个观测值的数据集中出现虚假高阶依赖性的风险。选择K2分数是因为它提供了一个计算上可行的封闭形式贝叶斯分数,适合离散数据,不需要大样本近似,同时使用均匀的狄利克雷先验来平衡数据拟合和结构简洁性。这种方法基于两个强假设:因果充分性[81]和没有不可观测的混杂因素[84]。鉴于数据集是从多个独立实验室研究中编译的,这些假设在实践中可能并不完全成立。因此,学到的因果结构和反事实效应估计应被视为合理的因果假设,而不是确定的因果声明。所得到的因果DAG不仅可视化了变量之间的合理依赖关系,还识别了表明哪些混合成分的干预可能对压缩强度更有影响力的关键路径,从而为工程决策提供指导。
2.5. 反事实分析
反事实分析代表了因果推断层次结构中最高和最强大的级别。通过回答“如果某个条件不同,结果会是什么”的问题,这种方法对应于Pearl因果阶梯的第三级[84]。在工程应用中,反事实分析能够评估尚未进行物理测试的设计方案,并支持最优参数的选择。结构因果模型(Structural Causal Models,简称SCMs)为用数学语言表达变量之间的因果关系提供了一个正式的框架。Sharma和Kiciman[85]强调,SCMs是因果推理的基本组成部分。在SCM中,每个变量用Xi表示,由以下结构方程定义(如方程(8)所示):(8) Xi := fi(PAi, Ui)。这里,PAi表示Xi在有向无环图(DAG)中的父节点,对应于其因果前因;fi表示一个确定性的因果函数;Ui表示一个未观测的随机噪声项。在具体压缩强度的背景下,总粘结剂含量可以用方程(9)定义:(9) 凝结剂 = 水泥 + 矿渣 + 粉煤灰 + 硅灰 + 纳米硅 + 石灰石粉。压缩强度用fc表示,可以作为所有混合参数的复杂非线性函数进行建模,如方程(10)所示:(10) fc(X) = f(粘结剂, 水, 砂, 粗骨料, 增塑剂, 钢纤维, 直径, 长度, 固化时间)。
2.5.2 反事实推理
反事实推理是计算在给定观测到的实际情况下对选定变量进行假设性干预的结果的过程[86]。Henne等人[87]将这一过程概括为三个主要步骤:
1. 推理(Abduction):使用观测数据来推断每个结构方程中未观测噪声项Ui的后验概率分布。
2. 干预(Action):修改SCM中相关变量的结构方程以反映感兴趣的情景,此操作用do演算符号表示为do(Xi = x*i)。
3. 预测(Prediction):使用干预后的SCM以及第一步中推断出的噪声项来计算目标变量Y的新值或分布。
通过积分所有可能的噪声配置可以获得反事实分布。这种公式提供了一个概率分布,回答了如果给定变量取某个特定值会发生什么的问题。
2.5.3 可逆结构因果模型和反事实抽样
在实际应用中,经常使用反事实抽样方法。?ift?io?lu[88]表明,可逆结构因果模型(Invertible Structural Causal Models,简称ISCM)为反事实推理提供了重要的计算优势。在ISCM中,结构方程是可逆的,因此可以直接计算噪声项为Ui = f?1i(Xi, PAi)。这一属性使得推理步骤可以解析地完成。反事实抽样算法分为三个步骤:首先,对于每个观测到的实例,推断所有噪声项;其次,使用do运算符对相关变量进行干预;最后,按照变量的拓扑顺序更新所有受干预变量影响的下游变量。这个过程通过消除混杂因素的影响,隔离了对给定变量的干预对所有因果相关变量的影响。
在这项研究中,使用DoWhy库的Graphical Causal Model模块[85],[89]基于之前学习的因果DAG构建了一个可逆SCM。对于每个变量,从其数据集中自动学习了因果机制fi。为了进行反事实情景分析,定义了一组干预措施,分别将每个输入变量固定为其在数据集中观测到的最小值、平均值和最大值。需要注意的是,反事实分析中采用的干预水平对应于编译数据集中观测到的最小值、平均值和最大值,确保所有情景都在SFRC混合料的经验记录范围内。由于每次干预只固定一个变量,而所有其他变量保持其观测值,因此分析保留了混合料成分的自然协方差结构。此外,因果模型还包括了派生变量,如总粘结剂含量和水灰比,这些变量会根据对其组成变量的干预自动更新,从而在整个反事实推理过程中保持混合比例关系的一致性。对于每个干预水平,从所有观测数据点生成反事实样本,这使得能够量化每个混合料成分对压缩强度的直接因果效应,而不受混杂因素的影响。对于每种变量和干预水平组合,计算了所得反事实强度分布的统计特性,如中位数和离散度。这些指标有助于识别对强度具有最强和最一致因果影响的成分。
总体而言,这种反事实分析方法不仅将机器学习模型的黑盒预测转化为可解释的因果洞察,还为工程设计提供了基于证据的、直接可操作的指导,说明在混凝土混合料设计中应优先考虑哪些参数。
2.6 模型评估指标
所有模型的预测性能使用五折交叉验证进行评估,其中80%的数据用于训练,剩余20%作为独立的未见过的验证部分,确保用于训练的观测数据不会影响报告的绩效指标。使用了四个统计指标[90],[91]来客观全面地评估所有开发模型的预测性能。决定系数(Coefficient of Determination,表示为R2)量化了模型解释目标变量总方差的程度,如方程(11)所示。众所周知,接近1的值表示解释能力更强。(11) R2 = 1 - (Σ(yi - y^i)2 / Σ(yi - yˉ)2。平均绝对误差(Mean Absolute Error,简称MAE)衡量预测值和观测值之间的平均绝对差异,如方程(12)所示。由于其单位与原始数据相同,因此易于解释。(12) MAE = (1/n) Σ|yi - y^1|。均方误差(Mean Squared Error,简称MSE)和均方根误差(Root Mean Squared Error,简称RMSE)通过平方残差来更严厉地惩罚较大的预测误差。MSE表示误差的平方幅度,如方程(13)所示,而RMSE是MSE的平方根,将指标转换为原始单位,如方程(14)所示,便于解释。(13) MSE = 1/n Σ(yi - y^i)2 (14) RMSE = √MSE。这里,n表示样本数量,yi和?i分别表示第i个观测值的观测值和预测值,yˉ表示观测值的平均值。结合使用这四个指标,可以通过R2捕捉整体拟合优度,并通过MAE、MSE和RMSE捕捉预测误差的幅度和分布,从而进行多维和平衡的模型性能比较。
3. 结果与讨论
使用五折交叉验证协议比较了提出的HERO-R集成算法和八种传统机器学习模型的性能。九个模型的训练和验证性能指标总结在表4中,其中预测准确性用R2报告,误差幅度用RMSE、MSE和MAE报告。
表4. 压缩强度预测的统计指标。
算法 折叠 训练数据 测试数据 R2 RMSE MSE MAE R2 RMSE MAE
HERO-R 1 1.00 1.36 1.84 1.03 0.94 7.32 53.57 4.82
2 1.00 1.08 1.16 0.82 0.91 9.80 95.98 5.78
3 1.00 1.34 1.79 1.05 0.96 6.19 38.35 4.53
4 1.00 1.39 1.92 1.07 0.95 6.54 42.75 4.05
5 1.00 1.27 1.60 1.00 0.92 8.13 6.02 5.71
平均值 1.00 1.28 1.66 0.99 0.94 7.59 59.33 4.98
XgBoost 1 1.00 0.48 0.23 0.33 0.87 11.11 123.51 7.47
2 1.00 0.44 0.19 0.30 0.90 10.28 105.68 6.37
3 1.00 0.41 0.17 0.28 0.91 8.76 76.80 5.89
4 1.00 0.57 0.32 0.38 0.94 7.38 54.51 5.02
5 1.00 0.51 0.26 0.32 0.84 11.75 138.16 7.23
平均值 1.00 0.48 0.23 0.32 0.89 9.86 99.73 6.40
RF 1 0.98 3.76 14.13 2.71 10.87 11.38 129.61 8.31
2 10.98 3.62 13.11 2.59 0.91 19.76 95.19 6.33
3 10.98 3.85 14.86 2.67 0.90 9.48 89.96 6.72 40.98 4.19
4 11.75 2.89 0.89 9.64 92.89 6.03 50.99 3.60 12.92 2.44
5 1.00 0.51 0.26 0.32 0.84 11.75 138.16 7.23
从所有模型中,HERO-R集成算法的预测准确性最高,平均R2为0.9405。其次是XGB(R2 = 0.8928),然后是RF(R2 = 0.8806)和GB(R2 = 0.8798)。相比之下,支持向量回归器(Support Vector Regressor,R2 = 0.4993)、EN(R2 = 0.5579)和KNN(R2 = 0.6985)的性能最低。训练和验证性能之间的差距是泛化能力的一个关键指标。例如,DT模型在训练集上几乎完美拟合,R2为0.99,但其验证R2下降到0.81,表明严重的过拟合。XGB也出现了类似的下降,训练和验证R2值从0.99降至0.89。相比之下,HERO-R在训练和验证阶段的性能都保持较高且紧密对齐,R2值分别为0.99和0.94,表明其泛化能力稳定。这一观察结果进一步得到了HERO-R验证R2标准差低(0.0178)的支持,表明在不同数据折中的性能一致且可靠。
在误差指标方面,HERO-R在验证集上的预测误差较低,平均RMSE为7.38,平均MAE为4.88。这些值明显低于表现最佳的模型,即RF(RMSE = 10.43,MAE = 7.20)和GB(RMSE = 10.47,MAE = 7.92)。相比之下,支持向量回归器产生了最大的预测误差,RMSE为21.37。
图7通过报告每个样本的观测值和预测值,比较了HERO-R模型和八种基准算法在测试数据集上的预测性能。图中,蓝线表示测量的压缩强度值,彩色标记表示相应模型产生的预测值。下载:下载高分辨率图像(944KB)下载:下载全尺寸图像
对于HERO-R,粉红色的预测点在整个强度范围(大约30 MPa到180 MPa)内紧密跟随蓝色的测量值曲线。这种视觉模式表明模型在低强度和高强度范围内都保持了高准确性和一致性。尽管XGB和RF的整体表现也较好,但它们在60到80 MPa的中等强度范围内以及某些极端观测值处与测量值有明显的偏差。这些偏差在预测点和测量值曲线之间造成了可见的差距。GB和DT表现出一般可接受的一致性,尽管DT模型在某些点上有超出预测的情况。MLP模型的预测值与测量值偏离较大,在某些区域产生明显的错误。
KNN、EN和SVR的表现最弱。它们的预测值与测量值偏差较大,尤其是在较高强度水平上。EN的行为尤其值得注意,因为其预测值聚集在一个狭窄的带状区域内,无法捕捉数据中的广泛变异性。这一结果表明线性模型不足以表示该数据集中存在的复杂和非线性关系。
图8展示了HERO-R和其他模型产生的观测值和预测值的散点图。在这些图中,横轴表示测量的压缩强度,纵轴表示预测的压缩强度。黑色虚线表示完美的预测(1-1关系),紫色区域表示正负10%的误差容忍带。模型性能可以通过数据点在参考线附近的聚集程度来评估。下载:下载高分辨率图像(746KB)下载:下载全尺寸图像
对于HERO-R模型,训练和测试点都紧密集中在1-1线附近。在大约25-175 MPa的整个强度范围内,点的紧密对齐表明其预测准确性高且泛化能力平衡。XGB和RF也取得了良好的结果。然而,对于XGB,有少数测试点在80-100 MPa范围内位于容忍带之外;对于RF,一些测试点在25-50 MPa范围内偏离了可接受区域。对于GB和DT,训练数据上近乎完美的一致性并未转化为测试数据上的一致性。特别是DT,训练和测试行为之间的显著差距表明了过拟合倾向。在MLP图中,90-130 MPa范围内的预测倾向于低于测量值。
KNN、EN和SVR的性能较为有限。对于这些模型,大量点位于正负10%的容忍带之外。EN的预测值聚集在测量值的平均值附近的一个狭窄带状区域内,这表明它们难以表示数据中的广泛变异性。SVR图中点的广泛分散表明其预测一致性较低,在较高强度水平上效果较差。
图9a使用雷达图展示了五个性能指标的标准化值,即R2、RMSE、MSE、MAE和稳定性。每个轴的范围从0到1,较大的向外区域表示更好的性能。HERO-R位于图表的外边界附近,在所有轴上显示出平衡的轮廓,表明其整体性能最为全面。XGB和RF也延伸到了外部区域,特别是在RMSE和稳定性轴上,同时保持R2值在0.88以上。GB在R2方面也达到了类似的水平,但在RMSE、MSE和MAE方面仍相对更接近中心,这表明其平均误差水平较高。下载:下载高分辨率图片(331KB)下载:下载全尺寸图片图9. 机器学习算法的比较性能评估:(a) 显示标准化指标的多维雷达图,(b) 所有模型性能指标的统计分布。SVR、EN和KNN位于雷达图的中心附近。这种模式从视觉上支持这些模型在表示非线性和复杂关系(如钢筋混凝土的抗压强度)方面比其他方法更有限。稳定性轴定义为交叉验证折叠中R2值一致性的倒数。基于集成的方法(如HERO-R、XGB和RF)也位于该轴的外部区域附近,这表明它们的结果更加稳定,而DT和MLP在折叠间的性能变化较大。图9b展示了测试集性能指标的分布箱形图。对于R2值的分布,中位数为0.813,HERO-R和XGB位于较高的四分位数,而SVR和EN位于分布的较低尾部。RMSE和MAE的分布呈右偏态,中位数分别为13.212和8.739。由于误差是平方的,MSE的分布范围更广,其中位数为174.586,标准差超过137。在图中,每个模型的彩色标记突出了它们在分布中的位置。SVR和EN的点在所有指标上始终出现在不利的极端位置。相比之下,HERO-R、XGB和RF的点集中在每个指标的最佳结果区域,即误差较低或R2较高的区域。这一视觉证据清楚地表明HERO-R与其他先进的集成方法一起属于顶级性能层次,而传统的和线性模型对于这个数据集和问题设置来说是不够的。图10展示了总结了模型测试集性能的泰勒图。该图通过同时可视化模型预测的标准差、与观测值的相关性以及居中的均方根差(CRMSD)来进行全面比较。观测值的标准差和1.0的完美相关性在图中被标记为参考点。HERO-R模型的位置比所有其他模型都更接近这个参考点。HERO-R的相关系数约为0.99,CRMSD约为7-8单位,显示出高准确性与再现观测值统计变异性相结合的预测特性。XGB和RF紧随HERO-R之后,也实现了大约0.98-0.99的高相关性值和相对较低的CRMSD值,尽管它们与参考点的距离稍远。下载:下载高分辨率图片(326KB)下载:下载全尺寸图片图10. 泰勒图比较HERO-R集成模型与传统机器学习算法在抗压强度估计方面的预测性能。GB和MLP的相关性介于0.90-0.95之间,代表了观测值的标准差在一个合理的水平上。KNN和DT的相关性较低,约为0.85-0.90,同时CRMSD值也较高,这表明它们在捕捉数据中的复杂关系方面能力较弱。EN和SVR位于泰勒图的左侧,表现出最弱的性能。它们的相关系数在0.70-0.80的范围内。这一视觉证据表明,EN的线性结构和SVR的固定核结构不足以有效捕捉控制钢筋混凝土抗压强度的非线性和多维关系。为了评估HERO-R相对于基准模型的预测优势是否具有统计学意义,使用了五折水平的R2分数作为配对观测值进行了配对t检验。结果显示HERO-R与所有基准模型之间存在统计学上的显著差异(p < 0.05),p值从ElasticNet和决策树的0.000到XGBoost的0.039不等,证实了HERO-R的性能优势在所有比较中都具有统计学意义。表5. 基于配对t检验的HERO-R性能改进相对于基准模型的统计显著性。模型平均值R2HERO-R 平均值R2R2差异统计量p值显著性随机森林0.88060.94050.06003.5850.023是XGBoost0.89280.94050.04773.0300.039是梯度提升0.87980.94050.06074.3230.012是ElasticNet0.55790.94050.382711.1090.000是决策树0.81260.94050.128011.0610.000是K-最近邻0.69850.94050.24209.1870.001是支持向量回归0.49930.94050.44126.1480.004是多层感知器0.81300.94050.12757.7310.002是因果结构学习过程获得的DAG揭示了影响混凝土抗压强度的成分之间的因果关系。图11中呈现的图结构显示了变量之间的层次化因果网络。下载:下载高分辨率图片(174KB)下载:下载全尺寸图片图11. 学习到的混凝土抗压强度预测的因果DAG结构。下载:下载高分辨率图片(599KB)下载:下载全尺寸图片图12. 对观察到的强度范围1(≤50 MPa)的混合物成分对抗压强度的反事实分析。下载:下载高分辨率图片(733KB)下载:下载全尺寸图片图13. 对观察到的强度范围2(50–90 MPa)的混合物成分对抗压强度的反事实分析。下载:下载高分辨率图片(795KB)下载:下载全尺寸图片图14. 对观察到的强度范围3(90–130 MPa)的混合物成分对抗压强度的反事实分析。下载:下载高分辨率图片(741KB)下载:下载全尺寸图片图15. 对观察到的强度范围4(≥130 MPa)的混合物成分对抗压强度的反事实分析。在图中,所有粘结材料,包括水泥、BFS(粉煤灰)、硅灰、纳米硅和石灰石粉,都指向一个标记为“粘结剂”的节点,该节点代表总粘结剂含量。这种模式表明算法逻辑上将这些成分分组,形成了整体粘结剂用量的概念。从“粘结剂”节点延伸到“水与粘结剂比”节点(表示为W over B)和“抗压强度”节点(表示为fc)的红色箭头表明,总粘结剂含量对这些两个关键参数具有直接的因果影响。水含量也在决定W over B比率方面起着基本作用。从W over B到fc的红色箭头从因果学上证实了混凝土技术中的一个既定原则,即水与粘结剂比率是强度发展的主要驱动因素。较低的W over B比率通常与较高的强度相关,而较高的比率会增加孔隙率并导致强度降低[92]、[93]。减水剂在图中直接连接到“水”节点和“抗压强度”节点。这种结构反映了外加剂在减少用水需求方面的因果效应,并且还表明它可能通过对水化效率的改变等方式直接影响强度。总体而言,图中所有自变量直接或通过中间变量连接到最终的抗压强度节点,表明学习到的因果模型以全面的方式捕捉了混合物设计选择与机械性能之间的因果联系。基于学习到的因果图结构,检查了每种混合物成分对抗压强度的反事实效应。在分析中,每个变量依次被固定在其数据集中观察到的最小值、平均值和最大值,同时假设所有其他因素保持不变,从而定义了一组假设的干预方案。使用黑色曲线将观察到的强度分布作为参考。为了评估估计效应是否在强度水平上有所不同,在将数据集分为四个强度组后重复了分析。这些组被定义为≤50 MPa(标记为观察1),50至90 MPa(标记为观察2),90至130 MPa(标记为观察3)以及大于130 MPa(标记为观察4)。3.1. 抗压强度高达50 MPa的样品(图12)在这个组中,水泥和硅灰在最小和平均水平上的效应与观察到的强度分布大体一致,而将这些变量固定在最大水平会导致抗压强度显著增加。对于粉煤灰、BFS和纳米硅,随着剂量的增加,强度逐渐增加,这表明火山灰活性和/或填充效应对其有增强作用[94]。石灰石粉和沙子的影响有限,因为它们的最小水平与观察到的分布紧密对齐,较高水平只带来轻微的改善。粗骨料含量在这个范围内的任何干预水平上似乎都不会产生有意义的强度变化。这个组中水含量的效应尤为明显。最低的水含量产生最高的强度,随着水含量的增加,强度如预期般降低。对于减水剂,最小剂量对应于适度的强度增加,平均剂量显示出更中性或平衡的响应,而最大剂量导致明显的强度提升。在最小和平均水平下,钢纤维含量略有改善,而将其固定在最大水平则与观察值大致一致。相比之下,钢纤维的直径和长度在这个强度范围内没有明显的影响。养护时间的效果非常显著。最小的养护时间导致强度较低,而平均养护期为27.5天,特别是最大养护期为365天时,由于持续的水化作用导致强度显著提升。这一发现进一步证实了延长养护时间对于提高混凝土性能至关重要。3.2. 抗压强度在50–90 MPa范围内的样品(图13)在这个中等强度组中,水泥和硅灰的最小水平低于观察到的强度分布。平均值和最大水平通常与观察到的分布一致,尽管在所有场景中预测响应的波动更为明显。对于其他矿物添加剂,包括粉煤灰、BFS、纳米硅和石灰石粉,最小水平接近或略低于观察值,而增加剂量使预测强度超过参考分布。关于沙子含量,最大沙子水平与观察到的强度曲线一致。然而,随着沙子含量的减少,特别是最低水平,预测强度高于参考曲线,最低沙子场景在预测中产生了显著的变异性。粗骨料含量在所有水平上几乎没有影响,预测几乎与观察分布一致。对于水含量,最低水平产生的强度高于观察值,平均值接近观察分布,而最大水平低于观察分布。这个组中水含量的影响仍然明显。最低的水含量产生最高的强度,而增加水含量会降低强度,最大水含量导致的预测值低于观察分布。对于减水剂,最小剂量导致强度降低,而增加剂量则提高强度,最大剂量产生的值超过参考分布。关于钢纤维,最小纤维含量导致轻微的强度损失,而平均和最大纤维含量产生的预测明显超过观察到的强度分布。钢纤维的直径和长度在这个强度范围内没有明显的影响。养护时间的效果非常明显。1天的最小养护时间导致强度很低,而27.5天的平均养护期,特别是365天的最大养护期,由于持续的水化作用,导致强度显著提升。3.3. 抗压强度在90–130 MPa范围内的样品(图14)在这个高强度组中,水泥和硅灰的最小水平低于观察到的强度分布。平均值和最大水平与观察到的分布大致一致,尽管在所有场景中预测响应的波动更为明显。对于其他矿物添加剂,包括粉煤灰、BFS、纳米硅和石灰石粉,最小水平接近或略低于观察值,而增加剂量使预测强度超出参考分布。关于沙子含量,最大沙子水平与观察到的强度曲线一致。然而,随着沙子含量的减少,特别是最低水平,预测强度高于参考曲线,最低沙子场景在预测中产生了显著的变异性。粗骨料含量在所有水平上几乎没有影响,预测几乎与观察分布一致。对于水含量,最低水平产生的强度高于观察值,平均值接近观察分布,而最大水平低于观察分布。水含量的影响在这个组中仍然明显。最低的水含量产生最高的强度,而增加水含量会降低强度,最大水含量导致的预测值低于观察分布。对于减水剂,最小剂量导致强度降低,而增加剂量提高强度,最大剂量产生的值超过参考分布。关于钢纤维,最小纤维含量导致轻微的强度损失,而平均和最大纤维含量产生的预测明显超过观察到的强度分布。钢纤维的直径和长度在这个强度范围内没有明显的影响。养护时间的效果非常明显。1天的最小养护时间导致非常低的强度,而27.5天的平均养护期和365天的最大养护期由于持续的水化作用导致强度显著提升。这些扩展的养护场景也在预测值中显示出显著的变异性。3.3. 抗压强度在90–130 MPa范围内的样品(图14)在这个高强度组中,水泥和硅灰的最小水平低于观察到的强度分布。平均值接近观察到的值,而最大水平则带来适度的增加。矿物添加剂如粉煤灰、纳米二氧化硅和BFS的添加量在最低和平均水平上与观测到的分布基本一致,且在较高添加量下显示出有限的增强强度的潜力。石灰石粉在低和中等水平上的添加量接近或略低于观测值,其整体影响有限,尽管在最高添加量下呈现出逐渐上升的趋势。在这一组中,减少砂含量会显著提高强度。虽然最大砂含量与观测到的强度曲线对齐,但在平均和最低添加量下减少砂含量会导致预测强度超过参考分布。对于粗骨料,最低和平均添加量产生的强度值高于观测分布,而最高添加量则会导致强度下降。水分含量的影响显而易见:最低水分含量产生最高的强度,随着水分含量的增加,强度降低,最高水分含量下的预测强度低于参考值。对于超塑性增塑剂,低和中等剂量会导致强度略有下降,而最高剂量则接近甚至在某些情况下超过观测值。关于钢纤维,最低添加量会导致强度下降,而平均和最高添加量则使强度预测值高于观测分布。钢纤维的直径和长度在这一组中并未显示出显著影响。养护时间的影响非常明显:1天的短养护时间会导致非常低的强度,而27.5天和365天的中等和长养护期则会产生远高于观测强度分布的结果。3.4. 抗压强度超过130 MPa的试件(图15)在这个超高强度组中,各成分的影响与前几组不同,表现出更复杂的响应模式,这表明在该性能水平下材料间的相互作用变得更加复杂。对于水泥,最低添加量导致强度降低,平均添加量在观测分布附近波动,最高添加量则增加强度。对于粉煤灰和BFS,平均添加量低于预期,最低添加量与观测值一致,最高添加量产生的效果可能高于或低于参考分布。二氧化硅 fume、纳米二氧化硅和石灰石粉也表现出类似的行为:最低添加量通常与观测值一致,而平均和最高添加量则显示出不太一致且波动较大的响应曲线。这种模式表明,超高强度系统可能需要一个狭窄的最佳添加剂添加量窗口,且相互作用效应可能至关重要。骨料成分的影响也较为复杂:对于砂和粗骨料,最低和平均添加量有时接近观测值,有时超过它们,而最高添加量则会导致强度下降。这一发现表明,在超高强度系统中,过量的骨料含量可能是有害的。与所有组类似,水分含量仍然是最具影响力的因素之一:最低水分含量产生最高强度,随着水分含量的增加,强度降低,最高水分含量下的预测强度低于参考值。对于超塑性增塑剂,低和中等剂量会降低强度,而最高剂量则可能与观测值一致或高于观测值。对于钢纤维,最低添加量会导致强度下降,平均添加量产生平衡的响应,最高添加量则增加强度。钢纤维的直径和长度在任何干预水平上均无显著影响。养护时间的影响依然显著:1天的短养护时间会导致非常低的强度,而27.5天和365天的中等和长养护期则能保持或进一步提高观测到的高强度值。3.4. 抗压强度超过130 MPa的试件(图15)在这个超高强度组中,各成分的影响与前几组不同,表现出更复杂的响应模式,这表明在该性能水平下材料间的相互作用变得更加复杂。对于水泥,最低添加量导致强度降低,平均添加量在观测分布附近波动,最高添加量则增加强度。对于粉煤灰和BFS,平均添加量低于预期,最低添加量与观测值一致,最高添加量产生的效果可能高于或低于参考分布。二氧化硅 fume、纳米二氧化硅和石灰石粉也表现出类似的行为:最低添加量通常与观测值一致,而平均和最高添加量则显示出不太一致且波动较大的响应曲线。这种模式表明,超高强度系统可能需要一个狭窄的最佳添加剂添加量窗口,且相互作用效应可能至关重要。骨料成分的影响也较为复杂:对于砂和粗骨料,最低和平均添加量有时接近观测值,有时超过它们,而最高添加量则导致强度下降。这一发现表明,在超高强度系统中,过量的骨料含量可能是有害的。与所有组类似,水分含量仍然是最具影响力的因素之一:最低水分含量产生最高的强度,随着水分含量的增加,强度降低,最高水分含量下的预测强度低于参考值。对于超塑性增塑剂,低和中等剂量会降低强度,而最高剂量则可能与观测值一致或高于观测值。对于钢纤维,最低添加量会导致强度下降,平均添加量产生平衡的响应,最高添加量则增加强度。钢纤维的直径和长度在任何干预水平上均无显著影响。养护时间的影响依然显著:1天的短养护时间会导致非常低的强度,而27.5天和365天的中等和长养护期则能保持或进一步提高观测到的高强度值。这一结果表明,无论初始混合物设计多么优化,实现完全水化对于达到超高强度仍然是必不可少的。4. 结论本研究提出了一个双重预测和因果框架,用于模拟含有矿物添加剂的钢纤维增强混凝土的抗压强度,使用了包含446个实验记录的文献汇编数据集,这些记录涉及14个混合比和加工变量。基于异构树基础学习器和优化的岭回归元学习器的堆叠集成回归器HERO-R,在五折交叉验证下实现了最强和最稳定的预测性能,平均测试R2为0.9405,RMSE误差为7.38 MPa,MAE误差为4.88 MPa,性能优于八种广泛使用的基准算法。总体而言,这些结果表明,在严格验证的集成框架中整合互补的学习bias可以显著提高复杂水泥基系统中强度预测的准确性和鲁棒性,这些系统具有非线性、耦合的相互作用特征。除了预测之外,还利用因果结构学习和反事实分析将模型输出转换为可操作的工程洞察,通过识别将混合成分与强度联系起来的合理因果路径,并量化不同强度层次上干预措施的孤立效应。学习到的因果结构突出了总粘结剂的作用及其通过水灰比的影响,而反事实情景一致指出水分含量和养护时间是影响强度范围的主要因素,钢纤维的添加量提供了有益的增强效果,纤维几何形状在研究范围内影响有限。从实际角度来看,所提出的工作流程可以加速混合物筛选,降低实验成本,并通过更明智地选择粘结剂、添加剂和养护策略来支持可持续性导向的优化。尽管结果令人鼓舞,本研究仍存在某些局限性。首先,HERO-R模型的预测准确性严格受限于汇编数据集的具体参数范围。其次,因果推断框架假设所有关键混淆变量都被观察到并包含在有向无环图中。未来的研究应通过以下步骤解决这些限制:•进行有针对性的实验计划,以物理验证生成的反事实情景。•扩展数据集,包括合成纤维或玻璃纤维等不同的增强材料。•整合生命周期评估指标,以实现机械性能和环境影响的多目标优化。•应用不确定性量化技术,以提高模型预测在现实世界噪声条件下的可靠性。cRediT作者贡献声明Aybike ?zyüksel ?ift?io?lu:撰写——原始草案、方法论、调查、数据管理、概念化。Murteda Unverdi:撰写——原始草案、方法论、调查、数据管理、概念化。Naz Mardani:撰写——审阅与编辑、监督。Ali Mardani:撰写——审阅与编辑、监督。