一种可解释的堆叠网络模型,用于利用表格数据预测Consteel电弧炉的炉温终点值

《Engineering Applications of Artificial Intelligence》:Interpretable stacking network for predicting endpoint temperature of Consteel electric arc furnace using tabular data

【字体: 时间:2026年02月27日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  预测和控制在Consteel电弧炉熔炼终点温度对机械性能、微观结构和能源效率有显著提升。本研究提出基于随机森林特征提取和SHAP可解释性分析的多模型堆叠架构,整合XGBoost、TabNet、SVR、MLP等异构基模型,采用贝叶斯岭回归作为元学习器,结合热图关联分析和SHAP贡献度计算优化模型结构,验证了模型在±15℃误差范围内85.85%命中率,并符合冶金热力学机理。

  
董世健|胡文月|孔双|姜小青|邵一勤
东北大学冶金学院,中国辽宁沈阳110819

摘要

预测和控制Consteel电弧炉的终点温度可以提高材料的机械性能、微观结构和能源利用效率。首先开发了一个可解释的堆叠模型来预测Consteel电弧炉的终点温度。使用随机森林技术对原始数据进行预处理并提取关键特征。通过协同应用相关热图和SHapley加性解释值的累积贡献率来确定基础学习器,这提高了堆叠模型构建的方法论合理性。该堆叠模型通过整合不同学习器的优势(包括表格深度网络、极端梯度提升、多层感知器和支持向量回归)有效增强了模型的鲁棒性。设计了具有双重评估特性的贝叶斯岭回归作为元学习器。还分析了不同变量对终点温度的领域知识,以提高预测模型的可解释性。使用SHapley加性解释框架可视化了每个特征的重要性。通过与实际Consteel电弧炉过程的采样数据进行比较,验证了所提算法的有效性和适应性。同时展示了预测区间覆盖概率和标准化平均宽度。实验结果表明,所提模型在±15°C范围内的命中率为85.85%,在±20°C范围内的命中率为92.92%。

引言

电弧炉(EAF)炼钢具有适应性强、生产效率高和节能的优点(Klimas和Grabowski,2023)。Consteel是一种先进的EAF炼钢技术,具有连续加料、预热废钢和生铁、预还原铁矿石以及减少烟雾和粉尘排放的优势(Kieush和Schenk,2025;Fernández等人,2008;Liu等人,2023)。EAF在高温和强腐蚀的恶劣环境中运行(Thomson等人,2000;Ahmed等人,2025)。通过依赖热力学原理和节能理论,可以定性分析影响EAF终点温度的关键因素(Mesa等人,2009)。然而,这种基于机制的模型需要结合经验知识(Zhang和Jáno?ík,2024)。EAF的温度可以通过一次性浸入式热电偶或通过渣门取样的方式来测量(Hernández等人,2022)。然而,这种方法不经济且容易受到随机误差的影响。在EAF熔炼过程中获得动态变量的精确测量值具有挑战性(de Matos等人,2023)。通常,只有关于原材料初始成分和某些操作参数的数据是可靠的(He等人,2014)。因此,数据驱动技术为预测Consteel EAF的终点温度提供了一个有前景的替代方案。
领域知识分析建模技术可以提供Consteel EAF熔炼过程中能量变化的内在动态描述(Bla?i?等人,2021)。然而,通过分析进行建模需要做出合理的假设和数学简化(Ajorloo等人,2023)。机制模型中的参数难以准确确定,通常必须基于经验知识进行估计(Zhang和Zhao,2026;Inalegwu等人,2024)。已经报道了几种采用机制分析建模的方法来研究EAF过程(Song等人,2022)。基于数学、电气和机械原理,已经开发了EAF的电气和液压系统的建模(Logar等人,2011)。还开发了动力学模型,通过结合动力学表达式和热力学数据库来预测废钢、液态金属、渣和气体相的质量、温度和成分的变化(Van Ende,M. A,2022)。此外,反应速率的大幅波动和炉内材料分布不均会限制基于机制的模型预测Consteel EAF过程终点温度的适应性(Opitz和Treffinger,2016)。动态变量和中间过程状态的数据稀缺进一步复杂化了EAF过程的建模(Nath等人,2025)。因此,可以考虑使用智能建模技术来挖掘Consteel EAF过程终点温度数据之间的关系。
通过整合历史数据中的模式和趋势,数据驱动模型可以在处理非线性和动态变化的同时学习EAF熔炼过程中的温度变化(Klimas和Grabowski,2024)。在实验设计和数据收集过程中,获取更多变量动态信息是必不可少的(Gajic等人,2016)。然而,过多的输入变量可能导致智能模型过拟合(Chen等人,2021)。选择最相关的特征可以减少冗余特征的干扰,降低输入空间的维度,加速模型训练,并提高模型的泛化能力(Chu等人,2014)。特征选择技术主要包括主成分分析(PCA)、奇异值分解(SVD)和随机森林(RF)(Tsutsui等人,2024)。从每个炉子收集的熔炼数据是表格形式的生产数据(Song等人,2019)。常见的时间序列处理技术无法有效捕捉表格数据的内在特征(Liu等人,2024)。适用于表格数据的现有网络主要包括极端梯度提升(XGBoost)、表格深度网络(TabNet)、支持向量回归(SVR)、多层感知器(MLP)等(Fernández-Delgado等人,2019)。XGBoost模型基于残差误差进行迭代优化,在目标函数中同时考虑了误差和正则化项(Liu等人,2023)。TabNet是一种专为表格数据设计的深度学习架构。TabNet结合了神经网络和决策树的优点。TabNet的设计强调了预测结果的可解释性(Zhou等人,2025)。当数据分布复杂或未知时,带有核函数的SVR也适用于处理非线性数据特征(Shi等人,2023)。MLP非常适合捕捉输入和输出之间的非线性关系(Yilmaz和Kaynar,2011)。监督学习算法已被用于预测EAF过程中的终点温度(Song等人,2023)。使用多个支持向量机构建了一个用于预测终点参数的软传感器模型(Yuan等人,2007)。提出了一种基于CatBoost的两阶段优化方法来预测EAF中的终点碳含量(Lu等人,2024)。单个模型可能对测量干扰非常敏感。通过将AdaBoost与极端学习机结合,开发了一种混合集成网络来预测钢包炉的温度(Tian和Mao,2009)。提出了一种基于贝叶斯公式的集成模型来预测转炉的终点温度(Feng等人,2022)。可以考虑使用堆叠策略来完全捕捉Consteel EAF数据的内在特征。
堆叠架构整合了算法,从不同的视角、数据特征空间和结构中提取关键信息(Pernía-Espinoza等人,2018)。应选择误差相关性低的模型进行集成(Meng等人,2024)。基础学习器的多样性往往会增加整个模型的复杂性和过拟合的风险。由于考虑了参数的概率分布,贝叶斯岭回归可以提高预测的准确性并提供误差范围(Saqib,M.,2021)。详细的特征影响分析和贡献计算可以提高网络的可解释性和透明度。不确定性评估还可以为数据噪声的存在提供可靠的预测区间(Su等人,2022)。考虑到SHapley加性解释(SHAP)解释器提供了每个特征的全局视图,它可以用来解释每个特征对预测结果的平均影响(Cakiroglu等人,2024)。因此,本文研究了利用SHAP解释器的堆叠模型的可解释性问题。
在本文中,设计并实现了一个用于预测Consteel EAF终点温度的概率预测堆叠网络。主要创新和研究内容如下:(1)通过使用随机森林分析识别并选择了影响终点温度的关键特征。(2)通过使用相关热图选择基础学习器,以确保低误差相关性和多样性,并应用累积SHAP贡献分析来确认高预测重要性。这种双重策略通过结合多样且高度贡献的模型,得到了更全面和准确的集成。设计BRR算法作为元学习器来预测终点温度和不确定性区间。(3)利用SHAP框架可视化每个特征变量。所设计的模型具有很强的可解释性,可以清楚地显示输入特征和预测结果之间的转换过程和动态关系。(4)使用Consteel EAF的真实数据验证了所设计堆叠网络的有效性。测试结果表明,SHAP分析结果与冶金理论的本质完全一致。

部分摘录

EAF系统描述

以图1所示的Consteel EAF作为研究平台。Consteel EAF主要包括准备阶段、氧气熔炼阶段和出钢阶段。氧气熔炼阶段分为加料和熔炼阶段以及熔融钢加热阶段。加料输送带不断添加废钢,并始终保持炉内一定量的熔融钢。Consteel EAF中的反向烟气不断预热原料。

设计的堆叠网络

考虑到现有的基于集成的炉子预测方法主要根据训练误差或算法类型来确定基础学习器,它们存在明显的盲目性和随机性。为了克服现有堆叠网络的局限性,本文采用科学的定量指标来选择基础学习器,从而有效确保堆叠模型的鲁棒性。基于相关热图确定基础学习器。

Shapley加性解释(SHAP)

SHAP源自Shapley值,该值衡量每个特征对预测结果的边际贡献。SHAP分析是一种基于博弈论的Shapley值的解释方法。对于多输入系统,SHAP可以定量分析每个变量对输出预测的贡献。通过构建一个简化模型来近似原始模型,SHAP分析量化了每个输入变量对

数据收集与分析

使用实际钢铁厂的120吨Consteel EAF来测试所提出的网络。收集了十五个关键输入变量和一个温度输出变量的数据。每个炉子的熔炼周期大约为35分钟。各个炉子之间没有时间连续性或因果关系。记录的变量数据包括整个熔炼过程开始和结束时的工作条件和成分。

结论

建立了一个堆叠学习模型来预测Consteel EAF的终点温度。通过分析预测误差的相关热图和SHAP值的累积贡献率,确定异构基础学习器集成应包括MLP、SVR、XGBoost和TabNet,而BRR作为元学习器。通过整合这些优势,堆叠模型有效提高了泛化能力和预测准确性。

CRediT作者贡献声明

董世健:撰写 – 审稿与编辑,撰写 – 原始草稿,项目管理,方法论,研究调查,资金获取,正式分析,数据管理,概念化。胡文月:撰写 – 原始草稿,可视化,验证,监督,软件,资源。孔双:撰写 – 原始草稿,可视化,验证,监督,软件,资源,项目管理。姜小青:撰写 – 原始草稿,可视化,验证,监督,

资金声明

本工作得到了CPSF博士后奖学金计划(资助编号GZC20240231和2025M773596)中央高校基本科研业务费(资助编号N25LPY019)和国家自然科学基金(资助编号U24A2098)的支持。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号