通过结合机器学习与SHAP解释技术,实现对炼钢渣粘度可解释性的预测

《Journal of Non-Crystalline Solids》:Interpretable viscosity prediction of steelmaking slag integrating machine learning with SHAP explanation

【字体: 时间:2026年01月17日 来源:Journal of Non-Crystalline Solids 3.5

编辑推荐:

  针对电弧炉炼钢中钢渣粘度预测的难题,基于六种机器学习算法(包括XGBoost等集成模型)和SHAP解释框架,构建了CaO-SiO?-Fe?O?-MgO-Al?O?-MnO-P?O?多组分钢渣粘度预测模型,通过多指标评估发现XGBoost模型表现最优,R2达0.949,RMSE为0.163,MAE为0.101,且SHAP分析揭示了CaO、温度和SiO?对粘度的主要影响,为智能炼钢提供实时粘度预测支持。

  
贾贵斌|赵瑞仪|严伟
北京科技大学先进冶金国家重点实验室,北京,100083,中国

摘要

准确且实时的粘度预测对于实时监测和调节炼钢渣至关重要,以满足冶金要求,如渣滴和渣泡沫等,以实现智能炼钢。当前的粘度预测能力受到缺乏能够处理炼钢渣多组分和非牛顿特性的强大模型的限制,特别是在中低温范围内,传统的完全液态牛顿熔体的粘度模型的适用性有限。在本研究中,基于六种机器学习(ML)算法和SHapley Additive exPlanations(SHAP)解释框架,开发了用于多组分炼钢渣系统CaO-SiO?-FetO-MgO-Al?O?-MnO-P?O?的粘度预测模型,并使用公共文献中的数据集进行了训练。采用多标准评分排序决策方法,通过多种指标评估了模型的整体预测性能。基于极端梯度提升(XGB)算法的预测模型表现出优越的预测准确性,确定系数(R2)为0.949,均方根误差(RMSE)为0.163,平均绝对误差(MAE)为0.101。与RE修改的粘度预测模型(传统模型和Einstein-Roscoe模型的结合)的比较分析显示,XGBoost模型在统计上具有显著优势。SHAP可解释性分析量化了特征的重要性,确定CaO含量是粘度预测的主要贡献因素,温度是其次的调节因素,其次是SiO2。本研究提高了牛顿和非牛顿炼钢渣系统的粘度预测能力,实现了实时监测和调节渣液,以支持智能炼钢。

引言

炼钢渣是一种多组分渣系统,包含CaO、SiO?、FetO、MgO、Al?O?、MnO、P?O?等。粘度是炼钢渣的关键属性,它影响炼钢性能,如脱磷、渣滴保护、渣泡沫以及液态渣的粒化和高磷相的分离再利用等。特别是在快速发展的电弧炉(EAF)炼钢中,由于泡沫渣可以减少热量损失,并在冶炼过程中为耐火材料和石墨电极提供良好的保护,因此可以实现高功率输入,从而实现高生产率和低能耗[[1], [2], [3]]。然而,当渣泡沫不足或过度时,会产生飞溅现象,对生产造成巨大潜在危险[2,4]。因此,准确控制合理的渣泡沫非常重要。
研究人员在深入理解渣泡沫方面取得了许多显著成果。已验证EAF炼钢渣的粘度在泡沫过程中起着关键作用,作为控制泡沫现象的关键指标[5]。低粘度会导致泡沫尺寸、数量和高度不足,而过高粘度会损害渣的流动性。一些研究人员通过引入粘度作为核心参数,报告了粘度对渣泡沫的影响,并构建了泡沫指数的预测模型[[6], [7], [8], [9], [10]]。在此基础上,可以通过成分、粘度和渣泡沫效率之间的映射关系来大致控制渣泡沫。应当强调,理解粘度是设计具有更好泡沫能力的渣液的前提。目前获得准确渣粘度的主要方法仍然依赖于实验测量。许多出版物记录了渣成分与粘度之间的关系,包括CaO/SiO? [11]、CaO [12]、FeO [13,14]、SiO? [15]、MgO [13,15]、MnO [16,17]、Al?O? [18] 和 P?O? [19] 对粘度的影响。然而,实际渣成分在炼钢过程中是复杂的且变化的,因为造渣材料、废钢和直接还原铁(DRI)的添加量和成分的协同效应,设计和控制泡沫渣仍需要大量的实验和工程专业知识。对于研究人员和用户来说,进行大量渣粘度测量所涉及的大量材料和时间成本仍然很高,以满足不同渣成分的要求。随着炼钢向稳定性和智能化的发展,渣成分可以预测,因此对EAF炼钢过程中渣泡沫的实时在线预测尤为重要。
为了快速评估不同渣系统的粘度,研究人员广泛探索了有效模型的开发。随着渣粘度数据的积累和实验测量方法的改进,已经建立了几种基于经验和结构的模型。例如Iida模型[20]、Urbain模型[21]、Pyroresearch模型(改进的Urbain模型)[22]、CSIRO模型(基于分子动力学计算)[23]和Tanaka模型[24]等。然而,炼钢渣是多组分系统,这些传统预测模型对于这些复杂的硅酸盐系统往往存在显著误差。Zhang等人[25]改进了硅酸盐系统模型,使其适用于包含P和Cr的渣的多组分预测。然而,当粘度范围增加时,模型在高粘度区域的预测结果差异显著,导致较大误差。其他模型,如Shu[26]和Kondrative[27]也被应用,并涵盖了多种系统。然而,大多数模型不适用于含有固体相的渣系统,这也是大多数模型的典型缺陷。由于炼钢渣的成分和温度的变化,特别是EAF泡沫渣,它不能保持完全液态。对于含有液态和固态相的渣系统,Roscoe和Einstein[28]通过以下关系理论解释了固体颗粒大小分布如何影响悬浮液的粘度:η=ηl(1?af)?nf和液相成分。目前,固体相分数和液相成分主要使用FactSage热力学软件计算,这限制了其实时适用性。此外,an的参数在不同系统中有所不同,降低了预测准确性,限制了大规模应用。因此,现有模型难以预测具有显著温度变化和宽粘度范围的多组分渣系统的粘度。
得益于统计理论的成熟,特别是贝叶斯统计学和机器学习(ML)理论的出现。随着计算能力的迅速提升和数据的爆炸性增长,应用ML来揭示大量数据中的隐藏模式和规律性,并基于这些数据不断学习和改进已成为现实。因此,ML在当代材料研究中得到了广泛应用,例如预测离子液体的熔点[29,30]、金属疲劳寿命[31,32]和合金抗氧化性[33,34]。ML还被用于建立渣系统性质的预测模型。Yan和Shen[35,36]预测了模具助熔剂的粘度和熔点,开发了预测软件,并成功设计了工业模具助熔剂。Derin[37]率先应用人工神经网络预测多组分熔渣中的硫含量。训练好的模型显著优于现有的光学碱度模型,并证明适用于高FeO渣的专门精炼过程。Bashir[38]使用集成ML算法和CatBoost预测了基于高炉渣的混凝土的抗压强度,显示出与可持续发展目标一致的优越预测准确性。Liu[39]评估了ML算法在预测氧化物玻璃的关键物理性质方面的性能,特别是材料密度、杨氏模量、剪切模量和泊松比等关键机械性质。
实时预测和控制渣泡沫是实现智能EAF炼钢操作的关键技术前沿。准确的在线粘度估计是优化渣泡沫及相关冶金过程(如智能炼钢过程中的转炉渣滴)的基本前提。然而,传统粘度模型受到其有限的组分和成分适应性、温度依赖的有效性以及仅适用于完全液态牛顿系统的限制,这些限制促使了本研究。本工作的目标是通过开发可解释的ML框架来解决这些限制,这些框架能够在广泛的成分和温度范围内预测粘度,并定量揭示输入特征与输出之间的关系。在此背景下,系统地对比了六种ML算法模型和传统粘度模型,以预测CaO-SiO?-FetO-MgO-Al?O?-MnO-P?O?炼钢渣系统的粘度,包括监督学习算法和更先进的集成ML算法。实施了SHAP分析,以解释每个输入特征的具体贡献,并概括了多组分渣系统的模型行为。这种对预测准确性和机制透明度的双重关注显著提高了炼钢渣系统粘度预测的操作可靠性,特别是在工业异质条件下。

章节片段

数据库建立

从已发表的文献中提取了近800组不同成分和不同温度下的渣粘度数据[[40], [41], [42], [43], [44], [45], [46], [47], [48], [49], [50], [51], [52], [53], [54], [55], [56], [57], [58], [59], [60], [61], [62], [63]]。文献中的原材料大多是在实验室环境中制备的,然后进行了分析和验证。为了确保数据的可靠性,选择的大多数粘度数据是使用旋转

原始数据统计分析

在数据收集、清洗和筛选后,使用了近800组数据来研究和分析模型构建。渣液包含七种成分:CaO、SiO?、Fe?O?、FeO、MgO、Al?O?、MnO和P?O?,这些构成了主要的炼钢系统。温度范围为1483 K - 1918 K,基本涵盖了炼钢温度。表1总结了有效数据的统计分析结果。值得注意的是,本研究中使用的数据是

结论

在本研究中,基于六种ML算法成功开发并评估了CaO-SiO?-FetO-MgO-Al?O?-MnO-P?O?炼钢渣系统的粘度预测模型,包括单一算法和流行的集成算法。通过使用三种验证指标进行评估,并与四种传统模型进行比较,提出了性能最佳的模型。进行了基于SHAP的可解释性分析,以进一步揭示特征的重要性。主要结论是

数据声明

支持本研究发现的数据可在合理请求下从相应作者处获得

CRediT作者贡献声明

贾贵斌:撰写 – 原稿撰写、可视化、验证、软件开发、方法论、调查、形式分析、数据管理。赵瑞仪:可视化、验证、软件开发、方法论、调查、形式分析、数据管理。严伟:撰写 – 审稿与编辑、监督、项目管理、方法论、资金获取、概念化。

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

致谢

本研究由国家自然科学基金(资助编号52374317)资助。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号