编辑推荐:
炼铁烧结粒度指数(TI)预测面临动态过程捕捉难、标签对齐误差大等问题,本文提出VLMST模型。该方法通过变量长度序列建模和动态多实例学习整合时空特征,结合时空注意力编码器与LSTM分别处理动态/静态变量,并设计门控融合模块进行回归预测。实验表明,VLMST在MSE(0.116)、R2(0.741)等指标上优于传统基线,且通过消融实验验证了各模块的有效性。
彭子堂|黄晓娴|范晓辉|陈旭琳|冯振祥|甘敏|李瑞杰|廖卓章
中南大学矿物加工与生物工程学院,中国湖南410083
摘要
准确预测烧结翻滚指数(TI)对于稳定的烧结生产至关重要。烧结阶段在反应类型和强度上与其他阶段有显著差异,固定长度的时间窗口输入在捕捉材料全貌方面的能力有限。这些因素增加了建模的难度,导致整个数据集的预测误差较大或单个样本的绝对误差较大。本文提出了变长度多实例时空模型(VLMST)来解决这些问题。首先,根据过程先验将变量分类为动态变量或静态变量。为动态变量构建变长度序列以与托盘轨迹对齐,然后使用多实例学习聚合相邻轨迹。这保留了完整的烧结过程并减少了标签对齐的不确定性。随后,时空注意力编码器和LSTM分别从动态和静态变量中提取深度特征。最后,门控融合模块结合回归模块生成TI的预测输出。在真实生产数据上的实验表明,VLMST在均方误差、平均绝对误差、决定系数和区间命中率方面优于几种基线方法。在实际应用中,VLMST的均方误差为0.116,决定系数为0.741。消融研究量化了每个模块的贡献。所提出的方法为接近实时的TI评估和闭环质量控制提供了实用途径。
引言
烧结是高炉炼铁的主要原料,其质量直接影响冶炼效率和能源消耗。翻滚指数(TI)作为烧结物理和冶金特性的关键指标,反映了其在处理和运输过程中的抗降解和耐磨性[1]。较低的TI会导致细粉产生和输送及装料过程中的返料率增加,这不仅造成资源和能源损失,还会引起炉况异常。因此,保持稳定的TI对于提高烧结质量和降低冶炼能耗至关重要。在实际生产中,TI主要通过实验室离线分析进行测量。烧结冷却、破碎和筛分后,样品通过手动或自动设备收集并进行测试。烧结完成与测试结果之间的延迟通常超过2小时。这种低频率和长延迟的测量无法及时反馈给生产过程,使得难以支持闭环参数优化和实时质量控制。因此,开发可靠的在线检测方法成为提高烧结过程控制的迫切需求。
数字技术为TI的在线估计提供了实用途径。根据建模原理,预测方法可以分为基于物理的数值模拟和数据驱动的方法[2]。基于物理的方法明确模拟烧结过程中的物理和化学过程,如计算流体动力学(CFD)和离散元方法(DEM)。这些方法具有可解释性,但通常需要简化,并且计算成本较高,这限制了它们在在线或工程应用中的适用性[3,4]。相比之下,数据驱动的方法从历史数据中学习过程输入与TI之间的映射。这些方法具有灵活性,部署门槛较低,近年来受到了越来越多的关注。Umadevi等人[5]使用九个过程变量构建了一个反向传播神经网络,并进行了敏感性分析以识别关键变量并评估模型的可行性。Huang等人[6]提出了一个两阶段人工神经网络。在第一阶段,使用原材料化学成分预测液相含量及相关性质。在第二阶段,将这些输出与过程变量结合以预测TI,从而提高了预测性能。Xia等人[7]使用轻量级LightGBM预测TI,并应用核密度估计来量化预测区间并提高决策可靠性。区间方法理论上可以提高决策可靠性,但其有效性取决于误差分布的稳定性,当操作条件变化时可能会降低。Chen等人[8]提出了一种基于高斯混合模型的方法进行条件识别和在线学习,并结合半监督线性-非线性学习网络进行TI预测。Song等人[9]通过使用灰色模型GM(1,1)进行趋势预测和最小二乘支持向量机(LS-SVM)对残差进行建模和校正,以应对小样本和部分缺失信息的情况。上述研究证明了数据驱动建模的可行性。然而,使用传统浅层模型的点预测往往无法捕捉烧结过程中的复杂非线性动态、时间演变和跨条件变异性。随着深度学习的快速发展及其在序列特征学习方面的优势,深度方法已越来越多地应用于工业预测[[10], [11], [12], [13]]。Wei等人[14]提出了一个多级深度融合框架,用于预测烧结中的FeO含量。Xie等人[15]开发了一种基于分解的编码器-解码器模型,以实现准确的多步烧透点预测。对于TI预测,最近的工作探索了时空表示和图神经结构。Chen[16,17]提出了一个基于深度嵌入聚类的时空预测模型,并引入了加权损失来平衡多条件样本不平衡。Yan[18]开发了一个双分支图神经网络,融合了领域知识和数据驱动表示,以整合时空特征并实现准确的TI预测。
TI是多个阶段和因素相互作用的结果。从烧结机制的角度来看,当材料条件稳定时,烧结阶段的燃烧和冷却轨迹对TI有很强的影响。现有模型通常使用固定时间窗口作为输入,但实际上托盘速度是动态调整的,固定窗口可能会错过关键信息。此外,下游操作(如破碎和冷却)引入的时间延迟定义不明确,使得过程数据与实验室标签之间的精确对齐变得困难。这些问题会降低预测精度并导致某些批次的较大误差。变长度序列建模和多实例学习为解决这些问题提供了一种新方法。变长度序列通过灵活的时间长度表示整个过程轨迹,从而能够捕捉托盘速度、停留时间和其他相关效应的差异,避免关键特征的丢失。变长度序列建模已广泛应用于质量预测、故障检测和寿命估计[[19], [20], [21], [22], [23]]。多实例学习解决了标签-序列对齐问题并提高了鲁棒性。在这种方法中,时间上相邻的序列被分组到一个“袋”中,并在“袋”级别分配标签。袋级别训练减轻了连续行业中典型的采样延迟和过程变异性。这种策略在工业质量预测和故障检测任务中显示出良好的适用性[[24], [25], [26]]。基于这些想法,提出了变长度多实例时空(VLMST)模型,用于准确预测烧结翻滚指数。时空注意力编码器和LSTM分别从动态和静态过程变量中提取深度特征。特征在决策层对齐并融合。实验表明,所提出的方法在准确性和泛化能力方面优于几种基线模型。
本文的其余部分分为四个部分。第2节介绍了挑战和数据预处理以及所提出的VLMST模型。第3节描述了VLMST模型的架构。第4节报告了实验结果和分析。第5节提供了结论和未来工作。
部分摘录
过程描述与分析
铁矿石烧结过程涉及将铁矿石细粉、熔剂、燃料和返料与水混合形成颗粒状混合物。混合物通过分配装置铺在托盘上形成混合床。点燃后,混合床在下方风箱的吸力作用下向下燃烧。高温导致部分熔化和固化,产生多孔烧结矿。本研究关注的是一台有效吸力面积为600平方米的烧结机,配备了30个
样本构建模块
提出了一种基于材料轨迹的样本构建模块,以全面描述烧结阶段。该模块如图6(a)所示。变长度序列构建分为三个步骤。
(1)关键时间点识别
实验室测量时间及其标签和其标签用于通过考虑冷却延迟来推断候选烧结完成时间。平均冷却延迟为
实验设置
为了评估VLMST的有效性,将所提出的方法与传统的时间序列建模工作流程进行了比较。在去除停机和非正常条件的数据后,分别使用所提出的样本构建方法和传统方法构建了数据集。然后,每个数据集被严格划分为训练集和验证集,比例约为9:1。
模型性能使用均方误差(MSE)、平均绝对误差(MAE)、命中率(HR)等指标进行评估。
结论
本研究从过程特性和机制的角度分析了预测烧结翻滚指数的关键挑战,并提出了变长度多实例时空模型(VLMST)以增强预测能力。主要贡献包括:(1)开发了一种结合变长度序列建模和多实例特征构建的方法,并证明了这种输入表示改进了基于注意力的架构模型。
CRediT作者贡献声明
彭子堂:写作——审稿与编辑,写作——原始草稿,监督,形式分析,概念化。黄晓娴:写作——原始草稿,可视化,方法论,形式分析,概念化。范晓辉:验证,监督,概念化。陈旭琳:可视化,调查,形式分析。冯振祥:可视化,方法论,形式分析。甘敏:可视化,方法论,形式分析。李瑞杰:项目管理,形式分析。
声明
在撰写本文期间,作者使用GPT对稿件内容进行了润色,以使稿件写作更加逻辑清晰。使用该工具后,作者根据需要审查和编辑了内容,并对发表文章的内容负全责。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。
致谢
本研究得到了国家重点研发计划(项目编号:2023YFC3707001)和中南大学的康奈尔大学基本研究基金(项目编号:2024ZZTS0381)的财政支持。