《Energy》:Interpretable Machine Learning for Optimizing Product Distribution in Biomass-Plastic Co-pyrolysis: Unveiling Synergistic Mechanisms and Operational Windows
编辑推荐:
生物质与塑料共热解的三相产物分布预测模型研究。通过202组实验数据构建机器学习模型,发现Extra Trees算法最佳预测生物炭(R2=0.887),XGBoost算法适用于生物油(R2=0.733),Ridge回归对生物气预测效果最佳(R2=0.764)。SHAP分析揭示温度(500-700℃)和生物质-塑料配比是关键调控因素,协同效应源于塑料供氢与生物质自由基淬灭作用。确定了生物炭(500-550℃)、生物油(550-650℃)、生物气(>700℃)的优化操作窗口。
Jiawei Tan|Qicheng Lai|Yuanbo Song|Xiang Qin|Junhao Hu|Pan Li
郑州大学机械与动力工程学院,生物基运输燃料技术国家重点实验室,中国郑州450001
摘要
生物质和塑料废物的共热解为可持续废物转化提供了一条有前景的热化学途径,但由于复杂的协同效应,预测产物分布仍然具有挑战性。在这里,我们开发了机器学习模型,利用文献中的202个实验数据集来预测三相产物(生物炭、生物油、生物气)的产量。在测试的七种算法中,确定了针对特定产物的最优算法:Extra Trees用于生物炭(R2 = 0.887,MAE = 3.5 wt.%,固相碳化);XGBoost用于生物油(R2 = 0.733,MAE = 4.7 wt.%,复杂气相反应);Ridge回归用于生物气(R2 = 0.764,MAE = 4.1 wt.%,一级分解)。这表明算法的选择应与热化学复杂性相匹配。SHAP分析确定温度、生物质与塑料的比例以及碳含量是主要影响因素,其中500-600°C的温度阈值对生物炭向生物油的转变起关键作用。交互作用映射定义了生物炭的最佳操作条件为500-550°C,生物油为550-650°C,生物气为700°C以上,这些协同效应归因于聚合物的氢贡献和生物质的自由基淬灭。该框架实现了基于数据的优化,以实现对目标产物的选择性。
引言
塑料废物积累和生物质利用率低下同时存在,需要综合的热化学解决方案来实现可持续的废物转化。全球每年产生的塑料废物超过3.5亿吨,目前只有20%被回收利用,而木质纤维素生物质残渣(估计每年为1400亿吨)仍大多未被充分利用。生物质和塑料废物的共热解具有协同优势:富含氢的塑料有助于生物油的脱氧并抑制生物炭的形成,而生物质产生的自由基可以稳定塑料降解中间体,从而共同提高产品质量和工艺效率。尽管有这些优势,但由于原料组成、操作条件和反应动力学之间的复杂非线性相互作用,三相产物(生物炭、生物油、生物气)的定量预测仍然具有挑战性[1]、[2]、[3]、[4]。
传统的共热解参数实验优化方法劳动强度大,需要在不同的温度、加热速率和原料混合比例下进行大量实验。机器学习(ML)提供了一种基于数据的替代方法,它可以直接从实验观察中学习依赖关系,而无需明确的机制假设。最近的ML应用已成功应用于生物质热解、塑料废物转化和催化升级过程[5]、[6]。值得注意的是,Zhao等人将三种主要生物质成分(纤维素、半纤维素和木质素)的热解数据(单独和混合)整合到一个共热解预测模型中,从而克服了传统研究仅通过其体积性质来描述生物质的局限性[7]。已经采用了多种ML架构,包括支持向量机、随机森林、多层感知器和人工神经网络,并根据Yan等人提出的方法优化了模型超参数[8]。然而,综合考虑机制可解释性的生物质-塑料共热解系统三相产物产量的综合建模仍然非常缺乏。大多数现有研究要么专注于单一产物相,要么使用黑盒预测模型,而没有充分阐明控制产物形成的物理化学机制。此外,缺乏对所有三种产物相的多种ML算法的系统性基准测试,以及应用先进的可解释性工具(如SHapley Additive exPlanations (SHAP)、Partial Dependence Plots (PDPs)和交互作用分析)。这种关键的可解释性差距不仅阻碍了合理的工艺设计,也从根本上限制了对控制产物选择性的协同作用机制的理解[9]、[10]、[11]、[12]。
传统的共热解参数实验优化方法劳动强度大,需要在广泛的温度、加热速率和混合比例范围内进行大量系统试验。实验研究揭示了一些关键的机制见解:Nardella等人展示了促进全纤维素二次热解的同时抑制聚乙烯链断裂的协同效应[13]。此外,Miskolczi等人报告说,较高的温度有利于气相产物的形成,而降低的操作压力则增强了生物油的脱氧[14]。这种复杂性源于物理化学因素之间的复杂相互作用。特别是,温度控制着三种不同的反应阶段:初级挥发(300-500°C)、二次裂解(500-700°C)和气化(700°C以上)。同时,生物质与塑料的比例调节自由基池的动态,从而在共热解过程中产生各原料的加权平均值;然而,在整个参数空间内实验确定这样的窗口在实践中是不可行的[15]、[16]、[17]。ML通过直接从实验数据中提取复杂的特征依赖关系,提供了一种基于数据的替代方法,避免了繁琐的参数试验。然而,以往的努力通常集中在优化单个算法的超参数上,而没有进行跨算法的系统性比较,而且大多数现有模型将温度和原料组成视为独立变量,从而忽略了它们对产物相选择性的重要乘法相互作用[18]、[19]、[20]、[21]。
在这里,我们建立了一个可解释的ML框架,整合了七种算法(线性回归、Ridge回归、随机森林、Extra Trees、梯度提升、XGBoost和LightGBM)来预测生物质-塑料共热解的三相产物。一个包含202个实验观察结果的数据集涵盖了多种原料(农业残渣、木质生物质和聚烯烃)和操作条件(300-900°C,不同的加热速率和混合比例),确保了模型的广泛泛化能力。通过设计捕捉二次热效应和温度-比例相互作用的特征,明确表示了协同机制。该框架通过为每个产物相选择最优算法(生物炭使用Extra Trees,生物油使用XGBoost,生物气使用Ridge回归),实现了高达0.89的R2和低于5 wt%的MAE,从而实现了特定产物的预测准确性。SHAP和部分依赖性分析表明,温度和生物质与塑料的比例是产物分布的主要驱动因素,元素组成(C、H和O)作为次要调节因素。定量交互作用映射揭示了共热解优于单独原料转化的协同窗口,并定义了生物炭的最佳操作条件为500-550°C,生物油为550-650°C,生物气为700°C以上。机制解释将观察到的协同行为与聚合物的氢贡献、生物质的自由基淬灭和二次裂解路径联系起来,架起了实证预测和基本热化学理解之间的桥梁。所提出的框架为针对目标产物的过程优化提供了可行的指导,推动了基于数据的废物转化策略的发展。
数据收集与整理
数据通过Web of Science和Scopus使用搜索字符串(“pyrolysis” OR “co-pyrolysis”)AND (“biomass” OR “lignocellulosic” AND (“plastic” OR “polymer” AND (“yield”))从同行评审的期刊文章(2010-2024年)中收集。仅包括具有完整产量数据、原料特性和工艺参数的研究,共得到13项研究,包含222个观察结果。文章根据以下纳入标准进行了筛选:(1)实验
数据集特征和质量评估
对222个实验观察结果进行了严格的质量控制,最终得到了202个样本的精选数据集(减少了9.0%,见图2a)。被移除的20个样本被确定为多变量异常值,其特征是特征组合异常或单个产物的产量不现实,超过了95 wt%。随后的Isolation Forest多变量异常值检测(污染=0.09)未发现额外的异常样本,确认
结论
本研究建立了一个可解释的机器学习框架,用于预测生物质-塑料共热解中的三相产物分布。针对特定产物的算法选择——生物炭使用Extra Trees,生物油使用XGBoost,生物气使用Ridge回归——在涵盖多种原料和条件的202个实验数据集中实现了高准确性(R2高达0.89)。SHAP和部分依赖性分析确定温度和生物质与塑料的比例是主要控制因素
CRediT作者贡献声明
Yuanbo Song:撰写 – 审稿与编辑,监督,资源提供。Xiang Qin:验证,资源提供,调查。Jiawei Tan:撰写 – 原稿撰写,软件开发,资源提供,调查。Qicheng Lai:方法论设计,调查,数据整理,概念化。Junhao Hu:可视化,调查,数据整理。Pan Li:撰写 – 原稿撰写,资金获取,正式分析
致谢
本工作得到了国家自然科学基金(编号:52006200和52576239)以及河南省研究生教育改革与质量提升项目(YJS2024JD04)的支持。