生物质气化的数据驱动建模及集成发电系统的多准则性能评估

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Renewable Energy》：Data-driven modeling of biomass gasification and multi-criteria performance assessment for integrated power generation

【字体：大中小】 时间：2026年05月26日 来源：Renewable Energy 9.1

编辑推荐：

　　开发了一种受限平衡（equilibrium-based）Aspen Plus模型，用于生物质气化及其后续气体压缩发电过程。气化炉中显式加入了甲烷化（methanation）化学计量建模，以实现对CH₄产率的准确预测，从而克服现有模型中的这

开发了一种受限平衡（equilibrium-based）Aspen Plus模型，用于生物质气化及其后续气体压缩发电过程。气化炉中显式加入了甲烷化（methanation）化学计量建模，以实现对CH₄产率的准确预测，从而克服现有模型中的这一关键问题。研究人员采用蒸汽和空气两种工况下的实验数据进行了模型验证。研究中变化了6个输入变量，包括当量比（ER）、气化区温度与压力、气体压缩机和蒸汽压缩机出口压力，以及蒸汽流量。7个输出变量包括合成气低位热值（LHV）、冷煤气效率（CGE）、热效率与碳转化效率（CCE）、总设备热负荷（TDD）、合成气产率（SGY）以及CO₂摩尔分数。由此获得的54,540个可行运行点被用于训练8种算法，包括支持向量回归（SVR）、多层感知机（MLP）、随机森林回归（RF）、极端梯度提升（XGBoost）、CatBoost、轻量梯度提升机（LightGBM）、K近邻（KNN）和极端随机树回归（ETR）。研究人员将各算法预测结果与Aspen模型数据进行了比较，并进一步实施多准则评估以比较其Pareto前沿。所提出的Aspen模型相较现有模型在CO、H₂、CH₄和CO₂浓度预测精度方面均有提升。RF和ETR表现出最高的预测精度，并与Aspen Pareto前沿呈现出优异一致性。

该论文发表于《Renewable Energy》，聚焦于生物质气化—发电耦合系统的数据驱动建模与多目标性能评价。研究背景在于，生物质气化是高效且灵活的热化学转化路径，可将固体生物质转化为以CO、H₂、CH₄和CO₂为主的可燃合成气，并进一步用于发电、费托合成及化学品制备。然而，现有基于Aspen Plus的平衡模型虽然应用广泛，但常存在CH₄预测偏低、H₂预测偏高等系统性误差，限制了其在合成气品质评价和工艺优化中的可信度。与此同时，机器学习（ML）代理模型虽可显著降低流程仿真的计算负担，但其性能高度依赖底层流程模型的准确性；若原始模拟存在偏差，则误差会传递至数据驱动模型。此外，既有ML研究多依赖规模有限、来源异质的实验数据，针对气化与发电集成系统的仿真驱动代理建模仍较少，且对多输出、多工况和Pareto最优特性的系统评估不足。因此，开展一项兼顾机理修正、数据生成、代理建模与多准则决策的系统研究具有明确必要性。

针对上述问题，研究人员构建了一个修正的Aspen Plus生物质气化—发电流程模型，在传统受限平衡气化框架中单独引入甲烷化反应模块，以改善CH₄产率预测这一平衡模型的典型短板。该模型以前处理干燥、分解、挥发分气化、焦油重整、焦炭气化、净化、合成气燃烧、燃气轮机与蒸汽轮机发电等单元构成完整流程，并在相同木质生物质条件下，分别基于蒸汽气化与空气气化实验数据进行验证。验证结果表明，所提出模型相较传统受限平衡模型，在CO、H₂、CH₄、CO₂组成预测方面与实验吻合更好，尤其在空气气化独立验证中显示出更强稳健性。在此基础上，研究人员围绕6个决策变量进行全空间枚举，得到54,540个可行运行点，并据此训练8类监督学习回归算法。除统计误差比较外，研究进一步采用基于Shannon熵（信息熵客观赋权方法）的综合性能指标，并通过7组Pareto前沿分析检验代理模型是否能重现原始Aspen模型的多目标权衡关系。最终得出结论：RF、ETR与CatBoost具有最高预测精度，其中RF和ETR在Pareto前沿再现方面与Aspen Plus模型最为接近，说明仿真数据与机器学习可有效结合，构建适用于生物质气化—发电系统快速预测和多目标优化的高可信代理模型。

研究的意义主要体现在三个层面。第一，方法学上，论文通过在平衡模型中加入显式甲烷化修正，为改善CH₄预测提供了可操作的流程模拟方案。第二，数据层面，研究建立了覆盖较宽工况范围并经实验验证的大规模仿真数据集，为气化过程的代理建模提供了坚实基础。第三，应用层面，论文不仅比较了不同机器学习算法的拟合能力，还进一步考察了其在多目标优化中的可靠性，使代理模型从“数值替代”拓展为“决策支持工具”。研究同时明确指出，该框架应被视为在已验证工况域内用于筛选、灵敏度分析和优化的稳健代理工具，而非可直接工业部署的数字孪生系统。

本研究主要采用了以下关键技术方法：首先，在Aspen Plus中建立包含干燥、热解、受限平衡气化、甲烷化、焦油蒸汽重整、焦炭气化及燃气—蒸汽联合发电的集成流程模型；其次，利用Fremaux et al.与Sousa Cardoso et al.的实验数据分别对蒸汽气化与空气气化工况进行验证；再次，通过6个操作变量的穷举生成54,540个可行工况点；随后，基于Python与scikit-learn训练SVR、MLP、RF、XGBoost、CatBoost、LightGBM、KNN、ETR八类回归模型，并采用R²、均方误差（MSE）、平均绝对误差（MAE）与5折交叉验证进行评估；最后，使用Shannon熵赋权构建综合性能指数，并以Pareto前沿比较代理模型与Aspen模型的多目标一致性。

4.1. Validation results
在验证部分，研究人员首先将两种模型的合成气组成预测结果与Fremaux et al.实验数据进行比较。Model 1为受限平衡模型，Model 2则在其基础上加入独立甲烷化反应模块。结果显示，两种模型的总RMSE均低于已发表的对比平衡模型，但Model 1仍表现出典型平衡模型缺陷，即H₂高估且CH₄几乎为零。相比之下，Model 2通过增加甲烷化步骤，获得了更现实的H₂与CH₄预测。在蒸汽气化条件下，Model 2相对Model 1的RMSE改善幅度虽不算巨大，但在基于Sousa Cardoso et al.空气气化实验的独立验证中，Model 2明显优于Model 1，表明该修正模型在不同气化介质下具有更好的泛化能力和稳健性。因此，研究人员选择Model 2作为后续全工况枚举与机器学习数据生成的基础模型。

4.2. Comparison of ML model predictions with Aspen Plus data
在机器学习模型与Aspen数据对比中，研究人员重点展示了热效率η_thermal的预测结果，因为该指标直接受全部决策变量影响，最能代表集成系统拟合效果。总体而言，8种算法的测试集R²范围为0.82至1.00，说明在大规模高质量仿真数据支持下，监督学习模型能够较好学习系统输入—输出映射关系。其中，CatBoost呈现近乎完美的拟合效果并取得最高R²；ETR在已较优的RF基础上进一步降低误差，表现出全体算法中最低的误差水平。交叉验证结果以及训练集/测试集R²对比显示模型未出现明显过拟合。为排除高密度采样导致“邻域插值式高分”的可能，研究还进行了低密度域内验证，即在预定义工况域内以稀疏代表性样本训练，并在剩余点上测试。结果表明，即便训练比例降至0.2，CatBoost、ETR、RF和XGBoost的测试R²仍高于0.99，说明树模型并非仅依赖局部插值，而是真正捕捉了过程响应面结构。综合统计精度后，RF、ETR和CatBoost被选作后续代理模型候选。

4.3. Comparison of Pareto fronts attained from ML and Aspen Plus models
论文进一步指出，单纯高精度拟合并不足以证明代理模型适合优化任务，必须检验其是否能够在相同输入条件下重现Aspen模型的Pareto最优解结构。为此，研究人员基于7个性能指标与综合性能指数之间的权衡关系，分别构建了7组Pareto前沿。结果显示，RF、ETR和CatBoost生成的Pareto点总体聚集于与Aspen Plus相同的区域，反映出较好的一致性。对于选取的代表性全局最优点，研究人员以相同输入向量比较各模型输出与Aspen结果的偏差。结果表明，ETR在所有输出变量上几乎实现零误差，RF误差基本低于1%，CatBoost误差基本低于4%。这说明ETR不仅具有高回归精度，而且在最优解识别方面与原模型几乎等价。对全部Pareto点误差统计的进一步比较也支持这一结论：在LHV_syngas、CGE、CCE、TDD、SGY与CO_2,fraction等指标上，RF与ETR几乎完全重现Aspen对应输出，而CatBoost虽仍表现良好，但存在更明显偏差；在η_thermal指标上，ETR的可靠性仍略优于RF。因此，从多目标优化角度看，ETR是最稳健的代理模型。

4.4. Effects of key variables on the performance indicators
在关键变量影响分析中，研究人员利用ETR生成等值线图，揭示操作条件与系统性能之间的规律。对于碳转化效率（CCE），ER升高在一定范围内可提供更多氧化剂，促进气化反应和碳燃尽，但ER过高会使过程偏向燃烧，降低合成气产率并改变产物组成；高效率区主要位于温度高于800 °C且ER>0.28的区域。对于冷煤气效率（CGE），最优区域集中于较低ER（0.24–0.26）和中等温度（800–900 °C），说明此时既能有效促进焦油裂解、挥发分释放与反应进行，又可避免过度氧化造成能量损失。对于CO₂摩尔分数，较低温度和较低压力对应更高CO₂生成，而提高温度或压力可显著降低CO₂含量，这与高温下Boudouard反应及逆水煤气变换反应更有利、从而消耗CO₂的热力学行为一致。文中还展示了温度、压力、蒸汽流量与压缩压力对总设备热负荷和热效率的影响，反映出发电侧变量同样会改变系统整体表现，说明集成系统优化不能仅局限于气化段。

讨论部分表明，该研究的核心贡献并不只在于提高了某一单一产物的预测精度，而在于提出了一种从流程修正、实验验证、数据生成、机器学习建模到多准则决策评估的完整方法链。研究结果证明，若底层Aspen流程模型经过针对性修正并具备足够验证基础，则由其生成的大规模仿真数据可以支撑高精度机器学习代理模型的构建，并进一步服务于快速优化和复杂权衡分析。与此同时，作者也审慎指出，该框架仍受限于底层过程模型的假设，例如气化过程采用平衡近似、焦油以苯单组分代替、焦炭视为纯碳以及甲烷修正依赖经验校准参数等。因此，该方法更适用于已验证工况范围内的筛选、灵敏度分析与优化研究，而尚不足以直接替代工业级高保真模型或实际装置表征。若要面向工业部署，仍需进一步引入中试或工厂尺度数据，以考虑动力学限制、流体力学效应、催化剂失活及更广泛原料波动等因素。

研究结论部分可译为：在8种机器学习算法中，随机森林（RF）、极端随机树回归（ETR）和CatBoost表现出最高的预测精度，而由RF和ETR代理模型获得的Pareto最优解与原始Aspen Plus模型的结果高度一致。结果证实，基于模拟生成的数据集能够与机器学习有效结合，构建用于生物质气化的高精度代理模型，从而在既定操作域内实现快速预测与高效多目标优化。Aspen Plus与机器学习所得Pareto前沿之间的高度一致性表明，所提出框架能够在无需重复进行全流程仿真的计算负担下，捕捉过程中的主要权衡关系。该研究仍受到底层过程模型假设的约束，包括基于平衡的气化处理方式，以及对焦油、焦炭和甲烷校正所采用的简化表示。因此，所提出的Aspen-ML框架应被视为在本文验证域内用于筛选、灵敏度分析和优化的稳健代理工具，而非可直接应用于工厂的数字孪生。未来研究应拓展至更多生物质原料，利用更广泛数据集加强验证，并在需要更高保真度预测时纳入更详细的反应描述。

联系信箱：

粤ICP备09063491号

热点排行