基于目标的双聚类主动表示学习方法辅助数值研究等离子体催化的CO?加氢制甲醇过程

《Separation and Purification Technology》:Target-guided dual clustering active representation learning assisting numerical investigation of plasma-catalytic CO 2 hydrogenation to methanol

【字体: 时间:2026年03月03日 来源:Separation and Purification Technology 9

编辑推荐:

  CO?制甲醇的等离子体催化过程通过目标导向的主动表征学习策略优化,以小样本覆盖大部分参数空间并构建高保真代理模型。

  
Jie Pan|Qi Peng|Yiming Yao|Shaohua Qin
山东师范大学物理与电子学院,中国济南250014

摘要

等离子体催化CO2氢化制甲醇是一项有前景的CO2利用技术,优化甲醇产率对其工业化至关重要。然而,产率受到多种参数的影响,而遍历整个参数空间以找到最佳产率在时间和资源上代价高昂。机器学习提供了一个潜在的解决方案,但其性能也依赖于大量的训练数据。为了解决这一挑战,本研究引入了一种目标导向的主动表示学习策略,通过迭代的产率相关潜在学习和聚类获得了一个小的核心数据集,该数据集能够有效表示整个参数空间。仿真结果显示,采样率低于10%的核心数据集就可以覆盖89.1%的参数空间,大大降低了甲醇产率优化的成本。依靠这个核心数据集的高质量训练数据,还可以获得高保真度的替代模型(R2=0.93±0.02),从而能够快速识别出最佳工艺条件和关键机制。这种方法可以从甲醇生产参数空间中有效选择代表性组合,减少数据冗余而不遗漏关键条件,并为机器学习提供高质量的数据训练,从而提高替代模型的逼近性能,促进高效的CO2利用。

引言

二氧化碳(CO2)是主要的温室气体,其过量排放主要是由于工业革命以来人类活动大量消耗化石燃料所致。它还作为一种廉价且丰富的C1来源,用于生产碳氢燃料和增值化学品[1]、[2]、[3]。开发将CO2转化为碳基能源产品的技术对于缓解温室效应、实现碳中和以及应对非可再生资源的稀缺性至关重要[4]、[5]。作为一种热力学稳定且非极性的分子,CO2的转化通常需要高活性催化剂的协同作用以及大量的能量输入,在高温高压下断裂强键(783 kJ/mol)[6]、[7]。已经采用了多种催化途径,包括热催化、光催化、电催化、生物催化以及耦合催化方法,来研究CO2的分解及其与其他原料气体(如氢气、甲烷、氮气、水蒸气和硫化氢)的共转化[8]、[9]、[10]。然而,在温和条件下实现CO2及其共反应物的高效和选择性转化仍然是二氧化碳捕获、利用和储存(CCUS)领域的一个关键挑战[11]、[12]、[13]。在众多的CO2转化途径中,CO2氢化制甲醇(CH3OH)特别具有吸引力,因为其产品的战略重要性。甲醇不仅作为生产烯烃和芳烃等大宗化学品的核心平台化合物,还作为一种清洁的高能量密度液体燃料和理想的氢储存介质,在化学和能源领域具有广泛的应用前景[14]、[15]、[16]。然而,传统的热催化甲醇合成往往受到苛刻反应条件(即高温高压)和热力学限制的制约,这激发了人们对更节能和有效技术的探索[17]、[18]。
非热等离子体(NTP)催化作为一种非常有前景的替代方法出现,能够在相对温和的条件下驱动化学反应[19]、[20]。图1展示了在典型的填充床介电屏障放电(DBD)反应器中CO2氢化制甲醇的工艺示意图。这项技术的核心优势在于能够生成高能量的电子,这些电子可以在接近室温的情况下激活像CO2这样的惰性分子,从而克服传统的热力学障碍[21]。等离子体与异质催化剂之间的协同作用可以进一步提高能量效率和目标产物的选择性,可能开启传统催化方法无法实现的新反应途径[22]、[23]。受到这些前景的启发,等离子体催化CO2氢化制甲醇方面取得了显著进展。瑞士ABB公司的Kogelschatz研究小组首次使用DBD等离子体反应器和
催化剂,在0.8 MPa和100°C的温和条件下,将体积比为1/3的
混合气体转化为甲醇[24]。21世纪以来,研究人员采用了多种放电方法,如DBD、纳秒脉冲放电、射频放电、微波放电和滑动弧放电来生成非平衡等离子体,并与铜基、铁基、镍基、钴基和铂基负载催化剂或其他异质催化剂协同作用,以提高CO2转化率、能量效率和甲醇产率及选择性,同时探索等离子体催化CO2氢化制甲醇的机制和特性[25]、[26]、[27]、[28]、[29]、[30]。这些令人兴奋的进展凸显了等离子体催化在高效CO2利用方面的巨大潜力。
甲醇产率的优化对于等离子体催化CO2氢化的工业可行性至关重要。然而,产率受到许多操作参数(如电场强度、放电频率、气体温度、进料组成、催化剂性质等)的共同影响,而等离子体催化过程涉及数百种活性物种和数千个基本反应之间的复杂相互作用,使得通过实验试错来探索和优化庞大的参数空间变得成本高昂且耗时。目前,数值模拟已成为提供等离子体和表面动力学微观洞察以及指导工艺参数优化不可或缺的工具。世界各地的研究团队已经开发并应用了全局和流体模型,对等离子体催化CO2氢化制甲醇的机制进行了数值建模,成功阐明了演变特性、参数效应和等离子体催化动力学机制[31]、[32]、[33]、[34]、[35]。然而,由于需要设置精细的网格和小的时间步长,数值模拟通常需要较长的单次运行时间和较高的计算成本,并且可能存在收敛问题。因此,无论是通过实验还是模拟,要在由多个工艺参数组成的庞大参数空间中构建完整的“参数-产率”关系图,都需要巨大的总计算成本。这严重限制了快速参数搜索和全局优化的效率,而这些步骤对于实现高效的CO2工业应用至关重要。
自2022年以来,越来越多地利用机器学习(ML)来推动等离子体催化CO2转化的机制研究和最优设计的研究被报道,成为该领域的一个新兴研究热点。例如,Luo等人[36]使用贝叶斯优化+反向传播人工神经网络和遗传算法+支持向量回归开发了一个用于等离子体催化CO2转化的机器学习模型。Cai等人[37]建立了一个由回归树、支持向量回归和人工神经网络组成的混合机器学习模型,并结合遗传算法优化,研究了工作参数对等离子体催化CO2转化的影响。尽管机器学习提供了一个潜在的解决方案,但传统的ML模型开发从根本上依赖于足够大的标记数据集,而当每次评估成本较高时,获取这样的数据集非常困难。
同时,主动学习(AL)作为一种数据高效的范式,在更广泛的科学界引起了越来越多的关注,用于加速科学发现。在催化相关研究中,代表性的AL工作流程通常依赖于显式的化学特征。例如,Souza等人[38]整合了基于混合密度泛函理论(DFT)的随机森林(RF)替代模型和指纹描述符以及不确定性采样,使用不到400次实验就高效地覆盖了超过22,000种化合物的虚拟空间。此外,AL还与图表示学习相结合。Gong等人[39]通过整合学习到的反应图表示和以多样性为导向的查询策略开发了“DeepReac+”,实现了数据高效的有机反应产率建模,而Samoaa等人[40]提出了一个利用图嵌入进行软件性能预测的统一AL框架。最近,Hua等人[41]引入了“RS-Coreset”方法,该方法结合了多源分子指纹和产率反馈指导,实现了2.5%–5%的标记比例的高精度预测。
尽管如此,主动学习在等离子体催化领域仍处于起步阶段,尚未得到充分探索。基于上述主动学习的进展,本文创新地将基于AL的优化范式引入等离子体催化领域,以减轻数据获取的负担。然而,将这些范式应用于等离子体催化面临方法论上的挑战。与离散的分子图或指纹描述符不同,等离子体催化的数值研究通常涉及连续的、多维的和非线性的物理化学参数空间。因此,本研究构建了一个针对这些参数特性定制的目标导向的双重聚类主动表示学习框架。该框架的核心是目标导向的表示学习与样本选择之间的闭环耦合:利用产率反馈迭代更新等离子体操作参数的潜在表示,将具有相似产率的样本聚类到紧凑的区域。因此,在这个更新的“产率感知”潜在空间中进行的最大覆盖采样(MCS)可以高效地识别出全局代表性的样本,同时最小化性能相似区域中的冗余评估。这种方法论的调整有效地将复杂的过程参数与最少的数据分离,将研究范式从“被动模拟扫描”转变为“主动、目标驱动的探索”,并为基于机制的分析奠定了成本效益的基础。

方法

所提出的主动表示学习框架如图2所示,旨在解决与等离子体催化CO2氢化的全局优化和机制探索相关的高昂计算成本问题,为CO2利用提供了一种成本效益高的解决方案。其核心目标是从最少的低成本模拟中构建一个高保真度的替代模型,从而实现整个参数-产率景观的高效映射。

目标导向的表示学习

本研究的一个核心假设是,参数空间的有效、产率相关的表示是数据高效替代建模的先决条件。本研究采用目标导向的表示学习策略将原始输入特征转换为与产率相关的潜在表示。这种转换的有效性在图4中得到了可视化,该图使用可视化工具t-SNE比较了学习过程前后的参数空间。

结论

在本研究中,成功开发并验证了一个目标导向的双重聚类主动表示学习框架,用于加速等离子体催化CO2氢化制甲醇的数值研究。该框架为机器学习提供了一个小而高度代表性的核心数据集,使得构建高保真度替代模型成为可能。在等离子体动力学模型上验证后,该框架展示了显著的数据效率。

CRediT作者贡献声明

Jie Pan:撰写 – 审稿与编辑、方法论、资金获取。Qi Peng:撰写 – 原始草稿、软件、方法论、研究。Yiming Yao:研究、数据整理。Shaohua Qin:验证、监督、软件、方法论。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。

致谢

本工作得到了国家自然科学基金(编号52577172)和山东省自然科学基金(编号ZR2025MS780)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号