基于增强型自适应学习的预测方法与混合整数非线性优化技术在CO?到甲醇转化过程中用于催化剂发现

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Applied Energy》：Augmented adaptive learning-based prediction and mixed-integer nonlinear optimization for catalyst discovery in CO 2-to-methanol process

【字体：大中小】 时间：2026年03月03日 来源：Applied Energy 11

编辑推荐：

　　基于数据增强的自适应深度神经网络与混合整数非线性优化结合，本研究提出新型催化剂开发框架。通过傅里叶变换去除1272原始数据中的异常值，结合皮尔逊相关分析与领域知识筛选出368有效样本。构建的AA-DNN模型包含变分自编码器进行数据增强和自适应深度神经网络进行性能预测，在CO2转化率预测上较传统DNN提升6.58%-10.34%。通过建立含化学平衡约束的混合整数非线性优化模型，成功筛选出Cu/ZnO/In2O3催化剂组合，使CO2转化率提升4.73%，甲醇选择性提高2.9%，优化耗时仅7.03秒。该框架为多组分催化剂开发提供了高效解决方案。

作者：Dat-Nguyen Vo | 合著者：Xunyuan Yin

南洋理工大学化学、化学工程与生物技术学院，62 Nanyang Drive，637459，新加坡

摘要

二氧化碳到甲醇（CTM）工艺面临的主要挑战在于缺乏有效的方法来准确预测催化剂性能，并在有限的实验数据基础上识别出最佳的催化剂候选者，同时还需遵守化学反应的限制。为了解决这些挑战，本研究提出了一种新颖的高保真框架，该框架结合了基于增强型自适应学习的预测方法和混合整数非线性优化技术，以确定CTM工艺的有效催化剂组成、合成条件和操作条件。最初收集了1272个实验样本作为原始数据。通过快速傅里叶变换方法检测并移除了异常值，随后基于皮尔逊相关分析和领域知识进行了特征选择，最终得到了368个精炼样本。为了克服实验数据的稀疏性问题并纳入化学反应的限制，开发了一个增强型自适应深度神经网络（AA-DNN）模型，该模型包括两个部分：用于数据增强的变分自编码器和用于性能预测的自适应DNN。使用精炼后的数据集，将AA-DNN模型的预测性能与传统DNN和增强型DNN模型进行了比较，结果显示其预测准确性提高了6.58%至10.34%。随后，利用开发的AA-DNN模型构建了两个混合整数非线性优化问题，以证明其在催化剂发现中的有效性。在最佳催化剂组分、组成、合成条件和操作条件下，Cu/ZnO/In?O?（CuZnIn）催化剂表现出最佳性能，与实验数据集相比，二氧化碳转化率提高了4.73%，甲醇产率提高了2.9%。值得注意的是，优化过程仅需7.03秒，相比传统的实验方法大幅减少了筛选时间。这些发现为CTM工艺的数据驱动催化剂开发提供了宝贵的见解。此外，由于二氧化碳转化途径的共性，所提出的框架为加速各种二氧化碳转化工艺中的催化剂发现提供了一个有前景且可扩展的工具。

引言

由于对经济可行且环境可持续的解决方案的需求不断增加，将二氧化碳（CO?）转化为有价值的化学品受到了广泛关注[1]、[2]。在各种二氧化碳利用途径中，通过氢化将二氧化碳转化为甲醇（CTM）被认为是一个有前景的选择，因为甲醇市场需求高，且作为化学原料具有价值，同时还能减少对传统甲醇生产中化石燃料的依赖[3]、[4]。

在CTM工艺中，催化剂的发展至关重要，因为它显著影响关键性能指标，如二氧化碳转化率和甲醇选择性。以往的研究主要集中在使用不同的金属和载体/促进剂[5]、[6]（以不同的摩尔比或质量比）来识别能够提高二氧化碳转化率和甲醇选择性的新催化剂。这些催化剂需要在不同的条件下合成（例如，煅烧温度、煅烧时间），以实现理想的性能，包括结晶度指数、晶体尺寸和表面积[7]。合成后，会对催化剂进行性能评估，以评估二氧化碳转化率和甲醇选择性[8]。这种实验工作流程需要大量努力且耗时较长。因此，开发一个高效的基于模型的预测和优化框架对于CTM工艺中的催化剂发现至关重要。

鉴于已有实验数据的可用性，开发一个数据驱动的机器学习模型是预测CTM工艺关键性能指标的有希望的方法[9]。以往的研究开发了各种机器学习模型来预测转化性能。例如，Suvarna等人开发了一个集成树模型，用于预测在不同催化剂性质、合成条件和操作条件下的甲醇产率[10]。Nia等人应用了四种机器学习模型来预测二氧化碳转化率和甲醇选择性[7]。同样，其他研究也采用了神经网络、支持向量回归、随机森林回归、高斯过程回归和混合神经网络架构来预测CTM工艺中的甲醇选择性和二氧化碳转化率[11]、[12]、[13]、[14]、[15]、[16]。尽管取得了这些进展，但这些研究的共同局限性在于它们完全依赖于有限的实验数据，这限制了预测准确性并阻碍了模型的泛化能力。因此，迫切需要开发一种新型的数据驱动预测模型，即使在数据有限的条件下也能准确预测CTM工艺中的催化剂性能。

CTM工艺的性能本质上受到化学反应限制的影响。具体来说，预测的二氧化碳转化率受到给定反应温度和压力下平衡二氧化碳转化率的限制[17]。此外，甲醇是CTM工艺的主要产物，而一氧化碳（CO）是副产物[18]。因此，实现100%的甲醇选择性实际上是不可能的，这引入了另一个限制。二氧化碳转化率和甲醇选择性都必须保持在最低阈值以上；否则，工艺将变得效率低下且在经济上不可行。然而，现有的研究在开发数据驱动的机器学习模型时大多忽略了这些化学反应限制，可能导致不现实的结果。为了解决这一限制，将化学反应限制纳入数据驱动的机器学习建模中是必要的。这不仅提高了预测的可靠性，还促进了尊重潜在工艺物理特性的自适应机器学习模型的发展。

CTM工艺中催化剂发现的最终目标是确定最佳的催化剂组分、组成、合成条件和操作条件组合[19]、[20]。然而，关于CTM工艺中催化剂优化的研究较少，这是一个典型的混合整数线性或非线性优化问题。以往的研究主要将机器学习模型与无导数优化技术相结合，以确定CTM工艺的最佳合成和操作条件[7]、[14]、[19]、[21]；然而，这种方法仅适用于连续变量。这种方法也被应用于操作优化，以提高CTM工艺的技术经济性能[22]、[23]。此外，这些出版物忽略了化学反应限制对其开发的机器学习模型的影响，可能会影响最优结果的准确性。这一研究空白可能源于缺乏一个能够同时处理离散变量（例如催化剂组分）和连续变量（例如催化剂组成、合成条件和操作条件）的高效基于模型的预测和优化框架。

最近，我们证明了将独热向量嵌入深度神经网络（DNN）中，可以使DNN模型有效地与混合整数非线性编程（MINLP）结合[24]。这种方法已被用于二氧化碳捕获[24]和电力到甲醇工艺[25]、[26]的设计和操作优化。在当前的工作中，我们提出将独热向量嵌入到增强型自适应机器学习模型中，以将该模型与MINLP结合[27]用于催化剂发现。这种集成有望克服当前的局限性，并系统地确定CTM工艺的最佳催化剂组分、组成、合成条件和操作条件。具体来说，这使得可以明确优化催化剂组成，允许模型选择（或排除）特定的金属氧化物。它还可以同时优化连续变量。此外，所提出的优化框架是一种高效的解决方案，仅需几秒钟即可确定最佳催化剂设计。

总之，CTM工艺中的催化剂发现面临两个主要挑战。首先，需要一种新型的机器学习模型，能够在有限的实验数据基础上准确预测关键催化剂性能指标，同时遵守基本的化学反应限制。其次，一个可行的基于学习的优化框架对于系统地确定最佳催化剂设计和工艺参数以最大化二氧化碳转化率和甲醇选择性至关重要。

本研究开发了一种基于增强型自适应学习的预测和优化方法，用于发现CTM工艺中的最佳催化剂。最初收集了1272个数据样本作为原始数据，然后使用快速傅里叶变换方法检测异常值，并基于皮尔逊相关分析和领域知识进行特征选择。接着开发了一个增强型自适应深度神经网络（AA-DNN）模型，该模型包括用于数据增强的变分自编码器和用于性能预测的自适应深度神经网络。即使实验数据有限，该模型也能准确预测CTM工艺中的关键性能指标，同时遵守化学反应限制。将AA-DNN模型的预测性能与传统DNN和增强型DNN模型进行了比较，突显了其更高的准确性。进一步利用AA-DNN模型构建了两个混合整数非线性优化问题，以确定含有一种和两种载体/促进剂的铜基催化剂的最优组分、组成、合成条件和操作条件。分析结果证明了所提出方法的重要性和有效性。本研究的主要贡献如下：

我们提出了一种新颖且高效的基于增强型自适应深度神经网络的预测和优化框架，用于CTM工艺中的催化剂发现。

据我们所知，这是首次将变分自编码器用于数据增强与自适应深度神经网络相结合，以解决催化剂性能预测中的关键挑战，包括有限的实验数据和遵守化学反应限制。

本研究为研究人员提供了一种实用的方法，用于在各种设计场景中确定最佳的催化剂组分、组成、合成条件和操作条件。

研究结果为提高CTM工艺中的催化剂性能提供了宝贵的见解。此外，所提出的基于增强型自适应学习的预测和混合整数非线性优化框架有潜力扩展到其他二氧化碳转化工艺中的催化剂发现。

数据准备

本研究使用来自先前发表研究的实验数据来开发CTM工艺中催化剂性能的预测模型。原始数据（1272个样本）收集自[28]、[29]、[30]、[31]、[32]、[33]、[34]、[35]、[36]、[37]、[38]、[39]、[40]、[41]、[42]、[43]、[44]、[45]、[46]、[47]、[48]、[49]、[50]、[51]、[52]、[53]、[54]、[55]、[56]、[57]、[58]、[59]、[60]、[61]、[62]、[63]、[64]、[65]、[66]、[67]、[68]、[69]、[70]、[71]、[72]、[73]、[74]、[75]、[76]、[77]、[78]、[79]等文献。

数据分析和特征选择

本研究汇总了来自先前出版物的1272个原始实验样本。使用快速傅里叶变换方法[117]检测并移除了异常值，得到了1145个无异常值的样本。这些样本用于估计输入变量（催化剂组成、合成条件和操作条件）与目标输出（二氧化碳转化率和甲醇选择性）之间的皮尔逊相关系数[118]，如图2所示。

结论

本研究开发了一种新颖且高效的基于增强型自适应深度神经网络（AA-DNN）模型的预测和混合整数非线性优化框架，用于发现二氧化碳到甲醇（CTM）工艺中的有效催化剂。

收集了来自先前实验研究的数据作为原始数据。使用快速傅里叶变换方法移除了异常值，得到了1145个无异常值的样本。随后根据皮尔逊相关分析和领域知识，数据集被精炼为368个样本。

作者贡献声明

Dat-Nguyen Vo：撰写——原始草稿、可视化、验证、方法论、调查、正式分析、概念化。Xunyuan Yin：撰写——审稿与编辑、监督、资源管理、项目协调、资金获取、概念化。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。

致谢

本研究得到了新加坡教育部的支持，资助项目属于学术研究基金第一层级（RG63/22和RG95/24）。此外，本研究还得到了Schmidt Sciences, LCC的支持。

联系信箱：

粤ICP备09063491号

摘要

引言

数据准备

数据准备

数据分析和特征选择

结论

作者贡献声明

利益冲突声明

致谢

热点排行