由于对经济可行且环境可持续的解决方案的需求不断增加,将二氧化碳(CO?)转化为有价值的化学品受到了广泛关注[1]、[2]。在各种二氧化碳利用途径中,通过氢化将二氧化碳转化为甲醇(CTM)被认为是一个有前景的选择,因为甲醇市场需求高,且作为化学原料具有价值,同时还能减少对传统甲醇生产中化石燃料的依赖[3]、[4]。
在CTM工艺中,催化剂的发展至关重要,因为它显著影响关键性能指标,如二氧化碳转化率和甲醇选择性。以往的研究主要集中在使用不同的金属和载体/促进剂[5]、[6](以不同的摩尔比或质量比)来识别能够提高二氧化碳转化率和甲醇选择性的新催化剂。这些催化剂需要在不同的条件下合成(例如,煅烧温度、煅烧时间),以实现理想的性能,包括结晶度指数、晶体尺寸和表面积[7]。合成后,会对催化剂进行性能评估,以评估二氧化碳转化率和甲醇选择性[8]。这种实验工作流程需要大量努力且耗时较长。因此,开发一个高效的基于模型的预测和优化框架对于CTM工艺中的催化剂发现至关重要。
鉴于已有实验数据的可用性,开发一个数据驱动的机器学习模型是预测CTM工艺关键性能指标的有希望的方法[9]。以往的研究开发了各种机器学习模型来预测转化性能。例如,Suvarna等人开发了一个集成树模型,用于预测在不同催化剂性质、合成条件和操作条件下的甲醇产率[10]。Nia等人应用了四种机器学习模型来预测二氧化碳转化率和甲醇选择性[7]。同样,其他研究也采用了神经网络、支持向量回归、随机森林回归、高斯过程回归和混合神经网络架构来预测CTM工艺中的甲醇选择性和二氧化碳转化率[11]、[12]、[13]、[14]、[15]、[16]。尽管取得了这些进展,但这些研究的共同局限性在于它们完全依赖于有限的实验数据,这限制了预测准确性并阻碍了模型的泛化能力。因此,迫切需要开发一种新型的数据驱动预测模型,即使在数据有限的条件下也能准确预测CTM工艺中的催化剂性能。
CTM工艺的性能本质上受到化学反应限制的影响。具体来说,预测的二氧化碳转化率受到给定反应温度和压力下平衡二氧化碳转化率的限制[17]。此外,甲醇是CTM工艺的主要产物,而一氧化碳(CO)是副产物[18]。因此,实现100%的甲醇选择性实际上是不可能的,这引入了另一个限制。二氧化碳转化率和甲醇选择性都必须保持在最低阈值以上;否则,工艺将变得效率低下且在经济上不可行。然而,现有的研究在开发数据驱动的机器学习模型时大多忽略了这些化学反应限制,可能导致不现实的结果。为了解决这一限制,将化学反应限制纳入数据驱动的机器学习建模中是必要的。这不仅提高了预测的可靠性,还促进了尊重潜在工艺物理特性的自适应机器学习模型的发展。
CTM工艺中催化剂发现的最终目标是确定最佳的催化剂组分、组成、合成条件和操作条件组合[19]、[20]。然而,关于CTM工艺中催化剂优化的研究较少,这是一个典型的混合整数线性或非线性优化问题。以往的研究主要将机器学习模型与无导数优化技术相结合,以确定CTM工艺的最佳合成和操作条件[7]、[14]、[19]、[21];然而,这种方法仅适用于连续变量。这种方法也被应用于操作优化,以提高CTM工艺的技术经济性能[22]、[23]。此外,这些出版物忽略了化学反应限制对其开发的机器学习模型的影响,可能会影响最优结果的准确性。这一研究空白可能源于缺乏一个能够同时处理离散变量(例如催化剂组分)和连续变量(例如催化剂组成、合成条件和操作条件)的高效基于模型的预测和优化框架。
最近,我们证明了将独热向量嵌入深度神经网络(DNN)中,可以使DNN模型有效地与混合整数非线性编程(MINLP)结合[24]。这种方法已被用于二氧化碳捕获[24]和电力到甲醇工艺[25]、[26]的设计和操作优化。在当前的工作中,我们提出将独热向量嵌入到增强型自适应机器学习模型中,以将该模型与MINLP结合[27]用于催化剂发现。这种集成有望克服当前的局限性,并系统地确定CTM工艺的最佳催化剂组分、组成、合成条件和操作条件。具体来说,这使得可以明确优化催化剂组成,允许模型选择(或排除)特定的金属氧化物。它还可以同时优化连续变量。此外,所提出的优化框架是一种高效的解决方案,仅需几秒钟即可确定最佳催化剂设计。
总之,CTM工艺中的催化剂发现面临两个主要挑战。首先,需要一种新型的机器学习模型,能够在有限的实验数据基础上准确预测关键催化剂性能指标,同时遵守基本的化学反应限制。其次,一个可行的基于学习的优化框架对于系统地确定最佳催化剂设计和工艺参数以最大化二氧化碳转化率和甲醇选择性至关重要。
本研究开发了一种基于增强型自适应学习的预测和优化方法,用于发现CTM工艺中的最佳催化剂。最初收集了1272个数据样本作为原始数据,然后使用快速傅里叶变换方法检测异常值,并基于皮尔逊相关分析和领域知识进行特征选择。接着开发了一个增强型自适应深度神经网络(AA-DNN)模型,该模型包括用于数据增强的变分自编码器和用于性能预测的自适应深度神经网络。即使实验数据有限,该模型也能准确预测CTM工艺中的关键性能指标,同时遵守化学反应限制。将AA-DNN模型的预测性能与传统DNN和增强型DNN模型进行了比较,突显了其更高的准确性。进一步利用AA-DNN模型构建了两个混合整数非线性优化问题,以确定含有一种和两种载体/促进剂的铜基催化剂的最优组分、组成、合成条件和操作条件。分析结果证明了所提出方法的重要性和有效性。本研究的主要贡献如下:
我们提出了一种新颖且高效的基于增强型自适应深度神经网络的预测和优化框架,用于CTM工艺中的催化剂发现。
据我们所知,这是首次将变分自编码器用于数据增强与自适应深度神经网络相结合,以解决催化剂性能预测中的关键挑战,包括有限的实验数据和遵守化学反应限制。
本研究为研究人员提供了一种实用的方法,用于在各种设计场景中确定最佳的催化剂组分、组成、合成条件和操作条件。
研究结果为提高CTM工艺中的催化剂性能提供了宝贵的见解。此外,所提出的基于增强型自适应学习的预测和混合整数非线性优化框架有潜力扩展到其他二氧化碳转化工艺中的催化剂发现。
数据准备
数据准备
本研究使用来自先前发表研究的实验数据来开发CTM工艺中催化剂性能的预测模型。原始数据(1272个样本)收集自[28]、[29]、[30]、[31]、[32]、[33]、[34]、[35]、[36]、[37]、[38]、[39]、[40]、[41]、[42]、[43]、[44]、[45]、[46]、[47]、[48]、[49]、[50]、[51]、[52]、[53]、[54]、[55]、[56]、[57]、[58]、[59]、[60]、[61]、[62]、[63]、[64]、[65]、[66]、[67]、[68]、[69]、[70]、[71]、[72]、[73]、[74]、[75]、[76]、[77]、[78]、[79]等文献。
数据分析和特征选择
本研究汇总了来自先前出版物的1272个原始实验样本。使用快速傅里叶变换方法[117]检测并移除了异常值,得到了1145个无异常值的样本。这些样本用于估计输入变量(催化剂组成、合成条件和操作条件)与目标输出(二氧化碳转化率和甲醇选择性)之间的皮尔逊相关系数[118],如图2所示。
结论
本研究开发了一种新颖且高效的基于增强型自适应深度神经网络(AA-DNN)模型的预测和混合整数非线性优化框架,用于发现二氧化碳到甲醇(CTM)工艺中的有效催化剂。
收集了来自先前实验研究的数据作为原始数据。使用快速傅里叶变换方法移除了异常值,得到了1145个无异常值的样本。随后根据皮尔逊相关分析和领域知识,数据集被精炼为368个样本。
作者贡献声明
Dat-Nguyen Vo:撰写——原始草稿、可视化、验证、方法论、调查、正式分析、概念化。Xunyuan Yin:撰写——审稿与编辑、监督、资源管理、项目协调、资金获取、概念化。
利益冲突声明
作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。
致谢
本研究得到了新加坡教育部的支持,资助项目属于学术研究基金第一层级(RG63/22和RG95/24)。此外,本研究还得到了Schmidt Sciences, LCC的支持。