关于二氧化硫在深共晶溶剂中吸收的新见解

《Microchemical Journal》:New insights into sulfur dioxide absorption in deep eutectic solvents

【字体: 时间:2026年02月11日 来源:Microchemical Journal 5.1

编辑推荐:

  准确预测二氧化硫在深熔盐中的吸收能力,本研究构建了包含1382个实验数据和924个计算数据点的综合数据库,评估了15种机器学习算法。结果表明支持向量回归(SVR)和卷积神经网络(CNN)表现最优,R2分别达0.9904和0.9872,关键影响因素为压力和s8结构描述符。研究证实机器学习可有效建模复杂DES系统的气体吸收行为,为高效溶剂设计提供新方法。

  
胡超凡|Farag M.A. Altalbawy|Krunal Vaghela|V. Vivek|Sarbeswara Hota|Devendra Singh|Mahesh Manchanda|Prakhar Tomar|Raed Alfilh|Aseel Smerat|Mehrdad Mottaghi
桂林电子科技大学机械与电气工程学院,中国桂林 541004

摘要

本研究旨在通过开发强大的机器学习(ML)模型,准确预测深共晶溶剂(DESs)对二氧化硫(SO?)的吸收能力。构建了一个包含1382个实验数据和924个计算数据点的综合数据集,涵盖了来自22种氢键受体(HBAs)和42种氢键供体(HBDs)的156种独特DESs。输入变量包括sigma轮廓描述符(s1–s10)、水分含量、压力和温度。评估了15种ML算法,包括支持向量回归(SVR)、卷积神经网络(CNN)、随机森林(Random Forest)、XGBoost和LightGBM等。使用蒙特卡洛异常检测算法确认了数据集的可靠性。在所有模型中,SVR和CNN在测试数据集上表现最佳,R2值分别为0.9872和0.9904,均方误差(MSE)分别为0.0015和0.0011,平均相对偏差(MRD)分别为9.11%和8.95%。分析表明,压力和结构描述符(特别是s8)是影响SO?吸收的关键变量。这些结果突显了ML技术在模拟复杂DES系统中气体吸收行为方面的有效性,并支持其在高效溶剂系统设计中的应用。

引言

二氧化硫(SO?)是一种重要的大气污染物,主要由化石燃料燃烧和工业活动产生[1]。过量的SO?排放会导致严重的生态后果,包括全球变暖和酸雨[2],并对人类健康和生态系统产生不利影响[3]。因此,减轻SO?浓度已成为研究和开发工作的重点。烟气是SO?的主要来源,其浓度通常低于二氧化碳(CO?)等其他气体[4]、[5]。目前,有机胺溶液吸收和石灰-石灰石吸附是主要的烟气脱硫(FGD)技术[6]。然而,这些方法存在一些局限性,如需要大量用水、产生有害副产品以及循环效率不足[7]。因此,迫切需要一种可持续、高效且经济可行的方法来处理烟气中的SO?。
离子液体(ILs)因其良好的特性(如化学稳定性、低蒸气压和可定制的结构)而受到广泛关注[8]、[9]。2004年,Han[10]引入了1,1,3,3-四甲基胍酸乳酸盐用于SO?捕获。这种IL通过1,1,3,3-四甲基胍和乳酸的直接中和合成,表现出0.305 gSO?/gIL的SO?吸收能力。在这一突破之后,开发了功能化的ILs,包括胺功能化的ILs和基于氮杂环化合物的ILs,在SO?吸收方面取得了更好的性能[11]、[12]、[13]。尽管具有这些优势,但ILs的应用仍受到粘度较高、运营成本较高以及合成过程复杂的限制[14]、[15]。
深共晶溶剂(DESs)作为一种新型环保溶剂,被引入作为ILs的潜在替代品[16]、[17]。DESs是通过将氢键供体(HBDs)和氢键受体(HBAs)以精确的摩尔比例混合,并提高混合物的温度来制备的,从而形成比其单独组分具有更低熔点的共晶系统[18]。它们的化学性质因HBDs、HBAs和摩尔比例的不同而有所差异,提供了广泛的设计灵活性。DESs具有多种吸引人的特性,如可调性、低蒸气压、易于制备、低毒性和优异的热稳定性[19]。特别是,它们的低蒸气压和可调性使其在气体吸收应用中非常受欢迎[20]、[21]。
大量的实验研究已经证明了DESs在SO?吸收方面的有效性,取得了令人满意的结果[7]、[22]、[23]、[24]、[25]、[26]。例如,Yang研究了由甘油和氯化胆碱组成的DESs在1 atm和293.15 K条件下的SO?吸收能力,达到了0.678 gSO?/gDES[22]。这是DESs首次用于SO?捕获的应用。随后,基于无机盐的DESs(如ChCl-EG(氯化胆碱-乙二醇)和乙酰胺-KSCN[23]、[24])也被用于SO?吸收,显示出优异的性能。然而,某些DESs的高粘度仍然是一个挑战,促使人们进一步研究基于己内酰胺和氮杂环化合物的DESs[7]。
Soleimani和Saeedi Dehaghani[27]应用了集成学习方法,特别是随机梯度提升(SGB)算法,并结合COSMO-RS描述符,预测了多种DESs中的CO?溶解度,平均绝对相对偏差分别仅为0.85%和2.30%。他们的模型比传统的状态方程和其他ML技术具有更高的准确性。在另一项研究中,Soleimani和Saeedi Dehaghani[28]使用SGB估计了离子液体和非离子组分二元混合物的表面张力,性能优于ANFIS、SVM和ANN混合模型,并进行了特征重要性分析。Abooali和Soleimani[29]也使用SGB模拟了盐溶液中阴离子表面活性剂的临界胶束浓度,同时考虑了分子结构和操作条件,结果表明SGB模型在预测准确性上优于遗传编程。此外,Saeedi Dehaghani等人[30]使用SGBTree预测了压缩空气储能系统设计所需的多项热物理性质,再次证明了SGB在处理具有复杂物理依赖性的多变量系统时的稳健性。类似地,基于SGB的模型还被用于准确估计CO?-油系统中的最小混溶压力(MMP)[31],以及在高精度下预测生物柴油组分的性质(如压缩性和密度)[32]。值得注意的是,Soleimani等人[33]证明了SGB算法在估计各种离子液体中H?S溶解度方面的优越性,其性能优于热力学模型和机器学习(ML)方法(如GEP和LSSVM)。这些研究共同强调了SGB和集成学习框架在模拟复杂溶剂和混合物的物理化学性质方面的日益广泛应用和可靠性,并强烈推动了当前工作探索多种ML模型(包括梯度提升变体)以模拟DESs中的SO?吸收。
尽管有许多关于DESs吸收SO?的实验研究,但这些研究往往局限于特定的HBA和HBD类型以及预定的浓度。考虑到进行全面实验分析的复杂性,建立HBA-HBD组合对的分子排列与其功能特性之间的内在联系至关重要。因此,开发用于预测SO?吸收选择性和能力的模型是必要的。
类似导体的溶剂筛选模型(COSMO-RS)常用于溶剂筛选[34]。COSMO-RS广泛用于气体吸收预测,利用分子间的电荷分布来实现快速准确的计算预测[35]。ML方法,特别是人工神经网络(ANNs),在预测物理化学性质和相稳定性方面取得了进展。其中,多层感知器(MLPs)已被用于预测DESs的特性[36]、[37]、[38]。本研究采用了多种先进的ML算法来扩展对各种DESs中SO?吸收的预测模型。所包含的模型包括决策树、随机森林、k最近邻、支持向量机、梯度提升机、XGBoost、LightGBM、分类提升(CatBoost)、线性回归、岭回归和弹性网。为了确认数据适合训练,采用了基于蒙特卡洛的异常检测技术。该方法的具体描述见图1。与以往主要关注单一算法(例如多层感知器或传统回归模型)或严重依赖COSMO-RS等量子化学描述符的研究不同,本研究系统地评估了15种不同的ML算法,使用了包含2306个数据点(1382个实验数据和924个计算值)的大型异构数据集来预测DESs中的SO?吸收。这种广泛的比较方法不仅识别出最准确的预测模型,还整合了特征敏感性分析,以突出影响吸收的关键分子和操作参数。此外,该方法展示了如何直接将这些见解应用于高效DESs的合理设计,而无需完全依赖计算成本高昂的量子化学计算。据我们所知,这是首次结合如此广泛的算法比较、大规模数据整合和可解释性分析来研究SO?-DES系统的研究。

部分摘录

人工神经网络(ANN)

ANNs被认为是模仿生物大脑架构的计算工具。它们由相互连接的节点(神经元)层组成,通过加权连接和非线性激活函数处理输入数据。在训练过程中,这些网络通过反向传播算法迭代更新连接权重,以减少预测误差。它们强大的复杂模式建模能力使其被广泛用于

数据收集

我们收集了Jin等人[58]的研究数据。本节提供了包含1382个实验数据和924个计算数据的DESs数据集,这些数据与SO?吸收相关。这1382个实验数据直接来源于文献[4]、[6]、[22]、[24]、[25]、[59]、[60]、[61]、[62]、[63]、[64]、[65]、[66]、[67]、[68]、[69]、[70]、[71]、[72]、[73]、[74]、[75]、[76]、[77]、[78]、[79]中报道的相关实验研究。

敏感性分析

为了评估输入变量对SO?吸收的相对影响,通过皮尔逊相关系数进行了敏感性分析,作为线性关系的度量。图3展示了本研究中所有变量对之间的皮尔逊相关矩阵,突出了它们线性关联的大小和方向。接近+1的系数表示强正相关,接近-1的系数表示强负相关,接近0的系数表示无相关

结果与讨论

为了确保所选模型不会因过度复杂或过拟合而受到影响,在模型开发过程中实施了多项保护措施。首先,所有模型在超参数调整期间都经过了五折交叉验证,使我们能够评估不同数据子集的性能稳定性,并防止选择过于复杂的配置。其次,使用单独的验证集可以监控训练过程中的泛化行为

结论

本研究通过多种ML算法创建了基于信息的多样化模型,如RF、线性回归、KNN、CNNs、岭回归、ANNs、弹性网、Lasso回归、SVM、XGBoost、DT、LightGBM、GBM、高斯过程和CatBoost。这些模型用于估计SO?吸收,考虑了关键因素,如S1至S10、水重量(WH?O)、压力(P)和温度(T)。使用了多种性能指标和图形分析来评估模型。

CRediT作者贡献声明

胡超凡:正式分析、数据整理、概念化。Farag M.A. Altalbawy:可视化、验证、监督、资源管理。Krunal Vaghela:验证、监督、项目管理、研究。V. Vivek:项目管理、方法论、研究、数据整理。Sarbeswara Hota:研究、正式分析、数据整理、概念化。Devendra Singh:研究、正式分析、数据整理、概念化。Mahesh Manchanda:项目管理

资助

资助编号20-065-40-004Z,来自桂林电子科技大学

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了广西制造系统与先进制造技术重点实验室、桂林电子科技大学机械与电气工程学院的支持(资助编号20-065-40-004Z)。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号