二氧化硫(SO?)是一种重要的大气污染物,主要由化石燃料燃烧和工业活动产生[1]。过量的SO?排放会导致严重的生态后果,包括全球变暖和酸雨[2],并对人类健康和生态系统产生不利影响[3]。因此,减轻SO?浓度已成为研究和开发工作的重点。烟气是SO?的主要来源,其浓度通常低于二氧化碳(CO?)等其他气体[4]、[5]。目前,有机胺溶液吸收和石灰-石灰石吸附是主要的烟气脱硫(FGD)技术[6]。然而,这些方法存在一些局限性,如需要大量用水、产生有害副产品以及循环效率不足[7]。因此,迫切需要一种可持续、高效且经济可行的方法来处理烟气中的SO?。
离子液体(ILs)因其良好的特性(如化学稳定性、低蒸气压和可定制的结构)而受到广泛关注[8]、[9]。2004年,Han[10]引入了1,1,3,3-四甲基胍酸乳酸盐用于SO?捕获。这种IL通过1,1,3,3-四甲基胍和乳酸的直接中和合成,表现出0.305 gSO?/gIL的SO?吸收能力。在这一突破之后,开发了功能化的ILs,包括胺功能化的ILs和基于氮杂环化合物的ILs,在SO?吸收方面取得了更好的性能[11]、[12]、[13]。尽管具有这些优势,但ILs的应用仍受到粘度较高、运营成本较高以及合成过程复杂的限制[14]、[15]。
深共晶溶剂(DESs)作为一种新型环保溶剂,被引入作为ILs的潜在替代品[16]、[17]。DESs是通过将氢键供体(HBDs)和氢键受体(HBAs)以精确的摩尔比例混合,并提高混合物的温度来制备的,从而形成比其单独组分具有更低熔点的共晶系统[18]。它们的化学性质因HBDs、HBAs和摩尔比例的不同而有所差异,提供了广泛的设计灵活性。DESs具有多种吸引人的特性,如可调性、低蒸气压、易于制备、低毒性和优异的热稳定性[19]。特别是,它们的低蒸气压和可调性使其在气体吸收应用中非常受欢迎[20]、[21]。
大量的实验研究已经证明了DESs在SO?吸收方面的有效性,取得了令人满意的结果[7]、[22]、[23]、[24]、[25]、[26]。例如,Yang研究了由甘油和氯化胆碱组成的DESs在1 atm和293.15 K条件下的SO?吸收能力,达到了0.678 gSO?/gDES[22]。这是DESs首次用于SO?捕获的应用。随后,基于无机盐的DESs(如ChCl-EG(氯化胆碱-乙二醇)和乙酰胺-KSCN[23]、[24])也被用于SO?吸收,显示出优异的性能。然而,某些DESs的高粘度仍然是一个挑战,促使人们进一步研究基于己内酰胺和氮杂环化合物的DESs[7]。
Soleimani和Saeedi Dehaghani[27]应用了集成学习方法,特别是随机梯度提升(SGB)算法,并结合COSMO-RS描述符,预测了多种DESs中的CO?溶解度,平均绝对相对偏差分别仅为0.85%和2.30%。他们的模型比传统的状态方程和其他ML技术具有更高的准确性。在另一项研究中,Soleimani和Saeedi Dehaghani[28]使用SGB估计了离子液体和非离子组分二元混合物的表面张力,性能优于ANFIS、SVM和ANN混合模型,并进行了特征重要性分析。Abooali和Soleimani[29]也使用SGB模拟了盐溶液中阴离子表面活性剂的临界胶束浓度,同时考虑了分子结构和操作条件,结果表明SGB模型在预测准确性上优于遗传编程。此外,Saeedi Dehaghani等人[30]使用SGBTree预测了压缩空气储能系统设计所需的多项热物理性质,再次证明了SGB在处理具有复杂物理依赖性的多变量系统时的稳健性。类似地,基于SGB的模型还被用于准确估计CO?-油系统中的最小混溶压力(MMP)[31],以及在高精度下预测生物柴油组分的性质(如压缩性和密度)[32]。值得注意的是,Soleimani等人[33]证明了SGB算法在估计各种离子液体中H?S溶解度方面的优越性,其性能优于热力学模型和机器学习(ML)方法(如GEP和LSSVM)。这些研究共同强调了SGB和集成学习框架在模拟复杂溶剂和混合物的物理化学性质方面的日益广泛应用和可靠性,并强烈推动了当前工作探索多种ML模型(包括梯度提升变体)以模拟DESs中的SO?吸收。
尽管有许多关于DESs吸收SO?的实验研究,但这些研究往往局限于特定的HBA和HBD类型以及预定的浓度。考虑到进行全面实验分析的复杂性,建立HBA-HBD组合对的分子排列与其功能特性之间的内在联系至关重要。因此,开发用于预测SO?吸收选择性和能力的模型是必要的。
类似导体的溶剂筛选模型(COSMO-RS)常用于溶剂筛选[34]。COSMO-RS广泛用于气体吸收预测,利用分子间的电荷分布来实现快速准确的计算预测[35]。ML方法,特别是人工神经网络(ANNs),在预测物理化学性质和相稳定性方面取得了进展。其中,多层感知器(MLPs)已被用于预测DESs的特性[36]、[37]、[38]。本研究采用了多种先进的ML算法来扩展对各种DESs中SO?吸收的预测模型。所包含的模型包括决策树、随机森林、k最近邻、支持向量机、梯度提升机、XGBoost、LightGBM、分类提升(CatBoost)、线性回归、岭回归和弹性网。为了确认数据适合训练,采用了基于蒙特卡洛的异常检测技术。该方法的具体描述见图1。与以往主要关注单一算法(例如多层感知器或传统回归模型)或严重依赖COSMO-RS等量子化学描述符的研究不同,本研究系统地评估了15种不同的ML算法,使用了包含2306个数据点(1382个实验数据和924个计算值)的大型异构数据集来预测DESs中的SO?吸收。这种广泛的比较方法不仅识别出最准确的预测模型,还整合了特征敏感性分析,以突出影响吸收的关键分子和操作参数。此外,该方法展示了如何直接将这些见解应用于高效DESs的合理设计,而无需完全依赖计算成本高昂的量子化学计算。据我们所知,这是首次结合如此广泛的算法比较、大规模数据整合和可解释性分析来研究SO?-DES系统的研究。