《The Journal of Chemical Thermodynamics》:Neural circuit policies for accurate prediction of interfacial tensions between liquid mixture of hydrocarbons and brine
编辑推荐:
本研究开发了三种架构(深度神经网络、长短期记忆网络和神经电路策略)预测石油与盐水界面张力,发现神经电路策略在RMSE(0.048 mN/m)和参数数量(8.3-15倍更少)上表现最优,并揭示了盐度升高导致界面张力增大的机理。
杨艳玲|贝琳达·凯齐亚·普尔瓦托|帕努鲁·文卡特苏
台湾国立科技大学化学工程系,台北市10607,台湾
摘要
烃类与盐水之间的界面张力(IFT)在提高石油采收率的过程中起着关键作用。尽管已经对烃类-盐水系统进行了多种实验和模拟研究,但关于烃类-盐水系统中IFT的全面经验关联仍不完全清楚。本研究开发了三种IFT预测方法:深度神经网络(DNN)、长短期记忆(LSTM)和神经电路策略(NCP)。对于两相系统来说,输入向量通常包含多个数值参数,包括压力(P)、温度(T)、比重(ρ)、氯化钠(NaCl)当量盐度和pH值。除了使用DNN方法外,LSTM和NCP方法还结合了简化的分子输入线表示系统(SMILES)作为输入数据。在三种方法中,包含所有六个参数和SMILES的NCP方法在所有测试方法中具有最低的均方根误差(RMSE),其值为0.048 mN/m。此外,NCP方法中的可训练权重数量是DNN和LSTM方法的8.3-15倍。因此,我们提出的NCP方法比那些体积更大的黑箱学习系统具有更好的泛化能力和鲁棒性。随着盐水盐度的增加,由于盐离子在水中优先保留,界面张力的增加受到限制,这限制了它们破坏水分子在界面处凝聚结构的能力,最终在高盐度水平下稳定了IFT。
引言
两种溶解度较低的相之间的张力称为界面张力(IFT),它是两不相溶相之间的一种特性,是多相系统的关键特征。IFT已被应用于各种化学和石油工业中,用于分析表面性质[1]、[2]、[3]。高盐度盐水作为一种提高石油产量的技术引起了人们的兴趣。为了优化采收率,将油和水之间的IFT降低到超低范围(10?2–10?3 mN/m)是有利的[4]、[5]、[6]。原油与盐水之间的IFT在各个采收阶段显著影响石油生产效率,因为它通过影响毛细数来影响残余油饱和度。然而,大多数研究将原油视为简单的烃类,忽略了非烃类成分。为了做出有效的提高石油采收率的决策,有必要充分理解原油与储层结构和原位流体的相互作用。
原油与盐水之间的IFT是石油工业中的一个重要指标,通常使用原油/盐水系统来测量它[5]、[7]、[8]、[9]。这类系统的IFT取决于多种参数,主要包括操作条件(T和P)、盐水规格(pH和盐度)以及原油规格[5]、[7]、[8]、[9]、[10]、[11]、[12]。然而,关于盐度对IFT影响的研究结果存在矛盾。首先,有研究表明盐度会对IFT产生负面影响[5]、[13]、[14]。其次,随着盐度的增加,界面张力呈现出波动趋势,先是下降然后再次上升[9]、[15]、[16]、[17]。第三,盐度对IFT的影响微乎其微[18]、[19]、[20]。关于IFT趋势的研究存在很多争议,这可能是由于原油和盐水组成的多样性[21]。尽管油对IFT有显著影响,但一些先前的研究没有将极性成分纳入油模型中[21]、[22]。目前还没有可靠的经验关联或理论模型能够准确预测原油和盐水系统中的IFT。除了实验测量外,分子模拟也被广泛用于解释烃类+盐水系统的整体和界面性质[23]。
人工智能技术,如遗传算法[24]和提升方法[25],已被应用于预测原油和盐水系统中的IFT。机器学习技术可能为解决复杂的计算问题提供新的方法。近年来,深度学习(DL)这一涉及人工神经网络的机器学习技术受到了广泛关注。DL,包括人工神经网络(ANNs),已经证明了其在处理大型数据集中的复杂非线性模式方面的能力。ANNs由多层相互连接的人工神经元组成。这种模型包含一个或多个隐藏层,能够准确捕捉输入和输出之间的复杂关系。模型接收外部数据作为输入,并产生最终结果作为输出。循环神经网络(RNNs)是一种ANN,适用于建模序列数据。它们在涉及序列模式的多种任务中表现出有效性[26]、[27]。RNNs常用于处理序列数据的领域,如化学和生物信息学[28]、[29]。它们能够处理不同长度的输入数据。RNNs已被应用于分析以特定格式表示的DNA序列和化学结构[30]、[31]。之前的研究曾使用ANNs研究n-烷烃/水-盐系统中的IFT[32],但没有考虑分子结构。在本研究中,我们使用具有多个隐藏层的ANNs来估计原油与盐水之间的IFT,并评估分子结构对这种张力的影响。
ANNs预测原油与盐水之间界面张力的准确性在很大程度上取决于可用数据的数量。在神经网络模型中,预测是在模型训练过程中从输入到输出获得的,错误会传递到神经网络的每一层。根据上述错误调整DNN的神经元参数,直到模型收敛或达到所需的性能。虽然端到端学习可以降低工程复杂性,但很难确定模型中的每个参数对输出结果的贡献。换句话说,模型变得更加“黑箱化”,降低了网络的可解释性。使用神经电路策略(NCP)处理车道保持任务,由于它们使用的神经元数量相对较少,因此提供了更好的可解释性[33]。与深度神经网络(DNN)模型相比,NCP这种受大脑启发的智能代理表现出更好的泛化能力、可解释性和鲁棒性。此外,整个NCP架构仅由19个神经元组成,其计算能力优于深度神经网络模型。研究表明,NCP产生的网络更具可解释性,更容易理解,并且将较小的受大脑启发的神经模型与紧凑的卷积神经网络结合可以产生更好的结果[34]。最近,NCP模型输入非乔治亚文本数据进行有毒评论分类时显示出令人满意的结果[35]。在这项研究中,我们还将利用NCP的可解释性来解释SMILES无法解释的问题,即官能团或碳链对烃类与盐水之间IFT的影响。
部分摘录
烃类与盐水混合物的IFT数据分析
在这项工作中,数据集包含560个数据点,包括14种不同的烃类在各种储层条件下的性质、原油特性和盐水特性。根据它们的化学结构,烃类可以分为三类:线性烷烃、支链烷烃和环状烷烃,如图1所示。饼图显示线性烷烃占总数的98.56%。烃类/盐水系统的储层条件包括IFT、温度(T)和压力
DNN、LSTM和NCP方法的输入向量
为了预测IFT,需要确定输入到DNN、LSTM和NCP模型的输入变量数量。输入变量的数量由吉布斯相规则确定的自由度数量决定。一个包含三种组分(烃类、水和NaCl)且具有两个相(液态烃类和液态水)的系统可以通过三个自由度来确定其强度状态,正如吉布斯相规则所规定的那样。这意味着三个强度
结论
使用深度神经网络(DNN)方法计算了两相系统中烃类与盐水之间的界面张力(IFTs)。输入向量通常包括六个参数:压力(P)、温度(T)、比重(ρ)、NaCl当量盐度(Seq)和烃类的简化分子输入线表示系统(SMILES)。除了P和T之外,ρ和SMILES也被发现是有用的输入参数。均方根误差(RMSE)值为
CRediT作者贡献声明
杨艳玲:撰写 – 审稿与编辑、验证、监督、方法论、资金获取、正式分析、数据管理、概念化。贝琳达·凯齐亚·普尔瓦托:撰写 – 原始草稿、可视化、调查、正式分析。帕努鲁·文卡特苏:撰写 – 审稿与编辑、验证、正式分析、数据管理、概念化。
利益冲突声明
作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。
致谢
本研究得到了台湾科技部的支持,授予编号为110-2222-E-032-005的资助。