醋酸乙烯(VAC)是有机化学工业中的重要原料,广泛用于生产聚醋酸乙烯乳液、聚乙烯醇、粘合剂、涂料等产品,市场需求稳定且庞大(Cheng, 2008)。目前,工业生产主要依赖于乙烯气相氧化路线。尽管该工艺具有高选择性和长催化剂寿命的优点,但其流程复杂且能耗较高。在典型的石化装置中,蒸馏部分的能耗占总能耗的70%以上(Yu et al., 2024)。传统的VAC工艺通过多塔串联来实现高纯度产品,这种配置涉及大量设备,能耗高且热量损失大。为降低能耗,业界引入了分壁塔(DWC)技术。DWC技术通过减少关键组分的混合,能够在单个塔内实现多组分分离,从而达到“用一个塔替代多个塔”的效果,从而降低设备投资和能耗。
DWC的内部结构非常复杂,气相和液相回流塔板位置、气相和液相回流流量、分离位置以及塔板数量之间存在强烈的非线性耦合(Li et al., 2024)。以某石化公司的乙烯基醋酸乙烯生产装置为例,其净化过程通常采用传统的两塔串联配置,具有相似的进料条件、操作压力以及中间组分的塔内分离。从工艺合成和热耦合蒸馏理论来看,这种配置可以等效地重构为Petlyuk型或Kaibel型DWC,共享再沸器并减少混合-蒸发损失,从而进一步降低能耗和年成本,同时保证产品纯度。然而,关于VAC系统DWC的系统设计和优化研究仍相对较少,特别是如何快速高效地确定最优运行参数的研究较为缺乏。
传统上,蒸馏过程的稳态设计和运行优化通常采用基于非线性规划(NLP)和混合整数非线性规划(MINLP)的确定性优化算法,这些方法已广泛应用于分壁塔结构和操作的优化。例如,Franke使用MINLP方法比较了传统蒸馏和DWC的年总成本(TAC),并采用改进的广义Benders分解算法进行求解,从而系统地筛选不同的DWC结构方案并进行经济评估(Franke, 2017)。Rawlings等人提出了针对Kaibel型DWC的分阶段精确模型,利用NLP/MINLP和广义析取规划(GDP)集成优化塔板数量、进料和侧流塔板位置及操作条件(Rawlings et al., 2019)。Tobias等人进一步提出了大规模NLP公式,能够同时模拟和优化多个DWC。通过将某些工艺变量作为决策变量,并对剩余变量使用稳健的分阶段计算程序,提高了复杂DWC系统优化的稳定性和收敛性(Tobias et al., 2022)。然而,面对包含离散结构变量(如塔板数量)和连续操作变量(如回流比和流量)的混合决策问题,确定性方法在处理高非线性约束、保证解的稳定性以及避免局部最优解方面仍存在局限性。
近年来,越来越多的研究人员采用随机算法(如遗传算法和粒子群优化)对蒸馏过程进行全局优化,尤其是针对DWC。例如,Ye等人基于GA-BP替代模型提出了蒸馏塔的智能设计方法,显著减少了优化所需的计算时间(Ye et al., 2023)。Li等人比较了多目标遗传算法(MOGA)、多目标差分进化-禁忌搜索组合(MODE-TL)和多目标粒子群优化(MOPSO)在六种三元DWC结构中的能量和年总成本权衡优化中的应用效果,指出了不同算法在收敛速度和全局搜索能力上的差异(Li et al., 2024)。Wang等人使用多目标遗传算法优化了液相传递萃取分壁塔(LTS-EDWC)的结构和操作参数,目标是总塔板数和再沸器负荷,并进一步比较了各种控制结构的动态性能(Wang et al., 2025)。总体而言,这些随机启发式算法能够在复杂和非线性设计空间中实现最优或接近全局最优的解决方案,但通常依赖于大量的离线仿真评估,这导致计算成本较高,难以直接应用于复杂操作条件下的实时决策和策略更新。
深度强化学习(DRL)近年来在复杂过程系统的优化和控制中引起了关注。深度Q网络(DQN)利用深度神经网络近似状态-动作价值函数,无需显式过程模型即可直接从交互数据中学习近似最优策略。与遗传算法和粒子群优化等离线启发式方法相比,DQN结合了策略搜索和函数逼近能力,能够处理高维状态空间和离散动作,具有更好的样本效率和泛化能力。现有文献表明,DWC的运行优化和控制研究仍主要依赖于确定性优化和智能启发式方法,尚未有系统性的研究关注带有DWC的VAC系统,并使用基于DQN的DRL进行自动运行优化。因此,将DQN应用于VAC DWC有望为这类强耦合的蒸馏过程提供一种新的自学习优化方法。
本研究基于某石化厂成熟的商业化VAC蒸馏装置,提出了一种基于分壁塔的节能改造方案,并将深度强化学习融入运行优化中。通过将优化后的条件与工厂现有运行方式对比,在严格的VAC产品质量约束下定量评估了该方案的节能和增产潜力。从DQN算法的搜索机制和蒸馏过程的物理行为两个互补角度阐明了优化方案的合理性和工程可行性。