基于机器学习的紫外线/氯处理工艺优化方法,用于实现可持续的微量污染物去除
《Journal of Hazardous Materials》:Machine Learning-Guided Optimization of UV/Chlorine Process for Sustainable Micropollutant Abatement
【字体:
大
中
小
】
时间:2026年03月08日
来源:Journal of Hazardous Materials 11.3
编辑推荐:
微污染物的降解动力学预测与UV/chlorine过程优化研究
张中燕|李博涵|赵静|宋新杰|尹然|任洪强
中国南京大学环境学院,水污染控制与绿色资源回收国家重点实验室,南京210023
摘要
基于紫外线的高级氧化工艺(AOPs)在饮用水处理和可再生水利用中越来越被用于去除微量污染物,但由于微量污染物种类繁多及其高碳足迹,仍存在诸多挑战。为了克服这些限制,我们开发了一个机器学习(ML)框架,用于预测在254纳米波长下,不同环境和操作条件下紫外线/氯工艺对微量污染物降解速率常数(k)的影响。通过对六种微量污染物进行外部验证,得到的预测k值与文献报道的结果相当(平均误差<50%),使用克拉霉素和西玛津进行的实验验证也显示出较高的一致性(平均误差<38%),证明了该模型的泛化能力。特征重要性分析表明,芳香碳、羟基和C-I键能够增强降解速率常数(k),而硝基和杂环氮原子则会抑制降解动力学。应用该验证模型,我们预测了五种新兴微量污染物(未包含在训练数据集中)在现实条件下的紫外线/氯工艺中的降解情况——这些污染物存在于自来水、地表水和再生水中。该模型还提供了针对不同水质情景下特定微量污染物去除的最佳氯剂量建议。此外,该框架还扩展到了能够初步预测卤化副产物形成的功能。为了便于实际应用,我们为水处理工程师和从业者创建了一个开放访问的网络界面。本研究突显了机器学习在优化基于紫外线的AOPs方面的潜力,促进了水处理中可持续且高效的微量污染物控制。
引言
由于微量污染物(MPs)的持久性和生物累积潜力,它们对人类健康和水生生态系统构成了日益增长的风险[1]。传统的水处理工艺往往无法有效去除这些痕量污染物。作为有前景的替代方案,基于紫外线的高级氧化工艺(UV-AOPs)依靠紫外线照射氧化剂前体(例如H2O2)来生成活性物质,从而高效降解MPs[2],[3]。
在UV-AOPs中,UV/H2O2工艺在饮用水处理和可再生水利用方面得到了广泛研究并得到了实际应用[4]。与文献中记录的UV/H2O2工艺相比,UV/氯工艺具有几个优势:(1)它可以在分配系统中提供残余消毒剂,而无需熄灭氧化剂[5];(2)它同时产生羟基自由基(HO•)和活性氯物种(RCS;例如Cl•、ClO•和Cl2•?),为MPs提供了互补的降解途径[6];(3)在低压汞灯(253.7纳米波长)的紫外线照射下,氯的紫外线吸收率和量子产率高于H2O2,并且该工艺可以通过最小的基础设施改动即可集成到现有的处理系统中[7]。尽管有这些优点,UV/氯工艺的广泛应用仍面临关键挑战,例如新微量污染物的不断出现使得在不同水质条件下评估去除效率变得复杂。此外,水质组成的区域差异(例如溶解有机物、氯化物和pH值)需要精确优化氯剂量,以平衡RCS的生成和自由基的清除。
目前的研究主要依赖于实验室密集型的实验来评估工艺效率、优化参数和阐明降解机制,但测试大量的微量污染物是不切实际的。尽管一些研究采用了线性回归模型来建立结构-活性关系以预测反应速率常数[8],但污染物描述符的选择仍然依赖于经验,并且未能考虑反应条件因素的影响。这种方法在捕捉非线性关系方面表现不佳,因此无法建立适用于多种污染物的稳健结构-活性相关性。机器学习(ML)提供了一个可行的替代方案,利用计算技术的进步来满足评估需求[9],[10],[11],[12]。通过ML模型预测工艺效率的前提是建立微量污染物的分子结构信息与其在紫外线/氯工艺中的降解速率常数之间的定量关系。常用的分子结构编码方法是分子指纹技术(MF),它将MPs的结构和功能特征转换为二进制向量[10],[13]。在各种MF方法中,基于计数的Morgan指纹技术可以编码环状原子环境并记录其出现频率,从而提供分子结构的定量表示[14],[15]。最近的研究将ML与MF技术结合,用于预测某些UV-AOPs(如UV/H2O2和UV/过硫酸盐工艺)中MPs的降解速率常数。然而,目前还没有模型能够预测UV/氯工艺中污染物的降解效率。另一种建立预测模型的方法是结合量子化学计算(例如使用密度泛函理论)与ML[16],[17]。然而,这些尝试仅限于简单的工艺(例如UV/H2O2),在涉及多种自由基物种的复杂情景中表现有限。此外,量子化学计算的引入显著增加了计算复杂性,阻碍了模型快速适应操作条件实时变化的能力。
当前研究的另一个关键局限性是这些模型通常缺乏实验验证,主要依赖于测试集性能或计算化学评估,而没有使用样本外数据进行验证。为了减少潜在偏差,建议使用未包含在模型数据集中的微量污染物进行实验验证。一旦模型得到验证,就可以将其应用于解决实际工程挑战,例如评估不同水环境中的工艺可行性和有效性。然而,训练有素的机器学习模型的扩展用途在实践中很少得到展示。
本研究旨在解决上述知识和实践上的空白。我们从文献中收集了实验数据,并开发了一个MF-ML框架,用于预测在254纳米波长下,不同环境和操作条件下紫外线/氯工艺中微量污染物(MPs)降解的伪一级速率常数。评估了六种机器学习算法,选择了预测准确性最高的算法。通过将预测的速率常数与训练数据集中未包含的两种代表性微量污染物的实验确定值进行比较,进一步验证了模型的性能。此外,我们确定了影响降解效率的关键因素,并评估了五种新兴微量污染物在真实水介质(自来水、地表水和再生水)中的降解情况。为了支持水处理专业人员的实际应用,我们开发了一个开放访问的网络工具,并附上了使用手册。
数据收集与预处理
我们在PubMed、Web of Science和Google Scholar中使用包括“UV/氯”、“AOP”、“微量污染物”和“降解”等关键词进行文献搜索(数据来源的详细信息见表S1)。数据集包含88种新兴污染物的1139个降解速率常数(详见SI中的表S2),以及这些污染物的基于计数的Morgan指纹(长度为512,半径为3),还包括光照强度、pH值等反应参数
机器学习算法的比较与选择
图1a–1f展示了六种ML算法预测的lg k值与真实值之间的比较。SVR、XGB、RFR、CBR、LGBM和DT算法的训练/测试数据集的R2值分别为0.862/0.786、0.998/0.923、0.925/0.878、0.926/0.878、0.996/0.915和0.967/0.857。相应的RMSE值分别为0.261/0.420 s–1、0.048/0.112 s–1、0.045/0.131 s–1、0.182/0.329 s–1、0.179/0.330 s–1和0.102/0.343 s–1。XGB算法的R2值最高,分别为0.998和0.923
结论
由于传统处理方法去除效果不佳,微量污染物(MPs)以痕量水平(ng L–1至mg L–1)持续存在,对水质和生态系统构成威胁,危及人类健康和水生生物。UV/氯工艺通过生成HO•和RCS有效降解MPs,同时提供残余消毒效果。然而,在不同水质介质和新兴污染物条件下优化这一工艺需要创新的方法。本研究引入了一个MF-ML框架,用于预测微量污染物的降解动力学并确定最佳操作条件
环境影响
新兴微量污染物的问题日益严重,给水处理带来了重大挑战。UV/氯工艺显示出很大的潜力。然而,其应用受到需要在不同水质介质中进行复杂、经验性优化的限制。本研究通过开发一个机器学习框架,准确预测微量污染物的降解动力学并确定最佳操作条件,从而克服了这一限制
CRediT作者贡献声明
张中燕:撰写——原始草稿、方法论、研究、正式分析、概念化。任洪强:撰写——审阅与编辑、项目管理、资金获取。李博涵:撰写——审阅与编辑、软件、资源管理、数据管理。赵静:撰写——审阅与编辑、研究、数据管理。宋新杰:撰写——审阅与编辑、可视化、验证、软件、概念化。尹然:撰写——审阅与编辑、监督、项目管理
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
本工作得到了国家自然科学基金基础科学中心项目(项目编号52388101)、江苏省自然科学基金(项目编号BK20241218)、中央高校基本科研业务费(项目编号4919/14380002和4919/14380009)以及苏州创新创业领军人才计划项目(项目编号ZXL2024358)的财政支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号