通过在宏观多孔基底上使用纳米管插层的纳米片中间层,提高薄膜复合纳滤膜的抗生素分离性能

《Journal of Water Process Engineering》:Boosting antibiotics separation performance of thin-film composite nanofiltration membranes via nanotube-intercalated nanosheet interlayer on a macro-porous substrate

【字体: 时间:2026年02月11日 来源:Journal of Water Process Engineering 6.7

编辑推荐:

  提出基于多模块协作的污水处理优化框架TEASG,通过任务分解确定分类/回归模型、EMD特征重构、数据增强生成新样本、集成XGBoost等算法模型堆叠,并利用GAM-SHAP解析特征交互制定控制策略。实验表明该框架使TNeff分类准确率提升12.9%,回归R2达0.804,TEC预测R2达0.924,控制策略使TNeff和TEC分别降低31.7%和21.4%。

  
陈健|邓志成|万金全|王燕|于淑华|莫万秋
华南理工大学环境与能源学院,广州,510006,中国

摘要

污水处理厂(WWTPs)面临着数字建模和控制优化的双重挑战。为了解决数据有限情况下模型精度不足和控制策略不匹配的问题,本研究提出了一个基于多模块协作的优化框架,该框架包括五个主要模块:(1)任务分解机制,用于确定目标变量的建模类型;(2)使用经验模态分解(EMD)和特征重构来增强特征表示能力;(3)结合趋势感知技术的数据增强,以生成数据样本;(4)构建双层堆叠集成学习架构,以互补XGBoost、CatBoost、LightGBM和RF算法的优势;(5)基于可解释机器学习方法指示特征交互机制。对于出水总氮(TNeff)和总电力消耗(TEC)的预测模型,研究表明,通过基于EMD的特征重构-数据增强-模型堆叠的三模块协作优化后,分类模型精度提高了12.9%至26.0%,回归模型的R2提高了6.6%至41.3%,RMSE降低了24.3%至32.5%。优化后的TNeff模型的R2值为0.791(分类)和0.804(回归),而TEC模型的R2值分别为0.814和0.924。基于(GAM)-Shapley加性解释(SHAP)的控制策略在单目标优化下将TNeff和TEC分别降低了31.7%和21.4%,在多目标优化下同时降低了13.4%和18.4%。本研究提出的优化框架通过结合提高的预测精度和过程控制指导,为数据稀缺环境中的污水处理厂智能化提供了解决方案。

引言

在智能水管理系统加速发展的背景下,污水处理厂(WWTPs)的数字化转型已成为实现可持续水管理的必然选择[1]。随着水质法规的收紧和污水处理过程中对能效要求的提高,准确高效的水质预测技术已成为过程优化的关键驱动力[2]、[3]、[4]。准确的水质预测可用于评估水处理过程的有效性,并为优化处理计划提供依据[5]。此外,它还可以提前识别潜在问题,作为预警机制[6]、[7],从而防止不符合规定的排放造成环境危害。然而,水质特性、过程设计和运营管理之间的强耦合导致水质数据高度非线性和非平稳,使得出水质量的准确预测极具挑战性[7]、[8]。
随着人工智能的发展,机器学习为解决这些挑战提供了新的方法[9]、[10]、[11]。数据驱动的机器学习算法可以在不受人类认知限制的情况下有效揭示变量之间的复杂关系[12]。使用各种与水处理相关的特征构建的机器学习(ML)模型使得水质指标的准确预测成为可能。张等人开发了一种基于长短期记忆(LSTM)网络的深度学习模型,该模型在污水处理厂中对进水化学需氧量、总氮和总磷的预测表现优异[13]。庞等人提出了一种优化的时间序列ML方法,用于准确预测多变量饮用水质量,XGBoost模型在12小时动态预测滞后下对四个水质特征的预测精度表现出色[14]。丁等人利用机器学习和博弈论确定复合权重以提高水质指数评估模型的准确性,并引入新的聚合函数以减少模型不确定性[15]。王等人提出了一种基于Prophet时间序列模型、门控循环单元网络和自适应权重的新型混合ML模型,能够短期高精度预测家庭用水和能源消耗[16]。
尽管先进的机器学习模型具有理论上的变革潜力,但其实际应用受到大多数污水处理厂面临的数据现实的根本限制[17]、[18]。大多数市政污水处理厂尚未建立全面的数字监控系统[2]。这意味着对于大多数旨在开发水质预测模型的处理厂来说,可用的数据集通常有限,样本数量少,特征数量少,并且经常伴随着数据质量差和数据缺失等问题。这种小样本数据环境严重限制了模型性能[19],导致模型精度不足,缺乏实际应用性,从而阻碍了污水处理厂向数字化和智能技术的转型。鉴于普遍存在的数据限制,采用在少量样本条件下表现出固有鲁棒性和稳定性的ML方法至关重要。在这种情况下,基于树的ML算法和堆叠等集成技术具有显著优势。基于树的ML算法利用装袋和随机特征选择来构建多样化的决策树,从而有效减少方差并降低过拟合的风险——这在数据集有限的情况下是一个常见挑战。同时,堆叠架构通过元学习器战略性地整合了各种基础学习器的预测结果,利用它们的集体优势同时弥补个别弱点,从而进一步提高预测精度和泛化能力。这种对数据稀缺的固有适应性使得基于树的ML算法和堆叠等集成方法特别适合于在污水处理厂中开发可靠的水质预测模型。
此外,污水处理厂是能源密集型设施,约占全球电力消耗的3%,这严重阻碍了各国实现碳减排目标。污水处理厂的高能耗主要源于在水处理过程中使用高能耗设备,如泵、曝气机和鼓风机[20]。确保污水处理厂高效和可持续运行的关键策略是灵活调整这些设备的运行模式,以满足污染物排放标准的同时最小化能源消耗。
然而,水处理操作中的传统控制方法通常依赖于操作员的个人经验或固定的过程变量阈值[21]。尽管传统控制方法通常具有良好的稳定性,但它们往往导致性能不佳、运营成本高以及难以实现实时优化。基于深度学习和强化学习的智能控制策略在各种控制领域都有效[16]、[22]、[23]。然而,要建立这样的控制策略,通常需要大量的历史数据,涉及大量的计算工作。此外,这些数据往往与大多数工厂的实际条件脱节,其在实际工业环境中的部署可能相当具有挑战性。因此,探索通过挖掘有限水质数据之间的潜在关系来指导水处理控制策略的方法具有潜在价值。基于GAM-SHAP的可解释优化控制策略具有几个显著优势:它对大量训练数据的依赖性较低,可以为控制提供可解释和操作性的见解,并且易于在工业环境中实施。这些特点使其成为一个实用且有效的解决方案,而不仅仅是一个纯粹的理论框架。
为了解决在数据有限条件下对污水处理厂建模的性能限制,并为水处理过程提供控制优化策略,本研究创新性地提出了一个基于多模块协作的优化框架,称为“任务分解、基于EMD的特征重构、数据增强、模型堆叠、控制指导(TEASG)”。该框架包括五个模块:(1)任务分解模块分析在不同特征数量下分类模型和回归模型之间的性能差异,以确定适当的建模类型;(2)基于经验模态分解(EMD)的特征重构模块通过使用EMD和内在模态函数(IMF)选择策略来增强时间序列特征的表示能力;(3)数据增强模块根据数据分布的趋势、变化趋势或时间序列模式生成新样本;(4)模型堆叠模块通过双层堆叠方法整合多个模型的优势;(5)控制指导模块使用Shapley加性解释(SHAP)、部分依赖图(PDP)和局部可解释模型不可知解释(LIME)来揭示特征之间的潜在关系,并基于特征交互制定优化控制策略。
为了验证所提出框架的有效性,使用实际污水处理厂运营数据建立了出水总氮(TNeff)和总电力消耗(TEC)的预测模型。详细分析了每个模块对模型性能的增益效果,并提出了针对目标变量的单目标和多目标优化控制策略,并进行了验证。

部分摘录

数据收集

数据集来自中国武汉某市政污水处理厂的日常运营记录,涵盖了2022年1月至12月。该厂主要采用活性污泥生物工艺处理生活污水,设计处理能力为53,000立方米/天。所有变量都是通过在线监控和实验室分析每天收集一次的时间序列数据。进水变量(Qinf、SSinf、CODinf、TNinf、NH3-Ninf、TPinf和pHinf

任务分解和模型开发

任务分解是预测建模中的关键初步步骤,用于确定目标变量应被建模为分类问题还是回归问题。在本研究中,TNeff_Level和TEC_Level被视为分类模型的分类输出变量,而TNeff和TEC被视为回归模型的连续输出变量。图S1展示了在不同条件下分类模型和回归模型之间的性能差异

结论

为了解决在数据有限条件下污水处理厂建模的性能限制,并为水处理过程提供优化的控制策略,本研究提出了一个集成的优化框架,该框架在提高模型性能的同时提供了控制指导。该框架包括五个模块:任务分解、基于EMD的特征重构、数据增强、模型堆叠和控制指导。

CRediT作者贡献声明

陈健:撰写 – 审稿与编辑,撰写 – 原稿,方法论,形式分析,概念化。邓志成:撰写 – 原稿,形式分析,概念化。万金全:监督,资源,项目管理,概念化。王燕:方法论,调查,概念化。于淑华:验证,调查。莫万秋:验证,调查。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。

致谢

本研究由广东省专项支持计划(编号:2021JC060580)和广东省科技创新项目(编号:2130218003140)资助。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号