《Journal of Water Process Engineering》:Optimizing Pond-In-Pond wastewater treatment systems: The impact of pit placement on hydrodynamics and efficiency
编辑推荐:
预测饮用水中卤代酮(DCP、TCP及总HK)的模型研究,比较了线性回归、随机森林和基于RBF激活的ANN模型,提出具有CRADBAS转移函数的CANN模型,在较小数据集上表现优异,R达0.94,RMSE 0.398,并通过敏感性分析验证了关键输入,为常规监测提供参考。
J.I. Johnson | A.I. Mata | A. Parrales | J.E. Solís-Pérez | A. Huicochea | J.A. Hernández
POSGRADO-应用工程与科学研究中心,莫雷洛斯自治大学,Universidad大街1001号,Chamilpa区,邮编62209,Cuernavaca,莫雷洛斯州,墨西哥
摘要
预测饮用水中的卤代酮对于公共卫生监测和治疗控制具有重要意义。本研究使用了来自中国金华的63个样本,这些样本包含了常规监测的物理化学参数,研究目标包括1,1-二氯-2-丙酮(DCP)、1,1,1-三氯-2-丙酮(TCP)和总卤代酮(HK)。我们比较了两种简单的基线方法——多元线性回归和随机森林——以及一种使用径向基函数激活函数的人工神经网络。模型训练采用了固定的训练/验证/测试数据划分方式,并进行了最小-最大缩放(范围为[0.1, 0.9]),评估指标包括R值、均方根误差(RMSE)和平均绝对百分比误差(MAPE)。全局敏感性分析确定了最具影响力的输入因素。这些基线方法得出了实际的性能限值(例如,对于DCP:线性回归的R值约为0.77,RMSE约为0.23;随机森林的R值约为0.77,RMSE约为0.28)。基于径向基函数激活函数的网络在所有目标上的预测一致性都有所提高,平均R值约为0.94,RMSE约为0.398。敏感性分析结果与已知的影响因素一致。所提出的激活函数设计在小数据集上相比线性回归和基于树的模型具有显著优势,同时计算复杂度较低。本文记录了相关假设、数据范围和局限性,以便该模型能够用于常规监测。
术语表
命名法
| ANN | | 人工神经网络 RADBAS | | 径向基函数传输函数
| b | | 截距 | 残差 | 残余氯浓度
| b1, b2 | | 矩阵偏置 | RMSE | 均方根误差
| Br | | 溴 | S | 斜率
| CANN | | 一致人工神经网络 | SOFTPLUS | Softplus传输函数
| CELU | | 一致指数线性单元函数 | SWISH | Swish传输函数
| CLOGSIG | | 一致对数Sigmoid传输函数 | TANSIG | 双曲正切Sigmoid传输函数
| CRADBAS | | 一致径向基函数 | TCP | 三氯丙酮
|
方法论
本研究的工作流程如图1所示,涵盖了从数据采集到模型评估的整个过程。该过程分为三个主要阶段:(1)预处理:数据库获取、异常值分析和数据集标准化;(2)处理:模型设计和训练,使用LM作为优化器开发经典和一致的人工神经网络架构;(3)后处理:使用斜率/截距测试、R值、RMSE和MAPE进行统计验证。
结果与讨论
本节展示并讨论了使用120个人工神经网络(ANN)模型进行实验的结果。这些模型应用了经典(LOGSIG、TANSIG、SOFTPLUS、SWISH、ELU和RADBAS)和一致(CLOGSIG、CTANSIG、CSOFTPLUS、CSWISH、CELU和CRADBAS)传输函数来预测自来水中的卤代酮(DCP、TCP和总HKs)的含量。训练采用Levenberg-Marquardt算法,其中60%的数据用于训练,20%的数据用于验证。
结论
本研究提出了一种包含CRADBAS传输函数的一致人工神经网络(CANN)架构,用于预测饮用水中的卤代酮(HKs),即1,1-二氯-2-丙酮(DCP)、1,1,1-三氯-2-丙酮(TCP)和总HKs)。与基线回归方法(多元线性回归和随机森林)以及Deng等人[24]提出的基于RADBAS的经典ANN模型相比,所提出的一致模型获得了更高的相关性系数(R值)。
CRediT作者贡献声明
J.I. Johnson:撰写初稿、软件开发、方法论设计、概念构建。
A.I. Mata:数据可视化、软件开发、方法论设计、数据分析、概念构建。
A. Parrales:撰写内容审核与编辑、资源协调、数据分析、概念构建。
J.E. Solís-Pérez:项目监督、软件开发、方法论设计、概念构建。
A. Huicochea:撰写内容审核与编辑、软件开发、数据分析。
J.A. Hernández:撰写内容审核与编辑、项目监督、资金管理。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文的研究结果。
致谢
第一作者和第二作者感谢SECIHTI通过学生奖学金提供的财务支持。此外,Arianna Parrales Bahena还感谢SECIHTI通过“Investigadores por México 2017”计划提供的支持。