双凝剂投量的逐步优化：一种用于饮用水处理的闭环机器学习框架

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Environmental Chemical Engineering》：Stepwise Optimization of Dual-Coagulant Dosing: A Closed-Loop Machine Learning Framework in Drinking Water Treatment

【字体：大中小】 时间：2026年02月17日 来源：Journal of Environmental Chemical Engineering 7.2

编辑推荐：

　　针对饮用水处理中双凝聚剂投加的非线性动力学和协同作用难题，本研究提出分步机器学习框架，先预测FeCl3用量作为PAC预测的关键特征，并建立同步水质模型作为内反馈机制。基于天津某水厂长期数据，AutoML模型实现FeCl3（R2=0.91）、PAC（R2=0.98）和NTU-TW（R2=0.92-0.98）的高精度预测，通过SHAP和PDP分析揭示FeCl3对原水波动敏感，PAC直接调控出水质量。优化策略使药剂用量减少9.8%-17.7%，出水水质达标率提升7.5%-6.5%。该闭环框架为常规监测条件下双凝聚剂智能化投加提供新范式。

沈书坤|张颖|冯丽燕|王晨晨

天津大学环境科学与工程学院，中国天津300350

摘要

在饮用水处理厂中，双凝剂的精确投加受到非线性动态、操作延迟以及复杂协同效应的挑战，尤其是在过程监测不完善的情况下。为了克服这些限制，本研究提出了一种基于过程信息的逐步机器学习框架，该框架首先顺序预测FeCl₃的投加量，然后将其作为PAC投加量的关键特征，有效补偿了未监测到的中间水质条件。同时开发了处理后水质（TWQ）模型，作为内部反馈机制来验证投加决策。利用全规模工厂的长期运行数据，基于AutoML的模型实现了高精度（FeCl₃的R2值为0.91，PAC的R2值为0.98，TWQ的R2值为0.92–0.98）。SHAP和PDP可解释性分析揭示了两种凝剂的独特作用：FeCl₃对原水变化敏感，而PAC直接调节最终处理后的水质。优化策略显示出显著潜力，将凝剂投加量减少了9.8%-17.7%，同时使NTU-TW、pH-TW和COD_Mn-TW的达标率分别提高了7.5%、2.1%和6.5%。该研究建立了一个透明的闭环框架，用于在常规监测限制下进行双凝剂投加，为更高效和稳定的饮用水处理提供了可扩展的途径。

引言

饮用水处理厂（DWTPs）是城市供水的最后一道防线，因此其运行效率和处理后的水质至关重要。在传统处理过程中，混凝是首要步骤。混凝的效果直接影响后续单元的负荷，并最终决定最终的水质[1]、[2]、[3]。该过程通过添加凝剂来破坏胶体并使细小颗粒聚集形成可沉淀的絮体，机制包括电荷中和、吸附桥接和扫掠絮凝[4]、[5]。凝剂投加不足会导致悬浮物和溶解物质去除不完全，从而可能不符合水质标准。相反，过量投加会引起次生问题，如产生过多污泥，增加运行负担和额外成本[6]。因此，在原水条件波动的情况下实现实时和准确的凝剂投加仍然是提高处理效率和确保DWTPs处理后水质稳定的主要技术挑战。

凝剂投加控制技术的发展经历了三个阶段：手动控制、自动控制和智能预测。传统的手动方法，如基于经验的视觉判断和定期罐式测试[7]，严重依赖操作人员的专业知识。然而，这些方法通常响应延迟、主观性强且对原水质量的突然变化适应能力差[8]。后续的自动控制技术，包括基于流式电流检测器（SCD）的反馈控制和基于机制的前馈控制，提高了投加系统的自动化水平[9]、[10]。尽管有这些进步，但基于机制的模型在复杂水质条件下难以准确捕捉非线性关系。此外，这些系统中使用的传感器容易发生污染和信号漂移，限制了其可靠性[11]。

近年来，数据驱动技术在水处理领域受到越来越多的关注。通过从历史数据中学习操作条件与水质参数之间的非线性关系[11]、[12]，这些模型可以提供更准确的凝剂需求预测[13]、[14]。例如，Dadebo等人开发了一种基于人工神经网络（ANN）的模型，该模型通过历史水质数据进行训练，以预测最佳凝剂投加量，并将经济和环境因素纳入评估过程[15]。为了解决进水不确定性及混凝时间滞后问题，长短期记忆（LSTM）网络及其变体（包括结合差分优化的方法）也被应用于预测水处理厂中的凝剂投加量[16]、[17]、[18]。Lin等人提出了一种基于图注意力（GAMTF）的多变量时间序列预测模型，成功预测了凝剂投加量和沉淀后的浊度[19]。同时，使用SHAP等可解释性技术来提高模型透明度并增强操作人员的信任度，帮助识别影响投加决策的关键因素[20]。最近的研究进一步推动了水处理系统中智能决策和自动控制的开发。集成数据驱动的优化框架提高了水质预测的准确性[21]，而自动控制和反馈机制增强了处理过程的鲁棒性和响应性[22]、[23]。这些研究表明，数据驱动的决策和智能控制正逐渐成为优化水处理过程的关键趋势。

然而，大多数现有研究集中在预测单一凝剂的投加量上，很大程度上忽略了双凝剂投加系统中固有的协同作用和顺序依赖性[24]、[25]。在现代DWTPs中，越来越多地采用混合投加策略，如将铁盐与铝盐结合，或将无机凝剂与有机聚合物结合。这些策略用于应对高度变化的原水质量，提高处理效率，并减轻单一凝剂过度使用带来的环境风险[24]、[26]、[27]、[28]。这些策略利用互补机制来平衡性能和安全性。具体来说，基于铁的凝剂（如三氯化铁FeCl₃）尽管可能存在颜色问题，但具有强大的电荷中和能力和优异的有机物去除效率[29]。相反，在原水条件波动的情况下，单独使用基于铝的凝剂（如聚合氯化铝PAC）通常需要高剂量，导致出水中的铝残留过多[30]。因此，这两种凝剂的协同作用不仅提高了对复杂水质的适应性，还显著降低了单一凝剂投加导致的金属离子超标风险，实现了浊度去除和化学安全的协同优化。FeCl₃和PAC的投加量相互依赖，因为它们在混凝化学中存在协同作用，且它们与处理后水质的关系高度非线性且依赖于具体条件。此外，实际操作中往往缺乏各个工艺单元的长期详细监测数据。这些因素使得传统模型难以同时准确估计两种凝剂的投加量。

为了解决这些挑战，本研究提出了一种实用的逐步预测框架，用于智能双凝剂投加。所提出的框架结合了高精度和强可解释性，利用处理后水质反馈来补偿实际操作中常见的有限过程数据。为了验证其在DWTPs常见实际约束下的有效性，使用天津某全规模DWTP的长期运行数据对该框架进行了验证。该工厂采用脉冲澄清工艺，其中混凝、絮凝和沉淀高度集成。虽然这种集成设计空间效率高，但通常限制了中间反应状态的观测性和数据可用性。因此，本研究的具体目标如下：（1）利用工厂提供的有限运行数据，构建高精度的处理后水质预测模型以及FeCl₃和PAC投加量的逐步预测模型；（2）应用SHAP和PDP分析来识别关键控制变量并阐明潜在的响应机制；（3）评估所提出模型在减少凝剂消耗和改善处理后水质方面的实际价值。

数据收集

本研究使用的数据来自一个设计容量为175,000立方米/天的全规模DWTP。该工厂主要处理通过主要引水项目（长江和滦河）引入的地表水。该工厂采用的处理方案包括预处理、强化传统处理以及通过紫外线消毒结合氯化进行最终消毒。详细的工艺布局（包括凝剂投加点）如图1所示。

处理后水质的预测与解释

使用TPOT框架成功开发了关键处理后水质参数（NTU-TW、pH-TW和COD_Mn-TW）的预测模型。通过基于遗传编程的迭代优化，TPOT自适应地为每个任务选择了最合适的算法[40]：随机森林（RF）用于NTU-TW和pH-TW，极端随机树（ERT）用于COD_Mn-TW。这些模型的回归性能如图3所示。所有三个模型都展示了强大的泛化能力。

结论

本研究通过整合AutoML和可解释性分析，开发并验证了DWTPs中双凝剂投加的预测和优化框架。主要结论如下：

提出了一种逐步预测策略，顺序预测FeCl₃和PAC的投加量，有效解决了中间过程数据的缺失和投加阶段之间的相互依赖性。使用基于TPOT的AutoML，模型取得了优异的性能，其中RF在FeCl₃投加量预测方面表现最佳

CRediT作者贡献声明

王晨晨：撰写 – 审稿与编辑、可视化、监督、软件开发、项目管理。冯丽燕：可视化、验证、形式分析、数据整理。张颖：撰写 – 审稿与编辑、资源管理、项目管理、方法论、资金获取、概念构思。沈书坤：撰写 – 原稿撰写、可视化、验证、软件开发、方法论、调查、形式分析、数据整理。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

本工作得到了国家关键研发计划（2022YFC3203803）的支持。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号