可解释的ANN-SHAP框架用于全尺度厌氧消化中CH4和H2S的多目标优化

《Regional Studies in Marine Science》:Interpretable ANN-SHAP framework for multi-objective optimization of CH4 and H2S in full-scale anaerobic digestion

【字体: 时间:2026年05月11日 来源:Regional Studies in Marine Science 2.4

编辑推荐:

  阿米尔霍赛因·希尔扎德·加瓦巴里(Amirhosein Shirzad Gavabari)| 赛义德·莫尔泰扎·扎米尔(Seyed Morteza Zamir)| 莫赫森·诺斯拉提(Mohsen Nosrati) 伊朗德黑兰塔比亚特莫达雷斯大学(Tarbiat Modares

  阿米尔霍赛因·希尔扎德·加瓦巴里(Amirhosein Shirzad Gavabari)| 赛义德·莫尔泰扎·扎米尔(Seyed Morteza Zamir)| 莫赫森·诺斯拉提(Mohsen Nosrati)
伊朗德黑兰塔比亚特莫达雷斯大学(Tarbiat Modares University)化学工程学院生物化学工程系

**摘要**
在厌氧消化(AD)过程中,如何在限制腐蚀性硫化氢(H2S)的同时优化生物气中的能量含量仍然是一个关键挑战。本研究提出了一种新的框架,结合了可解释的人工神经网络(ANN)、Shapley加性解释(SHAP)和多目标进化算法(AGE-MOEA),以同时预测和优化来自全规模污水处理厂(WWTP)的生物气中甲烷(CH4)和H2S的浓度。经过超参数调整后,所建立的ANN在甲烷预测方面的R2值为0.78 ± 0.05,在硫化氢预测方面的R2值为0.79 ± 0.04。ShAP分析表明温度是影响甲烷生成的主要因素,而初沉污泥(PS)和碱度则是影响硫化氢生成的主要因素。AGE-MOEA生成了一个帕累托前沿,展示了在最大化甲烷产量与抑制硫化氢生成之间的不同选择。通过调整操作条件,在不超出现场脱硫装置允许的5000 ppm硫化氢浓度上限的情况下,实现了56.4%的甲烷产量和4980 ppm的硫化氢含量,甲烷产量提高了7.6%,硫化氢含量降低了11.6%。这种集成框架为数据受限的厌氧消化环境中提升生物气质量提供了一种透明且基于数据的工具。

**引言**
厌氧消化(AD)是一个复杂的生化过程,其中不同类型的微生物在无分子氧的条件下分解有机物质[1]。这一过程通常包括四个主要步骤:水解(将复杂聚合物分解为简单单体)、酸化(将这些单体转化为挥发性脂肪酸(VFAs)、酒精、CO2和H2)、乙酸化(将VFAs转化为乙酸盐、H2和CO2),最终是甲烷化(将乙酸盐、H2和CO2转化为CH4和CO2)[2]。污水处理厂(WWTP)常利用厌氧消化来稳定污泥、大幅减少污泥体积,并灭活病原体;同时,该过程还能产生可作为可再生能源的生物气[3]。典型的生物气成分中甲烷占50-75%,二氧化碳占25-45%,此外还含有少量氮气(N2)、硫化氢(H2S)、水蒸气等气体[4]。各组分的含量受多种因素影响,包括原料特性、操作参数和工艺设计[5]。生物气的能量值直接与其甲烷含量相关,因此最大化甲烷含量是主要的操作目标之一。

生物气中存在硫化氢会带来诸多问题:硫化氢由含硫有机化合物(如蛋白质、氨基酸)的厌氧降解以及原料中硫酸盐的还原产生[6]。除了对发动机、管道和其他金属部件具有高度腐蚀性外,高浓度的硫化氢对产甲烷的古菌具有毒性,可能对操作人员健康造成危害,并可能破坏用于改善生物气的催化剂[7][8]。因此,特别是在热电联产(CHP)系统中,硫化氢浓度通常需要被控制在5000 ppm以下以防止损坏[8]。

厌氧消化过程本质上非常复杂,表现为非线性动态以及众多操作变量与微生物群落之间的相互作用[9]。在实现最大化甲烷产量的同时最小化硫化氢含量是一个重大挑战:某些可能提升甲烷产量的操作条件反而可能促进硫化氢的生成;而某些抑制硫化氢生成的条件则可能导致生物气中甲烷含量降低。这种生化冲突使得协同优化变得困难。传统的厌氧消化过程控制方法依赖于经验知识、定期实验室检测以及对问题反应迟缓,导致生物气质量管理不佳[10]。因此,先进的预测和优化工具至关重要。然而,现实世界中污水处理厂的数据稀缺(在线传感器不足、实验室分析不规律、数据集不完整)限制了可靠数据驱动模型的开发[11]。数据限制使得构建能够捕捉影响甲烷和硫化氢生成复杂关系的模型变得困难。

已有多种方法用于模拟厌氧消化过程。例如基于生化原理的厌氧消化模型1号(ADM1)能够提供对整个过程的全面理解[12],但这类模型需要大量参数调整,计算复杂且可能无法完全反映所有实际操作变化和微生物动态[13][14]。近年来,数据驱动模型(尤其是机器学习模型)成为有前景的替代方案。人工神经网络(ANN)在预测生物气产量和甲烷含量方面表现出良好性能[15][16],在预测硫化氢浓度方面也有一定应用[17][18],但在同时预测甲烷和硫化氢的单一多输出模型研究方面仍有空白。

许多机器学习(ML)和深度学习(DL)模型(尤其是ANN)的“黑箱”性质使得理解其预测背后的逻辑变得困难[19][20]。为了更好地理解模型及其预测结果,可解释性至关重要。基于合作博弈论的Shapley加性解释(SHAP)技术能够量化每个输入特征对预测的贡献,为模型及其预测提供可靠的解释[21][22]。该技术已成功应用于小样本生物气预测的集成模型解释[22]。

以往的厌氧消化优化研究往往关注单一目标(如最大化生物气产量[23]),虽然多目标优化也被应用于提高生物气产量和甲烷产量[24],但在同时最大化甲烷产量和最小化硫化氢含量的多目标优化研究方面仍存在不足,尤其是在使用可解释数据驱动模型定义目标函数时[25]。近期在可解释人工智能(XAI)领域的进展展示了其在可再生能源应用中的价值,例如结合SHAP特征排名、聚类和预测建模的综合性数据驱动框架可用于优化大规模生物气系统的甲烷产量[25]。陈等人提出的可扩展框架利用SHAP分析确定了工业干式厌氧消化的最佳操作条件,突显了可解释模型在过程优化中的潜力[26]。此外,还开发了一种结合SHAP分析的可解释堆叠集成深度学习模型,用于优化添加生物炭的厌氧消化过程,该模型在保持过程透明度的同时展现了强大的预测准确性[27]。这些研究强调了在生物能源领域结合可解释机器学习与优化策略的日益增长的兴趣。像基于自适应几何估计的多目标进化算法(AGE-MOEA)这样的进化算法非常适合处理此类复杂优化问题[28]。

本研究旨在开发一种可解释的ANN模型,用于同时预测工业厌氧消化过程中生物气中的甲烷和硫化氢浓度。另一个目标是将SHAP分析应用于该模型,以了解操作参数如何影响甲烷和硫化氢的生成。此外,还将在多目标优化框架(使用AGE-MOEA)中利用该可解释模型来寻找既能最大化甲烷产量又能最小化硫化氢含量的操作策略。

本研究基于某污水处理厂实际运行的全规模厌氧消化器的数据,输入变量包括初沉污泥与总污泥的比例(PS分数)、碱度、温度以及进水中挥发性固体含量(VSin)。研究旨在提供一种方法论框架,用于可解释地建模和优化作为生物气质量指标的甲烷和硫化氢浓度。

**数据采集与描述**
本研究的数据来源于伊朗库姆市的第三污水处理厂(Qom WWTP No. 3)。该厂采用活性污泥法处理废水,其厌氧消化阶段采用完全混合的连续流式中温消化系统处理初沉污泥和二次污泥(SS)。消化器的总液体体积为10500立方米,气体体积为3547立方米,流程示意图见图S1。研究使用了166天的数据集。

**超参数调整与ANN模型评估**
通过Hyperband算法进行超参数优化后,最终的ANN模型在预测准确性方面显著优于初始模型。表2显示了该模型的最佳超参数设置,最终优化后的性能指标见表3。优化的ANN模型在硫化氢预测方面的平均均方误差(MSE)为56126。作为对比,还测试了用于单一目标硫化氢预测的模糊决策树模型。

**实际应用价值**
本研究的结果对于实际操作中的甲烷和硫化氢预测与优化具有实用价值。操作人员可根据这些信息将消化器温度维持在最佳范围内,或在条件允许的情况下调整污泥混合比例,以达到所需的生物气质量。此外,多目标优化结果提供了精确的操作参数;在实际应用中,这些参数可被合理调整。

**结论**
本研究开发并评估了一种用于全规模厌氧消化器生物气质量管理的集成可解释AI框架。经过优化的ANN模型包含两个隐藏层和ELU/SELU激活函数,表现出稳健的性能,甲烷预测的R2值为0.78,硫化氢预测的R2值为0.79。ShAP分析表明,消化器温度对甲烷生成影响最大,而初沉污泥比例和碱度对硫化氢含量影响显著。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号