通过厌氧消化处理食物废弃物的工程优化:构建因果机器学习网络以进行全面分析

《Journal of Cleaner Production》:Engineering optimization of food waste treatment via anaerobic digestion: Building causal machine learning networks for comprehensive analysis

【字体: 时间:2026年01月23日 来源:Journal of Cleaner Production 10

编辑推荐:

  食品废料厌氧消化效率优化面临实验室到工业规模转化的挑战,本研究构建因果机器学习框架,通过可解释特征分析、因果推断和反事实预测,揭示挥发性脂肪酸(VFA)的双重作用(平均处理效应0.41)和氨氮浓度(平均处理效应1.97)的影响机制,建立变量间的定量因果网络(如1m3日投料量增加导致VFA浓度13.2%上升),并确定关键参数阈值,为工程稳定性优化提供理论支撑。

  
Fangyun Wang|Yi Zhang|Jianfeng Peng|Yu Fu|Hao Wan|Jinling He|Jianping Su|Yanjuan Lu|Yeqing Li
中国石油大学(北京)新能源与材料学院生物气升级利用重点实验室,北京,102249,中国

摘要

目前,食物垃圾厌氧消化(AD)的效率面临着将实验室优化的生物过程转化为稳定工业规模运营的挑战。本研究开发了一个综合的因果机器学习框架,该框架结合了可解释的特征分析、因果推断和反事实预测。该研究构建了一个两阶段预测建模框架(R2 = 0.95),并进行了SHAP分析以确定变量之间的相关性。随后,应用因果推断模型来区分协变量和混杂变量的影响,阐明了挥发性脂肪酸(VFA)作为底物和毒素的双重作用,平均处理效应(ATE)为0.41,以及总氨氮(TAN)的浓度依赖效应(ATE = 1.97)。因果分析模型构建了变量之间的定量因果关系网络(每日进料量增加1立方米会导致VFA浓度增加13.2%),并识别出显著的相关性(p值<0.05)。反事实模拟进一步确定了关键参数的可行操作阈值。这一框架和发现为提高厌氧消化系统的效率和稳定性提供了理论见解和优化策略。

引言

可持续的食物垃圾管理已成为全球环境治理中的一个关键问题(González-Nú?ez等人,2023;Huang等人,2024)。厌氧消化(AD)是一种先进的生物转化技术,因其能够通过厌氧甲烷生产过程实现有机垃圾减少和可再生能源回收而受到广泛关注(Ali等人,2023;Li等人,2018;Pan等人,2021)。研究表明,优化操作条件可以显著提高甲烷产量(Nie等人,2024;Zhan等人,2023)。然而,将实验室优化结果应用于工程实践仍然是一个挑战(Zhong等人,2022)。因此,全面优化反应条件以提高食物垃圾厌氧消化的效率和稳定性仍然是一个紧迫的技术挑战。
最近,人工智能(AI)技术发展迅速(Saha等人,2021),机器学习为优化厌氧消化过程提供了一种新的方法(Khan等人,2023)。在先前的研究中,可解释的机器学习技术已被用于分析基于植物的厌氧发酵(Zhang等人,2023)、生物炭促进的AD(Zou等人,2024)和热水预处理的AD(Zhang等人,2024)。尽管这些模型揭示了单个变量与AD性能之间的几个有意义的相关性,但它们未能充分考察系统层面的因果相互作用。因此,现有模型存在根本性局限,这源于对代谢途径的机械理解不足,以及在数据分析中对局部最优解的敏感性,加上在数据稀疏区域的过拟合(Mi等人,2020;Rudin,2019)。因此,在动态工业环境中确保一致的性能具有挑战性(Wei等人,2024)。
相比之下,因果机器学习的兴起为克服这些挑战提供了有希望的解决方案。通过建模潜在的因果机制,因果机器学习能够有效区分因果效应和虚假相关性,克服了传统方法在量化变量间因果依赖性方面的局限性(Kuang等人,2020)。与传统方法仅关注相关性不同,因果机器学习为复杂系统中的决策提供了可解释的科学依据(Liao等人,2023;Richens等人,2020)。Jia等人应用因果机器学习揭示了流域中参与氮代谢的微生物群落的因果驱动网络(Jia等人,2024)。迄今为止,因果机器学习尚未被应用于分析食物垃圾厌氧消化,特别是在深度可解释性和变量间的因果关系方面。因此,本研究提出将因果机器学习与传统的机器学习方法相结合,以量化变量间的因果依赖性。这种整合可以增强对食物垃圾厌氧消化过程的机械理解,并解决从算法模型优化到实际应用过程中的挑战。
本研究探讨了全规模食物垃圾厌氧消化的可解释性。我们提出了一个因果机器学习框架,该框架将系统层面的关系映射与反事实预测相结合,从而实现更清晰的机械理解和更可靠的过程优化。

材料与方法

本研究采用的方法如图1所示。首先,从食物垃圾厌氧消化厂收集了有关食物垃圾的数据。进行了初步的数据预处理,包括数据筛选和标准化。对于少量的缺失数据,使用了三种机器学习算法进行数据插补和评估,以选择最优的数据集。接下来,根据工艺流程和专家意见

数据插补和双层机器学习预测的有效性

在应用三种机器学习算法——k最近邻(KNN)、随机森林(RF)和轻量级梯度提升机(LGB)来插补数据集中的缺失数据后,研究了每种插补方法的性能。KNN算法的表现优于其他算法,在沼气生产测试集上获得了0.8111的R2(有关插补性能的更多细节,请参阅支持信息图S2)。尽管某些指标表明LGB和

结论

本研究提出了一个用于食物垃圾厌氧消化的因果机器学习框架,该框架整合了预测、因果效应估计和反事实模拟,以支持系统层面的解释和优化。该研究提出了一种综合方法,将算法建模与第一性原理分析相结合,以实现厌氧消化产生的沼气的全面监测、解释和优化。我们的分析阐明了对沼气生产的直接效应和

CRediT作者贡献声明

Fangyun Wang:撰写 – 审稿与编辑,撰写 – 原始草稿,可视化,验证,软件,资源,项目管理,方法论,调查,正式分析,数据管理,概念化。Yi Zhang:撰写 – 审稿与编辑,可视化,验证,监督,正式分析。Jianfeng Peng:方法论。Yu Fu:可视化。Hao Wan:可视化,正式分析,数据管理。Jinling He:撰写 – 审稿与编辑,可视化,监督,数据

注释

作者声明没有竞争性财务利益。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

本工作得到了国家自然科学基金(编号:22278435)和碳中和研究院基金(编号:20220202,编号:20230102)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号