《Bioresource Technology》:Prediction of preparation conditions for low PAHs corn straw biochar guided by CatBoost model optimized via genetic algorithm and molecular dynamics simulation
编辑推荐:
多环芳烃污染控制与生物炭优化制备研究,采用玉米秸秆通过水热碳化制备生物炭,结合机器学习(CatBoost)和分子动力学模拟,揭示制备条件与PAHs含量非线性关系。通过特征重要性分析确定水热时间(30.35%)、氮含量(18.38%)和氢含量(13.37%)为核心影响因素,优化后PAHs含量<347.04 μg/kg,验证误差<2.5%。
Jikai Lu|Jiwei Ma|Bing Wang|Kenji Ogino|Hongyu Si|Yan Li
中国海洋大学工程学院,山东省青岛市三沙路1299号,266100
摘要
生物炭在改良耕作土壤方面显示出巨大潜力,但其所含的多环芳烃(PAHs)具有毒性,可能通过土壤-植物系统威胁生态安全和人类健康。为了优化低PAHs含量的生物炭生产,本研究以玉米秸秆为原料,通过水热炭化实验、机器学习和分子动力学模拟,探讨了制备条件与PAHs形成之间的相关性。建立了一个包含10个输入变量(如水热温度、时间等)和PAHs含量作为输出变量的数据库。在四种机器学习模型中,CatBoost的表现最佳。经过遗传算法(GA)优化后,其测试集R2达到0.9914,提高了对多因素非线性关系的分析能力。特征重要性分析表明,水热时间(30.35%)、氮含量(18.38%)和氢含量(13.37%)是关键因素。偏相关分析显示,超过4小时后,高温会通过脱烷基作用减少PAHs含量,而高氮和氢含量则会促进PAHs的积累。分子动力学模拟证实,延长处理时间会加速碳链断裂,能量变化反映了反应的转变。最佳条件(240–300°C,6小时)下,PAHs含量控制在347.04 μg/kg以下。验证结果显示误差小于2.5%,证实了GA-CatBoost方法的可靠性。本研究为生物炭优化提供了一种数据驱动的策略,有助于其安全农业应用。
引言
生物炭在改良耕作土壤方面具有显著潜力,其应用范围逐渐扩大,功能包括优化土壤结构、增强水分和肥料保持能力以及调节微生物群落(Antonangelo等人,2025年;Shaheen等人,2025年)。然而,生物炭中存在多环芳烃(PAHs)引起了广泛关注。这些持久性有机污染物由两个或多个苯环融合而成,具有致癌、致畸和致突变性(Si等人,2025年)。当生物炭施用于土壤时,PAHs会持续积累,破坏土壤微生物群落的结构和功能,降低土壤酶活性,并影响土壤生态系统的物质循环和能量代谢。此外,PAHs可通过植物吸收进入食物链,威胁农产品安全和人类健康(Barbosa等人,2023年;Sahoo等人,2020年)。生物炭在水热制备过程中PAHs的形成与原料性质、制备条件和元素组成密切相关(Buss等人,2022年)。富含木质素的原料(如木屑和作物秸秆)由于其结构中含有大量芳香化合物,在制备过程中更容易通过环化和聚合反应生成PAHs(Marcińczyk等人,2023年;Si等人,2025年)。相比之下,高纤维素和半纤维素含量的原料(如草本植物)通过水解产生的小分子片段较多,通常PAHs含量较低(Alharbi等人,2023年)。水热处理时间对PAHs形成的影响呈先增加后减少的动态趋势,而非简单的线性关系。在水热反应的早期阶段,随着时间的延长,原料水解产生的自由基和不饱和烃中间体逐渐积累,为环化反应提供足够的底物,导致总PAHs含量随反应时间增加(Weidemann等人,2018年)。随着水热处理时间的延长,一些高环PAHs可能因高温而发生裂解或碳化,导致其含量随时间减少(Zhao等人,2020年)。此外,原料中的蛋白质和脂质等成分为PAHs的形成提供了碳、氢、氮等元素来源(Sarma等人,2024年)。鉴于PAHs对环境和人类健康的潜在风险,以及生物炭在土壤改良中的重要价值,迫切需要通过优化生产条件来有效控制PAHs含量,以确保生物炭技术的可持续发展和安全应用。
为了深入探讨生产条件与PAHs浓度之间的复杂关系,专家和学者们通过实验研究不断优化水热炭化过程。制备温度会引发脱水、脱羧和脱氢反应。Devi(2023年)观察到在500–600°C下所有原料中的PAHs含量均有所增加。Shen(2022年)和Siatecka(2023年)也通过实验观察了制备温度和持续时间对生物炭中PAHs浓度的影响。一些实验建议使用不同的生产设备和工艺,以使反应更加均匀,并减少局部过热导致的PAHs大量生成(Cui等人,2022年)。仅依靠实验和经验来推断低PAHs生物炭的生产过程需要大量的工作条件设计和成本投入(Ullah等人,2023年)。这种方法不仅无法系统地处理因变量和自变量之间的复杂关系,也无法在单一影响因素变化时探索最佳条件,也无法揭示实际工程应用中的变化规律或确定多因素影响下的最佳应用条件(Sun等人,2024年)。近年来,机器学习技术逐渐应用于这一领域。基于梯度提升决策树算法的机器学习预测模型具有可并行计算、良好的可解释性和鲁棒性,并且对于密集数据分布具有强大的表达能力和泛化能力(Balasubramanian等人,2024年;Eltohamy等人,2025年)。研究人员收集了大量关于不同原料和制备条件的数据来构建预测模型(Li等人,2024年;Zhang等人,2023年)。例如,Zhang(2024年)使用随机森林和梯度提升决策树等机器学习模型来预测和分析与生物炭性质相关的制备条件,发现制备条件显著影响生物炭的性质。建立基于机器学习的PAHs形成预测模型可以综合考虑原料、时间、元素组成和其他热解参数。通过学习大量数据,可以揭示复杂因素之间的隐藏规律,准确预测不同生产条件下的PAHs生成情况,并为优化生产条件和实现有效PAHs控制提供科学指导。这有助于促进生物炭在土壤改良等领域的安全和高效应用。
本研究收集了10组参数,包括制备条件、元素含量和生物炭制备过程中的物理化学性质,以建立数据库。通过研究不同参数与生物炭中PAHs含量变化之间的关系,旨在预测低PAHs含量的玉米秸秆生物炭的生产条件。比较了多种机器学习预测模型,并根据相关系数和平均绝对误差选择了适合本研究的模型。针对机器学习模型中超参数的非线性耦合特性(如n估计器、max_depth、learning_rate和L2_leaf_reg),提出了遗传算法-机器学习模型的自适应框架优化算法。通过特征重要性和偏相关分析解释了机器学习模型的预测结果,以识别对生物炭中PAHs含量有显著影响的因素。创新性地引入了分子动力学模拟计算,揭示了部分参数在PAHs形成早期阶段对生物质碳链断裂过程的能量影响。综合考虑生物炭的炭化程度、毒性和生产能耗,选择了适合玉米秸秆生物炭的水热制备条件。本研究可以为生物质能源的全面开发与利用、环境保护等领域提供数据和理论支持。
数据编译和预处理
本研究选择玉米秸秆作为生物炭生产的原料。原料来自山东省济南市郊区的农田,经过清洗、自然风干后,使用高速多功能研磨机(HD2500,LINGSUM,中国)进行研磨。研磨后,通过2毫米筛网过滤并储存以备后续使用。将100克处理后的玉米秸秆粉与500毫升去离子水混合,充分搅拌
数据集分析
为了分析生产过程对生物炭中PAHs含量的影响,我们在不同的水热温度和持续时间下分批制备生物炭,并检测了C、H、O、N、pH、SSA、EC、APV和PAHs的含量。通过对小提琴图和箱线图的综合分析,发现九组参数在数据分布特征、中心趋势和离散程度上存在显著差异。C的箱线图的中位数为62.96%,Q1 = 54.85%
结论
在生物质水热炭化过程中,纤维素、半纤维素和木质素通过水解和重组形成有毒的PAHs。本研究提出了一个遗传算法优化的CatBoost框架(GA-CatBoost)来寻找最佳生产条件。该框架保留了有序提升的优势,能够捕捉非线性特征交互作用,训练集和测试集的R2分别为1.0000和0.9914。影响PAHs的关键因素是时间、氮(N)和氢(H)。时间通过降解作用抑制PAHs的生成,而高N/H比则促进PAHs的生成
CRediT作者贡献声明
Jikai Lu:撰写——原始草稿、方法论、研究、数据管理、概念化。Jiwei Ma:研究、数据管理。Bing Wang:撰写——审稿与编辑、监督、资金获取。Kenji Ogino:撰写——原始草稿、数据管理。Hongyu Si:监督、资金获取。Yan Li:撰写——审稿与编辑、监督。
资助
本研究得到了中国国家自然科学基金青年基金(编号32202606)、山东省自然科学基金青年基金(编号ZR2022QC056)和中央高校基本科研业务费(编号202461069)的支持。
利益冲突声明
作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。
致谢
作者感谢Qi Chenxiao先生(来自Scientific Compass www.shiyanjia.com)在BET分析方面提供的宝贵帮助。