《Journal of Environmental Chemical Engineering》:Interpretable framework based on stepwise virtual sample generation for accelerating accurate PCDD/Fs prediction and assessing emission control strategies under small-sample conditions
【字体:
大中小
】
时间:2026年02月05日来源:Journal of Environmental Chemical Engineering 7.2
编辑推荐:
准确预测城市固体废物焚烧炉烟气中多氯二苯并二恶英和二苯并呋喃(PCDD/Fs)排放受限于高维数据和小样本集,导致传统机器学习模型预测精度和泛化能力不足。本研究提出分步虚拟样本生成(VSG)可解释框架,通过迭代优化避免一次性生成低质量虚拟样本的局限性,使随机森林模型RMSE降低60.52%,MAPE降低68.47%,并揭示最佳虚拟样本量与原始样本量呈指数关系。基于Shapley值解释和部分依赖图分析,确定了多参数协同控制策略,将PCDD/Fs排放降低至0.023 ng TEQ/Nm3。该框架为小样本场景下高精度预测模型开发和排放控制策略制定提供可靠工具。
董露露|吴玉佳|侯东|王孔昭|张伟|张晋|尚凡杰|唐少福|唐明珠|卢胜勇
浙江大学清洁能源利用国家重点实验室,杭州,310027,中国
摘要
由于高维性和有限的离线数据集,准确预测城市固体废物焚烧烟气中多氯二苯并-p-二噁英和二苯并呋喃(PCDD/Fs)的排放量受到限制,导致传统机器学习模型的预测准确性和泛化能力不佳。为了解决这一小样本问题,本研究提出了一种基于逐步虚拟样本生成(VSG)的可解释框架。与传统方法不同,该框架不是一次性生成所有虚拟样本,而是每一步只生成50个虚拟样本,并通过迭代优化预测模型,从而突破了初始模型对虚拟样本质量的限制。综合验证实验表明,逐步VSG具有更好的有效性和鲁棒性。生成的虚拟样本在减少预测误差方面表现出有效性和跨模型适用性,使得均方根误差和平均绝对百分比误差分别降低了60.52%和68.47%。同时,性能极限和最佳虚拟样本量与原始样本量之间存在指数依赖关系。这些关系为该框架在实际工程中的应用提供了科学的建模策略和定量监测预算。最后,Shapley加性解释和部分依赖图分析揭示了一种多参数协同控制策略,理论上可将PCDD/Fs排放量降低到0.023 ng TEQ/Nm3。所提出的框架在高精度预测模型的定量开发和小样本条件下的排放控制策略评估方面显示出巨大潜力,从而支持有效的PCDD/Fs管理。
引言
随着经济的快速发展和城市化的加速,城市固体废物(MSW)的产生量正在迅速增加[1]。作为一种有效的处理方法,焚烧已被全球采用[2]。多氯二苯并-p-二噁英和二苯并呋喃(PCDD/Fs)被认为是MSW焚烧过程中最具毒性的物质,具有致癌、致畸、持久性和生物累积性[3]、[4]、[5]。现有研究表明,即使在MSW焚烧器正常运行期间,烟气中的PCDD/Fs的国际毒性当量(I-TEQ)值也可能超过GB 18485-2014标准规定的排放限值(0.1 ng TEQ/Nm3),达到0.5-0.7 ng TEQ/Nm3[6]、[7]、[8]。这突显了监测PCDD/Fs排放的重要性。目前,测量MSW焚烧(MSWI)排放的主要方法是离线采样。这种方法至少需要一周时间才能完成,导致成本高昂且结果滞后,仅适用于年度测量[9]、[10]。这些限制使得监管机构和公众无法在非采样期间获得真实的PCDD/Fs排放数据,也阻碍了对焚烧器运行条件的及时调整。因此,迫切需要开发快速准确的预测模型和在线监测技术,以实时获取PCDD/Fs排放信息。