一个以数据质量为导向的框架，用于构建中国煤炭行业的高分辨率省级生命周期评估（LCA）数据库

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月10日 来源：Journal of Cleaner Production 10

编辑推荐：

　　精准且区域代表性强的生命周期评估（LCA）数据对高耗能行业碳核算至关重要，但区域化LCA数据库开发面临异构数据源、标准不一致及质量参差等挑战。本研究提出数据质量驱动-加权模糊逻辑模型（DQR-WFLM）框架，通过数据质量评级实现多源异构数据优先级排序与条件融合，以中国23个产煤省份甲烷排放因子（MEFs）为案例，证明融合数据在方差降低和结果稳健性上优于单一数据源，同时保留区域异质性。该框架为空间异质性显著的行业构建区域化LCA数据库提供了可复用的方法论。

李兆军|李新宇|桂志军|刘涛|周静|王玉萌|孙兆鑫|宋小龙

上海HiQ智能数据有限公司，中国上海，200441

摘要

准确且具有区域代表性的生命周期评估（LCA）数据对于能源密集型行业的可靠碳核算至关重要。然而，由于数据来源的多样性、标准的不统一以及数据质量的不同，开发区域化的LCA数据库面临诸多挑战，尤其是在将自下而上的测量结果与自上而下的统计数据相结合时。本研究为中国的煤炭行业开发了一个高分辨率的省级LCA数据库，并提出了一种基于数据质量的集成框架来解决这些问题。引入了一种数据质量评级-加权模糊逻辑模型（DQR–WFLM）框架，以支持在异构条件下的透明数据源优先级排序和条件集成。该框架结合了数据质量评估，允许对多个数据源进行明确的决策规则，包括筛选、优先级排序和集成。以甲烷排放因子（MEFs）为例进行研究，这些因子具有空间异质性和数据类型之间的差异。通过对23个产煤省份的应用发现，采用了不同的数据处理策略，如基于预定义质量标准的单一数据源优先排序和数据融合。条件数据融合确保了MEFs的内部一致性和可追溯性。蒙特卡洛不确定性分析表明，融合后的数据比单独使用自下而上或自上而下的数据具有更低的方差，证实了该框架的有效性。最终的省级煤炭LCA数据库包含1473个数据集，在保持区域异质性的同时确保了不确定性传播的透明度。将其应用于热力发电领域，表明使用区域化数据可以提高碳足迹结果的稳健性和可解释性。所提出的框架为在具有显著空间变异性的行业中开发区域化LCA数据库提供了一种可转移的方法。

引言

在全球努力减缓气候变化和推进碳中和的背景下，对温室气体（GHG）排放的稳健和透明量化已成为政策制定、工业决策和企业碳管理的先决条件（Frischknecht等人，2005；Goglio等人，2020；Li等人，2017）。生命周期评估（LCA）为评估产品生命周期的环境影响提供了一个系统框架，并广泛应用于国家清单、行业评估和产品碳核算（Chau等人，2015；Li等人，2019）。然而，LCA结果的稳健性和可比性在很大程度上取决于基础数据的质量和完整性。在具有强烈区域异质性的能源密集型行业中，背景数据库的局限性——如空间分辨率粗略、数据来源多样以及数据质量不均衡——会显著影响下游结果，并引入难以解释或追踪的不确定性（Hellweg和Milà I Canals，2014；Duval-Dachary等人，2023；Kalverkamp等人，2020；Takano等人，2014）。

尽管取得了持续进展，LCA数据库的开发仍面临持续挑战。数据来源的多样性和标准的不统一导致透明度和可追溯性受限，而自下而上的测量结果与自上而下的统计数据之间的差异阻碍了多源数据的一致集成（Baitz和Piotrowski，2025；Gavankar和Suh，2014；Guo等人，2025；Tan等人，2025）。此外，大多数广泛使用的数据库缺乏足够的地理分辨率，限制了它们捕捉区域变异性的能力，可能会使评估结果产生偏差（Teixeira，2015）。为此，出现了两个主要的研究方向：区域化LCA数据库开发和数据质量评估框架。

像ecoinvent和GaBi这样的通用数据库提供了全面的覆盖范围和方法一致性，但往往无法反映当地技术、能源结构和地理条件（ecoinvent，2025；GaBi，2025）。因此，已经提出了许多区域化方法，包括农业（Pogue等人，2024）、建筑和建设（Alaux等人，2024；Benke等人，2025）以及使用多区域投入-产出技术的更广泛的工业系统（Nouhoun等人，2025；Peng和Pfister，2024）。这些研究表明，提高空间分辨率可以显著提高代表性和决策相关性。

与此同时，LCA中的数据质量和不确定性管理已经从定性的谱系矩阵发展到更系统的、基于数据质量指标（DQI）的框架（Balcioglu等人，2025；Weidema和Wesn?s，1996）。例如，ecoinvent从五个质量维度评估数据，而GaBi引入了与PEF和ILCD指南一致的一致性标准（Ciroth等人，2016）。最近的研究开始将区域化与不确定性或数据质量考虑联系起来，例如使用全球敏感性分析来优先考虑区域化工作（Patouillard等人，2019）或应用多层次建模来保持空间和时间变异性（Dai等人，2020）。然而，这些方法通常将区域化和数据质量管理视为平行步骤，而不是一个用于积极协调冲突多源数据的集成框架。

这种局限性在具有强烈空间异质性的能源密集型行业中尤为明显，例如中国的煤炭生产。煤炭仍然是全球能源系统的基石，其生命周期排放对国家温室气体清单和下游碳足迹结果有重大影响（Wang等人，2019；Zhang等人，2023，Zhang等人，2023）。尽管中国几十年来一直是世界上最大的煤炭生产国（中国国家统计局，2025），但现有的关于中国煤炭的研究主要集中在区域甲烷排放特征上，而不是构建全面的区域化LCA数据库（Chen等人，2024；Sheng等人，2019；Wang等人，2019；Zhang等人，2023，Zhang等人，2023）。此外，这些研究通常依赖于单一数据来源，限制了它们的稳健性和一致性。在现有的中国LCA数据库项目中，TianGong数据库代表了编制区域差异化煤炭相关清单数据的重要努力（TianGong，2025）。然而，现有文档表明，其数据质量管理主要依赖于传统的基于DQI的评估来表征数据集质量，而没有提出专门的方法框架来筛选、协调和融合自下而上和自上而下的数据来源。因此，在异构数据条件下解决多源数据冲突和提高稳健性的系统机制仍然有限。

为了解决这些差距，本研究提出了一种基于数据质量的、多阶段的动态数据集成框架，将数据质量评级（DQR）与加权模糊逻辑模型紧密结合。该框架专注于中国的煤炭行业，系统地将自下而上的矿级数据与自上而下的统计数据相结合，构建了一个高分辨率的省级LCA数据库。通过将数据质量评估直接嵌入区域化数据库开发过程中，所提出的方法主动限制了不确定性传播，增强了内部一致性，同时保留了有信息量的区域异质性。该框架通过下游碳足迹应用得到了进一步验证，展示了其在其他具有强烈空间变异性的行业中开发区域化LCA数据库的潜在适用性。

部分摘录

数据库系统边界和范围定义

本研究开发的省级煤炭行业LCA数据库旨在作为支持各种下游LCA应用的背景数据库，而不仅仅是一个单一的案例研究。该数据库涵盖了煤炭产品的从原材料提取到最终产品交付给下游用户或配送中心的整个生命周期（图1）。

煤炭开采的系统边界从煤层暴露开始（通过露天或地下开采）

结果与讨论

本研究提出了一种在数据异质性和不完整条件下构建区域化LCA数据库的规范数据源优先级排序和条件集成框架。DQR–WFLM框架的设计目的是在不确定性下结构化数据处理决策，确保数据源选择和集成遵循透明、可复制和可审查的规则。

该框架的一个核心前提是

结论

本研究为中国煤炭行业开发了一个省级LCA数据库，并提出了一种规范的数据源优先级排序和条件集成框架（DQR–WFLM），以应对数据不完整和不均衡条件下的持续数据异质性问题。该框架的设计目的是使数据处理决策在区域化LCA数据库构建过程中明确、可审查和可复制，而不是试图近似一个不可观察的“真实”排放因子。

使用MEFs——

CRediT作者贡献声明

李兆军：撰写——原始草稿，概念化。李新宇：撰写——审阅与编辑，调查，数据管理。桂志军：方法论。刘涛：验证。周静：监督。王玉萌：调查。孙兆鑫：验证，方法论。宋小龙：监督，项目管理。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。

致谢

本研究得到了国家自然科学基金（42471331）的支持。

联系信箱：

粤ICP备09063491号

摘要

引言

部分摘录

数据库系统边界和范围定义

结果与讨论

结论

CRediT作者贡献声明

利益冲突声明

致谢

热点排行