《Scientific Data》:A project-level dataset of Chinese Belt and Road energy investments 2013–2023
编辑推荐:
本刊推荐:为破解中国"一带一路"能源投资数据碎片化难题,研究团队整合AidData、CGEF、AEI和COFI四大数据库,构建了涵盖412个电力项目(2013-2023年)的首个投资项目级数据集。该数据集创新性地系统收录了贷款利率、期限等关键金融参数,并通过经济走廊视角揭示了不同区域的能源技术偏好和融资特征,为评估BRI对全球能源金融、债务可持续性和气候目标的影响提供了精准证据基础。
随着中国"一带一路"倡议(Belt and Road Initiative, BRI)自2013年启动以来,其规模已达到数万亿美元,涉及全球约三分之二的人口和经济总量的三分之一,成为过去十年最大的基础设施倡议之一。在这一宏大框架下,能源基础设施投资尤为突出,中国已成为全球能源领域双边融资的主要来源国。然而,尽管其影响力巨大,但实证评估一直受到数据碎片化和融资条款披露有限的制约。现有公共数据源在范围、方法和覆盖面上存在差异,缺乏中央化的官方数据库,导致无法进行整合分析。特别是,贷款条件(如利率、期限和宽限期)的缺失,限制了对项目可行性、债务偿付状况和长期再融资风险的深入理解。此外,以往研究多集中于国家或区域层面,而基于"经济走廊"这一官方定义的战略分组的细粒度分析仍显不足。这些走廊(如中国-巴基斯坦经济走廊、中国-中亚-西亚经济走廊等)在政策文件中被明确为有针对性的基础设施投资和经济一体化的区域分组,可能反映出不同的政策重点、项目选择和风险特征。因此,构建一个全面、可靠、项目级的BRI能源投资数据集,对于评估其与可持续发展目标和气候目标的契合度至关重要。
为了填补这一研究空白,由伦敦大学学院(University College London)可持续资源研究所的Ge Yin、Alvaro Calzadilla和Raimund Bleischwitz组成的研究团队,在《Scientific Data》上发表了题为"A project-level dataset of Chinese Belt and Road energy investments 2013-2023"的数据描述符文章。研究人员开展了一项系统性的数据整合与验证工作,旨在创建一个涵盖2013年至2023年间中国在BRI参与国能源投资的项目级数据集。该研究的核心方法是整合四个主要的公共数据源:威廉与玛丽学院的全球中国发展融资数据集(AidData)、波士顿大学的中国全球能源融资数据库(CGEF)、美国企业研究所的中国全球投资追踪器(AEI)以及世界资源研究所的中国海外融资清单数据库(COFI)。研究团队采用了严格的数据纳入标准,包括项目时间处于BRI时代(2013-2023年)、东道国为BRI参与国、聚焦能源基础设施以及涉及中国融资。通过一个多阶段的实体解析工作流程,包括基于参考的匹配、去重和验证,最终从989个候选记录中筛选出412个独特的电力部门投资项目。一个显著的特点是,数据集系统性地整理了贷款条款(利率、期限和宽限期),当原始数据缺失时,采用保守的最近邻程序生成带有明确标志的估计值,并提供了模拟的年度债务偿付计划以供分析。每个项目还被分配到一个经济走廊(共8个,包括6个陆上走廊和2个海上分析分组),从而支持区域特定的分析。最终数据集通过交叉验证、范围与异常值分析以及对估算财务条款的验证(比较报告值与估算值的分布)确保了技术可靠性。
数据记录与属性
最终数据集包含了412个独特的BRI能源基础设施项目。每个项目记录由五大类属性描述,确保了数据的全面性和可分析性。项目识别与时间线类提供了项目的基本特征和关键日期,如唯一项目ID、承诺年份(2013-2023年)等。地理与战略背景类指明了项目的位置和战略分组,包括东道国和被指定的BRI走廊。技术规范类提供了项目的技术细节,如装机容量(MW)、能源类型(如煤电、水电、天然气、太阳能等)和能源子行业(如发电、输电)。金融结构类详细记录了项目的融资和条款,包括总投资额(百万美元)、融资方式、主要贷款机构/投资者以及详细的贷款条款(期限、利率、宽限期),这些条款均以"原始值"和"估计值"两种形式呈现,并带有明确的标志以区分。数据来源与定性信息类记录了每个项目条目的来源和背景,包括详细的描述性叙述和用于验证的网页来源链接。
技术验证
为确保数据集的质量和一致性,研究团队执行了多步骤验证协议。交叉验证确保当项目在多个来源中列出时,关键属性(如投资额、容量)的一致性,并通过查阅第三方来源解决差异。范围和异常值分析检查了所有数值字段,确认最大和最小项目均与外部报告一致,且贷款条款的分布符合政策银行贷款规范。对估算财务条款的验证通过统计和可视化比较进行,结果显示估算值的分布(如平均利率原始值为3.79%,估算值为3.85%)与报告值高度一致,表明估算方法没有引入系统性偏差,保留了数据的底层特征。
使用说明
该数据集支持广泛的分析应用。研究人员可以按年份、国家或经济走廊聚合数据,分析投资趋势和技术组合,例如计算各走廊可再生能源与化石燃料的容量比。利用贷款条款字段,可以模拟东道国的债务偿付负担,识别潜在的债务可持续性问题。数据集与外部数据集(如世界银行的国家级指标)的兼容性,便于进行更全面的相关性分析。此外,它还可作为特定国家或项目案例研究的起点,确保个案分析置于更广泛的背景之下。
该研究构建的BRI能源投资项目级数据集,通过整合多源公共数据、实施严格的验证流程并创新性地估算缺失的金融参数,成功解决了该领域数据碎片化和关键信息缺失的核心挑战。其突出贡献在于提供了系统、透明且可追溯的项目级证据,特别是首次大规模地揭示了BRI能源投资的贷款条件。通过引入经济走廊的分析视角,数据集能够揭示不同战略区域的差异化投资模式和融资特征,超越了以往宽泛的地理分类。这不仅为学术研究提供了宝贵的资源,支持对BRI在能源结构、空间格局和债务状况等方面的深入分析,也为政策制定者、金融机构和民间社会组织评估BRI对全球能源转型、债务可持续性和气候目标的深远影响提供了坚实的实证基础。该数据集的开放获取(CC BY 4.0许可)将极大地促进相关领域的跨学科研究和基于证据的政策讨论。