机器学习与克里金方法的比较研究:在数据稀缺、受季风影响的地区提升风能资源评估的准确性

《Remote Sensing Applications: Society and Environment》:A Comparative Study of Machine Learning and Kriging: Improving Wind Resource Assessment in Data-Scarce, Monsoon-Affected Regions

【字体: 时间:2026年02月05日 来源:Remote Sensing Applications: Society and Environment 3.8

编辑推荐:

  机器学习与地统计学Kriging在印度尼西亚Sumba岛水平风速插值中的对比研究,基于2023年NASA POWER数据。结果显示,梯度提升回归器(GBR)在无空间特征时表现最优,点预测误差最低;指数Kriging模型在干季表现最佳。ML模型在湿干季保持更高稳定性,而Kriging提供可解释的误差区间,两者结合提升风能项目可靠性。

  
Nurry Widya Hesty | Dionysius Aldion Renata | Bono Pranoto | Prima Trie Wijaya | Rudi Purwo Wijayanto | Didik Rostyono | Silvy Rahmah Fithri | Vetri Nurliyanti | Agus Nurrohim | Erwin Siregar | Arief Heru Kuncoro
印度尼西亚国家研究与创新机构(BRIN),能源转换与保护研究中心,南丹戎15314

摘要

全球向可再生能源的转型需要准确的风能资源评估,尤其是在数据稀缺、地形复杂且季节性变化显著的地区。本研究使用2023年NASA POWER网格化数据,在季风影响条件下,对印度尼西亚松巴岛的水平风速插值方法进行了机器学习(ML)和地统计克里金(Kriging)方法的比较分析。评估了十二种ML算法(包括集成方法、回归方法和深度学习方法),并在两种特征场景下进行了测试(包含和不包含简单空间描述符:距离和方位角),采用跨站点训练框架,四个训练地点,Hambapraing作为未见过的目标站点。同时测试了五种克里金变异函数模型,其中指数变异函数模型在所有评估配置中表现最佳。在这个特定的数据集和实验设计中,不使用空间特征的梯度提升回归器(GBR)在测试的ML模型中实现了最高的预测准确性,并优于指数变异函数克里金。季节性分析进一步表明,在干燥季风期间,当风场更加稳定时,ML和克里金的表现都更好。尽管如此,与克里金相比,ML在湿润和干燥季节都保持了略微更一致的准确性。这些发现突出了在受季风影响、数据有限的环境中进行早期风能资源映射时的实际权衡:ML可以提供强大的点预测准确性,而克里金则提供了可解释性和与不确定性相关的信息,有助于风险意识规划。整合这两种方法可以提高受季风影响、数据有限环境中的风能项目的可靠性和可行性,最终支持更有效的选址和可持续能源发展。

引言

全球向可再生能源的转型加剧了对准确风能资源评估的需求。风能作为化石燃料最有前景的替代品之一,需要精确估计风速分布以优化选址和能源产量预测。然而,风速测量通常较为稀少且局限于特定地点,这在评估较大范围内的风能资源时带来了重大挑战。
因此,风速数据的水平插值对于填补监测站之间的空白和构建高分辨率的风能资源图至关重要。风速插值的一个主要挑战是大气条件的空间变异性,这受到地形复杂性、表面粗糙度和气象波动等因素的影响。传统的插值方法,如逆距离加权或线性回归,往往无法捕捉风速变化的非线性和随机性。因此,需要先进的数据驱动方法来提高未探索地点的风速分布预测准确性。对风能资源的全面评估需要比较各种建模技术,突出不同拟合优度测试在确定每种情况下最准确方法方面的有效性(Khan等人,2024年)。
水平风速的准确空间插值在多个科学和应用领域都起着关键作用。在风能评估中,风速估计中的小空间误差可能导致风功率密度和年能源产量的不确定性不成比例地增大,直接影响选址、项目可行性和投资风险。在气候和大气建模中,水平风场控制着地表-大气交换、水分传输和中等尺度环流模式,特别是在受季风影响的地区,空间一致性随季节变化。同样,在气象预报和灾害评估中,可靠的空间风信息对于表示沿海环流、对流过程和极端风事件至关重要,尤其是在观测网络稀疏的地区。因此,提高水平风速插值的准确性和稳健性不仅是一个方法论挑战,也是可再生能源规划、气候分析和操作气象学中更可靠决策的先决条件。
两种方法论范式已成为水平风速空间插值领域的领先者:地统计方法,如克里金,它利用空间自相关结构;以及ML算法,它可以捕捉环境变量之间的非线性依赖性和高阶交互作用。ML方法能够从数据中自适应学习,从而在风预测场景中提高预测准确性,特别是在地形变化显著影响风模式的异质环境中(Slot等人,2020年)。相比之下,克里金也被用于此目的。克里金有潜力提供更精确的置信区间估计,这对于潜在风电场的风险评估非常有价值(Samalot等人,2019年)。克里金在各种环境中都展示了其适用性,从城市环境到海上条件(Elshafei等人,2023年;P. Zhang等人,2022年)。
虽然克里金和ML技术在环境建模和空间预测方面都展示了潜力,但关于它们在水平风插值中的有效性的比较研究仍然不足,特别是在异质性和数据受限的环境中。以往的研究往往集中在垂直风剖面或区域尺度预测上,而没有充分考虑影响近地面风变化的局部空间动态(Baquero等人,2022年;Hu等人,2020年;Pu等人,2024年;Rouholahnejad等人,2023年;Rouholahnejad & Gottschall,2024年)。
现有文献在ML和克里金技术的直接比较分析方面存在明显空白,特别是在数据有限的场景下进行水平风插值时。虽然之前的研究独立探讨了ML和克里金的应用,但缺乏全面分析它们在异质环境和测量站稀少情况下插值风速数据的优缺点。此外,ML模型的模型参数和超参数优化以及克里金变异函数模型的选择在风能资源评估的背景下尚未得到充分探索。
本研究旨在通过深入比较十二种不同的ML算法(重点关注超参数调整)并评估五种克里金变异函数模型来解决这些空白。本研究的新颖之处在于解决了两个关键问题。首先,这是首次在受季风影响的热带岛屿松巴岛上专门比较ML和克里金,该岛在空间异质性、季节性变化和观测数据稀少方面面临独特挑战。其次,本研究首次引入了季节性分析,通过对比湿润和干燥季风条件,提供了关于时间动态如何影响模型准确性和不同季节插值稳定性的见解。
通过同时考虑空间异质性和季节性变化,本研究为数据稀缺的热带地区优化风能资源评估提供了新的视角。此外,它强调了理解风场预测中季节性动态的重要性,这一点在以往的研究中尚未得到充分探讨。这种对方法论和季节性的双重关注使本研究区别于以往的工作,特别是在热带季风环境中。
除了技术性能评估外,本研究还探讨了模型选择对风能资源评估的更广泛影响。具体来说,模型性能比较的发现与其对政策框架、监管标准、技术采用和长期研发优先事项的实际意义进行了相关探讨。这种双重关注确保了结果不仅在方法论上严谨,而且直接适用于可再生能源规划的战略决策。
通过这样做,本研究不仅促进了方法论的进步,也具有实际应用价值。作为首次在热带季风岛屿背景下结合ML和克里金的比较评估以及季节敏感性分析的研究,该研究提高了风能评估的可靠性和可行性。研究结果预计将支持在受季风影响、数据有限的地区进行更有效的选址、不确定性管理和投资策略,最终促进可持续能源发展。

研究区域和数据收集

本研究在印度尼西亚东努沙登加拉省的松巴岛进行。松巴岛的风场空间异质性受其多样地形的影响,包括平坦的沿海平原、陡峭的高地地区和山区。与许多受季风影响的沿海和山区类似,松巴岛由于地形和气象因素的影响,经历强烈的季节性风向变化和风速及风向的显著变化

使用ML方法进行水平插值

表3总结了在两种情况下每种ML和DL模型获得的最优超参数:包含和不包含空间特征(距离和方位角)。所有模型都通过网格搜索进行调优,以确定最佳的超参数组合。对于基于集成的模型(如RF、XGBoost和GBR),估计器的数量始终设置为200,以确保足够的树多样性以实现稳健的预测。然而,在控制参数方面观察到了差异

结论

本研究使用2023年NASA POWER网格化数据,在受季风影响的条件下,评估了ML和地统计克里金方法在松巴岛的水平风速插值中的应用。在所考察的实验设计和数据限制范围内,GBR在测试的跨站点任务中实现了较低的点插值误差,而指数变异函数克里金提供了一个具有明确不确定性信息的可解释空间框架,这对风能评估非常有价值

CRediT作者贡献声明

Erwin Siregar:正式分析。Arief Heru Kuncoro:撰写——审阅与编辑。Vetri Nurliyanti:正式分析。Agus Nurrohim:监督、正式分析。Bono Pranoto:撰写——初稿、概念化。Prima Trie Wijaya:软件。Nurry Widya Hesty:撰写——审阅与编辑、撰写——初稿、可视化、方法论、正式分析、概念化。Dionysius Aldion Renata:软件、方法论。Didik Rostyono:撰写——审阅与编辑。Silvy Rahmah Fithri:

未引用参考文献

Maria Marsella Co-Advisor Carlo L Bottasso, 2025; Meli`i等人,2013; Wang等人,2020.

数据访问声明

数据可应要求提供

利益冲突声明

作者声明与本文的发表没有利益冲突。

伦理声明

本研究不涉及任何涉及动物或人类参与者的实验程序。因此,无需伦理批准。调查符合机构和国际关于科学诚信的协议,从而确保遵守既定的伦理规范。所有数据都是经过审慎和透明地收集和审查的,体现了对维护研究诚信的坚定承诺。

伦理声明

作者确认本手稿遵守Elsevier的出版伦理指南。所有作者都对研究做出了实质性贡献,批准了手稿的最终版本,并同意提交。该工作是原创的,尚未在其他期刊上发表,也未被其他期刊考虑。作者声明没有利益冲突,并同意遵守负责任的数据处理和报告标准。

生成式AI声明

在准备这项工作时,作者使用ChatGPT提高了手稿的可读性,并使用Scite AI搜索参考文献。在使用这些工具/服务后,作者根据需要审查和编辑了内容,并对最终出版负全责。

利益冲突声明

? 作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

作者衷心感谢国家研究与创新机构BRIN)的支持。我们还要感谢NASA兰利研究中心(LaRC)POWER项目提供本研究使用的数据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号