《Scientific Data》:A global 0.05° gross primary production dataset from 2001 to 2024 generated using a hybrid LSTM framework
编辑推荐:
本研究为解决全球总初级生产力(GPP)估算在季节性和年际变化上存在显著差异的问题,开发了一套名为TRAX GPP的全球0.05°空间分辨率、月度覆盖(2001-2024年)的数据集。该研究采用集成了稳健季节趋势分解(RSTL)和时间学习优化损失函数的混合长短期记忆(LSTM)框架,结合卫星植被、气象驱动因子及大气CO2同化约束,显著提升了GPP估算精度,尤其改善了对CO2施肥效应的捕捉。结果表明,TRAX GPP与通量塔测量吻合良好,在季节动态和年际波动方面优于标准LSTM模型,并缓解了全球GPP总量和年际趋势的常见偏差。该数据集为全球GPP估算提供了新途径,支持陆地碳动态的精细化监测。
植物通过光合作用固定的碳,构成了地球生命和气候系统的基石。这个被称为总初级生产力(Gross Primary Production, GPP)的过程,是全球能量和碳循环的核心。然而,尽管其重要性不言而喻,科学家们对全球GPP的准确估算却一直面临着巨大挑战。现有的多种模型给出的GPP估计值存在显著分歧,尤其是在刻画其随季节更迭的起伏和逐年之间的微妙变化时,差异更为明显。这种不确定性就像一层迷雾,笼罩在我们对陆地生态系统如何响应气候变化、如何调节大气二氧化碳(CO2)浓度的理解之上。为了拨开这层迷雾,实现对陆地碳收支更精确的评估,发展更为精准、可靠的全球GPP估算方法已成为当务之急。近期,一项发表在《Scientific Data》上的研究带来了突破。研究人员开发了一套全新的、高分辨率的全球GPP数据集——TRAX GPP,旨在为相关领域提供一个更强大的工具。
为了达成这一目标,研究团队构建了一个创新的混合建模框架。其核心是一种被称为长短期记忆网络(Long Short-Term Memory, LSTM)的人工智能模型,这种模型特别擅长处理像气候和植被生长这样的时间序列数据。研究人员的独特之处在于,他们不是简单地应用标准LSTM,而是对其进行了两项关键增强。首先,他们引入了稳健的季节趋势分解(Robust Seasonal-Trend decomposition, RSTL)方法,预先从数据中分离出季节性和趋势成分,这有助于模型更清晰地学习不同时间尺度上的变化规律。其次,他们专门为时序学习优化了模型的损失函数,确保模型不仅能做出准确的单点预测,还能学习到数据在时间上的连贯演变特征。模型的输入数据综合了多源信息,包括来自卫星的植被指数(反映植物生长状况)和各种气象驱动因子(如温度、辐射、降水)。尤为重要的是,研究还将大气CO2浓度的同化过程作为约束条件整合到模型中,这使得模型能够更真实地模拟CO2浓度升高对植物光合作用的促进作用,即CO2施肥效应。利用这套先进的框架,研究人员生成了从2001年到2024年、空间分辨率高达0.05度(约5公里)、按月覆盖的全球GPP数据集。
研究通过多角度的验证和对比,全面展示了TRAX GPP数据集的优越性能。在与通量塔测量的直接比较中,TRAX GPP表现出良好的一致性,其估算值与全球范围内通量塔的直接观测结果吻合度高,证明了该数据集在站点层面的可靠性。在捕获季节动态和年际变化方面,TRAX GPP明显优于未经过上述增强的标准LSTM模型。它更好地再现了植被生长的季节性节律,并对干旱、炎热等极端气候事件引起的GPP年际波动做出了更敏感的响应。当进行与以往GPP产品的综合对比时,TRAX GPP的优势进一步凸显。研究发现,与已有的主流GPP数据集相比,TRAX GPP有效缓解了在估算全球GPP总量时普遍存在的一些偏差。同时,它所揭示的全球GPP年际变化趋势也与独立观测证据更为接近,提供了关于全球陆地碳汇变化更可信的图景。
这项研究的结论清晰而有力。它成功开发并发布了TRAX GPP这一全新的、高质量的全球GPP数据集。该数据集凭借其高时空分辨率、长时序覆盖以及更优的精度,为解决当前GPP估算中的不确定性问题提供了创新性的方案。其采用的混合LSTM框架,通过集成RSTL分解和时序优化损失函数,并结合大气CO2约束,为利用机器学习和多源数据提升生态过程模拟树立了范例。TRAX GPP数据集的意义深远,它不仅为全球碳循环研究、气候模型评估和生态系统管理提供了一个更可靠的基础数据,也标志着我们在精细化监测和理解陆地碳动态方面迈出了重要一步。这项成果有望推动相关领域产生更准确的科学认识,并为应对气候变化的政策制定提供更坚实的科学依据。