数据整合揭示亚热带雨林植物繁殖物候的时空与分类格局,填补全球气候变化监测的空白

《Ecography》:Data integration advances reproductive phenology research across temporal, spatial and taxonomic scales

【字体: 时间:2026年03月10日 来源:Ecography 4.7

编辑推荐:

  这篇综述阐述了如何通过整合传统与非常规数据源(如标本馆记录、公民科学、专家照片与笔记),在时空和分类学层面极大地扩展了对澳大利亚亚热带雨林树木繁殖物候(开花和结果)的研究能力。研究构建了跨越255年、覆盖915个物种的11万余条观测记录,证明了数据整合对于在数据稀疏地区建立工业革命前基线、量化气候变化对生物事件时序影响的关键意义,并探讨了超越西方科学知识体系、融合土著知识系统的未来方向。

  
引言:理解气候变化的关键指标
在全球范围内,生物事件发生时间的改变正成为气候变化最显著和可测量的指标之一。在温带生态系统中,物候期的提前正在扰乱维持了数千年的植物-动物相互作用,例如一些春季开花植物在其专性传粉者出现之前就已开花,而结果时间也日益与传播种子的鸟类迁徙模式不匹配。这些对授粉和种子传播的干扰可能引发对繁殖成功率、种群动态乃至碳固存等更广泛生态系统过程的级联效应。
这其中,开花和结果的周期(合称植物繁殖物候)尤为重要,它们是食物网和生态系统功能的基础。然而,将物候与气候变化联系起来的研究主要来自季节分明的地区,如北温带。对于南半球以及一些热带和亚热带系统,其基线物候模式及气候变化影响的认识仍存在显著空白。鉴于全球三分之二的树种依赖脊椎动物传播种子,植物物候的变化可能触发许多尚未知的级联生态后果。
在热带和亚热带地区,长期物候监测项目仍然稀缺,这限制了我们理解基线模式和气候驱动变化的能力。为了弥补这些数据缺口,研究人员正越来越多地转向新的数据源,包括标本馆标本、公民科学观察、遥感和专家知识。然而,单个数据源存在固有的局限性,例如标本馆标本可能表现出显著的收集偏差,而公民科学观察在时空上往往聚集。为了克服这些局限,数据整合(结合来自多个来源的物候观测)已成为一种有价值的方法,对于数据稀缺的热带和亚热带地区尤其相关。
澳大利亚亚热带雨林正是物候研究不足系统的缩影。这些森林拥有卓越的生物多样性,是联合国教科文组织列入名录的冈瓦纳雨林的一部分。然而,它们在全球物候文献中的代表性仍然最低。该地区经历季节性气候模式和超年际气候变化,可能对气候变化敏感。对这些森林物候的有限研究表明其繁殖模式多变,从可靠的年度事件到超年度的零星开花结果事件不等,甚至存在关于“大年”结果的轶事报道。因此,其物候模式和触发因素显得复杂。
本研究在一个看似数据稀疏的地区,通过评估整合多个来源如何扩展数据覆盖范围,来探索物候研究的机会。我们的工作基于一个理念:不同的物候数据源提供了互补的而非冗余的植物繁殖物候观测。具体假设如下:1) 标本馆标本提供最深的时间深度;2) 公民科学提供最广泛的当代空间覆盖;3) 抽样努力在系统发育上存在结构,某些谱系因更显眼或易被观察者接触的特征而被过度代表;4) 与任何单一来源相比,数据整合通过扩展覆盖范围和增加每物种的观测密度来增强研究能力。
材料与方法:构建综合数据集
研究系统与物种选择
我们利用国家植被信息系统的主要植被群来定义雨林植被的当前分布,并过滤出亚热带雨林区域。研究范围涵盖了从核心湿润亚热带雨林到季节性干旱雨林等多种类型。我们根据权威植物志资料,编制了包含1813个树种和灌木种的综合物种列表,并使用R包“APCalign”将所有名称标准化为当前接受的名录。
数据收集
我们从六个来源收集繁殖物候观测数据:
  1. 1.
    已发表数据集:通过系统评价指南,筛选出位于或邻近亚热带雨林、包含超过一年观测期的研究,最终从101项研究中提取数据。
  2. 2.
    标本馆标本:从全球生物多样性信息机构(GBIF)提取目标物种的出现数据,并通过正则表达式识别“繁殖状态”字段中包含“花”、“芽”、“果”或“种子”变体的记录,以筛选出提供物候观测的标本。
  3. 3.
    iNaturalist公民科学:通过API直接提取iNaturalist上的观测记录,包括“研究级”和“需要鉴定”的分类,以最大化数据覆盖。
  4. 4.
    植物学家照片集、野外笔记和种子收集记录:从多位植物学家处获取历史幻灯片和现代数码照片。我们利用基于视觉变换器(ViT)架构的机器学习流程,将照片分类为花、果或无繁殖材料三类,模型识别准确率达93.1%。同时,联系生态学家和植物学家获取未发表的野外笔记、博士论文数据以及苗圃和私人收藏者的种子收集记录。
数据标准化与互补性分析
所有数据均按照达尔文核心标准进行标准化,最终数据集包含代表繁殖状态的两个变量:开花和结果。观测被编码为1(存在)、0(确认不存在)或NA(不适用)。我们进行了时间、空间和分类学上的数据清洗。随后,通过评估四个假设来量化不同数据源之间的互补性,包括分析三个时间段(1770s–1970历史期、1971–2000中历史期、2001–2025当代期)的时间覆盖、空间分布、系统发育代表性以及观测密度增加情况。
结果:互补性与研究能力的显著提升
对六个物候数据源的整合产生了110,657条繁殖观测记录,涉及915个物种,时间跨度从1770年到2025年,共计255年。不同数据源在澳大利亚亚热带雨林物候研究的时间、空间和分类学尺度上提供了独特的观测。
时间覆盖
正如所预测的,标本馆标本提供了跨越整个255年研究期的连续时间覆盖,并且是历史观测(1770-1970年)的唯一来源(20,444条观测)。虽然在时间上保持连续覆盖,但其贡献比例从1770-1970年的100%下降到1971-2000年的56%,再降至2001-2025年的20%。这一变化表明,如果仅依赖标本馆数据,将错过大部分当代观测。在所有时期,物候活动全年均有发生,开花观测在9月至11月达到高峰,而结果观测则在12月至次年4月达到高峰。
空间分布
研究发现,公民科学观测(iNaturalist)和标本馆标本在当代时期(2001-2025)提供了最广泛的空间覆盖。这两个来源捕获了整个研究区域范围内的观测,而已发表的研究仅限于两个特定地点,专家收集(野外笔记、照片等)则集中在收集者家庭附近和常去的雨林地点。所有来源都具有高度的生态相关性,超过90%的观测持续出现在绘制的雨林边界10公里范围内。
分类学代表性
综合数据集代表了原始物种列表中50%的雨林树木和灌木,覆盖102个雨林植物科中的81个。与预期的系统发育偏差相反,我们发现物种观测数不存在系统发育信号,这表明抽样努力在整个系统发育树上分布,而非集中在特定谱系。专家收集贡献了独特的分类学覆盖,在整个综合数据集中有46个物种仅存在于这些非传统来源中,其中照片集贡献了31个独有物种。结合标本馆标本贡献的154个独有物种,这显示了清晰的分类学互补性。在中历史时期,专家照片集贡献了59个独有物种,填补了该时期的数据空白。
观测密度增加
通过多源整合产生的完整数据集在空间、时间和分类学覆盖上都有显著提升。110,657条观测的总数据集,相比最大的单一数据源标本馆标本(52,564条观测)增加了111%。当代时期(2001-2025)包含51,983条观测,比历史时期(1770-2000)增加了154%,这主要归功于公民科学和专家来源。尽管如此,仍有46.6%的物种观测数少于50次,其中约70%的低代表性物种同时具有开花和结果观测记录。
讨论:整合的价值与未来方向
这项综合研究表明,对于澳大利亚亚热带雨林树木而言,不同的数据源在时间和分类学覆盖上是互补而非冗余的。没有任何单一来源能捕获超过一半的信息。这种互补性在专家植物学家未发表的照片集的分类学贡献(31个独有物种)和独特的时间模式上尤为明显:标本馆标本主导历史记录,专家植物学家在中历史和当代时期做出重要贡献,而公民科学则在2000年至2025年间贡献巨大。
通过数据整合产生的合成数据集,很可能在气候变化的背景下增强物候研究能力。来自当代和历史时期(如前工业化时代)的记录可以改进对物种环境响应变化的建模。虽然这样的基线在亚热带系统中基本缺失,但我们的数据整合方法表明建立这些基线的机会是存在的。尽管许多代表性不足的物种可能反映了在系统性植物监测之前就已发生的广泛土地清理历史,但我们的结果表明,整合方法可能为高度改造景观中的物种提供唯一可用的物候信息。
我们方法的一个关键创新是通过非学术网络与专家植物学家接触,以获取很少被纳入物候综合的未发表或非正式数据集。这些非传统来源贡献了23,271条观测,涉及740个物种,并包含了46个其他来源中没有的物种,突显了其巨大价值。一个重要见解是整合了非研究目的的数据,如种子收集记录,它贡献了4617条结果观测和6个独有物种。然而,在数据发现、可用性、共享以及数字化和标准化所需时间方面仍然存在挑战。
数据整合的应用范围超出了当前主导物候研究的标本馆和公民科学观测的组合。我们的多源方法扩展了这些方法,系统性地展示了六种不同数据类型之间的互补性。然而,这种扩展方法的成功取决于现有的标本馆基础设施、活跃的专家网络、研究人员建立促进数据共享关系的意愿,以及产生这些多样化数据流所需的充足植物学观测。这些条件可能在具有殖民植物学历史的地区得到满足,包括澳大利亚和南半球其他地区,以及热带和亚热带区域。
尽管揭示了巨大的研究潜力,我们的整合方法完全在西方科学知识体系内运作,并反映了澳大利亚数据收集的殖民历史。虽然土著知识体系在生态研究中日益得到认可,但在不同知识体系之间建立有意义的生态关系仍存在重大障碍。对多年和季节模式、物种相互作用以及长期环境变化的土著知识代表了数千年的系统观测,可以从根本上增强我们对物候的理解。我们必须承认本综合中包含的许多来源产生的复杂社会政治背景。为了超越这种提取性的殖民遗产,物候研究需要重视和承认土著研究优先事项及知识主权的协作方法。
我们的综合展示了协作整合如何在数据稀疏系统中开启新的研究机遇。255年的时间跨度使得建立物候基线以及检测气候驱动变化所必需的历史基准成为可能。分类学的广度(915个物种)和时间深度使得研究植物-动物相互作用网络成为可能。整合的价值超越了简单的观测计数;增加的时间跨度和地理覆盖将使数据稀疏的物种受益。为了充分发挥这一潜力,我们呼吁协调努力,开发整合方法学,系统地吸引专家网络,并建立能够解锁数据稀疏系统物候研究能力的数据共享框架,同时优先考虑重视多知识体系的协作方法。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号