通过杂交带分析推断物种形成时间有助于评估分类学的膨胀问题

《Molecular Ecology》:Inferring Time-to-Speciation From Hybrid Zone Analysis Informs Assessments of Taxonomic Inflation

【字体: 时间:2026年05月07日 来源:Molecular Ecology 3.9

编辑推荐:

  摘要 测量杂交带之间的基因流可以直接评估进化上不同谱系之间的生殖隔离(RI)。对杂交带基因流进行基于地理位置的建模,即所谓的梯度分析(cline analysis),为根据生物物种标准进行物种界定提供了黄金标准。本文将演化分裂时间与从两栖动物、爬行动物、鸟类、哺乳动物和昆虫的研

  摘要

测量杂交带之间的基因流可以直接评估进化上不同谱系之间的生殖隔离(RI)。对杂交带基因流进行基于地理位置的建模,即所谓的梯度分析(cline analysis),为根据生物物种标准进行物种界定提供了黄金标准。本文将演化分裂时间与从两栖动物、爬行动物、鸟类、哺乳动物和昆虫的研究中推断出的杂交带梯度宽度所指示的合子后生殖隔离联系起来。数据证实了梯度宽度与演化分裂时间之间存在总体上的显著负相关(在两栖动物中这一相关性在谱系内部始终显著)。在108个杂交带中,有104个情况下杂交的类群年龄小于1000万年(Ma),94个情况下年龄小于700万年,这表明较古老的谱系对通常具有生殖隔离。在两栖动物中,这种相关性表明,亚种和物种特征的浅梯度带和陡梯度带分别对应于小于260万年和大于700万年的演化分裂时间。通过模拟过去被归类的物种集合,我们发现随着时间的推移,年轻的谱系越来越多地被描述为新物种。总体而言,推断出的后更新世时代的物种比例在鸟类中最高(27.3%)和哺乳动物中最高(21.8%),而在两栖动物和有鳞类动物中最低(小于10%)。在两栖动物中,我们从1980年到2010年记录到新描述物种的数量增加了56%,这些物种的演化分裂时间低于杂交带得出的260万年参考点。虽然这一趋势目前只影响到一小部分两栖动物物种总数,但我们建议应谨慎评估那些将更新世时期的谱系界定为物种的分类学假设,或者相反,将中新世或更早时期的谱系视为同种的假设,以避免分类学上的膨胀和收缩。

1 引言

物种是生物组织的基本单位(Mayr 1942;de Queiroz 2005),并在编目、测量和保护全球生物多样性方面发挥着关键作用(Colwell 和 Coddington 1994;Ak?akaya 等人 2000;Coates 等人 2018;Hausdorf 2021)。虽然历史上物种被认为是由独特形态特征定义的不变自然实体,但分子遗传学提高了检测其内部变异的精确度(Ekblom 和 Galindo 2011;Fujita 等人 2012)。因此,对传统物种检测、诊断和描述方法提出了挑战(Dufresnes 等人 2023),并且提出了许多基于生物学属性(如杂交能力、生态适应性、可诊断性或单系性)的物种概念(de Queiroz 2007;Wilkins 2009)。然而,大多数这些概念都认为物种是由具有离散演化轨迹的种群级谱系组成的部分,而分歧点则集中在识别这些单元的操作标准上(Mayden 1997;de Queiroz 1998;Conix 等人 2023)。谱系的分化是一个连续过程,因此不同的物种标准可以在不同的阶段被追踪到。例如,分配给特定分类单元的种群的单系性可能在分化的非常早期阶段就出现了,而系统发育物种标准(PSC)可能会错误地将仍然明显是同种的个体群体界定为不同物种,特别是当依赖少数遗传标记时。相比之下,生物物种标准(BSC)通常更为保守,因为种群之间的合子后生殖隔离(RI)通常在分化的连续过程中较晚出现(Mayr 1942;de Queiroz 1998, 2007;Sites 和 Marshall 2004;Padial 等人 2010)。根据 Agapow 等人(2004)的研究,优先考虑 PSC 可以识别出比基于 BSC 的方法多出48.7%的物种。对 PSC 的过度依赖被认为是某些脊椎动物群体中物种数量近期增长的主要因素,这种现象被称为“分类学膨胀”(Isaac 等人 2004;Zachos 等人 2013),其原因、影响和普遍性已经得到了深入讨论(例如,Agapow 和 Sluys 2005;Harris 和 Froufe 2005;Knapp 等人 2005;Zachos 2015;K?hler 等人 2005;Padial 和 De la Riva 2006;Sangster 2009;Zachos 2015;Tolley 等人 2022)。为了避免和检测分类学膨胀,一种谨慎的方法可能是基于 BSC 及其核心指标 RI,RI 被定义为杂合的缺失或杂交的适应性成本,这影响了谱系之间的遗传物质交换率(Mallet 2005;Mallet 等人 2016)。RI 可以在生殖循环的多个阶段产生;它可能是合子前的,即由亲本物种的行为或生态隔离介导的,或者是合子后的,由杂交不育性、不育(由基因组不相容性引起)或适应不良/不吸引性介导的。为了本研究的目的,我们使用这种基于 BSC 的方法来定义分类学膨胀,即将表现出很少或没有合子前或合子后生殖隔离的谱系指定为物种。在野外测试 RI 时,谱系接触至关重要,因此已经被纳入各种操作性物种界定程序中(Unmack 等人 2022;Pyron 等人 2023)。特别是,具有杂交潜力的次级接触区域作为宝贵的“自然实验室”(Hewitt 1988),用于研究基因流并评估 RI 的程度(Barton 1983;Payseur 等人 2004)。具体来说,沿着穿过这样的杂交带(HZ)的地理截面,某一位点上的等位基因频率的转变可以通过一个S形梯度来建模,其参数受到选择(对抗杂合子)和人口统计学(扩散)力量的影响(Barton 和 Hewitt 1985,Barton 和 Gale 1993)。不同位点上的梯度形状和位置可能有所不同,同一截面同一位置上等位基因频率的陡峭转变,且没有扩散障碍,表明合子后 RI 稳定了杂交带(Barton 和 Gale 1993)。多个因素可以介导 HZ 内的基因流地理模式(及其在整个基因组中的异质性),例如自首次接触以来的时间、历史或持续的杂交带移动、涉及的类群的扩散行为,以及中性等位基因和局部适应等位基因在异质环境中的选择类型和强度(Hewitt 1988;Buggs 2007;Dufresnes 等人 2020)。尽管如此,HZ 分析对于将谱系界定为物种或亚种来说非常有用(Chambers 等人 2022;Dufresnes 等人 2023;Vences 等人 2024),并且可以被视为测试满足 BSC 的“黄金标准”。高通量测序技术的出现现在可以可靠地推断出数千个全基因组范围内的双等位基因单核苷酸多态性的梯度宽度(例如,Dufresnes 等人 2021),并且越来越多的案例研究表明这种方法在两栖动物分类学中的实用性(例如,Kalaentzis 等人 2023;Parkin 等人 2023;Purser 等人 2025;Shimada 等人 2025)。杂交带方法显然不适用于异地类群,即那些没有次级接触的类群。此外,它还需要密集的地理采样和大量的分子资源,而这些资源显然还无法为每年新诊断和命名的数千种物种提供(Miralles 等人 2020)。确定 RI 的代理指标,即与成功交配前或交配后障碍相关的可测量分化线索,可能有助于部分克服这些障碍。演化分裂时间尤其具有吸引力,因为它甚至可以用单一分子标记轻松估计(Arbogast 等人 2002)。物种的形成预计是一个类似时钟的现象,因此早期就考虑了物种形成的时间维度(Avise 等人 1998;Hedges 等人 2015)。基于线粒体时钟的初步实证研究发现了北美洲鸣禽姐妹物种之间的前更新世分化,即超过250万年,通常表明物种形成已经完成(Klicka 和 Zink 1997;Avise 和 Walker 1998),后来的研究表明鸟类的平均物种年龄为200万年,哺乳动物为220万年,爬行动物和两栖动物为920万年,鱼类为680万年(Avise 等人 1998)。分析了一个包含超过50,000个物种的全面时间树,Hedges 等人(2015)发现脊椎动物(210万年)、节肢动物(220万年)和植物(270万年)的平均物种年龄相似。显然,这些平均值存在巨大差异(Avise 等人 1998;Hedges 等人 2015),并且 inherently 受当时可用的分类学和技术分辨率的偏见影响。然而,其他因素可能在塑造物种形成率的变化中起着更大的作用。在某些物种形成模式下,例如同域环境、杂交或核学重组(例如,Mallet 2007;Abbott 等人 2013;Momigliano 等人 2017;Kautt 等人 2020),生殖隔离的谱系可能更快出现。此外,基于时间树的比较可能会高估或低估物种形成所需的时间,这取决于分类群的不同。在基于可能膨胀的分类学基础上,物种年龄的群体中往往会高估;而在研究不足的、包含许多未描述谱系的群体中则可能低估(Linnean 缺口)。根据在古北界两栖动物中观察到的现象,即内在的合子后隔离(杂交不兼容性)随着分化时间的推移而逐渐积累,Dufresnes 等人(2021)建议可以根据简单的分化时间估计来预测物种等级。通过研究杂交带,他们发现年龄小于200万年的谱系往往表现出超过50公里的梯度宽度,这表明基因兼容性,因此物种形成不完整。相反,杂交年龄大于600万年的谱系表现出小于10公里的梯度宽度,且有大量位点完全停止了混合,这表明存在 RI,因此物种形成处于较高级阶段(Dufresnes 等人 2021)。多项研究表明,随着遗传分化或时间的增加,RI 显著增加(Mendelson 等人 2004;Coughlan 和 Matute 2020);例如,在中心颌鱼类中,部分 RI 在分化时间超过600万年的物种对中可以检测到,并且从大约1500万年开始普遍存在(Bolnick 和 Near 2005)。关于杂交能力的预期甚至可以用来测试校准时间树时的竞争性生物地理场景的合理性(“谱系兼容性合理性测试”;Dufresnes 等人 2024)。对于希望依赖 RI、因此基于 BSC 来界定物种的分类学家来说,这些时间参考点可以作为评估两个谱系成为物种的概率的标尺,并在林奈分类系统中对它们进行排名,而不需要繁琐且有时根本不可能的杂交带调查。如果在主要动物群体中能够全面建立 RI 与分化之间的关系,那么这将加强将分化时间纳入综合分类学家工具包的论据,并允许更客观地测试分类学膨胀,即以更合适的通用方式定义物种。在这里,我们(i)从已发表的研究中收集了关于多种动物的 HZ 数据集,以寻找梯度宽度与分化时间之间的相关性,并估计谱系被视为物种所需的时间,根据它们的渐渗模式。然后我们(ii)使用这些物种形成时间估计来预测基于时间顺序明确的物种组合的时间树的分类学膨胀。

2 材料与方法

2.1 编制梯度宽度数据库

我们使用 Harzing 的 Publish or Perish 版本 7.33.338.7819(Harzing 2007)的关键词搜索,截至2022年7月14日的科学文献,关键词包括:“hybrid zone”、“cline width”、“hzar”和“transect”。如果研究包含关于梯度宽度的信息,这些数据就被考虑在内。编译了每对杂交类群的扩散(McEntee 等人 2020)和分化时间,并优先考虑最近发表的估计值。扩散被分为八个类别(A:≤0.25,B:>0.25 且 ≤0.75,C:>0.75 且 ≤2.5,D:>2.5 且 ≤7.5,E:>7.6 且 ≤25,F:>26 且 ≤75,G:>76 且 ≤250,H:以及 >250公里/代)。工作流程的总结见图 S1,完整的编译数据集提供在 Dryad 仓库中,网址为 https://doi.org/10.5061/dryad.wwpzgmsv2。一般来说,一个 HZ 可以包含多个横截面,每个横截面在不同时间测量多次梯度宽度。除了这些数据,我们还记录了每个梯度分析的额外信息,如用于计算梯度宽度的标记数量、标记的基因组位置(线粒体或核)以及用于推断梯度宽度的方法(称为“推断方法”)。推断方法包括基于(i)单个标记的测量(称为单宽度),(ii)基于单个标记的多基因座梯度分析得出的中位梯度宽度(中位宽度),以及(iii)基因组祖先或等位基因频率平均值(平均宽度)。在仅报告多个单个标记的梯度宽度的情况下,我们计算了中位宽度。我们根据这些额外信息将数据分为八个不同的类别(步骤 I–III,图 S1)。HZ 梯度宽度反映了两个谱系之间的地理渐渗范围,并且在谱系诊断位点之间估计时更为可靠,即这些位点上的等位基因是固定的(Mallet 等人 1990)。对非诊断性标记的分析,即那些在不同物种之间不是固定不变的等位基因,可能会对梯度分析产生偏差,尤其是在地理采样没有覆盖到亲本个体的情况下。为了识别这些标记,我们还筛选了代表梯度最小和最大等位基因频率的参数pmin和pmax(通常是亲本物种的等位基因频率)。因此,我们排除了那些由非诊断性梯度得出的单一和平均梯度宽度,其pmin值大于0.2且pmax值小于0.8,并且在大多数单一宽度都是非诊断性的情况下也排除了中位数梯度宽度(步骤IV,图S1)。在每个扩散类别中,我们分别计算了两次中位数,首先是为每个截距(步骤V,图S1),然后是为每对杂交分类单元(步骤VI,图S1)。为了量化分歧时间和梯度宽度之间的相关性,我们首先对非高斯数据进行了对数转换(Shapiro-Wilk检验:两个数据系列的p值均<0.001)(Lesaffre等人,2007年)。然后,我们使用R版本4.2.1中的ggpubr包计算了对数转换后数据集(以下简称“数据集A”)中的皮尔逊相关系数——分别是整个数据集和每个类别中的相关系数(Kassambara 2020,R Core Team 2022)。此外,我们还计算了数据集中最完整梯度宽度子集的皮尔逊相关系数,这些宽度是通过使用“平均方法”并基于多个标记推断出来的。这些宽度是基于平均的基因/基因组祖先信息得出的,没有受到线粒体标记、不同推断方法或过度分类的干扰(以下简称“数据集B”)。使用R版本4.2.1中的广义线性模型(GLM)评估了数据集A中分歧时间对梯度宽度的影响(R Core Team 2022)。我们模型中考虑的潜在解释变量包括分歧时间、扩散类别和分类单元归属。为了避免由不同推断方法计算出的梯度宽度产生偏差,我们只选择了“平均宽度”类别中的梯度宽度。为了确定最适合GLM的概率分布,我们使用car包生成的分位数-分位数图比较了各种分布(Fox等人,2012年),结果发现伽玛对数分布是最适合我们分析的概率分布。为了识别所有可能变量组合中最佳拟合模型,我们使用了glmulti包(Calcagno 2020)和glm函数。该包使我们能够比较和区分不同的GLM,并选择在拟合优度和模型复杂性之间达到最佳平衡的模型。我们基于修正的赤池信息量准则(AICc)的权重来选择模型,选择AICc最低的模型作为首选模型。最后,进行了类似ANOVA的检验,以评估最佳模型预测因子(分歧时间、扩散类别和分类单元)对梯度宽度的显著性。

2.2 估计不同时期的谱系距离变化

我们开发了一个信息学工具,用于检查随时间变化的分类单元分歧时间(https://github.com/iTaxoTools/TaxoInflationAnalyzer)。该程序用Python 3编写,需要DendroPy包(Sukumaran和Holder 2010)。它可以在Newick格式的超度量树上运行,并计算物种对之间的谱系距离。为了分析特定时间间隔,它以tsv格式的描述年份列表作为输入文件,并根据描述年份逐步排除分类单元。通过这种过滤,然后计算每个定义时间间隔的平均谱系距离。iTaxoTools项目提供了一个简单的基于GUI的可执行文件(Vences等人,2021年;https://itaxotools.org)。输出包括数据集中每个定义时间间隔的两个文件:一个包含数据集中直到设定时间间隔上限的所有物种的Newick格式的树,以及一个包含物种对及其相应谱系距离的列表,还包括诸如样本量、平均谱系距离以及最小和最大谱系距离等统计参数。此外,该程序还生成了一个摘要文件,其中包含了所有分析时间的统计参数。这个摘要文件提供了整个分析过程中观察到的模式的简要概述。第二个程序模式会根据用户定义的谱系距离阈值,编译(i)低于该阈值的物种对的数量以及(ii)它们相应的比例。作为输入,我们使用了2022年6月从timetree.org网站生成的超度量树(Kumar等人,2022年)。为了确保节点的有效性,我们开发了一个工作流程来过滤无效名称并获取带有相应描述年份的物种列表。首先,使用timetree网站提供的“Build a Timetree”函数为每个分类单元生成一个时间树(https://www.timetree.org)。然后使用R包ape(Paradis和Schliep 2019)从生成的时间树中提取分类单元名称,并排除了非二项式名称。使用“物种匹配工具”(https://www.gbif.org/tools/species-lookup,访问于2022年6月)将提取的列表与GBIF Backbone Taxonomy(GBIF Secretariat 2021)进行了交叉验证。在物种级别上,准确率为100%的匹配结果被提取出来,而准确率较低的匹配结果则进行了手动检查。最终得到的物种列表及其相应的描述年份被重新上传到timetree.org,并使用“Load a List of Species”函数。

2.3 分歧时间分析的时间校准

对于两栖动物,我们的HZ分析提出了基于分歧时间和梯度宽度相关性分析得出的明确经验值(见结果)。为了校准两栖动物的分析,我们使用了Dufresnes等人(2021年)提出的梯度过渡分类,分为三个类别:浅梯度(>50公里)、陡梯度(50公里到10公里之间)和非常陡梯度(<10公里)。我们使用R包ggplot2中的stat_ellipse函数估算了物种分化的参考点,以计算分为浅梯度和非常陡梯度(>2个标记)的平均梯度宽度的多变量t分布(Wickham等人,2022年)。浅梯度HZ的最大t值作为第一个参考点,表明在这个点之后我们预计生殖隔离基本完成。相反,非常陡梯度分布的最小t值作为第二个参考点,在这个点之下我们假设大多数物种的生殖隔离尚未完成。然后我们将同样的工作流程应用于七个分类单元:鸟类(Aves)、有鳞目(Squamata)、蝴蝶(Lepidoptera)、软体动物(Mollusca)和新生代辐鳍鱼类(Neoteleostei),但使用了更保守的物种分化时间参考点(2 Ma),以检测非常年轻的(后新近纪)物种对。此外,我们还使用R中的rstatix包(Kassambara 2021年)和Bonferroni校正的成对t检验,比较了所有物种对的平均分化时间。

3 结果

3.1 数据集描述和GLM结果

通过文献筛选,共获得了2078个梯度宽度,代表了259个采样截距和160对不同的杂交谱系。梯度宽度数据以及分化时间和扩散率数据来自十二个生物群体的已发表研究(所有来源的完整列表见表S1)。在应用我们的过滤工作流程(图S1)并排除了没有分化时间数据的HZ之后,数据集A包含了108对杂交谱系的232个分类梯度宽度(表1;元数据和原始参考文献可在线获取:https://doi.org/10.5061/dryad.wwpzgmsv2)。在数据集A中,81个梯度宽度是使用平均方法估算的,57个使用中位数方法估算的,94个基于单个标记(77个线粒体标记),测量的对象是108对杂交谱系。数据集B是数据集A的过滤子集,包含了71个梯度宽度,全部使用平均方法估算。这个最终数据集每个杂交谱系对仅包含一个梯度宽度,涵盖了五个生物群体中的65.7%的所有分类单元对和数据集A中30.6%的梯度宽度(表1)。表1总结了数据集A和B中包含的杂交谱系对及其梯度宽度,按主要生物群体分类。

3.2 分歧时间的相关性分析

在两个数据集中(数据集A包含基于232个梯度宽度的108个杂交分类单元,R = -0.17,p = 0.008,图1a;数据集B包含基于71个梯度宽度的71个杂交分类单元,R = -0.24,p = 0.045,图1b)发现了对数转换后的梯度宽度与分歧时间估计之间的显著负相关。值得注意的是,在两栖动物数据集(数据集A:基于69个梯度宽度的32个杂交分类单元,R = -0.44,p = < 0.001,图1a;代表性数据集:n = 25,R = -0.59,p = 0.002,图1b)中发现了最一致的相关性。在有鳞目和鸟类中,数据集A中也发现了显著的负相关,但在数据集B中这种相关性没有持续存在,尽管趋势仍然存在(图1a,b)。在样本量最小的哺乳动物和六足动物组中,观察到了一个违反直觉的正相关趋势,但没有检测到显著性,且R值相对接近零(图1a,b)。图1展示了两个不同过滤数据集中对数转换后的 published 梯度宽度与分歧时间估计之间的线性关系。上图(a)显示了数据集A,包含基于八个不同类别的232个梯度宽度(平均后得到)的108个杂交分类单元。下图(b)显示了数据集B(仅基于多个标记并使用平均方法测量的梯度宽度),包含71个杂交分类单元。图(a)和(b)中的左上面图分别显示了所有较高分类单元的混合区域,并包括了来自其他分类单元的五个杂交对的梯度宽度(灰色)。来自线粒体标记的梯度宽度以三角形显示。对于每个图表,我们通过线性回归计算了皮尔逊相关系数(r)及其p值(ns,p > 0.05;*p < 0.05;**p < 0.01;*** p < 0.001)(红线表示,95%置信区间由周围的灰色区域标示)。坐标轴采用对数刻度。在数据集A(108对杂交谱系)中,我们观察到在样本量较大的分类群(如两栖纲Lissamphibia、鸟纲Aves、有鳞目Squamata)中,分歧时间估计值与渐变带宽度之间存在负相关趋势,并且当使用平均方法基于多个标记测量渐变带宽度时这种趋势更为明显(见图S4a–S9a;在基于100多个标记的两栖动物中这种相关性显著)。预期的是,在分歧时间和选择系数(经过离散扩散率校正的渐变带宽度)之间存在反向(正相关)趋势(见图S4b–S9b);但在样本量较小的数据集中这种相关性并不一致。

3.3 根据描述时间确定的两栖动物物种的年龄

从直接文献挖掘或timetree.org数据库独立获得的分歧时间在两栖动物杂交谱系中显示出显著的相关性(R = 0.57,p < 0.001,见图S10)。对于两栖动物杂交对(n = 14),timetree.org中的分歧时间较老(平均值 = 8.63 Ma,中位数 = 7.9 Ma,标准差 = 4.64 Ma),而我们从文献中直接提取的分歧时间则包括群体遗传学而非系统发育学估计(平均值 = 5.3 Ma,中位数 = 5.38 Ma,标准差 = 1.96 Ma)。根据timetree得出的分歧时间,分析中最近十年(2000–2010年)有至少一个物种被描述的兩栖动物物种对的中位数分歧时间为9.12 Ma(n = 399,最小分歧时间 = 0 Ma,最大分歧时间 = 81.1 Ma,标准差 = 9.96 Ma)。我们使用了两个参考点来估算两栖动物的物种形成时间:(i) ‘浅层’渐变带宽度(来自八个杂交谱系,t分布在x轴最大值处的切线,为7.0 Ma);(ii) ‘非常陡峭’渐变带宽度的x轴最小值(来自十个杂交谱系,为2.6 Ma,见图2a)。与timetree得出的分歧时间相比,这些基准显示,在两栖动物的物种图中,有216对物种(8.6%)的形成时间小于2.6 Ma,782对物种(31%)的形成时间小于7 Ma(n = 2523个谱系)。在分类学历史的几十年里,形成时间小于7 Ma的物种对的比例稳步上升,到1950年时达到了17.8%(见图2b),而在1867年至1950年间,形成时间小于2.6 Ma的物种对比例保持在3%–4%之间。自1950年以来,这两个比例持续增长。在1980年至2010年间,形成时间小于7 Ma的物种对增加了34%,形成时间小于2.6 Ma的物种对增加了56%(见图2b)。

3.4 其他动物分类群中物种随时间的年龄

我们的数据揭示了从1758年到2010年不同分类群在物种描述率(见图3a)和相应分类历史时期已知的物种对分歧时间(见图3b)方面的显著差异(除了鸟纲Aves与哺乳纲Mammalia、两栖纲Lissamphibia与新近真骨鱼类Neoteleostei、有鳞目Squamata与鳞翅目Lepidoptera之间的比较外,所有比较均具有显著性)。软体动物纲Mollusca的时间树显示出所有物种对分歧时间的最高平均值、中位数和标准差(平均值 = 35.5 Ma,中位数 = 13.6 Ma,标准差 = 60.8 Ma,见表S5),而鸟纲的时间树具有最低的中位数,为3.9 Ma。形成时间小于2 Ma的物种对比例在不同分类群中也有所不同(见图3c和表2),其中鸟类和哺乳类的比例最高,分别为27.3%和21.8%(见表2),而有鳞目Squamata和两栖纲Lissamphibia的比例最低,分别为6.1%和6.6%(见表2)。在1980年至2010年间,形成时间小于2 Ma的物种对中,哺乳类和鸟类的比例也最高(分别为48.1%/45.1%,见表2),而两栖纲Lissamphibia和有鳞目Squamata的比例最低(分别为11.8%/11.7%,见表2)。在所有分类群中,最近描述的形成时间小于2 Ma的物种比例都有所增加(见表2)。

4 讨论

4.1 杂交带宽度与分歧时间的关系

在这项研究中,我们通过检查来自不同支系的108对谱系(包括有鳞目Squamata、鸟纲Aves、哺乳纲Mammalia、六足纲Hexapoda和两栖纲Lissamphibia),扩展了关于杂交谱系的分歧时间与其在野外形成的杂交带宽度之间关系的视角。这大大拓宽了类似研究的范围,这些研究以前仅限于特定的分类群,例如澳大利亚的有鳞目(Singhal和Moritz 2013;Singhal和Bi 2017)或古北界无尾目Anurans(Dufresnes等人2019, 2021)。对于所有较高分类群的合并数据集,我们发现分歧时间与杂交带宽度之间存在显著相关性,并确定分歧时间是首选广义线性模型(GLMs)中预测杂交带宽度最重要的因素。这种相关性在两栖动物、有鳞目和鸟类中显著,但在哺乳动物或六足纲中不明显,其中两栖动物的相关性最为明显和一致。在这一类群中,假设分歧时间与杂交能力之间的关系反映了通过整个基因组中多个遗传不兼容性的随机积累而逐渐进展的合子后隔离(即“基因质量”模型,用于描述合子后隔离的进展,Dufresnes等人2021)。重要的是,在我们的调查中,我们只发现了极少数超过10 Ma的谱系之间的杂交带实例,这表明在这一时间跨度之后,绝大多数谱系的物种形成已经完成。我们的结果表明,这一模型也可能适用于其他脊椎动物群体,且分歧时间确实是物种形成的关键决定因素,至少在异域扩散过程中是如此(Dufresnes等人2021)。这一模型的一个含义是,遗传不兼容性最终会以“滚雪球效应”表达出来(Matute等人2010;Moyle和Nakazato 2010)。换句话说,一旦分歧谱系之间出现了一定数量的突变,渗入会通过破坏上位性功能显著降低杂交适应性,即依赖于共同进化的基因。考虑到生物体之间的替代率差异(Brownstein等人2024),这种机制的速度预期会有所不同。在突变率和替代率较低的分类群中,例如由于世代时间长、代谢率低或繁殖力低等因素(例如Martin和Palumbi 1993;Bromham 2020;Bergeron等人2023),可能需要更长的时间才能达到产生RI所需的随机屏障位点数量。这可能解释了某些“活化石”物种尽管经历了数百万年的独立进化,仍然能够保持杂交能力的特殊性(Brownstein等人2024)。不兼容性的随机积累,加上由于人口统计过程导致的杂交带内的基因流波动,也意味着并非所有位点都以相同的方式受到影响,因此分析少量位点的研究可能会检测到那些可能与RI无关的特异性信号;然而,在基因组规模的数据集中分析数百或数千个位点时,通常会发现与平均基因组祖先相关的信号。对于昆虫和哺乳动物,我们数据集中缺乏显著模式可能是由于这些分类群的样本量相对有限,但也可能反映了分歧时间推断的不确定性或分类群内替代率的差异。此外,物种形成机制的差异也可能导致这种模式。例如,在数据集A中仅分为“其他”类的鱼类,可能更频繁地经历同域物种形成和适应性辐射。在这些情况下,合子前的生殖隔离,通过局部适应和性选择,可能成为分歧的初始驱动力,而不是长期的异域隔离(Kautt等人2020;Ngoepe等人2023),可能是因为它们多样化的水生环境促进了即使在同一地理区域内的生态位分化。因此,杂交带方法用于物种界定依赖于物种形成主要是由渐进的——大体线性的——基因组分歧积累所驱动的假设,并且可能不适用于主要受内在和外在过程驱动的系统,这些过程涉及合子前的隔离,例如昆虫和鱼类(例如Endler 1977;Xue等人2009;Henrich和Kalbe 2016)。总的来说,许多混杂因素会影响任何跨分类群的杂交带分析,但我们的分析表明,这种背景噪声仍然不足以掩盖整个基因组范围内渐进分歧在物种形成中的重要作用。

4.2 两栖动物物种形成时间的参考点估计

由于我们分析中主要分类群之间杂交带宽度与分歧时间之间的相关性存在差异及其强度的不同,我们将物种形成时间的基准值估计限制在两栖动物上,因为在这一分类群中相关性最为明显(也参见Dufresnes等人2021)。我们预计由于涉及的分类群具有极大的扩散能力差异(McEntee等人2020),相关性模式会有显著不同,这一混淆因素甚至可能在密切相关的物种之间也有很大差异(Stevens等人2010)。我们尝试通过使用针对杂交个体的选择系数来校正杂交带宽度,这是一种临时方法来调整扩散的影响,从而仅量化RI对宽度的影响。然而,我们并没有通过使用这个系数获得更强的相关性。这可能是因为量化扩散本身在方法上具有挑战性且容易出错,因为它需要间接估计方法,如标记-回收或遗传推断,以及依赖这些方法的数学模型(Nathan 2001)。此外,关于动物移动的文献主要集中在活动范围内的迁移,而不是扩散,这些估计虽然可以提供物种相对移动性的信息,但可能无法准确预测基因在几代后如何在地理空间中扩散(Barton和Hewitt 1985;Araya-Donoso等人2022)。我们无法控制的另一个潜在重要混淆因素是分歧时间估计的不确定性,这些估计全部是由我们自己和timetree.org从方法上异质的原始出版物中收集的。例如,欧洲蟾蜍Bombina bombina/B. variegata的中位分歧时间从5.9 Ma(Fromhage等人2004)到60 Ma(Igawa等人2008)不等。然而,如果可能的话,建议在“局部”分类学尺度上界定物种,即基于为给定物种群和给定方法校准的分歧参考点。这将有助于减少时间估计和扩散能力的变化,从而提高分歧-HZ宽度相关性(Dufresnes等人,2021年,2023年)的可靠性和预测潜力。尽管存在这些不确定性,但在我们的分析中,HZ宽度和两栖动物分化时间之间的相关性非常强,使我们能够为这个分类群估计出两个统计上得出的分化参考点,我们认为这些点分别表明了弱的或不存在的合子后隔离(RI)<2.6 Ma,或者相反,表明存在显著的合子后隔离(RI)>7 Ma。显然,这些估计不能被视为物种划分的教条性“阈值”标准,鉴于上述讨论的时间到物种形成的变化,而应该被解释为在整合分类学中划分物种时需要考虑的几个因素之一。因此,我们建议将<2.6 Ma的两栖动物谱系划分为不同物种的分类假说,或将>7 Ma的谱系视为同种的假说,应该通过这种整合分析进行深入审查。此外,值得注意的是,无尾两栖动物的杂交带宽度小于或大于30公里通常与少数或许多障碍位点相关,因此分别表征了亚种和物种(Dufresnes等人,2021年)。在两栖动物的相关性中,“半衰期”即对应于30公里渐变带宽度的分化时间是4.1百万年(置信区间:3.5-4.8百万年),这也对于评估所谓的物种形成灰区中的物种划分假说具有参考价值(Dufresnes等人,2021年;Roux等人,2016年)。尽管从现有数据来看,其他类群的关系不那么强,但我们也同样发现只有非常少的HZs超过10 Ma(没有一个超过22 Ma),并且超过7 Ma的谱系的HZs总是以有限的基因流为特征。实际上,有鳞目动物和鸟类的显著相关性表明,与两栖动物一样,我们也可以从回归公式计算“半衰期”到物种形成。再次使用30公里的渐变带作为转折点,相应的分化时间对于有鳞目动物将是2.6百万年(置信区间:1.9-3.6百万年),对于鸟类将是0.9百万年(置信区间:0.6-1.3百万年)。这些值在这里只是为了举例说明这种方法,并应该基于更强的分化-渐变带宽度相关性(例如,从更多的杂交带计算得出)进行修订,最重要的是,通过确定这些群体中分隔物种和亚种的实际平均渐变带宽度来进行修订。例如,很可能在鸟类中,宽度远大于30公里的杂交带仍然表征了有效的物种,因为鸟类的扩散潜力通常比两栖动物高。因此,未来的研究应该确定与不同扩散能力群体相关的平均渐变带宽度,然后确定与这些值相对应的分化时间。不同群体的物种形成时间框架表明,尽管在具有低替代率的活化石谱系中偶尔会发生杂交,但年龄超过7百万年的同种谱系在动物中是罕见的(Brownstein等人,2024年)。相反,数据集包括的谱系中,哺乳动物和鸟类的物种级分化主要是相对年轻的,这与Avise等人(1998年)的发现一致。这一趋势在timetree.org上也显而易见,其中哺乳动物和鸟类物种对的平均父系距离明显低于其他分析的群体(图3b)。哺乳动物相对于两栖动物的较短物种形成时间自从Wilson等人(1974年)的早期研究以来就已知,他们将其与调节进化与蛋白质进化的较高比率联系起来。潜在机制可能导致杂交体中基因表达模式的更快出现(Prager和Wilson 1975年),但这些模式的潜在机制仍然知之甚少(Runemark等人,2024年)。Prager和Wilson(1975年)还发现,哺乳动物中的物种间杂交潜力比鸟类损失得更快(也参见Fitzpatrick 2004年);然而,鸟类的快速物种形成可能是由于合子前隔离,其中颜色模式或鸣声差异导致了物种的完全形成,尽管缺乏完全的合子后隔离(Edwards等人,2005年)。

4.3 定义和检测分类膨胀具有挑战性

我们的分析表明,在分类学的历史中,新描述的两栖动物物种数量在HZ定义的物种形成时间参考点以下有所增加。将这种模式解释为分类膨胀的迹象首先需要对这个术语进行精确定义。分类膨胀最初被描述为一些作者认为的不必要的分类等级过度划分(Patterson 1999年;Alroy 2003年)。随后,它被用来指物种等级数量的增加,特别是通过将亚种提升为物种(Isaac等人,2004年)。Padial和De la Riva(2006年)随后区分了“严格意义上的分类膨胀”,即由于将亚种提升为物种而导致物种数量的增长,以及“广义意义上的分类膨胀”,即由于采用基于谱系的物种划分标准而导致某些属中物种数量的增长。在这里,我们提出了一种精细的分类膨胀定义,即由于接受那些没有或几乎没有合子前或合子后生殖隔离迹象的谱系作为物种而导致的物种数量增加。更准确地说:我们定义中的分类膨胀包括将假定的物种添加到林奈分类系统中,这些物种在(潜在的)共存情况下缺乏行为、生态或遗传上的繁殖障碍,会产生自由混合的种群,没有选择压力对抗杂交体,并最终导致谱系融合。使用物种形成时间标准——例如两栖动物的2.6 Ma——来评估那些难以检测到生殖隔离的谱系(即异地群体),为识别潜在的分类膨胀案例提供了一个大致的指导方针,然后可以进行更细致的分类学检查。通过逐步排除根据描述年份的群体来计算超度测量树中的平均父系距离,从而有助于检测分类膨胀的信号。当然,这种时间树的任何特定时间估计都与相当大的不确定性相关联(Graur和Martin 2004年)。我们的分析也可能受到影响分类学研究中所包含物种的区域性偏见的干扰(McEntee等人,2020年),以及那些有时间树数据的物种,例如北美和欧洲的物种可能被过度代表,即在怀疑物种形成较慢的纬度地区(Weir和Schluter 2007年)。此外,新的物种的分化日期信息出现在timetree.org数据库中的时间滞后可能会扭曲分析中每年描述的物种数量与总体数量之间的关系。最后,我们的方法仅关注新物种的描述,而没有检测到先前描述的亚种的升级,这可能解释了在分类学早期鸟类和哺乳动物物种描述率相对较高的原因:在这些分类群中,命名亚种有着悠久的传统,而在随后提升为物种后,它们将在原始描述年份被计数,这可能比它们在物种层面被认可的时间早几十年。对于两栖动物来说,这个问题不太相关,因为在1992年至2003年间新认可的物种中,只有14.3%可以归因于将亚种提升为物种级别或重新验证同义词(K?hler等人,2005年)。

4.4 新描述的两栖动物物种的进化年龄随时间减少

随着分类学家逐渐将物种添加到我们星球的生命目录中,可以预期新描述的物种的推断进化年龄平均会减少。一方面,这是由于纯粹的随机原因,因为目录中包含的物种越多,其中也包括新描述物种的近亲的概率就越高。另一方面,很明显,分类学家和采集者首先会识别在形态上非常独特的物种作为新的物种,这意味着那些与近亲的区别较小的物种——通常在进化年龄上相差较小——将在分类学历史的后期被描述。最后,方法论的创新逐渐使得能够识别出在形态和基因上非常相似但仍然是生物学现实的年轻物种。这些因素都不会构成分类膨胀本身,但都导致了相同的经验模式:最近描述的物种在形态上更加相似,并且与已经描述的物种的进化分歧较小。根据这一预期,我们发现所有较高分类群的年轻物种比例都在增加。后更新世(<2 Ma)新描述的物种比例在所有群体中也都在上升,分别在哺乳动物和鸟类中增加了48.1%和45.1%(表2)。然而,这两个群体被认为包含大量年轻物种,因此检查两栖动物中HZ数据足够一致以推断物种形成时间参考点的特别年轻分类群的比例更为相关。在两栖动物中,我们发现1980年至2010年间新描述的年龄小于2.6 Ma的物种数量增加了56%,尽管总体上<2.6 Ma的物种比例仍然非常低(直到2010年不到10%;图2)。显然,许多新描述的两栖动物年轻物种都有令人信服的整合证据支持,其中一些甚至得到了深入的群体基因组数据的彻底支持。然而,在其他情况下,新描述的物种可能更具争议性,因为地理变异的采样不完全,形态差异较弱,以及依赖于单一的分子标记。此外,一些最初设计用于处理少数基因标记的物种划分程序,在应用于高通量测序产生的数千或数十万个SNP时,可能会将群体水平的差异误解为物种水平的差异(Sukumaran和Knowles 2017年;Leaché等人,2019年,2021年;Chambers和Hillis 2019年;Dufresnes等人,2020年;Burriel-Carranza等人,2023年)。在RI不太可能且物种状态无法确认的情况下,可以考虑亚种分类(Hillis 2020年;de Queiroz 2020年;Dufresnes等人,2023年)。物种是科学和社会重要领域的基本单位,分类膨胀和物种列表的不稳定性将对其产生重大影响(Frankham等人,2012年)。分类学家正在与时间赛跑,以发现和描述地球上数百万个科学上尚未命名的新物种(de Carvalho等人,2007年;Costello等人,2013年;Murali等人,2023年)。将边界不清的谱系描述为物种会分散重新评估它们分类学所需的许多工作能力(例如,Tolley等人,2022年),并远离绘制我们星球未编目多样性的紧迫任务。从时间树得出的物种对的父系距离结果提供了一种量化随时间描述的可疑年轻物种增加的方法,但需要额外的工作将任何检测到的趋势归因于分类膨胀。在哺乳动物和鸟类中,1980年至2010年间描述的后更新世(<2 Ma)物种比例的增加特别明显,需要更深入地研究杂交带,以了解是否可以为同质生活和自然历史的子群体建立物种形成时间的参考点。在两栖动物中,重新检查<2.6 Ma的物种对将是有价值的努力,以了解其中有多少是确实高度不同的物种(甚至可能是共存的,或者有不同的求偶叫声:Vences等人,2012年)而不是可能在缺乏充分证据的情况下描述的潜在同种谱系。

作者贡献
概念化:Sven Gippner、Christophe Dufresnes和Miguel Vences。方法论:Sven Gippner和Christophe Dufresnes。调查:Sven Gippner和Christophe Dufresnes。正式分析和验证:Sven Gippner、Christophe Dufresnes和Katharina Ruthsatz。写作——原始草稿:Sven Gippner、Christophe Dufresnes和Miguel Vences。写作——审稿和编辑:Sven Gippner、Katharina Ruthsatz、Christophe Dufresnes和Miguel Vences。致谢
我们感谢两位匿名审稿人的建设性评论,这些评论改进了手稿和相关的数据集。David Lei?e为基于时间树的分化时间分析提供了代码。开放获取资金由Projekt DEAL提供和组织。

M.V.、C.D.和S.G.得到了德国研究基金会(VE247/19-1)在Taxon-Omics优先计划(SPP1991)框架下的资助。利益冲突
作者声明没有利益冲突。数据可用性声明
本文描述的所有编译和生成的数据、代码和结果均可在DataDryad存储库中找到:https://doi.org/10.5061/dryad.wwpzgmsv2。这包括编译的杂交带数据、用于分析的R脚本、用于计算随时间变化的分类体分化时间的TInflA工具的源代码、时间树和物种列表,以及TInflA产生的所有结果。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号