《Molecular Phylogenetics and Evolution》:Integrative morphological and genomic analyses reveal diversity, reticulate evolution, and adaptation in diploid and tetraploid
Rosa species from Xinjiang
编辑推荐:
新疆蔷薇属植物的系统发育与形态适应研究整合了252份样本的形态测量、倍性分析和全基因组重测序数据,揭示了多倍体杂交与网状进化对形态重叠的驱动作用,并识别了与干旱高温适应相关的候选位点。
唐忠宇|梁振龙|邓恒宁|李亮英|卢健|李世奇|苗佳|张成|高新芬
中国科学院成都生物研究所四川省山地生态恢复与生物多样性保护重点实验室,中国四川成都610000
摘要
新疆拥有广阔的山脉系统和沙漠盆地,构成了东亚与中亚之间的重要生物地理走廊,同时也是分类学上具有挑战性的野生蔷薇属(Rosa)物种的栖息地。我们分析了252个样本(159个二倍体,93个四倍体),并结合了形态测量学、倍性估计和全基因组重测序数据。对14个数量性状的主成分分析(PCA)显示,二倍体R. beggeriana与四倍体R. laxa之间存在显著的重叠。相比之下,基于Gower距离的混合性状聚类结果与基因组结构一致,而随机森林(Random Forest)和线性判别分析(LDA)识别出10个具有较高区分度的诊断性状(准确率为86.2%)。这一综合框架有助于划分物种谱系边界,并将持续的表型重叠归因于网状进化。二倍体样本的重测序产生了477万个单核苷酸多态性(SNPs),揭示了深厚的谱系结构和普遍的基因渗入现象,包括一个具有镶嵌遗传背景的多物种混合谱系。基因组扫描和性状-环境关联分析突出了与压力相关的候选位点(包括与DRS1和DCL4重叠的信号)。研究还发现,在R. beggeriana的一个干旱谱系中,密集的花梗毛与炎热干旱的生境有关,这有待功能验证。基于240个质体和5,641个单拷贝核基因构建的系统发育树显示了细胞核与质体之间的强烈不一致性,以及基因树的分歧,这可能与快速的分化和不完全的谱系分化有关,并进一步受到基因渗入和质体捕获的影响。对于四倍体而言,综合证据支持其近期发生的自多倍体化现象以及持续的基因交换,尽管短读长数据限制了剂量敏感性的推断。总体而言,我们的结果阐明了新疆蔷薇属植物的网状进化历史,为保护和种质资源利用提供了基于谱系的信息。
引言
蔷薇属(Rosa L.)包含大约150-200个物种,分布于北半球的亚热带至寒温带地区,是全球观赏植物、精油和医药产业的基础(Hibrand Saint-Oyant等,2018;Jiang等,2025)。在中国——这一蔷薇属物种多样性中心——一项全面调查采样了《中国植物志》中列出的95个物种中的80个,其物种丰富度主要集中在西南部和西北部地区(Cheng等,2025)。从分类学上看,Rehder(1940)基于形态学的框架将蔷薇属分为四个亚属和十个组,但分子系统发育研究在不同程度上修正了这一分类(Jiang等,2025)。然而,主要分支的界定仍然不稳定,这可能是因为快速的物种分化和普遍存在的网状进化掩盖了具有诊断意义的形态特征。
与此观点一致的是,蔷薇属的物种分化相对较新,其进化历史具有强烈的网状特征,受到广泛的种间杂交、基因渗入和多次多倍体化的驱动;现存物种中近一半为多倍体(Bruneau等,2007;Debray等,2022)。对101个物种的GAPDH和五个叶绿体区域的分析表明,大多数传统定义的亚属和组并非单系群(Fougère-Danezan等,2015)。随后,Debray等(2022)开发了一个以二倍体为起点的系统基因组学框架,整合了单拷贝核基因(SCNGs)的靶向测序、系统发育重建和最大伪似然(MPL)网络推断。该研究基本解决了蔷薇属亚属和组之间的进化关系,并揭示了该属的多倍体化和网状进化复杂历史(Debray等,2022)。对215个样本的重测序结果与R. persica参考基因组进行了比对,并结合系统发育重建和群体结构分析,进一步揭示了中国蔷薇属的复杂分化过程(Cheng等,2025)。尽管如此,这种镶嵌式的进化历史仍然导致广泛的形态中间态、普遍的系统发育不一致性和模糊的物种边界,即使利用基因组数据也难以调和。
在这些未解决的问题中,新疆野生蔷薇的形态学歧义和细胞遗传学复杂性尤为突出。R. beggeriana(Schrenk,1841)具有向下弯曲的刺,在果实成熟后会脱落萼片和上部花托;R. laxa(Retz.,1803)的花朵较少,成熟时萼片保持直立,其他特征与R. beggeriana相似;R. albertii(Regel,1882)的刺是直的,叶缘通常有腺体;R. fedtschenkoana(Regel,1878)同样具有直刺,花托通常有腺体,尽管存在显著变异。这四个物种都属于Rosa组,花色相似(白色、粉色或介于两者之间),但在叶毛和锯齿特征上存在明显差异,使得鉴定——尤其是R. beggeriana和R. laxa之间的鉴定——非常困难。倍性变异进一步加剧了这些难度:Yu等(2014)报告R. beggeriana为二倍体,而Roberts等(2009)记录R. beggeriana存在四倍体和六倍体细胞型,R. laxa为二倍体细胞型,R. fedtschenkoana同时存在四倍体和六倍体细胞型。广泛的杂交、最近的分化和倍性变异模糊了诊断性状,阻碍了形态学鉴定和系统发育推断,使得新疆蔷薇属的物种界定尤为复杂。
因此,新疆蔷薇属研究的关键任务包括划定物种边界、解决系统发育关系以及探讨形态学如何随环境适应而变化。在这里,我们整合了高维形态测量学、倍性评估和基因组分析来重新评估新疆蔷薇属。具体来说,我们的目标包括:(i)评估传统基于形态学的分类与基因组谱系之间的一致性;(ii)重建二倍体和四倍体类群之间的关系;(iii)量化基因渗入和杂交对干旱高温环境下系统发育不一致性和性状-环境关联的贡献。
样本收集、倍性估计和样本选择
我们在2023年和2024年6月至7月期间,对中国新疆维吾尔自治区的Rosa个体(n=234;六个潜在分类单元)进行了采样。此外,我们还在四川省采集了R. willmottiae(n=18)的样本(Cheng等,2025),它是研究重点组的近亲(表S2;图S1a)。在每个种群中,我们至少相隔15米采集个体,以减少克隆的重复采样。所有个体均使用《中国植物志》的关键特征进行初步鉴定,并通过与其他已鉴定的样本进行比较。
形态多样性和适应性
对数量性状的PCA分析显示,不同物种在形态空间中有广泛的重叠(图S4a)。特别是
R. beggeriana与R. fedtschenkoana、R. platyacantha和R. laxa有显著重叠,也与R. albertii和R. spinosissima有部分重叠。相比之下,基于Gower距离(数量性状+质量性状)的t-SNE结合层次聚类方法较好地解决了物种级别的分组问题。在形态学树状图中,R. beggeriana形成了一个广泛分散的簇。方法选择与局限性
在分布广泛的Rosa物种中,物种鉴定常常受到采样不确定性、分类学同物异名、基因渗入、快速分化和倍性变异的影响。在这里,我们将详细的形态学信息与系统发育、群体结构和基因流推断相结合,随着新证据的出现不断调整分类结果。因此,我们的分类结论仅适用于研究区域的中国部分,特别是新疆的采样种群。结论
我们分析了新疆六个Rosa物种的形态学和基因组数据,以阐明这一分类学上复杂群体的关系、谱系结构和与环境相关的变异。基于Gower距离的层次聚类(结合质量性状和数量性状)与核基因组系统发育结果高度一致,证实了表型分化主要遵循基因组结构。此外,使用随机森林(Random Forest)和线性判别分析(LDA)进行特征选择进一步验证了这些结果。
未引用的参考文献
环境系统研究所(ESRI)(2018)。
CRediT作者贡献声明
唐忠宇:撰写——审稿与编辑、初稿撰写、可视化、验证、调查、正式分析、数据管理、概念构建。梁振龙:正式分析、数据管理。邓恒宁:资源获取、数据管理。李亮英:资源获取、正式分析、数据管理。卢健:撰写——审稿与编辑、数据管理。李世奇:正式分析、数据管理。苗佳:正式分析、数据管理。张成:资源获取、数据管理。高新芬:
资助
本研究得到了第二次青藏高原科学考察与研究(STEP)计划(项目编号2019QZKK0502)的支持。
致谢
我们感谢Jia Yanxia进行了流式细胞术分析。同时,我们也感谢第二次青藏高原科学考察与研究(STEP)计划提供的财务支持。