《Plant Diversity》:Unraveling phylogeny in Juglandaceae and endangered status of Carya sinensis via genome assembly and population genomics
编辑推荐:
通过基因组组装与群体基因组学解析山核桃科系统发育及中国山核桃濒危现状。中国山核桃(Carya sinensis)是中国国家二级保护植物,自2009年起被列入极小种群野生植物名录。作为一种极度稀有物种,其野生个体数量不足1000株,保护工作面临着分类学争议未解及
通过基因组组装与群体基因组学解析山核桃科系统发育及中国山核桃濒危现状。中国山核桃(Carya sinensis)是中国国家二级保护植物,自2009年起被列入极小种群野生植物名录。作为一种极度稀有物种,其野生个体数量不足1000株,保护工作面临着分类学争议未解及濒危遗传基础不明的双重挑战。本研究报道了中国山核桃染色体级别参考基因组,大小为593.68 Mb。比较基因组分析显示中国山核桃与山核桃(C. cathayensis)的分化时间约为1880万年前(18.8 Mya),全基因组复制(WGD)被确定为该物种基因复制的主要模式。此外,核基因组数据明确支持将中国山核桃归入山核桃属(Carya)。基于202份样本的重测序数据进行的群体基因组分析揭示了四个不同的谱系,谱系间遗传分化程度相对较低。中国山核桃表现出严重的近交现象,有害突变的积累可能进一步损害了其适应潜力。此外,纳亚雄格拉(Nayanxungla)冰期和末次盛冰期(LGM)对其种群规模施加了显著的瓶颈效应。最暖季度降水(Precipitation of Warmest Quarter)被确定为影响其分布的关键气候因子,并重建了不同历史时期的中国山核桃适生区。总体而言,本研究全面揭示了中国山核桃濒危状态的遗传、进化和生态因素,为其保护提供了宝贵见解,这些发现也可能适用于其他受威胁植物物种。
论文解读:中国山核桃基因组与濒危机制研究
研究背景与意义
当前全球正处于第六次生物大灭绝阶段,受威胁植物面临严峻生存压力。中国山核桃(Carya sinensis)作为胡桃科(Juglandaceae)的孑遗植物,因形态独特(如果实具喙)长期存在分类争议,曾被置于单型属Annamocarya。同时,该物种野生个体不足1000株,被列为中国国家二级保护植物及IUCN濒危(EN)物种。然而,其基因组特征、种群遗传结构、进化历史及濒危的深层遗传机制尚不明确,传统分子标记技术分辨率有限,制约了有效保护策略的制定。为此,研究人员开展了多组学联合分析,相关成果发表于《Plant Diversity》。
关键技术方法
研究人员首先利用Illumina、PacBio HiFi和Hi-C技术,对来自贵州三都县母树的无性系样本进行测序,完成了中国山核桃染色体级别基因组组装。在此基础上,对覆盖中国云南、贵州、广西全部分布区的202份中国山核桃野生样本进行全基因组重测序(WGS),并结合已发表的75份其他5种山核桃属物种样本数据进行联合分析。主要分析手段包括:使用OrthoFinder进行系统发育与分歧时间估算;利用MCScanX和Ks分布分析全基因组复制(WGD)事件;通过ADMIXTURE、PCA和系统发育树解析群体结构;采用PSMC推断种群历史动态;利用LFMM和MaxEnt进行环境适应性基因筛选与物种分布模型(SDM)预测。
研究结果
3.1 中国山核桃高质量基因组组装
研究人员通过K-mer分析估计基因组大小约为580.2 Mb。最终组装的基因组大小为593.68 Mb, scaffold N50达到38,587,282 bp,其中99.19%的序列被挂载到16条染色体上。BUSCO评估显示基因组完整性达99.0%,Merqury分析表明QV值为48.86,序列准确度超过99.99%。
3.2 基因组注释
基因组中共鉴定出340.9 Mb重复序列,占总基因组的57.42%,其中LTR逆转录转座子占比最高。共预测了39,330个蛋白编码基因,平均CDS长度为1192.03 bp。功能注释显示98.10%的基因获得功能注释。
3.3 比较基因组学分析
对20种被子植物(含19个其他物种)的比较基因组学分析显示,中国山核桃与胡桃科其他成员共享8517个单拷贝基因,自身特有134个单拷贝基因。系统发育分析证实中国山核桃与山核桃属聚为一支,强烈支持其归入山核桃属的分类地位。中国山核桃与山核桃的分歧时间约为18.8 Mya。基因家族分析显示中国山核桃经历的基因家族收缩(1131个)多于扩张(685个)。
3.4 全基因组复制事件
同线性分析显示中国山核桃与葡萄(Vitis vinifera)呈2:1对应关系,表明其经历了全基因组复制(WGD)事件。Ks分布分析显示约Ks=0.4和Ks=0.9处存在两个峰值,证实存在两轮WGD事件。WGD基因主要富集于生殖能力、能量代谢和环境胁迫响应通路。
3.5 全基因组重测序与SNP挖掘
对202份中国山核桃样本重测序共获得26,597,624个高质量SNP位点,平均测序深度为17.20×,基因组覆盖率达97.11%。
3.6 中国山核桃遗传结构与遗传多样性分析
群体结构分析(ADMIXTURE, K=4)结合系统发育树和PCA,将中国山核桃分为四个主要谱系:JX、GE、HC和YW。遗传多样性分析显示YW谱系核苷酸多样性(π = 5.25 × 10?3)最高,JX谱系最低。Tajima’s D值表明JX和HC谱系偏离中性进化,可能经历了近期瓶颈。
3.7 联合群体进化分析
结合其他五种山核桃属植物的分析显示,中国山核桃与C. kweichowensis和C. tonkinensis亲缘关系最近。基因流分析(TreeMix)表明中国山核桃未参与显著的历史基因流事件,LD衰减距离(5.530 kb)处于中等水平。
3.8 中国山核桃近交程度分析
基于亲缘系数和纯合片段(ROH)分析,JX和HC谱系近交程度最高,大多数样本显示三代以内的亲缘关系。杂合度分析显示年轻个体(胸围<80 cm)的平均杂合度显著低于中老年个体,表明随着世代更替,近交衰退加剧。
3.9 功能缺失(LoF)位点检测
通过与外类群C. kweichowensis比较,鉴定出1019个在中国山核桃中广泛存在的LoF位点,涉及880个基因,这些基因主要关联硫 relay 系统、次生代谢和生物合成等通路。
3.10 中国山核桃种群历史重建
PSMC分析显示中国山核桃四个谱系均经历了两次显著的瓶颈事件:第一次发生在纳亚雄格拉冰期(Nayanxungla glaciation, ~0.8–0.5 Mya),第二次发生在末次盛冰期(LGM, ~21 kya)。其中JX谱系在LGM期间种群下降幅度最大。
3.11 适应性信号筛选
与遗传多样性较高的C. hunanensis相比,中国山核桃检测到413个受选择基因。高海拔与低海拔样本间的选择消除分析分别鉴定出429和659个受选择基因,这些基因显著富集于倍半萜类和三萜类生物合成、维生素B6代谢等通路。
3.12 适宜区预测
MaxEnt模型显示最暖季度降水(bio18)是影响中国山核桃分布的首要气候因子(贡献率61.50%)。预测结果显示,末次间冰期(LIG)适生区面积最大,LGM时期缩减,现代有所恢复,主要集中于滇黔桂交界区域。
讨论与结论总结
讨论部分
研究人员指出,核基因组数据彻底解决了分类学争议,支持将中国山核桃归入山核桃属。其濒危原因可归结为内外双重因素:内在因素包括长期地理隔离导致的种群封闭、严重的近交衰退、WGD后的基因组不稳定性以及LoF突变的积累;外在因素则主要是第四纪冰期的瓶颈效应及人类活动导致的生境破碎化。研究还筛选出多个与抗逆、开花结果及高海拔适应相关的候选基因(如CsRPS8, CsHSP90.3, CsCBL3等)。基于此,建议对中国山核桃实施就地保护与迁地保护相结合的策略,针对不同谱系设立独立管理单元,并在潜在适生区(如四川)开展辅助迁移。
结论部分
综上所述,本研究组装的高质量染色体级别基因组为理解中国山核桃在胡桃科中的分类地位和进化历史提供了重要见解,研究人员强烈支持基于核基因组将其归入山核桃属。此外,鉴定出的两轮WGD事件和重要基因,以及群体基因组学分析揭示的低基因流频率和两次历史瓶颈事件,共同构成了该物种濒危的遗传基础。基因与环境关联分析确定了最暖季度降水为关键限制因子。这些发现不仅有助于中国山核桃的生物多样性和种质资源保护,也为东亚山核桃属物种的遗传进化和种群历史提供了清晰的图景。