《Horticulture Research》:A telomere-to-telomere gap-free genome of the new cultivar ‘Zhongtian No. 5,’ combined with pan-genome analysis, aids in exploration and genetic enhancement of red clover (Trifolium pratense L.)
编辑推荐:
本研究针对红三叶草缺乏高质量基因组组装及单一参考基因组无法全面代表其遗传多样性的问题,研究人员通过整合多平台测序数据,完成了首个端粒到端粒无间隙基因组组装,并构建了泛基因组。研究揭示了与异黄酮生物合成、多叶性状及产量相关基因的扩张与收缩,为红三叶草的分子育种提供了关键基因组资源。该成果对提升牧草品质、解析植物特殊形态建成的遗传机制具有重要意义。
红三叶草是一种重要的温带豆科牧草、园艺和生态植物,全球种植面积约400万公顷。它具备快速建植、耐荫、适应排水不良的酸性土壤等农艺优势,其共生固氮能力显著减少了对合成氮肥的依赖。然而,红三叶草是一种异交二倍体物种,具有高度杂合性和有效的配子体自交不亲和系统,这阻碍了从短读长数据组装连续基因组,也限制了其功能遗传资源的开发。此前,红三叶草缺乏高质量的参考基因组,现有组装高度碎片化,这严重阻碍了其遗传研究和分子育种进程。
为了突破这一瓶颈,研究人员对航天诱变选育的新品种‘中天5号’进行了深入研究。该品种表现出稳定的五小叶性状,叶片面积、干物质生物量和种子产量均显著优于其亲本品种‘岷山’,并且具有更高的异黄酮和粗蛋白含量。为了全面获取其遗传信息并深入了解其生物学特性,研究团队利用牛津纳米孔技术、PacBio HiFi测序、染色质构象捕获和BGI批量测序数据,成功组装了红三叶草首个端粒到端粒无间隙基因组。
研究人员采用的主要关键技术方法包括:利用PacBio HiFi和ONT超长读长进行混合从头组装,结合Hi-C数据进行染色体尺度支架构建,并通过系统性间隙填充最终获得T2T无间隙基因组。他们进行了全面的基因组注释,包括重复序列、蛋白质编码基因和非编码RNA的预测。通过比较基因组学分析构建系统发育树并估算分化时间,利用OrthoFinder进行直系同源基因簇分析以研究基因家族扩张与收缩。此外,研究还整合了三个红三叶草品种的基因组数据构建了泛基因组,并使用SyRI软件鉴定了结构变异。
测序、组装和验证T2T无间隙TpraZt5基因组
通过k-mer分析估计TpraZt5基因组大小约为419.66 Mb。整合多平台测序数据,最终获得了包含7条完整假染色体的390.94 Mb组装,contig N50达到52.95 Mb。Hi-C相互作用图谱验证了染色体的正确折叠。研究人员成功鉴定出14个端粒区域和7个大小不一的着丝粒区域。该组装质量极高,碱基准确度QV为38.03,BUSCO完整性达98.1%,长末端重复序列组装指数为25.65,达到黄金标准。
基因组注释
重复序列占基因组的59.6%,其中长末端重复反转录转座子占39.1%。研究人员注释了35,971个蛋白质编码基因,并分析了LTR-RTs的插入时间,发现Copia、Gypsy和未知类型反转录转座子的爆发分别发生在约0.0087、0.0069和0.0111百万年前。
LTRs对TpraZt5基因组附近基因的潜在影响
研究发现有大量蛋白质编码基因位于Gypsy、Copia和未知类型LTR-RTs的1 kb范围内。这些邻近基因在KEGG通路中呈现不同的富集模式,表明LTRs可能通过顺式调控影响邻近基因的功能。
进化和比较基因组分析
系统发育分析表明TpraZt5与TpraHA7的亲缘关系更近,分化时间约为200万年。基因家族分析显示,TpraZt5有2,434个基因家族发生扩张,3,228个发生收缩。扩张的基因家族显著富集于植物激素信号转导和光合作用-天线蛋白等通路,特别是与生长素相关的基因和叶绿素a-b结合蛋白基因。收缩的基因家族则主要富集于异黄酮生物合成通路。研究还发现TpraZt5有1,526个特有基因家族,而TpraHA7仅有273个。同义替换率分析表明红三叶草至少经历了两次全基因组复制事件。
泛基因组分析
研究人员构建了首个红三叶草泛基因组,将T2T TpraZt5基因组扩展了89.82 Mb。分析将基因分为核心基因、非必需基因和私有基因。TpraZt5含有606个物种特异性基因家族,其中包括4个与异黄酮生物合成相关的候选基因。功能分析表明,核心基因主要富集于基本细胞功能,而非必需基因和私有基因则富集于次生代谢物合成等与环境适应相关的通路。
SV分析
相对于TpraZt5参考基因组,在TpraHA7和TpraMiv中分别鉴定出大量结构变异。值得注意的是,在玉米素生物合成通路中发现了44个Gypsy型转座子,提示它们可能通过重复、倒位和易位事件参与三出复叶形态发生的调控。
研究结论与讨论部分强调,这项研究提供的T2T无间隙基因组和泛基因组资源标志着红三叶草正式进入T2T基因组学时代。该基因组组装是迄今为止已报道的质量最高的红三叶草参考基因组。基因家族分析揭示的叶绿素a-b结合蛋白和生长素相关基因的扩张,可能是TpraZt5较高生物量和种子产量的潜在驱动因素。泛基因组分析首次为红三叶草建立了研究框架,鉴定出的物种特异性基因和结构变异为了解其独特农艺性状的遗传基础提供了新视角。特别是发现44个Gypsy型转座子嵌入玉米素生物合成通路,为解析三叶草属植物叶片发育的分子机制提供了全新的调控范式,即转座子与植物激素途径相互作用以调节叶片结构。
尽管当前研究受样本量限制,但其鉴定的与异黄酮生物合成、叶片形态建成和产量相关性状的大量候选基因为后续功能验证和研究奠定了基础。未来需要更广泛地整合种质资源,包括野生近缘种,以发现控制关键适应性性状的野生等位基因,从而充分发挥泛基因组资源在红三叶草育种中的潜力。该研究为红三叶草的遗传改良和功能基因组学研究提供了至关重要的工具和见解。