枣(Ziziphus jujuba)品种'Huizao'的端粒到端粒(Telomere-to-Telomere, T2T)基因组组装及泛基因组(Pan-Genome)分析揭示枣果实质地多样性的遗传基础
《Molecular Horticulture》:The T2T genome assembly of Ziziphus jujuba ‘Huizao’ and pan-genome analyses provide insights into fruit texture diversity in jujube
编辑推荐:
酸枣(Ziziphus jujuba Mill.)俗称枣(2n = 2x = 24),是鼠李科(Rhamnaceae)中最重要的经济果树。枣果实质地决定口感与耐储性,是消费者选购的主要驱动因子;根据成熟果实质地可分为鲜食脆嫩型(如'冬枣')与干制用坚硬型(如'
酸枣(Ziziphus jujuba Mill.)俗称枣(2n = 2x = 24),是鼠李科(Rhamnaceae)中最重要的经济果树。枣果实质地决定口感与耐储性,是消费者选购的主要驱动因子;根据成熟果实质地可分为鲜食脆嫩型(如'冬枣')与干制用坚硬型(如'惠枣')。果胶(Pectin)是初生细胞壁和中胶层主要成分,通过结合含GUB_WAK_bind结构域的壁关联激酶(Wall-Associated Kinases, WAKs)调控细胞壁合成及厚度,进而影响果实硬度(Firmness),但GUB_WAK_bind基因在枣质地多样性中的作用尚不清楚。研究人员针对干食枣'Huizao'开展了T2T单倍型分型基因组组装,整合30.42 Gb HiFi CCS(Continuous Long Read Consensus Sequence) reads、36.63 Gb ONT(Oxford Nanopore Technologies) reads及50.18 Gb Hi-C(High-throughput Chromatin Conformation Capture)数据。评估显示两单倍型HZ_hapA与HZ_hapB的BUSCO(Benchmarking Universal Single-Copy Orthologs)完整度分别达98.2%和98.3%,Illumina及HiFi比对率均>99.3%,LTR组装指数(LTR Assembly Index, LAI)>20,24条染色体均鉴定到端粒重复序列,并注释了着丝粒区域,预测获得约30,369和30,005个蛋白编码基因。基于'Huizao'及9份已发表枣基因组构建图泛基因组(Graph-based Pan-Genome),大小556 Mb,含323,139个基因模型,其中核心基因家族11,652个。系统发育与基因家族分析表明'Huizao'特异扩张基因显著富集于多糖结合(Polysaccharide Binding)及果胶代谢过程。研究人员重点鉴定含保守GUB_WAK_bind结构域的基因家族,发现'Huizao'含有123个GUB_WAK_bind基因('Dongzao'为92个),主要经串联重复分布于染色体1、4、10,且侧翼伴随转转座子(Transposon)相关基因,提示该家族在'Huizao'中受转poson驱动扩张。两品种比较基因组学识别出大量SNP、InDel及结构变异(Structural Variations, SVs),SV关联基因同样富集于多糖结合。表型与超微结构显示'Huizao'果实发育过程中果胶含量、硬度及细胞壁厚度均显著高于'Dongzao',部分GUB_WAK_bind基因差异表达。综上,研究人员首次获得枣'Huizao' T2T单倍型基因组及枣泛基因组,鉴定并表征GUB_WAK_bind基因家族的拷贝数变异(Copy Number Variation, CNV)、表达差异及序列变异共同介导干食与鲜食枣果实质地分化,提出WAKs响应果胶信号调控细胞壁厚度的潜在机制模型,为枣多年生果树改良提供基因组资源。
《Molecular Horticulture》:枣(Ziziphus jujuba)'Huizao' T2T基因组组装与泛基因组分析揭示果实质地多样性机制》论文解读
一、研究背景与立项依据
枣(Ziziphus jujuba Mill.,2n=2x=24)是鼠李科最具经济价值的果树,耐旱耐盐碱且果实具较高营养与药用价值。果实质地(脆嫩vs坚硬)是决定鲜食型如'Dongzao(冬枣)'与干制型如'Huizao(惠枣)'商品价值的关键因素,其主要由细胞壁成分特别是果胶(pectin,初生细胞壁及中胶层主要组分)及其调控的细胞壁机械强度决定。壁关联激酶(Wall-Associated Kinase, WAK)可通过GUB_WAK_bind结构域结合果胶片段,触发细胞壁生物合成从而增加壁厚,影响果实硬度(firmness),但含GUB_WAK_bind结构域的基因家族在枣不同品种间果实质地分化中的进化与功能尚不明确。此前枣基因组组装存在大量缺口(gaps),缺乏完整的端粒到端粒(Telomere-to-Telomere, T2T)无间隙组装,限制了对结构变异、基因家族扩张及质地相关基因进化的解析。为此,研究人员开展'Huizao' T2T单倍型分辨基因组测序、枣泛基因组构建及'Huizao'与'Dongzao'比较基因组学与发育转录组学联合分析,以阐明果实质地多样性的遗传基础。
二、主要关键技术方法
研究人员以干食枣栽培品种'Huizao'为材料,整合PacBio HiFi CCS(30.42 Gb)、Oxford Nanopore Technologies(ONT,36.63 Gb)长读长及Hi-C(50.18 Gb)染色质构象捕获数据进行单倍型分辨的T2T基因组组装;选取已发表的9份不同枣品种基因组(含鲜食'Dongzao'等)构建基于图的泛基因组(graph-based pan-genome);利用BUSCO、LAI(LTR Assembly Index)、端粒/着丝粒注释评估组装质量;通过OrthoFinder进行直系同源聚类划分核心与可变基因家族,并进行GO(Gene Ontology)富集分析;鉴定含GUB_WAK_bind结构域基因家族,开展共线性(synteny)、侧翼转座子分析及系统发育树构建;以'Huizao'为参考与'Dongzao'进行全基因组比对识别SNP、InDel及结构变异(SV,50–10,000 bp)并注释关联基因;采集两品种五个果实发育阶段(花后31 d Young、63 d Expansion、78 d White-ripening、98 d Half-ripening、108 d Full-ripening)样品进行透射电镜细胞壁厚度观测、果胶含量与硬度生理测定及转录组测序筛选差异表达基因(DEG,|FoldChange|>1,P<0.01)。
三、研究结果
T2T单倍型基因组组装与质量评估
研究人员利用HiFi+ONT+Hi-C混合策略获得'Huizao'单倍型分辨无间隙基因组,HZ_hapA与HZ_hapB的BUSCO完整度分别为98.2%和98.3%,Illumina及HiFi读段比对率>99.3%,LAI值分别为20.34和20.46,两单倍型24条染色体均检出端粒重复(仅HZ_hapB Chr6 5'端未检出),除HZ_hapB Chr3外均注释到 putative centromeric regions。约半数序列为重复元件,分别预测30,369和30,005个蛋白编码基因。该组装达到gold-standard质量。
泛基因组构建与基因家族分析
基于10份枣基因组构建泛基因组(556 Mb,323,139个基因模型),聚类为25,575个基因家族,含11,652个核心(core)基因家族、21,468个非必需(dispensable)基因及185个私有(private)基因。系统发育(基于1,718个单拷贝基因)显示参试品种分为两支。'Huizao'显著扩张460个基因家族、收缩344个,Ks值分析示品种间共享峰~0.001,无近期全基因组复制(Whole Genome Duplication, WGD),仅保留祖先γ三倍化事件。扩张基因家族GO富集于多糖结合(polysaccharide binding),特有基因家族富集于果胶代谢过程(pectin metabolic process)。
GUB_WAK_bind基因家族鉴定与扩张机制
研究人员锁定与多糖结合相关的两个直系同源群OG0000002和OG0000064,均含保守GUB_WAK_bind结构域。'Huizao'中OG0000002含41拷贝(高于'Dongzao' 25、'Suanzao' 32、'Junzao' 15),OG0000064亦为最高拷贝数。全基因组鉴定得'Huizao'含123个GUB_WAK_bind基因('Dongzao' 92个),系统进化分三亚组,主要经串联重复(tandem duplication)富集于Chr1、Chr4、Chr10。共线性与侧翼基因分析发现'Huizao'中GUB_WAK_bind基因邻近大量转座子(transposon)相关基因而'Dongzao'缺失,表明该家族在'Huizao'中受转poson驱动扩张。
'Huizao'与'Dongzao'比较基因组及结构变异分析
两品种比较识别出435,321个SNP、>10万InDel及215个重复、145个易位等,以HZ_hapA为参考检出6,752个SV(50–10,000 bp)关联3,400个基因,GO富集同样显著关联多糖结合功能。
果实发育表型、超微结构与转录组分析
五阶段采样显示相比'Dongzao','Huizao'果实具更高果胶含量、更大硬度及更厚细胞壁(透射电镜观测)。转录组获大量品种间DEG,富集于细胞/细胞壁多糖代谢、ABA刺激应答、细胞壁厚度调节等。部分GUB_WAK_bind基因在'Huizao'幼果或膨大期上调,且多数GUB_WAK_bind基因同时存在差异表达与基因组变异(SNP/InDel/SV)。
四、讨论与结论总结(翻译自原文结论段)
综上所述,研究人员首次完成了枣'Huizao'的T2T单倍型分辨基因组组装并构建了枣泛基因组,为这一多年生果树的后续研究与品种改良提供了全面的基因组资源。尤为重要的是,研究人员鉴定并表征了GUB_WAK_bind基因家族。分析表明,干食型'Huizao'与鲜食型'Dongzao'的分化不仅涉及GUB_WAK_bind基因拷贝数变异(CNV),还包括表达水平差异及基因组序列变异,有效解释了二者果实质地的表型差异。通过整合基因组、转录组及果实发育数据,研究人员提出了一个潜在的机制模型:即GUB_WAK_bind基因编码的WAKs响应果胶来源信号以调节果实细胞壁厚度。这些发现为GUB_WAK_bind家族的进化及枣果实质地多样性背后的遗传基础提供了新的认识。