《DNA Research》:Chromosome-scale genome assembly of Malcolmia littorea using long-read sequencing and single-pollen genotyping technologies
编辑推荐:
本研究针对滨海Malcolmia littorea基因组资源匮乏的问题,利用PacBio HiFi长读长测序技术进行de novo组装,并创新性地开发单花粉基因分型方法构建遗传连锁图谱,成功获得覆盖10条染色体的高质量基因组(215 Mb,30,266个预测基因)。比较基因组分析揭示M. littorea经历全基因组复制事件,为解析其海岸环境适应性与生殖隔离机制提供关键资源,对十字花科植物进化研究具有重要意义。
在植物王国中,有一类特殊的物种能够顽强地生长在环境恶劣的海岸沙地,它们就是十字花科(Brassicaceae)的滨海Malcolmia littorea(沙地紫罗兰)。这种植物不仅具有极高的耐盐碱、耐贫瘠能力,还因其独特的自交不亲和性及种间生殖隔离现象,成为研究植物适应性进化与生殖屏障机制的理想模型。然而,尽管其生态与进化意义重大,科学界长期以来缺乏高质量的基因组资源,这严重阻碍了对该物种关键性状分子机制的深入解析。
为了打破这一研究瓶颈,研究人员在《DNA Research》上发表了题为"Chromosome-scale genome assembly of Malcolmia littorea using long-read sequencing and single-pollen genotyping technologies"的重要成果。该研究综合利用PacBio HiFi长读长测序与创新的单花粉基因分型技术,成功构建了M. littorea的染色体级别基因组图谱,为揭示这一滨海先锋植物的遗传奥秘奠定了坚实基础。
在研究技术方法上,团队首先通过流式细胞术和k-mer分析确定基因组大小(约250 Mb)和杂合度(1.8%)。利用PacBio Sequel II系统获得26.1 Gb HiFi reads进行初步组装,再通过单花粉转录组测序(Drop-seq技术)从300个花粉粒中鉴定41,972个SNP位点构建遗传连锁图谱。最后结合同源预测(GeMoMa)和从头预测(Helixer)方法完成基因注释,并使用BUSCO评估组装完整性。
3.1. M. littorea的染色体数目和基因组大小
通过体细胞染色体观察确定M. littorea染色体数为2n=20(图1)。流式细胞术显示其基因组大小约为拟南芥的1.62倍(254 Mb),k-mer分析结果(246.1 Mb)与之吻合,确认基因组大小约250 Mb且杂合度较高(图2)。
3.2. 基因组测序和组装
HiFi reads组装产生29个contigs(N50=13.1 Mb),经等位基因去除和污染序列过滤后获得215.0 Mb的最终组装版本MLI_r1.0。BUSCO评估显示完整性达98.0%,其中单拷贝基因占92.8%(表1-2),表明组装质量极高。
3.3. 基于单花粉转录组SNP基因分型的染色体级别序列构建
创新性单花粉基因分型技术成功构建包含10个连锁群(总长744.2 cM)的遗传图谱(图3)。将22个contigs(97.2%组装序列)锚定至图谱,获得10条伪分子序列(MLI_r1.0.pmol),总长213.4 Mb(表3),首次实现该物种染色体级别组装。
3.4. M. littorea基因组中预测的基因和重复序列
整合两种预测方法获得30,266个高置信基因(BUSCO完整性97.5%)。重复序列占基因组46.3%,以LTR反转录转座子为主(18.0%),其中gypsy型和copia型分别占13.0%和4.7%(表4),这些重复元件的扩增可能与其基因组扩张有关。
3.5. M. littorea基因组结构的比较分析
与拟南芥基因组比较发现92个共线性区块(图4),显示M. littorea基因组存在相对于拟南芥的加倍现象。同时检测到23个内部共线性区块,支持该物种经历全基因组复制(WGD)事件,但基因集已通过亚功能化/新功能化完成二倍化。
研究结论与讨论部分强调,本研究首次提供了Malcolmia属的染色体级别基因组资源。比较基因组证据表明M. littorea可能经历额外的WGD事件(超越拟南芥已知的α、β、γ三次WGD),这或许解释其对滨海环境的特殊适应性。单花粉基因分型技术的成功应用,为难以构建遗传群体的物种提供了基因组组装新范式。该基因组不仅为解析植物海岸适应性、生殖隔离机制提供分子基础,对保护这一濒危物种的遗传多样性也具有重要价值,同时展示了种子库中珍稀资源的研究潜力。