对2032份不同烟草样本进行的全基因组测序揭示了其遗传变异和种群分化情况

《Journal of Genetics and Genomics》:Whole-genome sequencing of 2032 diverse tobacco accessions reveals genetic variation and population differentiation

【字体: 时间:2026年03月06日 来源:Journal of Genetics and Genomics 7.1

编辑推荐:

  基于2032份烟草种质资源全基因组重测序,鉴定59百万SNP和830万InDels,揭示种群遗传亚群分化主要由育种实践驱动,抗病相关基因存在强选择信号,并发现与农艺性状相关的QTLs,为精准育种提供资源。

熊正|童志军|阿萨德·乌拉|朱天乐|索明哲|焦芳婵|吴兴福|徐海明|林峰|陈学军|肖炳光
浙江大学农业与生物技术学院作物科学研究所和生物信息学研究所,中国浙江省杭州市310058

摘要

Nicotiana tabacum是一种异源四倍体杂交种,在植物遗传学中是一种广泛使用的模式生物。尽管它在农业和生物学上具有重要意义,但针对烟草的大规模基因组研究及其群体差异的全面分析仍然有限。在这里,我们对2032份不同的烟草样本进行了全基因组重测序,鉴定出了5900万个单核苷酸多态性(SNPs)和830万个小插入和缺失(InDels)。这些变异在群体内部和群体之间都贡献了显著的遗传多样性。群体遗传结构分析揭示了两个主要的遗传亚群,其分化主要由育种实践驱动。值得注意的是,不同品种之间的遗传差异大于不同烟草类型之间的差异。在六个烟草类型中共同存在的差异区域主要集中在防御机制、表皮发育和脂质代谢途径上,这反映了选择压力对植物适应性和生长的影响。我们进一步确定了302份在免疫相关基因中表现出强烈选择信号的样本,突显了它们作为抗性育种亲本的潜力。主要栽培品种中的选择信号与之前鉴定出的19个数量性状位点(QTLs)有重叠,这些QTLs主要与叶片形态、抗病性和化学特性等农艺性状相关。本研究为深入的烟草基因组研究提供了高分辨率的基因组资源,并为精准育种提供了宝贵的见解。

引言

Nicotiana tabacum(2n = 4x = 48)是茄科植物中的一种一年生或有限多年生草本植物,该科还包括茄子(Solanum melongena)、辣椒(Capsicum annuum)、矮牵牛(Petunia × hybrida)、番茄(Solanum lycopersicum)和马铃薯(Solanum tuberosum)等经济重要作物。Nicotiana tabacum是由两个祖先物种Nicotiana sylvestris(S基因组;2n = 2x = 24)和Nicotiana tomentosiformis(T基因组;2n = 2x = 24)杂交而成的,这一杂交事件大约发生在0.2百万年前(Lim等人,2004年;Clarkson等人,2005年;Leitch等人,2008年)。因此,N. tabacum拥有相对较大的基因组(约4500 Mb),远大于大多数其他栽培茄科植物的基因组大小(Arumuganathan等人,1994年)。多倍化在提高烟草的环境适应性和生态可塑性方面发挥了关键作用,使其能够在多种农业生态区中茁壮成长(Clarkson等人,2005年;Leitch等人,2008年)。然而,这种进化优势也导致了基因组的复杂性增加,包括广泛的基因重复、染色体重排和表观遗传修饰(Sierro等人,2014年)。此外,自然选择和人工选择共同作用,使得栽培烟草的遗传基础较为狭窄(Lewis和Nicholson,2006年)。这种基因组复杂性与遗传多样性有限的结合,既带来了挑战,也为推进烟草遗传学研究提供了机会,特别是在解析关键农艺性状的遗传基础和改进分子育种策略方面。烟草还是植物分子生物学和生物技术的重要模式生物(Bally等人,2018年)。N. tabacum在烟草花叶病毒(TMV)的发现中起到了核心作用,TMV是最早被描述的“可过滤”传染性病原体,后来被归类为“病毒”(Creager等人,1999年)。最早的抗性育种工作涉及筛选野生Nicotiana物种的TMV抗性,并将抗性(R)基因引入栽培N. tabacum(Holmes,1938年)。此外,N. tabacum还是首次用于农杆菌介导的植物转化技术的植物,这是植物基因工程的基础(Otten等人,1981年;Barton等人,1983年;Herrera-Estrella等人,1983年)。烟草相对容易进行基因转化和再生,为跨多种植物的基因功能研究提供了宝贵的平台。
烟草(Nicotiana tabacum,2n = 4x = 48)是茄科植物中的一种一年生或有限多年生草本植物,该科还包括茄子(Solanum melongena)、辣椒(Capsicum annuum)、矮牵牛(Petunia × hybrida)、番茄(Solanum lycopersicum)和马铃薯(Solanum tuberosum)等经济重要作物。Nicotiana tabacum是由两个祖先物种Nicotiana sylvestris(S基因组;2n = 2x = 24)和Nicotiana tomentosiformis(T基因组;2n = 2x = 24)杂交而成的,这一杂交事件大约发生在0.2百万年前(Lim等人,2004年;Clarkson等人,2005年;Leitch等人,2008年)。因此,N. tabacum拥有较大的基因组(约4500 Mb),远大于大多数其他栽培茄科植物的基因组大小(Arumuganathan等人,1994年)。多倍化在增强烟草的环境适应性和生态可塑性方面发挥了关键作用,使其能够在多种农业生态区中生长(Clarkson等人,2005年;Leitch等人,2008年)。然而,这种进化优势也导致了基因组的复杂性增加,包括广泛的基因重复、染色体重排和表观遗传修饰(Sierro等人,2014年)。此外,自然选择和人工选择共同作用,使得栽培烟草的遗传基础较为狭窄(Lewis和Nicholson,2006年)。这种基因组复杂性与遗传多样性有限的结合,既带来了挑战,也为推进烟草遗传学研究提供了机会,特别是在解析关键农艺性状的遗传基础和改进分子育种策略方面。烟草还是植物分子生物学和生物技术的重要模式生物(Bally等人,2018年)。N. tabacum在烟草花叶病毒(TMV)的发现中起到了核心作用,TMV是最早被描述的“可过滤”传染性病原体,后来被归类为“病毒”(Creager等人,1999年)。最早的抗性育种工作包括筛选野生Nicotiana物种的TMV抗性,并将抗性基因引入栽培N. tabacum(Holmes,1938年)。此外,N. tabacum还是首次用于农杆菌介导的植物转化技术的植物,这是植物基因工程的基础(Otten等人,1981年;Barton等人,1983年;Herrera-Estrella等人,1983年)。烟草相对容易进行基因转化和再生,为跨多种植物的基因功能研究提供了宝贵的平台。
烟草(N. tabacum)是一种重要的经济作物,其主要产品是叶片。它广泛种植在北纬55°至南纬40°之间的地区(Jia等人,2024年)。据信烟草起源于南美洲,随后通过人类迁移和贸易传播到世界各地。在20世纪之前,农民种植的烟草品种是通过大规模选择产生的,因此具有较高的遗传多样性。随着孟德尔遗传学的建立和20世纪初科学植物育种的发展,育种目标转向了具有高基因型和表型一致性的品种(Novak和Blüthner,2020年)。现代烟草育种计划专注于培育高产和叶片品质优良、具有多重抗病性的品种。美国是这一领域研究的先驱,并取得了重大进展。其他主要烟草生产国的育种计划大多起源于美国最初开发的品种(Wang Y和Zhou J,1995年)。如今,中国是最大的烟草生产国,其次是巴西、印度和美国。商业烟草根据其农业种植方式和采后加工方法分为主要市场类型,包括烟叶熏制型、晒干型、伯利型、雪茄型和马里兰型(Novak和Blüthner,2020年)。这些类型在植株结构、叶片形态和代谢特性上具有明显差异,这些差异是适应不同环境条件以及长期选择育种的结果。例如,烟叶熏制型烟草通常含有较高的糖分。伯利型烟草的特点是叶脉和叶柄颜色较浅,尼古丁和总氮含量相对较高,而糖分含量较低。雪茄型烟草的特点是叶片较小,植株结构紧凑,具有浓郁的香气。这些差异可能是由于分类系统结合了形态特征和加工方法;然而,不同烟草类型之间的遗传差异仍不甚清楚。此外,栽培烟草种质资源内的遗传多样性较低,这对未来的育种和品种改良构成了重大挑战。
由于N. tabacum基因组中重复序列比例较高(>70%)以及其两个祖先物种衍生出的高度相关的同源序列,组装高质量的N. tabacum基因组序列长期以来一直是一个重大挑战(Renny-Byfield等人,2011年)。尽管在过去十年中发表了几个N. tabacum基因组,但它们主要是使用第二代测序技术组装的,因此存在相当大的碎片化,仅部分锚定在染色体上(Sierro等人,2014年;Edwards等人,2017年)。随着测序技术的进步,现在可以更经济高效地组装大型和复杂的植物基因组。最近,有三个染色体水平的N. tabacum基因组被发布(Wang等人,2024年;Sierro等人,2024年;Zan等人,2025年)。其中,Wang等人(2024年)的组装包含了与防御相关的基因的全面注释,而Zan等人(2025年)的组装提供了基因型-表型关联网络。虽然有几项研究使用全基因组重测序(WGR)来分析烟草的遗传变异,但这些研究主要基于早期的草图基因组,样本量有限且测序深度较低(Thimmegowda等人,2018年;Tong等人,2020年;Yang等人,2020年)。随着气候变化的持续,对改进烟草品种的需求正在增加,而遗传多样性对于旨在提高环境适应性的育种计划至关重要。然而,缺乏基于高质量参考基因组和基因注释的大规模、高深度重测序数据严重阻碍了烟草遗传学研究,并限制了该作物在基础生物学研究和应用育种方面的潜力。先前的研究已经发现了与尼古丁含量、叶片形状、植株高度和抗病性状相关的几个数量性状位点(QTLs)(Sallaud等人,2012年;Lan等人,2014年;Ma等人,2019年;Liu等人,2022年;Shi等人,2022年;Yuan等人,2022年;Song等人,2025年)。然而,主要栽培烟草类型之间的遗传差异以及两个祖先亚基因组对其表型多样性的贡献仍然很大程度上尚未解决。
在这项研究中,我们对2032份烟草种质样本进行了全基因组重测序,生成了一个全面的数据集。通过群体遗传结构分析进一步揭示了烟草种质之间的遗传多样性和亲缘关系。我们的结果表明,第4号染色体的差异导致了两个明显亚群的形成。我们还确定了六个烟草类型中的差异基因组区域,以阐明它们的基因组差异。此外,通过选择性清除分析,我们发现G1亚群在免疫相关和抗病毒RNA沉默基因上表现出更强的选择信号。我们还构建了一个DNA指纹图谱,并利用SNPs来区分不同的烟草种质。这项研究为栽培烟草种质的遗传多样性和关键农艺性状的分子基础提供了宝贵的见解,为开发更高效和有针对性的育种策略奠定了基础。
全基因组重测序在2032份烟草样本中发现了丰富的遗传多样性
为了探索不同烟草类型之间的遗传多样性和群体差异,我们对2032份N. tabacum样本进行了重测序(表S1)。该样本包括1320份烟叶熏制型烟草、321份晒干型烟草、165份雪茄型烟草、97份伯利型烟草、100份雪茄型烟草和29份马里兰型烟草(表S2)。烟草种质按地理位置和内容及来源国家进行了分类(表S1)。烟叶熏制型烟草主要收集自...
讨论
高质量的Nicotiana tabacum染色体水平参考基因组将显著推进遗传学和基因组学研究(Wang等人,2024年;Sierro等人,2024年;Zan等人,2025年)。以往的研究主要依赖于基于有限种质的支架级基因组组装(Jiang等人,2024年;Tong等人,2025年;Song等人,2025年)。在这项研究中,我们为2032份烟草种质样本构建了一个全面的全基因组多样性图谱,代表了六个主要烟草类型。
植物收集、栽培和测序
在这项研究中,我们收集了2032份N. tabacum样本,包括1320份烟叶熏制型、321份晒干型、165份雪茄型、100份雪茄型、97份伯利型和29份马里兰型烟草。这些样本来自43个国家(如美国、中国、日本、希腊),并保存在中国云南省昆明市的烟草生物技术育种重点实验室、国家烟草遗传工程研究中心和云南省烟草农业科学院。
未引用的参考文献
成员,C.-N和合作伙伴,2024年。
数据可用性
本文报告的原始序列数据已存放在中国国家基因组数据中心/北京基因组研究所的基因组序列档案中(成员,2022年),项目编号:PRJCA054049,访问编号CRA036453,可在https://ngdc.cncb.ac.cn/gsa公开获取。
CRediT作者贡献声明
熊正、童志军:撰写 - 原始草稿、可视化、验证、方法学、正式分析、概念化。阿萨德·乌拉、徐海明:撰写 - 审稿与编辑。朱天乐、索明哲、焦芳婵、吴兴福:正式分析。林峰:数据管理、方法学、正式分析。陈学军、肖炳光:监督、资金获取、正式分析、调查、资源提供。
利益冲突
作者声明没有利益冲突。
致谢
我们感谢中国国家烟草公司(110202101038 [JY-15]和云南烟草公司(2024530000241003、2022530000241003、2025530000241005)的资助。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号