《Molecular Ecology》:Comparative Population Genomics of Relictual Caribbean Island Gossypium hirsutum
编辑推荐:
本文采用全基因组重测序技术,对加勒比海波多黎各和瓜德罗普岛的野生及疑似野生陆地棉(G. hirsutum)居群进行了深入的比较基因组学分析。研究揭示了这些残遗居群的遗传多样性、群体结构及其与栽培棉(包括陆地棉和海岛棉(G. barbadense))之间的复杂基因流历史。结果表明,加勒比海岛屿上存在真正野生、半野生及野化(feral)等多种类型的棉花,其基因组记录了物种分化、驯化、基因渗入和群体瓶颈等演化历程。该研究为棉花野生近缘种的保护与利用提供了重要的基因组学见解。
2 材料与方法
研究收集了来自瓜德罗普岛(25个个体)和波多黎各(43个个体)的棉花样本,并进行了全基因组重测序。测序数据与之前已发表的全球种质资源库样本(包括野生、地方品种和栽培品种)以及来自佛罗里达州Mound Key的野生棉花种群数据进行了整合分析。通过比对到野生陆地棉TX2094的参考基因组,进行了基因分型,获得了高质量的基因组变异数据。利用主成分分析(PCA)、邻接树(Neighbor-joining tree)、群体遗传结构分析(LEA)等方法解析了样本间的遗传关系。为了评估基因流,使用了TreeMix和Dsuite(基于ABBA-BABA检验)进行分析。同时,对叶绿体基因组(plastome)进行了从头组装和系统发育分析,以研究母系遗传历史。此外,还计算了核苷酸多样性(π)、群体分化指数(Fst)、连锁不平衡(LD)衰减、纯合片段(ROH)以及Tajima‘s D等群体遗传学参数,以量化遗传多样性和推断群体历史。
3 结果
3.1 推断真正野生的G. barbadense作为外类群
为确保用于基因渗入测试的G. barbadense样本是真正野生的,研究者从18个推测为野生的G. barbadense样本中,通过系统发育和群体遗传结构分析,筛选出9个单系群的、与野生G. darwinii(加拉帕戈斯群岛特有物种)形成姐妹群的样本,作为纯野生G. barbadense的代表。
3.2 主要G. hirsutum遗传类群的遗传结构与关系
PCA和邻接树分析将G. hirsutum样本清晰地分为两大类:一类包含所有野生棉花和Mound Key棉花(真正的野生类群),另一类包含栽培品种(Cultivar)和地方品种(Landrace1, Landrace2)。值得注意的是,来自波多黎各的PuntaJacinto(PJ)和TamarindoBeach(TB)两个地点的样本与栽培棉类群聚在一起,表明它们是野化衍生种。而其他波多黎各样本和瓜德罗普样本则与真正的野生棉类群聚集。瓜德罗普的4个异常样本(GD2)显示出混合的祖先信号。
3.3 识别加勒比野生棉花中的异常样本
对野生棉花样本(包括加勒比样本和Mound Key样本)的进一步PCA分析显示,加勒比野生棉花内部存在遗传分化,形成了三个相对松散的群体:瓜德罗普主群体(GD)及4个异常个体(GD2)、波多黎各Highway325(PR_Hwy325)群体,以及波多黎各CaboRojo(CR)和Pitahaya(Ph)的剩余样本。其中一个Pitahaya样本(PR_Ph_6)在遗传空间上更接近瓜德罗普主群体。
3.4 加勒比棉花间频繁的基因流
群体结构分析(K=11)显示,大多数野生棉花样本按其采集地点聚类,但PR_Ph_6和4个GD2异常样本显示出混合的祖先成分,提示存在基因渗入。TreeMix分析(迁移事件m=7)揭示了复杂的基因流模式,包括从Landrace1到波多黎各居群(Hwy325, Ph, CR)的基因流,从瓜德罗普主群体(GD)到GD2和Mound Key棉花的基因流,以及从Mound Key到PR_Ph_6和从Hwy325到GD的基因流。Dsuite分析进一步证实了GD与GD2之间强烈的基因渗入信号,以及野生加勒比棉花祖先节点与Hwy325之间的基因流信号。
3.5 叶绿体系统基因组学揭示的网状演化关系
基于叶绿体基因组110个基因序列构建的系统发育树将样本分为三大支系:一支主要为野生G. barbadense和G. darwinii;一支为栽培G. hirsutum(“栽培”支);一支为加勒比野生G. hirsutum(“加勒比”支)。然而,部分样本的叶绿体类型与核基因组推断的类群不一致,例如波多黎各Pitahaya地点的样本叶绿体类型落入“G. barbadense + G. darwinii”支系,提示可能存在历史上的叶绿体捕获事件。
3.6 加勒比棉花中保存的高遗传多样性
核苷酸多样性(π)分析显示,野生类群(Wild)的多样性最高,其次是地方品种(Landrace1, Landrace2),栽培品种(Cultivar)的多样性最低。在野生棉花中,波多黎各的Hwy325和CR居群具有较高的多样性,与地方品种相当;Mound Key棉花的多样性介于地方品种和栽培品种之间;而瓜德罗普主群体(GD)和波多黎各Pitahaya(PR_Ph)居群的多样性异常低,反映了其高度近交的特性。
3.7 纯合性、杂合性与连锁不平衡水平评估
长纯合片段(ROH)分析显示,栽培品种、Landrace2和瓜德罗普主群体(GD)的ROH近交系数(FROH)最高,表明近交程度较高。Mound Key棉花的FROH最低。连锁不平衡(LD)衰减分析表明,栽培品种的LD衰减最慢,野生类群最快。瓜德罗普样本的LD衰减曲线平缓,与物理距离无显著相关,可能与其极低的遗传多样性有关。杂合位点比例分析显示,波多黎各Hwy325和CR居群杂合度最高,甚至高于野生类群,可能与基因渗入有关;而瓜德罗普主群体(GD)的杂合度最低。
3.8 基于溯祖模型的野生棉花分化理解
Tajima‘s D值为负值,特别是在Mound Key和瓜德罗普棉花中负值显著,表明这些群体经历过近期群体扩张或净化选择。位点频率谱(SFS)分析显示,所有四个野生棉花群体均表现出低频等位基因的缺失和高频等位基因的过量,暗示了瓶颈效应后的近期扩张以及可能的近期基因混杂。SMC++分析推断出所有棉花群体有效群体大小(Ne)在大约2万年前开始下降,从约10万个个体减少到不足1万个。波多黎各CR和Hwy325居群的Ne下降相对较轻且恢复较快,而Mound Key、PR_Ph和瓜德罗普(GD)居群的Ne在初始下降后一直维持在较低水平。
4 讨论
4.1 栽培棉花的基因组多样性
研究验证了利用先前的系统基因组框架可以有效区分真正野生棉花和野化衍生种。栽培棉花经历了从野生种到地方品种再到现代品种的遗传多样性逐步降低的过程。同时,研究也发现了G. hirsutum和G. barbadense之间存在双向基因渗入的证据。
4.2 半野生棉花的起源
在排除野化衍生种后,加勒比地区的野生棉花显示出复杂的遗传背景。波多黎各的Hwy325和CR居群以及瓜德罗普的GD2异常个体被推断为“半野生”棉花,含有不同比例的其他来源(如栽培棉)的祖先信号。这种混合 ancestry 被认为是历史上野生棉花与含有G. barbadense基因组片段的野化棉花基因交流的结果。
4.3 半野生棉花的基因组多样性
基因流从栽培作物到其野生近缘种的现象在其他作物中也有报道。波多黎各的Hwy325和CR半野生棉花居群虽然显示出较高的杂合度和核苷酸变异(符合基因流特征),但也表现出类似近交野生棉花的长的纯合片段和升高的连锁不平衡。这种看似矛盾的现象可能反映了其复杂的祖先历史,包括与G. barbadense的古老渗入事件以及强烈的遗传漂变。
4.4 野生棉花间的分化
加勒比海岛屿支离破碎的栖息地促进了野生棉花的扩散和分化。Mound Key棉花、瓜德罗普主群体(GD)和波多黎各Pitahaya居群这三个真正的野生居群都表现出低遗传多样性、近期有效群体大小下降以及不同程度的近交。每个居群都有其独特的演化历史,例如瓜德罗普主群体表现出极高的基因组同质性和强烈的瓶颈效应信号,而Mound Key棉花则显示出群体扩张的特征。
4.5 保护启示
加勒比地区作为生物多样性热点,其岛屿上的野生棉花是宝贵的遗传资源。然而,这些残遗居群分布范围狭窄,易受气候变化和人类活动的影响,且可能面临来自野化棉花的基因组“污染”。本研究强调了加强对这些珍贵野生棉花种质资源进行收集、评价和保存的紧迫性和重要性。