《Frontiers in Plant Science》:Comparative genomic analysis of the MAPKKK gene family reveals WGD-driven expansion and strong evolutionary constraints in Asteraceae
编辑推荐:
本项研究对菊科(Asteraceae)植物中关键的信号转导蛋白——促分裂原活化蛋白激酶激酶激酶(MAPKKK)基因家族进行了首次跨10个代表性物种的全面比较基因组学分析。研究揭示了全基因组加倍(WGD)是该家族扩张的主要驱动力,并发现其中保守基因相较于非必需基因受到更强的净化选择压力。结合启动子顺式作用元件分析及向日葵在干旱、盐、碱胁迫下的转录组与qRT-PCR验证,本研究阐明了MAPKKK家族在菊科植物环境适应性演化中的重要作用,为后续抗逆作物育种提供了重要的基因资源和理论依据。
MAPKKK基因家族在菊科植物中的鉴定与系统发育分析
研究团队在10个具有代表性的菊科植物中,共鉴定出1009个MAPKKK基因。基于与拟南芥同源基因的进化树聚类,这些基因被划分为RAF、MEKK和ZIK三个主要亚家族,并可进一步细分为14个不同的簇。基因数量存在显著的种间变异,从Centaurea solstitialis的60个到向日葵(Helianthus annuus)的139个不等。基因家族大小与基因组注释基因总数呈显著正相关。在亚家族组成上,RAF亚家族最为丰富,占基因总数的51.40%至71.67%,其次是MEKK和ZIK亚家族。14个簇中有9个在所有10个菊科物种中都存在,表明MAPKKK家族的基本架构在菊科共同祖先中就已确立。不同簇间呈现选择压力的差异,RAF亚家族的簇14平均Ka/Ks值最低(0.095),而MEKK亚家族的簇2平均Ka/Ks值最高(0.267),表明前者受更强的净化选择以维持高度保守的功能,而后者则具有更大的功能分化潜力。
菊科植物MAPKKK基因的结构特征
对基因结构进行分析发现,在基因组水平上,菊苣亚科(Carduoideae)的MAPKKK基因总长显著长于紫菀亚科(Asteroideae)和菊苣亚科(Cichorioideae),这主要源于内含子长度的扩张,而非编码区(CDS)长度、内含子数量或氨基酸序列长度在各谱系间无显著差异。不同亚家族和簇之间也存在显著的结构分歧。RAF亚家族拥有最复杂和庞大的基因结构,中位长度达4872 bp,这主要由内含子长度增加驱动。相反,MEKK亚家族展现出内含子贫乏的架构,其簇1-4中超过80%的基因是单外显子(无内含子)基因,中位长度仅为1291.5 bp,这与MEKK簇5(中位内含子数10个)及RAF/ZIK亚家族(中位内含子数6-15个)形成鲜明对比。
菊科植物MAPKKK家族的保守性与多样性分析
通过构建直系同源基因群(OGG),研究者将1009个基因划分为64个OGG,并归为三类:在所有10个物种中都存在的“保守”OGG(16个,含296个基因)、在9个物种中存在的“可变”OGG(28个,含495个基因)以及仅在1-8个物种中存在的“稀有”OGG(30个,含218个基因)。保守和可变基因共同构成了菊科MAPKKK基因库的主体,凸显了其核心功能的保守性。在亚家族层面,RAF贡献了最多的保守基因(195个)和可变基因(252个)。ZIK亚家族虽然规模小,但保守基因比例较高。MEKK亚家族则显示出更高的变异度,其簇1、2、3、4完全缺乏保守基因。选择压力分析表明,与非必需(可变和稀有)MAPKKK基因相比,保守MAPKKK基因具有显著更低的Ka/Ks比值中位数,表明它们受到更强的净化选择约束。
菊科植物MAPKKK家族的基因复制模式
为阐明家族扩张机制,研究识别了五种复制模式:全基因组复制(WGD)、串联复制(TD)、分散复制(DSD)、近端复制(PD)和易位复制(TRD)。在所研究的10个物种中,有9个物种的MAPKKK基因主要由WGD事件贡献,其衍生的基因数量占家族成员的30%以上,而TD的贡献通常低于12%。染色体分布模式显示了广泛的平行同源基因对,反映了古老的多倍化事件。然而,C. solstitialis表现出独特的进化轨迹,其WGD衍生基因仅占10%,但TD(18.3%)和TRD(38.3%)的比例很高。统计分析显示,不同基因类别中WGD衍生基因的比例存在差异:保守基因中WGD衍生基因比例最高(49.32%),其次是可变基因(43.03%),稀有基因中比例最低(32.57%)。这表明保守基因高度保守的功能和序列特征可能主要由WGD事件驱动。
选择压力关联复制类型与MAPKKK家族的保守性
Ka/Ks比值分析揭示了菊科MAPKKK基因家族普遍受到净化选择。进一步结合复制类型分析发现,WGD衍生的平行同源基因对的平均Ka/Ks比值最低(0.186),显著低于TD衍生对(0.379)和PD衍生对(0.311)。这表明WGD事件产生的重复基因受到更强的净化选择,保持了更高的功能保守性。当与基因保守性分析结合时,发现在保守和可变基因中,WGD衍生对的Ka/Ks比值显著低于小规模复制(SSD)衍生对。然而,在稀有基因中,不同复制类型间的Ka/Ks比值无显著差异。这些发现揭示了复制类型与基因功能保守性之间的协同进化关系:WGD事件倾向于保留具有核心功能的基因拷贝,而其他复制类型则为MAPKKK基因家族的功能多样化提供了进化的原材料。
十个菊科物种间MAPKKK基因家族的共线性分析
对十个菊科基因组进行两两共线性分析,揭示了MAPKKK基因之间可变的共线性模式,共线性基因对的数量从32对到112对不等。值得注意的是,这些共线性基因对中保守基因的比例显著升高,达到47.91%,远高于整个基因家族中保守基因的总体比例(29.34%)。相反,稀有基因在共线性对中的比例从总体比例的21.61%降至18.30%。这些发现表明MAPKKK家族的核心基因组架构保持了高度的共线性,保守基因在物种间具有更稳定的同源关系。
MAPKKK基因家族的启动子分析
从1009个MAPKKK基因的启动子区域共鉴定出49,446个顺式作用元件实例,分属86种不同类型。根据功能,这些元件被分为四类:胁迫响应(20,547个,占41.6%)、光响应(13,265个)、激素响应(12,396个)和植物生长发育(3,238个)。胁迫响应元件占比最高,表明胁迫适应可能是菊科MAPKKK家族的核心功能焦点。对高频元件(出现超过1000次)的分析发现了14种,包括胁迫响应类(如MYC、MYB、ARE)、光响应类(如Box-4、G-box)、激素响应类(如ABRE、ERE)和生长发育类(AAGAA-motif)。亚家族特异性分析显示,MEKK、RAF和ZIK亚家族在元件丰度上存在明显差异。例如,MEKK亚家族富含MYB、G-box和ABRE元件;RAF亚家族含有更高水平的ERE和STRE元件;ZIK亚家族则富含MYC、CGTCA-motif、TGACG-motif和as-1元件。
向日葵MAPKKK基因在多种胁迫下的转录组分析与表达验证
基于向日葵叶片干旱胁迫转录组数据,筛选出25个表达发生显著变化的MAPKKK基因。为进一步验证并在多种胁迫下表征关键基因的表达谱,从中选取12个高表达基因进行qRT-PCR分析,检测了它们在干旱、盐和碱胁迫下不同时间点(0、1、3、6、12、24小时)的表达动态。
在干旱处理下,多数基因在1小时内迅速响应。可变MEKK基因Hann_MAPKKK123在1小时激增超过21倍。保守ZIK基因Hann_MAPKKK135则呈现持续上升趋势,在24小时达到超过18倍的峰值。保守MEKK基因Hann_MAPKKK16在3小时达到峰值(>15倍)并维持高水平。
盐胁迫引发了最广泛的高幅度诱导。除了保守MEKK基因Hann_MAPKKK16(>105倍),保守ZIK基因Hann_MAPKKK135在24小时达到约54倍峰值。稀有ZIK基因Hann_MAPKKK10和保守MEKK基因Hann_MAPKKK26在12-24小时也表现出显著上调。
在碱胁迫下,响应尤为强烈。保守MEKK基因Hann_MAPKKK16表现出戏剧性的持续上调,在24小时达到超过158倍的峰值。保守ZIK基因Hann_MAPKKK135和稀有ZIK基因Hann_MAPKKK10也分别在碱胁迫下显著上调。
总结而言,qRT-PCR结果揭示了HaMAPKKK家族明显的功能特化。保守基因Hann_MAPKKK16和Hann_MAPKKK135充当多胁迫响应的枢纽。其他成员则显示出胁迫特异性角色,例如Hann_MAPKKK123是干旱特异性的,而Hann_MAPKKK10在盐/碱胁迫中特异性响应。这些发现证实了MAPKKK基因的亚功能化,以及向日葵中保守基因的多胁迫响应性。