《Frontiers in Plant Science》:Genome-wide identification of the HSF gene family in Chinese chestnut and functional characterization of CmHSF4 under temperature stress
引言
中国板栗(Castanea mollissima Blume)是一种重要的木本经济树种,其果实营养丰富,具有显著的经济和生态价值。然而,在板栗的生长发育过程中,常受到高温、干旱等多种非生物胁迫的威胁。其中,由全球变暖引发的极端高温天气日益频繁和严重,成为制约板栗产量与品质提升的关键环境因子之一。热激转录因子(Heat shock transcription factors, HSFs)是植物响应高温胁迫复杂分子网络中的核心调控因子。当植物遭受热胁迫时,胞质内变性蛋白积累,激活HSFs,使其形成三聚体并转运至细胞核。HSFs通过其高度保守的N端DNA结合结构域(DNA-binding domain, DBD)特异性识别并结合下游靶基因启动子中的热激元件(heat shock element, HSE,保守序列为5’-AGAAnnTTCT-3’),从而启动包括热激蛋白(Heat shock proteins, HSPs)在内的众多胁迫响应基因的转录,共同协助修复受损蛋白、维持细胞内稳态,从而建立耐热性。为了通过分子育种手段培育优良抗逆板栗品种,保障产业可持续发展,挖掘抗逆遗传资源和鉴定关键抗逆基因势在必行。
材料与方法
本研究基于板栗‘N11-1’品种的基因组数据,综合运用生物信息学方法进行HSF基因家族鉴定。首先,从Pfam数据库获取HSF结构域(PF00447),并从拟南芥数据库(TAIR)获取所有21个AtHSF蛋白序列,利用TBtools软件进行隐马尔可夫模型(HMM)搜索和BLAST比对,并通过InterProScan数据库验证,最终鉴定出18个CmHSF基因家族成员。染色体定位图谱利用TBtools软件绘制。利用ExPASy ProtParam在线工具分析蛋白理化性质,利用BUSCA在线工具预测亚细胞定位。
为明确家族成员分组,利用MAFFT程序比对所有蛋白序列,使用MEGA7软件构建了拟南芥与板栗HSF蛋白的系统进化树。利用TBtools软件的Simple MEME Wrapper程序分析CmHSF蛋白序列中的保守基序(motif),并通过Gene Structure View功能可视化基序和基因结构。
利用TBtools提取所有CmHSF基因ATG起始密码子前2000 bp的启动子序列,上传至PlantCARE数据库进行顺式作用元件(cis-regulatory element)预测,结果以热图形式展示。使用MCScanX软件分析板栗基因组内CmHSF基因家族的共线性(collinearity),并利用DupGenfinder程序分析基因复制类型,包括全基因组复制(whole-genome duplication, WGD)、易位复制(transposed duplication, TRD)、分散复制(dispersed duplication, DSD)和串联复制(tandem duplication, TD)。同时,分析了板栗与葡萄、玉米、拟南芥、水稻等物种间的全基因组共线性。
为探究CmHSF基因家族在不同非生物胁迫下的表达模式,从中国国家基因组数据库(GSA: CRA022911)和NCBI数据库(PRJNA1166987, PRJNA731244)获取了板栗在遮荫、低温、高温及干旱胁迫下的转录组数据。所有数据使用FPKM (Fragments Per Kilobase of transcript per Million fragments mapped)值作为基因表达水平,并绘制热图进行可视化分析。
针对高温胁迫下表达变化显著的CmHSF4基因,通过实时荧光定量PCR (RT-qPCR)验证其相对表达量。利用无缝克隆技术将去除终止密码子的CmHSF4的ORF序列连接至pAN580载体,并在N端附加GFP标签,通过聚乙二醇介导转化拟南芥原生质体,利用激光共聚焦显微镜观察GFP荧光信号,以分析CmHSF4的亚细胞定位。同时,将CmHSF4的ORF序列连接至含有CaMV35S启动子的pBWA(V)HS载体,通过农杆菌介导法转化烟草,获得转基因烟草植株,观察其在高温胁迫下的表型,并测定过氧化氢(H2O2)和丙二醛(Malondialdehyde, MDA)含量以评估氧化损伤程度。
结果
3.1 CmHSF基因家族的染色体定位与蛋白理化性质分析
通过搜索和比对板栗基因组数据,共鉴定出18个CmHSF基因,根据其在染色体上的位置命名为CmHSF1–CmHSF18。序列分析显示,CmHSFs编码的蛋白序列长度差异较大,氨基酸数量从204 (CmHSF5)到515 (CmHSF18)不等,分子量为23.64–56.97 kD,理论等电点(pI)为4.63 (CmHSF2)到8.08 (CmHSF3)。不稳定系数在31.56 (CmHSF12)到66.16 (CmHSF15)之间,平均值为54.18。蛋白亲水性分析表明,所有CmHSFs均为亲水性蛋白,但亲水性存在一定差异。蛋白亚细胞定位预测显示,所有CmHSFs均定位于细胞核。
染色体定位分析表明,18个CmHSF基因不均匀地分布在12条板栗染色体上。其中,1号和7号染色体上的成员最多,各有4个;其次是12号染色体,有3个成员;2号和9号染色体各有2个成员;而4号、6号和10号染色体上仅各有1个CmHSF基因。在3号、5号、8号和11号染色体上未检测到CmHSF基因。
3.2 板栗与拟南芥CmHSF基因家族蛋白的系统进化分析
利用MEGA软件对板栗和拟南芥的HSF家族成员进行系统进化分析。基于系统进化树的拓扑结构,将板栗和拟南芥的HSF基因家族分为三个亚家族(A类、B类和C类)。C类包含的基因数量最少,仅有1个CmHSF1基因;B类包含5个CmHSF基因,即CmHSF3、CmHSF8、CmHSF12、CmHS13和CmHSF17;A类包含的成员数量最多,有12个CmHSF基因,占总数的70.59%。板栗中基因数量的分布与拟南芥中观察到的相似。此外,多个CmHSFs与拟南芥AtHSF基因聚集在同一分支,表明它们具有高度的亲缘关系和相似的进化趋势,可能具有相似的生物学功能。
3.3 板栗CmHSF蛋白结构域预测与基因结构分析
利用TBtools预测板栗CmHSF结构域。结果显示,板栗CmHSFs的基序数量在4到10个之间。其中,C亚组的基序数量最少(4个)。除CmHSF17包含5个基序外,C亚组的其他成员均只包含4个基序。值得注意的是,所有的CmHSFs都包含基序1和基序2,这表明基序1和2在CmHSFs中相对保守,可能发挥重要作用。此外,基序6-10仅出现在A亚组中。同一进化分支上的CmHSFs基序结构相似,表明同一分支的CmHSF蛋白功能相似。家族成员间基序数量和分布的不同,提示不同的CmHSFs可能具有不同的生物学功能。
利用TBtools对CmHSF基因结构进行分析,发现CmHSFs的内含子数量在1到4个之间,外显子数量在2到5个之间。其中,A亚组中的CmHSF14和CmHSF18所含内含子最多。亲缘关系最近的CmHSF基因含有相同数量的内含子,且内含子和外显子长度相似,基因结构也相似。
3.4 板栗CmHSF基因的共线性分析
为阐明板栗CmHSF基因家族潜在的进化机制,研究了这些基因的复制情况。结果显示,在18个CmHSF基因中,有两个片段发生了复制,位于三条不同的染色体上,形成了两对同源基因对。这些成对的同源基因可能具有相似的功能。基于共线性结果,对基因复制类型的分析表明,与整个板栗基因组相比,PD复制类型在CmHSF基因家族中完全丢失,TD和TRD的比例下降,而DSD复制类型的比例显著增加。进一步的Ka/Ks计算表明,两对基因的Ka/Ks值均小于0.3,表明该家族在进化过程中受到了强烈的纯化选择压力。
进一步分析了板栗与拟南芥、水稻、葡萄和玉米之间的共线性,并绘制了热图。结果显示,板栗与不同物种之间存在不同数量的共线性基因对。板栗与玉米之间的基因对数量最少,仅为8个。板栗与葡萄之间的基因对数量最多,为21个。热图还显示,大多数A类成员仅与双子叶植物存在共线性,这表明这些板栗CmHSF成员可能是在单子叶和双子叶植物分化后形成的。而CmHSF12、CmHSF13和CmHSF17基因在所有物种中均存在共线性,表明它们可能在植物适应过程中扮演重要角色。
3.5 板栗CmHSF基因家族启动子顺式作用元件分析
本研究分析了CmHSF上游2000 bp启动子的顺式作用元件。结果显示,参与生物和非生物胁迫响应的元件数量最多,包括低温响应元件(LTR)和厌氧响应元件(ARE)。其中,ARE的数量最高,几乎存在于所有CmHSFs中。其他元件与激素响应相关,包括茉莉酸甲酯响应元件(CGTCA-motif, TGACG motif)和水杨酸响应元件(TCA-element)等。顺式作用元件预测结果进一步表明,CmHSFs可能具有多种生物学功能,并可能受激素诱导和调控以响应非生物胁迫。
3.6 板栗CmHSF基因在不同胁迫条件下的表达模式分析
为了分析CmHSF基因家族在不同非生物胁迫条件下的表达模式,基于转录组数据绘制了热图。结果显示,在不同胁迫处理下,有5个基因的表达量几乎为零。相比之下,其他12个基因在不同胁迫条件下的表达量相对较高,但其表达模式各不相同。
在遮荫胁迫下,6个基因的表达水平随着遮荫强度的增加逐渐降低,而7个基因的表达水平逐渐升高。
在低温胁迫下,除上述5个基因外,CmHSF2的表达量也非常低。随着低温处理时间的增加,2个基因的表达水平逐渐降低,3个基因逐渐升高,3个基因先升高后降低,4个基因先降低后升高。
随着高温胁迫强度和持续时间的增加,3个基因的表达水平逐渐降低,6个基因逐渐升高,1个基因先升高后降低,3个基因先降低后升高。
在干旱胁迫下,除上述5个基因外,CmHSF2的表达量也非常低。随着干旱持续时间的增加,4个基因的表达水平逐渐降低,4个基因逐渐升高,2个基因先升高后降低,2个基因先降低后升高。
值得注意的是,CmHSF4在高温处理4小时后的表达量增加了324倍。该基因的变化最为剧烈,qRT-PCR结果证实了转录组数据的正确性。
2FPKM。">
3.7 CmHSF4的亚细胞定位与转基因验证
为了探究CmHSF4的亚细胞定位,构建了35S启动子驱动的CmHSF4–GFP融合表达载体并转化拟南芥原生质体。共聚焦显微镜观察显示,GFP荧光信号呈现出清晰的细胞内分布模式。更重要的是,GFP信号与特异性核染料DAPI的染色区域完全共定位,证实CmHSF4是一个核蛋白。
本研究还分析了42°C高温胁迫5分钟对烟草幼苗的影响,通过测定烟草叶片中的MDA和H2O2含量进行评估。结果显示,高温处理后,烟草幼苗叶片出现大面积失水和黄化,叶片干枯卷曲,MDA和H2O2含量均呈上升趋势,表明烟草幼苗在高温胁迫后遭受了显著的高温损伤。
2O2含量的测定。">
讨论
在本研究中,成功将18个CmHSF成员分为A、B、C三类。其数量分布模式与拟南芥、水稻、玉米等模式植物一致,表明HSF基因家族在植物界已达到一定程度的保守性。系统进化分析显示,多个CmHSF成员与拟南芥中的直系同源基因聚集在同一进化分支,强烈提示它们可能具有相似功能。基因结构分析支持了这一推论,亲缘关系近的成员具有相似的基序组成和基因结构,而不同亚家族间存在显著差异,特别是基序6-10为A类亚家族所特有,可能决定了其独特的转录调控功能。
共线性分析表明,片段复制是驱动CmHSF基因家族扩张的关键机制。两对复制基因的Ka/Ks值远小于1,表明该家族在进化过程中受到了强烈的纯化选择压力,其蛋白序列和功能高度保守,这对于维持其核心生物学功能至关重要。进一步的跨物种共线性分析为不同亚家族的功能分化提供了线索。大多数A类成员仅与双子叶植物存在共线性,提示它们可能是在单子叶和双子叶植物分化后出现的,在功能上可能更专门化于木本双子叶植物的适应性。而CmHSF12、CmHSF13和CmHSF17等基因在所有分析物种中均存在直系同源,表明它们是古老且高度保守的成员,可能在植物界响应环境胁迫的核心通路中扮演着不可或缺的角色。
对CmHSF上游2000 bp序列顺式作用元件的研究揭示,CmHSF启动子中含有大量光响应元件、激素响应元件和逆境胁迫响应元件。考虑到转录因子可通过结合相关基因启动子中的顺式作用元件来激活或抑制转录,推测某些功能基因可能通过结合CmHSF启动子中的特定顺式作用元件来调控基因表达,从而参与逆境胁迫的调控并影响植物生长发育。在植物中,HSF基因的表达受脱落酸(abscisic acid, ABA)信号传导介导。上游转录因子可结合ABA响应元件(ABRE)来调控HSF的表达。水杨酸(salicylic acid, SA)、乙烯(ethylene, Eth)和茉莉酸甲酯(methyl jasmonate, MeJA)等也通过激素信号途径刺激植物中HSF基因的表达,从而增强植物的耐热性。通过对板栗HSF启动子区域的分析,发现了众多的激素响应元件,进一步表明植物激素在调节植物HSF基因对热激的响应中扮演重要角色。ABRE元件不仅是ABA信号响应元件,也是高温信号响应元件。本研究发现所有13个板栗HSF基因中均含有ABRE元件,进一步表明板栗HSF基因广泛参与其对热激的响应。
本研究还依据板栗与拟南芥HSF的聚类关系,从HSF进化树分析中可以预测部分基因功能。例如,AtHsfA2与CmHSF4具有相对较近的亲缘关系和相似的进化趋势。并且,AtHsfA2在拟南芥中的过表达增强了其对高温胁迫的耐受性,提示CmHSF4可能响应高温胁迫。表达模式分析有力地验证了上述预测,并揭示了家族成员功能的多样性。在不同非生物胁迫下,CmHSF基因展现出丰富而复杂的表达谱,表明尽管它们属于同一家族,但在胁迫响应中可能存在功能分工。值得注意的是,CmHSF4的表达水平在高温胁迫4小时后被急剧上调,这使其成为板栗响应热胁迫的关键候选基因。为验证其功能,进行了亚细胞定位实验,证实CmHSF4定位于细胞核,这与其作为转录因子的预期功能一致。后续的转基因烟草功能验证实验表明,高温胁迫对烟草幼苗造成了显著的氧化损伤,未来应深入研究CmHSF4调控的下游靶基因,以增强板栗的耐热性。
结合近期研究,HSF介导的热胁迫响应机制是一个多层次、动态协调的复杂网络。HSF的核心功能在于直接激活下游保护基因的转录。例如,苹果中的MdHSFA2被证实可直接结合并激活MdGolS4的启动子,从而增强耐热性。本研究预测CmHSF4可能具有类似功能,其核定位特征与转录因子的作用模式一致。其次,HSF家族内部存在精细的功能分工与协作。传统上研究较少的C类HSFs,例如百合中的LlHSFC2,被证明可作为A类HSFs的共激活子,通过异源相互作用显著增强A类HSFs的转录激活能力。更重要的是,HSF通路并非孤立运作,而是广泛与其他信号通路交互,形成更大的调控网络。启动子分析揭示,所有CmHSF基因均含有ABA响应元件ABRE,表明ABA信号传导深度参与板栗HSF基因的转录调控。这一调控层面可能非常复杂:一方面,来自其他家族的转录因子可以直接调控HSF表达;另一方面,一些转录因子也可能对HSF通路施加负调控。综合前人研究推测,CmHSF4可能通过类似于MdHSFA2的机制直接调控下游热保护基因,同时,它也可能作为网络节点,与家族内其他成员或其他家族的转录因子相互作用,共同整合ABA等激素信号,精确调控板栗的热胁迫适应性与生长发育平衡。这些发现为理解木本植物耐热分子机制奠定了理论基础,并为板栗抗逆分子育种提供了如CmHSF4等优良候选基因。未来工作应通过EMSA和双荧光素酶报告系统验证CmHSF4的下游靶基因,并利用转基因技术在植株水平阐明其功能,同时进一步探索其与CmHSFC等蛋白的相互作用,以全面绘制板栗热胁迫响应的转录调控网络。