《Phyton-International Journal of Experimental Botany》:A Comprehensive Expression Atlas of
Nicotiana tabacum: Revealing Specificity Expression Patterns and Regulatory Variants
编辑推荐:
为了解决烟草(Nicotiana tabacum)基因表达调控机制及胁迫响应网络尚不清晰的问题,研究人员通过整合分析603个转录组数据集,开展了烟草综合性表达图谱研究。结果揭示了萼片等组织中存在萜类等关键次级代谢物的特异性合成,并鉴定了28,396个叶片表达数量性状位点(eQTLs)。该研究为深入理解烟草生物学特性及遗传改良提供了宝贵的基因组资源与调控线索。
烟草,作为一种重要的非粮食经济作物,与人类生活息息相关。然而,与许多模式植物相比,其生命活动的奥秘——尤其是在不同组织中基因如何精确调控,以及面对病虫害、干旱、低温等“压力”时如何“紧急动员”——仍然像一幅未完成的拼图,许多关键部分尚不清晰。植物发育是一个连续且动态的过程,新器官的不断产生伴随着基因表达调控网络的持续重塑。为了绘制这张复杂的生命活动“地图”,科学家们通常会借助时空转录组测序技术,为不同器官、不同发育阶段、不同环境条件下的基因“拍摄快照”,从而构建表达图谱。在猪、牛等动物中,此类大规模、多器官的转录组图谱研究已卓有成效,为理解其复杂转录景观提供了坚实基础。然而,在植物领域,特别是像烟草这样的物种,受限于高昂的成本,往往难以开展覆盖多个器官、多个发育阶段及多种环境条件的大规模采样研究。与此同时,已有的大量小规模烟草转录组研究积累了大量数据,这为通过整合分析来构建综合性表达图谱提供了独特机遇。发表在《Phyton-International Journal of Experimental Botany》上的这项研究,正是通过整合分析来自35个独立研究项目、共计603个样本的RNA-seq(核糖核酸测序)数据,为我们呈现了迄今为止最为全面的烟草基因表达全景图,并深入挖掘了其组织特异性表达规律、跨胁迫响应网络以及遗传调控变异的奥秘。
为了完成这项宏大的分析,研究人员首先从美国国家生物技术信息中心(NCBI)的数据库和已发表文献中,通过文献挖掘手动收集并筛选了涵盖烟草13种不同组织的转录组数据。在获得原始数据后,他们使用了一套统一的分析流程,包括利用fastp进行数据质控,利用STAR软件将测序读数比对到烟草参考基因组,并利用StringTie结合基因组注释对基因表达水平进行定量。对于基因功能注释,他们使用了eggNOG-mapper软件。在数据分析方面,研究采用了R语言中的多种生物信息学包,例如利用Rtsne和umap进行表达谱的降维聚类分析,利用DESeq2进行差异表达基因(Differentially Expressed Genes, DEGs)分析,利用clusterProfiler进行基因本体(Gene Ontology, GO)富集分析。为了探索基因表达的遗传调控基础,研究人员还从RNA-seq数据中鉴定单核苷酸多态性(Single-Nucleotide Polymorphism, SNP),并利用FastQTL和EMMAX等工具进行了表达数量性状位点(expression Quantitative Trait Loci, eQTL)作图。此外,研究利用PlantTFDB数据库鉴定了烟草中的转录因子(Transcription Factor, TF),并通过计算皮尔逊相关系数(Pearson Correlation Coefficient, PCC)和利用HOMER软件预测启动子区基序,构建了胁迫响应相关的转录调控网络。
3.1. 样本统计与烟草转录数据的聚类分析
研究共收集了603个烟草转录组样本,覆盖叶片、根、幼苗、茎、毛状体、花瓣、萼片等13种组织或器官。其中,叶片和根组织的样本数量最多。对所有数据集进行统一处理与表达定量后,tSNE(t-分布随机邻域嵌入)聚类分析显示,大部分相同或相似组织的样本能够聚在一起,例如花瓣和萼片(均为花器官部分),但一些解剖学位置接近的组织(如花的各部分与叶)未能完全区分。有趣的是,幼苗期叶片与非幼苗期叶片在聚类中清晰分开,表明它们具有不同的基因表达模式,验证了将其划分为不同组织的合理性。从处理角度看,不同胁迫条件下的样本也呈现出明显的聚类趋势,说明处理条件和生长环境都能显著影响基因表达谱。
3.2. 烟草组织特异性基因分析
基于基因在不同组织中的中位表达水平,研究计算了组织特异性指数(Tissue-Specific Index, TSI)。在超过3.5万个基因中,仅有1405个(约4%)被鉴定为组织特异性基因(TSI ≥ 0.85)。这些基因在未成熟花、花瓣、萼片和根等组织中数量最多。功能富集分析揭示了令人兴奋的发现:在萼片中特异性表达的基因,显著富集于萜类生物合成过程、倍半萜生物合成过程、萜合酶活性等与萜类合成相关的通路。萜类化合物在吸引昆虫授粉、抵御生物胁迫等方面扮演着关键角色,这表明烟草萼片可能是合成这些具有重要生态功能次级代谢物的特定场所。此外,研究还鉴定出128个组织特异性转录因子,其中MYB和MYB_related在花瓣、花和根中富集,而ERF(乙烯响应因子)家族则特异性存在于花瓣、萼片和花等生殖相关组织中,提示它们可能在相应组织的生长发育和次生代谢调控中发挥重要作用。
3.3. 跨胁迫基因表达模式分析
研究整合了来自根、叶和腋芽的29种生物与非生物胁迫转录组数据。分析发现,随着同一胁迫(如冷害)持续时间或强度增加,差异表达基因的数量逐渐增多。通过比较不同胁迫下基因表达变化的相似性(基于log2FoldChange的相关性),研究发现了一些有趣的模式:在根中,无论硝酸盐(N)浓度高低,其诱导的基因表达变化方向高度一致;更引人注目的是,烟草根在遭受病原菌Phytophthora nicotianae侵染(生物胁迫)后,其基因响应方向与硝酸盐处理(非生物胁迫)呈现强正相关,暗示二者可能激活了某些共同的响应机制。相比之下,打顶处理在根中引起的基因响应模式则与硝酸盐和病原菌胁迫呈负相关。在叶片中,单独干旱胁迫与施用褪黑素(MEL)或水杨酸(SA)后的干旱胁迫响应相似,但与施用脱落酸(ABA)后的响应相关性较弱,可能因为ABA增强了植物的抗旱性。这些发现为了解烟草整合响应多种环境信号的机制提供了线索。
3.4. 烟草根和叶中的转录因子调控网络
研究在烟草基因组中鉴定出1865个转录因子。在不同胁迫下,差异表达转录因子的数量分布趋势与总体差异表达基因相似。为了解析多胁迫共同响应基因的调控机制,研究聚焦于根和叶中在各种胁迫下均发生差异表达的共享基因,并计算了它们与所有转录因子之间的共表达关系。在根中,发现了一个包含285个转录因子(涉及WRKY、MYB、bHLH等40多个家族)调控132个共享差异表达基因的复杂网络。在叶中,则鉴定出25个转录因子(包括WRKY、MYB、ERF)调控4个共享的胁迫响应基因。通过进一步分析这些共享差异表达基因上游2 kb启动子区的保守基序,并结合共表达分析,在根和叶中分别找到了21个和26个可能结合这些基序并共表达的转录因子。这些结果为剖析烟草胁迫响应的转录调控层级网络提供了宝贵资源。
3.5. 烟草的eQTL分析
利用379个叶片样本的RNA-seq数据,研究首先鉴定了598,293个高质量SNP,其在不同染色体上分布不均。随后,通过eQTL作图,在叶片中鉴定出28,396个eQTLs,根据其与关联基因的物理距离分为顺式(cis-)和反式(trans-)eQTLs。共有14,559个基因(占所有表达基因的41%)受到至少一个eQTL的调控,其中53%仅受顺式调控,21%仅受反式调控,26%同时受两者调控。平均每个基因与4.6个eQTL相关,揭示了基因表达的调控具有高度的复杂性。功能富集显示,受反式eQTL调控的基因显著富集于光合作用、光反应、茉莉酸响应、除草剂响应等生物学过程。研究还发现了一些与尼古丁合成相关的基因也受到eQTL调控。此外,全基因组范围内鉴定出1669个顺式eQTL热点和1858个反式eQTL热点。值得注意的是,反式eQTL热点区域中包含了68个转录因子,如WRKY、bHLH、MYB等家族成员。例如,在反式eQTL热点I47_C2中,位点eQTL (chr04:1227307)既能顺式调控一个与干旱响应相关的MYB转录因子,又能反式调控一个干旱诱导蛋白,这展示了单个调控变异如何通过转录因子介导的级联反应,协调对胁迫响应通路的层次化控制。
结论与讨论
这项研究通过整合大规模、多组织、多处理的烟草转录组数据,成功绘制了一幅全面的烟草基因表达图谱,取得了多项重要发现。首先,研究系统鉴定了1405个组织特异性基因,并首次明确指出烟草萼片是萜类等关键次级代谢物特异性合成的重要场所,这为利用分子生物学和合成生物学手段研究烟草次生代谢物的合成途径与功能提供了明确靶点。其次,通过跨胁迫比较分析,揭示了烟草根和叶在应对生物与非生物胁迫时,既存在特异的响应通路,也存在共享的响应机制,特别是根中病原菌侵染与硝酸盐胁迫响应的高度相似性,暗示了不同胁迫类型间可能存在交叉对话,这为培育多抗性烟草品种提供了新思路。最后,通过在叶片中进行大规模eQTL作图,鉴定了近2.8万个调控位点,系统地揭示了遗传变异如何塑造烟草叶片基因表达,并发现了包含关键转录因子的调控热点,将遗传变异、转录调控与性状表现联系起来,为烟草的分子设计育种提供了海量的候选遗传标记和调控节点。
总之,这项研究不仅是对现有烟草转录组数据资源的系统性总结与深度挖掘,更是对烟草生物学特性的一次重要剖析。它所揭示的组织特异性代谢规律、跨胁迫响应网络以及遗传调控图谱,极大地丰富了我们对烟草这一重要经济作物的认知,为后续的功能基因验证、抗性机制解析、品质性状改良等研究奠定了坚实的基础,具有重要的科学意义和应用前景。