《The Plant Genome》:Ubiquitin-like SUMO protease expansion in rice (Oryza sativa L.)
编辑推荐:
本综述聚焦水稻SUMO化修饰系统中的关键去修饰酶——类泛素蛋白酶(ULP)。研究采用多组学整合分析,系统鉴定了亚洲栽培稻(Oryza sativa)基因组及泛基因组中的ULP家族成员,揭示其相较于野生稻的显著扩张现象,并首次通过结构生物学与转录组学数据验证了新型ULP的功能潜力及其在生物与非生物胁迫响应中的关键作用,为水稻分子育种提供了重要理论依据与新靶点。
引言:SUMO化系统与作物研究背景
SUMO化(SUMOylation)是一种广泛存在于真核生物中的蛋白质翻译后修饰,对植物的生长发育及环境响应至关重要。该过程涉及一系列酶促反应:未成熟的SUMO蛋白(Small Ubiquitin-like MOdifier)首先被类泛素蛋白酶(Ubiquitin-Like Protease, ULP)在其C末端剪切,暴露出二甘氨酸(-GG-)基序;随后,活化的SUMO被SUMO激活酶(SUMO activating enzyme, SAE)复合物在ATP依赖下激活,并经由SUMO结合酶(SUMO conjugating enzyme, SCE)转移,最终通过E3连接酶(如SIZ1或HPY1)连接到靶蛋白的赖氨酸残基上。SUMO亦可被PIAL1/2聚合。SUMO化可影响靶蛋白的定位、复合物形成、蛋白质互作、酶活性或防止其泛素化。最终,DeSUMO化异肽酶(DeSUMOylating Isopeptidase, DeSI)和ULP类型的SUMO蛋白酶可以将SUMO从靶标上切割下来,实现循环利用。
在水稻中,SUMO化系统已被证明在生物与非生物胁迫响应中扮演关键角色。例如,E3连接酶OsSIZ2参与调控发育过程、磷酸盐和氮稳态以及繁殖。在SUMO蛋白酶中,OsFUG1参与调控发育和育性,OsELS1有助于控制开花时间,OsOTS1则在种子萌发和根系发育中发挥作用。此外,OsSCE1的过表达会降低干旱胁迫耐受性,反之其敲低则增强耐受性;OsSIZ1在拟南芥中的过表达可增强对干旱、热和盐等多种胁迫的耐受;OsOTS1在盐胁迫处理中的过表达能促进根系生长并增强耐盐性,而其缺失则会降低耐盐性但增加耐旱性。
以往对作物中SUMO化基因的鉴定多采用基于酵母或拟南芥同源序列比对的简单方法。在水稻中,通过同源性搜索已鉴定出6个OsSUMO修饰蛋白、2个E1激活酶(OsSAE1和OsSAE2)、3个E2结合酶(OsSCE1/2/3)和3个E3连接酶(OsSIZ1/2和OsHPY2),但尚无E4连接酶的报道。相较于其他SUMO组分,SUMO蛋白酶因其N端序列高度分化,基于BLAST的方法发现难度较大。此前研究通过在水稻基因组数据库(RGAP)中搜索保守催化结构域,推测水稻中存在12–22个ULP,但仅有7个(OsFUG1、OsELS1、OsSPF1、OsELS2、OsOTS1、OsOTS2和OsOTS3)经过实验验证其蛋白酶功能。有推测认为,作物中ULP的扩张可能源于驯化过程,并导致去SUMO化过程中的靶标特异性。然而,关于SUMO组分的知识仍存在缺口,其分子机制在作物中尚不明确。
本研究旨在系统分析水稻(O. sativa)中的SUMO化组分,重点关注其中明显且异常庞大的ULP蛋白酶家族扩张现象。我们利用新近发布的高质量水稻种群参考面板(Rice Population Reference Panel, RPRP)基因组集合,在泛基因组水平探索了ULP的变异情况,并通过计算结构生物学和公共转录组数据评估,为预测的新型ULP的功能性提供了有力证据。
核心观点
- •
驯化的亚洲水稻物种比其野生近缘种含有更多数量的类泛素SUMO蛋白酶(ULP)。
- •
水稻日本晴品种(Oryza sativa ssp. japonica cv. Nipponbare)中的新型ULP参与了生物与非生物胁迫响应。
- •
本研究在泛基因组水平上对水稻ULP基因家族进行了系统研究。
- •
我们利用结构生物学方法鉴定了功能性ULP。
方法
- 1.
水稻(O. sativa)中ULP的鉴定:以酵母和拟南芥中已知的ULP为查询序列,对IRGSP参考基因组(日本晴)的两个注释集(RAP-DB和RGAP)进行BLASTP和TBLASTN搜索。对显著结果进行蛋白质结构域(InterProScan)分析和多序列比对,筛选出具有保守催化结构域(HxDxC)的候选ULP。随后,利用Gramene数据库的新注释集(OsNip)和PanOryza泛基因矩阵进行交叉验证和泛基因水平分析。最后,使用ColabFold预测蛋白质三维结构,并通过测量催化位点(H、D、C残基)之间的距离进行功能验证。
- 2.
RPRP及野生稻中ULP基因的鉴定:使用BLASTP在RPRP基因组(包括籼稻、粳稻、Aus、Aromatic等亚种)以及八个野生稻和一个非洲栽培稻(O. glaberrima)的蛋白质组中搜索ULP同源物。经过严格的e值过滤、结构域鉴定和多序列比对(使用MUSCLE、MAFFT、CLUSTALOmega三种算法)后,将候选基因映射到泛基因矩阵中进行分析。
- 3.
系统发育分析:利用邻接法构建了包含酵母、拟南芥、李氏禾、野生稻、非洲稻和RPRP水稻ULP蛋白的系统发育树,并使用cutree函数划分了50个亚簇。
- 4.
RPRP泛基因中代表性基因的选择:根据泛基因矩阵中基因模型的优先级(优先选择Nipponbare的RAP-DB、OsNip、RGAP模型),为每个ULP泛基因簇选择一个代表性的、包含正确催化位点的ULP候选基因。
- 5.
蛋白质无序区域预测:使用metapredict v2.61预测代表性ULP序列中的无序区域。
- 6.
ULP的蛋白质结构分析:使用ColabFold预测RPRP泛基因代表和所有野生稻ULP的蛋白质结构,并通过内部Python脚本测量催化位点三个氨基酸残基之间的距离,以评估其催化口袋构象。
- 7.
RNA测序分析:从公共数据库获取并重新分析水稻RNA-seq数据集,计算ULP基因(RGAP模型)的FPKM值,进行z-score标准化和层次聚类。同时,利用两个单细胞RNA-seq数据集(GSE232863和GSE251706)分析ULP在不同细胞类型中的表达模式。
结果
1. 水稻参考基因组中ULP的鉴定
通过两步法鉴定策略,在IRGSP参考序列中最终确定了45个ULP。这包括了所有先前已知的水稻ULP(如OsOTS1、OsOTS2、OsFUG1、OsELS1、OsSPF1、OsELS2),但OsOTS3因在MSA后未比对出保守催化位点而被排除。分析发现,两个基因模型(RAP-DB和RGAP)之间存在不一致性,强调了交叉参考的重要性。其中有13个ULP在所检查的16个基因组中均包含保守的ULP结构域和正确定位的催化位点。
2. ULP在RPRP泛基因组中发生扩张
在RPRP泛蛋白质组中,ULP可映射到101个泛基因标识符,其“结构域占有率”和“基因组占有率”在1到16之间变化。ULP表现出不寻常的进化模式——大量富集于仅存在于单个基因组中的基因(cloud genes)。ULP蛋白酶结构域的平均占有率仅为5.94(满分16),属于“高度可变”结构域类别,这通常与受选择压力驱动的基因家族扩张相关,类似于抗病相关基因。
3. ULP扩张可能与亚洲水稻的选择育种有关
野生稻中ULP的数量在9到36个之间变化(O. punctata除外,有36个),而非洲栽培稻仅有11个ULP。相比之下,RPRP基因组(代表亚洲栽培稻)中的ULP数量(32-45个)高于非洲稻和几乎所有野生稻(O. punctata除外)。系统发育分析将ULP划分为50个簇,其中已知的OsFUG1(现建议重命名为OsELS3)位于与ELS型ULP相近的第26簇,而一个新发现的基因(Os11g0214001, LOC_Os11g10780)与拟南芥AtFUG1亲缘关系更近,被提议命名为新的OsFUG1(Os_nFUG1)。分析还表明,水稻中的OsOTS1和OsOTS2与拟南芥中的AtOTS1和AtOTS2独立进化,形成不同的分支。序列分析显示,当前的OsFUG1(Os_cFUG1)与O. rufipogon中的同源基因序列100%相同,支持其可能来源于O. rufipogon。
4. 野生稻和栽培稻中ULP的序列与结构分析
ULP的催化结构域(HxDxC)通常位于蛋白质的C端附近。RPRP水稻的ULP蛋白序列长度显著长于野生稻,表明其蛋白质结构更大,但ULP结构域本身的长度在各物种间相似。蛋白质无序区域预测和结构域分析显示,一些ULP与其他结构域(如氨基转移酶样植物移动域、锚蛋白重复域、MULE转座酶域)发生融合,这些融合事件可能发生在与拟南芥没有直系同源基因的簇中,表明在稻属中存在独立的基因扩张和潜在的功能亚分化。通过AlphaFold2进行的蛋白质结构预测和催化位点距离测量表明,RPRP代表基因和野生稻ULP的催化位点构象与已知的ULP参考距离相似,提示它们很可能具有SUMO蛋白酶活性。
5. 水稻日本晴品种中新型ULP的转录组学证据
公共RNA-seq数据分析揭示了ULP在叶片、茎和根中的组织特异性表达模式。已知的ULP(如OsOTS1、Os_cFUG1、OsELS1、OsOTS2、OsSPF1)和部分新型ULP(如OsULP40d、OsULP40e)在几乎所有细胞类型中均表现出较高的转录水平。单细胞RNA-seq数据进一步提供了组织类型特异性表达的证据,例如Os_nFUG1、OsULP36等在分生组织和幼穗中高表达,OsULP35在种子特定细胞中高表达,OsULP50c则主要在叶片和小穗中表达。胁迫处理下的表达分析显示,多个ULP响应非生物胁迫:在盐胁迫下,OsELS1、OsOTS1、Os_nFUG1和Os_cFUG1显著上调;在干旱胁迫下,OsELS1和Os_nFUG1上调,而OsOTS1下调;热胁迫上调了OsELS1、OsELS2、OsULP35、Os_nFUG1和OsOTS2,但下调了OsULP36和OsOTS1;ABA处理上调了OsELS1、Os_nFUG1、OsOTS2和OsSPF1,下调了OsOTS1和OsULP37a。在生物胁迫(线虫/真菌/病毒感染)下,仅OsOTS2显著上调,另有三个结构域高度保守但基础表达很低的ULP(LOC_Os10g06910, LOC_Os09g08440, LOC_Os02g27280)转录略有增加,提示它们可能参与生物胁迫响应。
讨论
本研究通过整合序列搜索、结构域鉴定、系统发育学和结构生物信息学等多种方法,全面描绘了水稻中ULP基因/蛋白质集合,证实了该家族(相较于模式生物)在多个水稻品种中普遍存在扩张。泛基因组分析显示ULP蛋白通常以单拷贝或低占有率(cloud genes)形式存在,这通常是受选择育种压力基因的特征。ULP蛋白酶结构域被归类为“高度可变”结构域,其平均占有率低且富含单拷贝基因,这与抗病相关基因的模式相似。
在稻属中,亚洲栽培稻的ULP基因数量高于野生稻,而非洲栽培稻则未表现出类似扩张,这表明ULP扩张是亚洲栽培稻谱系特异性事件。野生稻O. punctata含有最多ULP(36个),这可能与其作为杂草所具有的病原抗性性状有关。
亚洲水稻基因组中部分ULP的扩张可能由转座元件(如MULE转座酶、Ptta/En/Spm植物转座酶结构域)所促进,这些元件与ULP结构域融合,可能导致基因重复和功能分化。锚蛋白重复结构域的融合可能介导了底物靶向和去SUMO化特异性。
基于系统发育分析和序列比对,我们建议将当前的OsFUG1重命名为OsELS3,并将Os11g0214001(LOC_Os11g10780)鉴定为新的OsFUG1(Os_nFUG1)。转录组数据显示,高表达的ULP通常在其泛基因组集中至少有15/16的结构域占有率。LOC_Os12g01290(OsULP36)是一个例外,它在籼稻品种中基本缺失(OsLima除外),但其基因模型存在不确定性,需进一步实验验证。
SUMO化通过修饰转录因子等蛋白来调控其在胁迫响应中的功能,而SUMO蛋白酶则通过去SUMO化目标蛋白来重置系统。本研究鉴定出的多个ULP在盐、旱、热及ABA处理下差异表达,且部分基因被独立研究鉴定为盐胁迫相关候选基因,这强烈提示新型ULP在水稻胁迫耐受性中具有重要作用。未来通过基因克隆、蛋白表达和SUMO蛋白酶活性测定进行功能验证,将有助于阐明这些新型ULP的具体分子机制,并为通过分子育种改良水稻抗逆性提供新的靶点。