《Frontiers in Plant Science》:Sequence-based comparative secretome analysis reveals conserved core effectors and host lineage-specific divergence between monocot- and dicot-associated powdery mildew lineages
引言
白粉病真菌是广泛分布的专性活体营养型病原体,侵染超过10,000种植物,可导致小麦、大麦、黄瓜、番茄、葡萄等重要作物严重减产。它们严格依赖寄主活体组织生存,通过分泌蛋白(统称为分泌组)建立复杂的分子界面,以调控胞外防御、重编程寄主免疫与代谢,从而抑制寄主免疫并促进营养获取。因此,表征分泌蛋白,特别是直接调控寄主植物生理学的效应因子库,是理解白粉菌致病机制和宿主适应性的基础。
比较分泌组预测揭示单子叶植物相关白粉菌谱系分泌组扩张
为系统描述白粉菌分泌组的多样性,研究收集了来自5个属、具有不同宿主特异性(单子叶和双子叶植物)的26个白粉菌分离株的预测蛋白质组,应用了统一的分泌组预测流程。经过冗余序列去除、信号肽预测及跨膜结构域/糖基磷脂酰肌醇锚定信号排除后,从219,897个蛋白质序列中鉴定出7,545个分泌组候选蛋白用于比较分析。
全蛋白质组系统发育分析明确了26个分离株在属水平的聚类。蛋白质组大小差异显著,预测的分泌组候选蛋白数量也变化广泛。当标准化为总蛋白质组大小时,预测分泌蛋白的比例平均为3.6%,但变化范围从1.45%到7.53%,表明谱系间存在显著差异。在本数据集中,单子叶植物侵染由Blumeria谱系代表,而双子叶植物侵染则横跨Erysiphe, Golovinomyces, Parauncinula, Podosphaera四个属。Blumeria分离株始终显示出扩张的分泌组(约占其预测蛋白质组的5.18%–7.53%),而侵染双子叶植物的分离株通常具有较小的分泌组(通常为1.45%–3.86%)。
同源基因群分析揭示白粉菌分泌组中存在保守的共享组分及广泛的属特异性和分离株特异性分化
为了检查来自26个分离株的7,545个预测白粉菌分泌组候选蛋白之间的序列关系,研究进行了同源基因群聚类分析,共鉴定出1,399个同源基因群。同源基因群的占有率在分离株间差异很大。侵染单子叶植物的Blumeria分离株始终占据最多的同源基因群数量,这与上文描述的分泌组扩张情况一致。根据分类组成,同源基因群被分为共享(成员来自≥2个属)、属特异性(限制在单个属内)和分离株特异性(限制在单个分离株内)三类。共享同源基因群的数量在各分离株间相对一致,表明存在一组跨白粉菌属保守的共享同源基因群。值得注意的是,属特异性同源基因群在Blumeria中显示出最强的谱系限制信号,其每分离株计数远高于其他属。这代表了同源基因群组成分析中最清晰的模式之一。分离株特异性同源基因群则更具变异性,在一些侵染双子叶植物的分离株中数量较高,表明这些谱系中存在显著的分离株水平分化。
主成分分析基于同源基因群丰度矩阵进行,将分离株分成了属水平的聚类。第一个主成分(PC1)将Blumeria与侵染双子叶植物的属区分开来,表明同源基因群丰度谱捕获了白粉菌分泌组分化的主要轴。研究还展示了一些代表性的、具有功能注释的属特异性同源基因群以及不包含Blumeria的侵染双子叶植物的共享同源基因群。在属特异性示例中,来自Blumeria, Erysiphe, Golovinomyces, Parauncinula的大同源基因群常被注释为微生物核糖核酸酶,而Podosphaera则被一个注释为Egh16样毒力因子的同源基因群代表。此外,不包含Blumeria的侵染双子叶植物的共享同源基因群包括与多种分泌功能一致的注释类别,如小分泌蛋白、硫氧还蛋白还原酶1相关蛋白、以及蛋白酶或水解酶家族。
总之,同源基因群组成分析表明,白粉菌分泌组包含一个跨属保守的共享同源基因群组分,其上叠加了单子叶植物相关的Blumeria中显著的属特异性分化,以及几个侵染双子叶植物谱系中可变的分离株特异性分化,为后续分析保守效应因子群和谱系相关分化提供了同源基因群框架。
分泌组候选蛋白表现出特征性的长度分布,且较高的半胱氨酸含量与预测的质外体定位相关
为了表征7,545个预测白粉菌分泌组候选蛋白的序列特性,研究量化了成熟蛋白长度和成熟蛋白中的半胱氨酸比例。成熟蛋白长度分析显示,分泌组候选蛋白中较短的蛋白质占主导。大多数候选蛋白长度不超过400个氨基酸。半胱氨酸比例分析表明,大多数分泌组候选蛋白含有低到中等比例的半胱氨酸残基。当检查预测的质外体定位与半胱氨酸比例的关系时,在半胱氨酸比例较高的类别中,预测为质外体定位的蛋白质比例增加。对属进行分层总结后,这一趋势在分析的属中普遍存在,表明较高半胱氨酸类别通常表现出比较低半胱氨酸类别更高的预测质外体比例,尽管某些组中高半胱氨酸区间数量稀少。这些结果共同描述了白粉菌分泌组候选蛋白中蛋白质长度和半胱氨酸组成的分布,并表明较高的半胱氨酸含量与预测的质外体定位可能性增加相关。
N端Y/F/WxC基序在Blumeria分泌组中更频繁且具有位置偏好性
为了表征白粉菌分泌组中的N端Y/F/WxC基序,研究扫描了成熟蛋白序列的前30个氨基酸,寻找YxC、FxC或WxC基序的第一个出现位置。在26个分离株中,含有Y/F/WxC基序的蛋白质在Blumeria分泌组中比其他白粉菌属更频繁出现。在Blumeria中,38.8%–51.8%的分泌组候选蛋白在成熟序列的前30个残基内携带至少一个N端Y/F/WxC基序,表明含基序的蛋白质构成了Blumeria分泌组的主要部分。相比之下,含基序的蛋白质在侵染双子叶植物的属中出现频率较低。基序类型组成在属间也存在差异。Blumeria分泌组包含大量YxC和FxC基序以及较少的WxC基序,而WxC基序在Erysiphe中不存在,在Golovinomyces和Podosphaera中仅零星检测到。
成熟蛋白N端区域内的基序位置进一步支持了属相关差异。在Blumeria中,YxC基序表现出显著的位置偏好,在成熟序列的第4位达到峰值。FxC基序则显示出不同的位置模式,在第17位和第4位有突出的峰值,而WxC基序相对罕见,但其最高频率也出现在第4位。在Erysiphe、Golovinomyces和Podosphaera中,基序总体计数较低,且未观察到类似Blumeria的集中位置模式。这些结果表明,N端Y/F/WxC基序在Blumeria分泌组中更频繁,并在成熟蛋白序列中表现出属特异性的位置偏好。这种属相关的基序分布代表了一种与序列相关的模式,与同源基因群水平的比较一致,并支持后续关于保守与谱系相关的分泌组分化的分析。
预测的白粉菌分泌组候选蛋白的亚细胞靶向和功能注释全景
为了总结7,545个白粉菌分泌组候选蛋白的预测靶向特性和功能特征,研究整合了来自多个工具的亚细胞定位预测和源自不同蛋白质数据库的基于序列的功能注释。亚细胞定位预测揭示了潜在寄主和胞外相关靶向结果的广泛分布。功能注释分析表明,在7,545个白粉菌分泌组候选蛋白中,有4,148个可以根据与公共蛋白质和功能数据库条目的序列相似性被分配至少一个注释。因此,有3,397个候选蛋白在所应用的标准下在查询的注释资源中没有检测到匹配。在查询的数据库中,Pfam为3,015个候选蛋白提供了注释。最常见的注释类别概述了分泌组候选蛋白中常见的功能类别。Pfam注释富含与分泌毒力和酶活性相关的结构域。PANTHER分类同样强调了表面相关蛋白、羧酸酯酶、几丁质酶、葡聚糖酶和多种蛋白酶家族。酶分类揭示了与细胞壁修饰、蛋白质加工和氧化还原相关过程的活性频繁出现。这些分析共同提供了白粉菌分泌组候选蛋白预测亚细胞靶向和功能注释特征的综合概述。
已知白粉菌效应因子的同源性比对鉴定出跨分泌组候选蛋白的广泛保守效应因子群
为了将预测的白粉菌分泌组候选蛋白与先前表征的效应因子库联系起来,研究编制了75个已知白粉菌效应因子,并使用BLASTP在7,545个预测的分泌组候选蛋白中搜索同源物。这产生了对应于1,176个具有至少一个匹配的独特分泌组候选蛋白的2,392条效应因子-候选蛋白同源性记录。同源物分布情况在26个分离株中进行了总结,并与贡献同源物池的同源基因群相关联。
图表中的一个主导信号是一个广泛保守的、高丰度的效应因子群,由来自Podosphaera xanthii的PEC2158、PEC5191、PEC1666、PEC1961以及来自Erysiphe pisi的EpCSP083代表。PEC2158、PEC5191、PEC1666和PEC1961各自与分布在大约24个分离株中的大同源物池相关联,同源物源自共享的同源基因群组合。EpCSP083显示出类似的广泛分布,其分配的同源基因群与此模块重叠。这些效应因子共同指向一个重叠的、由同源基因群定义的候选蛋白集,构成了数据集中最突出的保守模块之一。
其他保守效应因子对应较小的、具有一致多分离株代表性的同源基因群定义的同源物池。例如,PxCDA3(PxCHBE) 匹配了分布在大约24个分离株的43个同源物,并对应到OG0015。BEC2(CSEP0214) 和 GoEC2 恢复了完全相同的同源物集,对应到OG0056,在23个分离株中检测到23个同源物。BEC1040(CSEP0196) 和 CSEP30 也恢复了完全相同的同源物集,对应到OG0075,在18个分离株中检测到23个同源物。此外,包括BEC1019、BEC1(CSEP0052)、BEC1005在内的Blumeria效应因子显示出广泛的跨分离株分布。EpCSEP009和EpCSEP001也显示出广泛的跨分离株代表性,同源物分布在多个同源基因群中。
在保守集之外,还包括限制性和稀疏分布的模式。唯一的Erysiphe特异性模式是CSEP080,它仅在Erysiphe分离株中检测到13个同源物。EqCSEP01276主要在Erysiphe内保守,另外在Golovinomyces cichoracearum UCSC1中显示一个同源物。其他几个效应因子显示出较低的同源物计数和有限的分离株覆盖率。
综上所述,同源性比对揭示了一个由少数高丰度、同源基因群定义的模块主导的保守效应因子组分,以及限制性和稀疏模式。这些不同的分布类别与接下来展示的、仅限于单子叶植物相关谱系的Blumeria特异性效应因子家族形成了清晰对比。
Blumeria特异性效应因子家族揭示白粉菌分泌组中的谱系限制性扩增模块
为了解析Blumeria内的谱系限制性效应因子家族,研究聚焦于那些同源物仅在Blumeria分泌组中检测到的已知白粉菌效应因子。图表总结了这六个Blumeria分离株中的这些“仅Blumeria”同源性模式,并将每个效应因子与贡献其同源物池的同源基因群相关联。
最大的Blumeria限制性模块包括CSEP0247和CSEP0025,两者在所有六个Blumeria分离株中均被检测到。这两个效应因子对应到一个强烈重叠的、以OG0001和OG0416为中心的同源基因群集。在此模块内,同源物计数在两个B. hordei分离株中始终最高,相对于四个B. graminis分离株。这表明该属内存在谱系特异性数量差异,这些效应因子家族在B. hordei中相对于B. graminis有明显扩增。
第二种主导模式以AVRA7和BEC1016 (CSEP0491) 为代表,它们与一个共享的多同源基因群池相关,且分离株间分布密切相关。相关模式也在AVRPM8和CSEP0139中观察到,支持连接到重叠候选池的其他中型Blumeria限制性家族。
额外的扩增家族由具有大量同源物池和明确同源基因群关联的效应因子代表,包括CSEP0128、CSEP0081和CSEP0105。另一个高覆盖模块包括Bgt_Bcg-7、SVRPM3A1/F1、Bgt_Bcg-6和Bcg1,它们都对应到相同的同源基因群组合,并显示出高度一致的分离株间分布。几个效应因子显示出相同的同源物集和相同的同源基因群分配,表明它们汇聚到相同的同源物池。这包括AVRA6与CSEP0254、AVRA10与AVRA22、以及AVRPM3D3与BgtE-20069a。
总之,Blumeria特异性效应因子家族由少数高丰度、同源基因群关联的模块主导,并伴有多个具有重叠或相同同源物池的中型家族。这种组织形式与跨属保守模块形成对比,突出了集中在Blumeria内的谱系限制性同源性模式。
全蛋白质组效应因子同源性揭示两个广泛保守的核心效应因子EqCmu和EqPdt
由于六个已报道的白粉菌效应因子缺乏预测的信号肽,仅限于7,545个分泌组候选蛋白的搜索无法捕获它们的完整分布。因此,研究使用相同标准对26个分离株的完整蛋白质组数据集进行了BLASTP搜索,在这六个效应因子中获得了389个全蛋白质组同源匹配。为了比较,这六个效应因子也针对预测的分泌组候选蛋白进行了搜索,并将分泌组与蛋白质组水平的匹配总结进行了整合。
全蛋白质组比对揭示了谱系限制性与广泛保守的非经典模式。Bh9o9在预测的分泌组候选蛋白中产生了同源匹配,并且在针对全蛋白质组搜索时显示出更大的同源物集合;在这两次搜索中,所有Bh9o9同源物在本数据集中都仅限于Blumeria。ROPIP1仅在Blumeria蛋白质组中检测到,而EqIsc1产生的九个匹配主要集中在Erysiphe。相比之下,EqCmu和EqPdt显示出最广泛的保守性,每个效应因子检测到27个同源匹配,并存在于跨越多个属的26个蛋白质组中的25个。EqCmu仅缺失于Podosphaera leucotricha PuE-3,EqPdt仅缺失于Erysiphe pulchra TENN-F-071826。全蛋白质组搜索比仅分泌组搜索恢复了更多同源物,这一观察突显了基于信号肽的效应因子发现的一个关键局限性:缺乏信号肽的非经典效应因子被系统性地排除在常规分泌组预测之外。这对于Bh9o9是明显的,其额外的同源物可能代表通过替代途径分泌的变体或作为非分泌旁系同源物保留。更重要的是,EqCmu和EqPdt在26个蛋白质组中的25个广泛保守,尽管它们存在于许多预测的分泌组中。这种广泛的保守性巩固了它们作为核心效应因子的地位,并强调了需要用全蛋白质组搜索来补充聚焦于分泌组的分析。
EqCmu和EqPdt的同源物不仅在多序列比对中保持了高度的序列保守性,而且与其参考结构也表现出高度的结构相似性。它们几乎普遍保留在白粉菌蛋白质组中,以及它们已证实的协同抑制寄主水杨酸信号的功能,共同支持EqCmu和EqPdt作为白粉菌中两个保守的核心效应因子。
讨论
白粉病真菌是依赖分泌蛋白定殖活体寄主组织并维持感染的专性活体营养菌。这项研究提供了跨五个属和26个分离株的预测白粉菌分泌组的统一序列比较,整合了同源基因群分析、N端Y/F/WxC基序筛选、预测的亚细胞定位、功能注释以及与已知白粉菌效应因子的同源性比对。在本数据集中,单子叶植物相关侵染由Blumeria谱系代表,而双子叶植物相关侵染则横跨Erysiphe, Golovinomyces, Parauncinula, Podosphaera。三个主要发现是显而易见的。首先,白粉菌分泌组包含一个跨属保守的共享组分,同时大量的分化发生在属和分离株水平。其次,N端Y/F/WxC基序的频繁出现和位置偏好是Blumeria分泌组的特征,加强了与此Blumeria相关(单子叶植物相关)谱系相关的独特序列特征,相对于双子叶植物相关属。第三,在分泌组候选蛋白和全蛋白质组中的同源性搜索突出显示了跨越不同白粉菌谱系的多个保守的、具有代表性的效应因子群,其中EqCmu和EqPdt作为两个突出的例子,得到了它们在白粉菌蛋白质组中广泛存在、高度的序列和结构保守性、以及已证实的抑制寄主水杨酸信号功能的支持。
结论
通过跨五个属的26个白粉菌分离株使用统一的序列分析流程,这项工作识别出了白粉菌分泌组中一个保守的共有组分,以及广泛的、属特异性和分离株特异性的分化。在成熟分泌蛋白中,Blumeria分泌组显示出更高比例的N端Y/F/WxC基序和位置偏好,提供了与此谱系相关的清晰序列特征。已知效应因子的同源性比对揭示了跨多个属和许多分离株存在的、保守的、高丰度的、由同源基因群定义的模块,以及在此处检查的单子叶植物相关谱系内Blumeria特异性扩增模块。将同源性搜索扩展到全蛋白质组进一步支持EqCmu和EqPdt作为两个保守的核心效应因子,这与它们的序列和结构保守性以及先前报道的协同抑制寄主水杨酸信号的功能一致。总之,这些发现为白粉菌分泌组提供了综合的比较资源,并建立了一个区分保守核心效应因子与谱系特异性分化的框架。