《Frontiers in Plant Science》:An integrated transcriptomic and metabolomic atlas reveals the temporal regulation of benzylisoquinoline alkaloid biosynthesis and transport in developing opium poppy capsules
编辑推荐:
本研究通过整合转录组与代谢组分析,系统揭示了罂粟(Papaver somniferum L.)蒴果五个发育阶段(S1-S5)中苄基异喹啉生物碱(BIA)生物合成与转运的时序调控网络。研究发现S4阶段为BIA积累的关键期,通过加权基因共表达网络分析(WGCNA)筛选出与关键中间体蒂巴因(thebaine)积累密切相关的共表达模块,并利用跨膜结构域预测及功能注释等多层级生物信息学策略,最终鉴定出PsMATE1和PsEXS1为高置信度转运蛋白候选基因,为阐明BIA转运机制提供了重要靶点。
引言
罂粟(Papaver somniferum L.)是多种具有重要医用价值的苄基异喹啉生物碱(Benzylisoquinoline Alkaloids, BIAs)的主要来源,其中包括吗啡和可待因。然而,在蒴果发育过程中,调控BIA时空积累的转录调控网络和转运过程仍未完全阐明。本研究通过对五个明确划分的蒴果发育阶段(S1–S5)进行整合的转录组和代谢组分析,旨在揭示BIA生物合成与转运的时序调控机制。
方法
研究材料与采样:新鲜罂粟蒴果采自武汉植物园(中国武汉)的栽培地,根据直径和诊断形态学特征定义了五个发育阶段(S1–S5)。每个阶段至少三个独立生物学重复,取样后立即液氮速冻,于-80°C保存直至RNA和代谢物提取。
代谢物提取与LC-MS分析:使用预冷甲醇:水(7:3, v/v)提取蒴果果皮中的代谢物,并加入同位素标记内标。通过高效液相色谱-质谱联用(LC-MS)进行数据采集,使用C18色谱柱,在正负离子模式(ESI+和ESI-)下获取数据。原始数据经Compound Discoverer软件处理,进行峰识别、对齐、空白扣除和特征分组,并通过精确质量数和MS/MS谱图匹配进行代谢物注释。
RNA提取、测序与分析:使用RNeasy Plant Mini Kit提取总RNA,经质量检测合格后构建poly(A)+文库,并在DNBSEQ平台上进行测序。原始读数经质量控制和修剪后,比对至罂粟参考基因组,使用DESeq2进行差异表达分析,并利用clusterProfiler进行GO和KEGG功能富集分析。
整合分析策略:通过全局Pearson相关性分析评估转录组与代谢组之间的整体关联。利用Mfuzz R包进行时间序列趋势分析,将基因和代谢物聚类至不同的时间表达模式。采用加权基因共表达网络分析(WGCNA)构建基因共表达网络,识别与BIA代谢物显著相关的共表达模块,并从中筛选枢纽基因。通过DeepTMHMM预测候选基因的跨膜结构域(Transmembrane Domains, TMDs),并结合Pfam和保守结构域数据库(Conserved Domain Database, CDD)进行功能域注释。最后,通过qRT-PCR验证候选转运蛋白基因的表达模式。
结果
代谢组景观定义罂粟蒴果的五个发育阶段
基于直径和明确的形态标记,将罂粟蒴果系统划分为五个发育阶段(S1至S5)。主成分分析(PCA)显示代谢组在不同发育阶段间存在清晰的渐进分离,验证了分期系统的合理性。差异积累代谢物(Differentially Accumulated Metabolites, DAMs)分析表明,S1至S2的过渡期发生了最显著的代谢重编程,涉及大量代谢物的上调和下调。BIA的动态分析显示,早期前体L-酪氨酸和酪胺在S1阶段含量最高,而终端BIA产物(如吗啡、罂粟碱和那可丁)在S4阶段达到峰值,随后在S5阶段显著下降,提示在发育晚期启动了主动转运或代谢转化过程。
阶段特异性转录重编程支撑蒴果发育
转录组PCA分析揭示了基因表达在蒴果发育过程中的全局性转变。差异表达基因(Differentially Expressed Genes, DEGs)分析显示,涉及S1阶段的比较(如S1对S2)产生了最多的DEGs,表明初始过渡期是深刻的转录重编程时期。GO和KEGG富集分析证实了特化代谢的顺序激活,其中“异喹啉生物碱生物合成过程”在S3对S2中富集,而“生物碱代谢过程”和“通过跨膜输出的外源物解毒”等术语在S5对S4中富集。对23个已知BIA生物合成基因的表达分析揭示了清晰的转录逻辑:上游基因(如TyrAT和TYDC)在早期阶段(S1/S2)高表达,而与晚期途径分支相关的基因(如noscapine分支的CAS和TNMT,morphinan分支的SalR和SalAT,papaverine分支的N7OMT和DBOX)在后期阶段表达量最高。特别是在morphinan分支中,从STORR到SalAT的基因表达模式从S1到S3增加,在S4急剧下降,在S5部分恢复,而负责最终转换为蒂巴因的基因(THS和T6ODM)在S4表达最高。这种表达模式与蒂巴因在S4达到峰值随后下降的代谢模式相呼应,强烈暗示S4是协调BIA通量的关键节点。
整合多组学分析揭示协调的代谢与转录动态
全局Pearson相关性分析显示,所有表达的基因和积累的代谢物之间存在广泛且稳健的正相关关系,表明基因表达的变化与代谢物丰度的变化系统性相关。Mfuzz趋势分析分别识别了代谢物和转录物的主要时间积累模式。代谢物聚类中,簇1、2和3在整个发育过程中持续增加,其中簇1和簇3显著富集于“异喹啉生物碱生物合成”途径。转录物聚类中,簇4、5和6从S1到S4表现出稳定增加的表达谱,其中簇5也显著富集于“异喹啉生物碱生物合成”途径。这种BIA途径基因上升趋势与BIA代谢物积累趋势的一致性,为从S1到S4的协同生物合成程序提供了双向证据。
加权基因共表达网络分析识别BIA相关模块与枢纽基因
WGCNA将转录组划分为32个不同的共表达模块。模块特征基因与18种BIA相关代谢物丰度的相关性分析显示,有10个模块与一种或多种BIA途径代谢物相关。聚焦于关键中间体蒂巴因(M16),"steelblue"和"brown"两个模块与其积累显示出极强的正相关性。从这四个关键模块中提取基因进行子网络可视化,并结合模块内连通性(kME)、基因显著性(GS)和网络中心性进行整合分析,筛选出核心枢纽基因候选。
多层级生物信息学管道优先筛选高置信度转运蛋白候选
对候选基因进行DeepTMHMM跨膜结构域预测,鉴定出13个具有预测跨膜结构域(TMDs)的蛋白质。Pfam和CDD分析进一步提供了它们潜在功能的关键信息。其中,PsMATE1(novel1170)属于MATE(Multidrug and Toxic Compound Extrusion)家族,该家族在植物生物碱的液泡隔离中作用明确。PsEXS1(novel15918)与EXS家族相关,该家族涉及多种底物的转运功能。通过整合结构域注释和表达谱,最终将候选名单缩小至六个高优先级转运蛋白基因:PsFAD5(C5167_036820)、PsMATE1(novel1170)、PsEXS1(novel15918)、PsTBR23(C5167_011818)、PsHAK5(novel5542)和PsRhaT1(novel8019)。
qRT-PCR验证候选转运蛋白基因表达
qRT-PCR结果与转录组数据高度一致。表达动态显示,PsEXS1、PsFAD5、PsMATE1和PsTBR23以及已知转运蛋白BUP1的表达趋势高度一致,即从S1到S3逐渐增加,在S4达到峰值,随后在S5下降。该模式与关键BIA代谢物的峰值积累期相吻合。结合先前的结构和功能注释,PsMATE1和PsEXS1被确定为最重要的候选基因。两者均具有多个预测的跨膜结构域,并归属于具有明确转运功能的蛋白家族,且其与BUP1在S4阶段的共表达为它们可能参与同一生物学过程(BIA转运)提供了有力的体内证据。
讨论
本研究构建了罂粟蒴果五个发育阶段的动态转录组和代谢组图谱,系统描绘了调控BIA生物合成和积累的时间程序。整合共表达网络分析和多层级生物信息学筛选策略,精确鉴定出两个高置信度候选基因PsMATE1和PsEXS1,它们可能参与BIA转运。观察到的从S1阶段前体高丰度到S4阶段终产物峰值积累的转变,体现了从初级生长到活性特化代谢的经典过渡。S5阶段终端BIA的下降以及中间体的波动,为发育晚期启动主动转运、再分配或转化过程提供了证据。转录组数据有力地证实了这些代谢动态,揭示了BIA积累的阶段特异性转录基础。WGCNA分析识别出与BIA谱密切相关的模块,其中包含已知生物合成基因(如THS、NISO)和未表征基因。已知的蒂巴因转运蛋白BUP1存在于该网络中,进一步验证了其与BIA转运相关的生物学意义。从这些模块中,通过严格的生物信息学管道(结合网络中心性、跨膜结构域预测和功能域分析)筛选出高优先级候选基因。最终的qRT-PCR验证表明,PsMATE1和PsEXS1的表达模式与BUP1以及S4阶段BIA积累峰值紧密同步。PsMATE1属于MATE家族,该家族成员通过H+反向转运介导多种植物生物碱的液泡隔离。PsEXS1含有EXS结构域,与输出功能相关。尽管EXS家族蛋白如PHO1以磷酸盐稳态闻名,但其在跨膜输出中的核心作用使PsEXS1成为BIA等小分子外排的有力候选者。基于这些发现,提出了一个模型:在S4阶段激活的核心共表达模块协同上调BIA生物合成机制(THS, NISO)和特定转运系统(PsMATE1, PsEXS1),以促进生物碱的合成及其随后向乳管中的定向转运和储存。
结论
本研究通过对罂粟蒴果发育的整合多组学分析,明确了BIA代谢的时间程序,确定S4阶段为关键的生物合成和调控枢纽。通过结合共表达网络分析、跨膜结构域预测和功能域注释的系统性基因发现管道,成功优先筛选出两个高置信度转运蛋白候选基因PsMATE1和PsEXS1。它们作为多跨膜蛋白的结构特征,以及与BIA积累紧密同步的表达模式,为其未来的功能表征提供了强有力的理论依据和优先方向,从而增进了我们对BIA转运机制的理解。