《Frontiers in Plant Science》:Analysis of structural variation and sex differentiation associated phylogenetic signals in newly sequenced Rhodiola chloroplast genomes using a batch processing pipeline
编辑推荐:
摘要
引言: 红景天属(Rhodiola)是景天科中少数同时包含雌雄异株和雌雄同株物种的属之一。然而,以往的研究主要依赖于代表性个体或有限的质体片段,这可能无法完全解决该属内的进化关系,特别是与性别系统分化相关的谱系分歧。方法: 本研究分析了代表35种红景天的
摘要
引言: 红景天属(Rhodiola)是景天科中少数同时包含雌雄异株和雌雄同株物种的属之一。然而,以往的研究主要依赖于代表性个体或有限的质体片段,这可能无法完全解决该属内的进化关系,特别是与性别系统分化相关的谱系分歧。方法: 本研究分析了代表35种红景天的89个新测序样本的完整叶绿体基因组。研究人员采用批量处理流程整合了原始读长处理、自动化叶绿体基因组组装与注释,以及下游比较基因组学和系统发育分析。结果: 红景天属的叶绿体基因组在整体结构、基因含量和密码子使用上高度保守,同时在数个编码基因和基因间区表现出中等的序列变异。高变区域包括编码基因ycf1、matK、rpoC2和rpoB,以及基因间区trnR-UCU–atpA、trnH-GUG–psbA和rpl14–rpl16。在R. discolor中检测到ndhA–ndhH基因间区存在罕见的108 bp扩张。系统发育分析支持两个主要分支,大体对应于雌雄同株和雌雄异株谱系。然而,R. sachalinensis、R. wallichiana和R. wallichianavar. cholaensis的系统发育位置表明其进化历史更为复杂,可能涉及性别系统的平行进化或过渡谱系。研究人员进一步鉴定出rps15、ndhI、rps3和rpl20中的谱系特异性多态性,作为与母系谱系分歧和性别系统进化相关的候选叶绿体基因组标记。讨论: 这些发现表明,完整的叶绿体基因组数据为理解红景天属内的进化关系提供了更高的分辨率。所鉴定的高变区域和谱系特异性多态性为物种鉴定提供了有用的分子标记,并为红景天叶绿体基因组进化和生殖性状分歧提供了新的见解。
论文解读:基于批量处理流程的红景天叶绿体基因组结构与性别分化系统发育信号研究
本研究针对红景天属(Rhodiola)植物开展了大规模叶绿体基因组分析,相关成果发表于《Frontiers in Plant Science》。红景天属是景天科中兼具药用价值与演化生物学意义的类群,包含约90种,广泛分布于青藏高原及周边高海拔地区。该属植物不仅在形态上具有高度多样性,更重要的是它是景天科中少数同时包含雌雄同株(hermaphroditism)和雌雄异株(dioecy)物种的属,这种性别系统的差异被认为是适应高海拔环境压力(如传粉者匮乏)的结果。然而,以往基于有限叶绿体片段或核ITS序列的研究难以完全解析该属复杂的系统发育关系,且单一个体的采样策略往往掩盖了种内变异,无法精确评估性别分化与谱系进化的关联。为此,研究人员显著扩大了采样规模,涵盖了35个物种的89个个体,旨在从群体水平重新审视该属的叶绿体基因组结构变异及其与性别分化的系统发育信号。
为实现大规模数据处理,研究人员开发了一套批量处理流程(batch-processing pipeline)。关键技术方法包括:利用改良的CTAB法提取总基因组DNA,通过Illumina NovaSeq平台进行双端测序(PE150);利用GetOrganelle软件进行批量叶绿体基因组组装,并通过Bandage软件手动校正;使用CpGAVAS2进行注释;开发了自定义脚本用于串联重复序列(tandem repeats)、散在重复序列(dispersed repeats)及相对同义密码子使用(RSCU)的批量计算;基于MAFFT比对结果计算核苷酸多样性(Pi)值;最后利用最大似然法(Maximum Likelihood, ML)构建系统发育树,并结合性征信息进行映射分析。样本覆盖了青藏高原、长白山、贺兰山等主要分布区,并由专业人员进行形态与分子双重鉴定。
研究结果
3.1 大规模叶绿体基因组组装、注释和数据处理
研究人员构建了包含数据预处理、质量控制、组装、注释及下游分析的完整自动化流程。该流程整合了Trimmomatic、BLASTn、MISA等多种工具,实现了从原始数据到系统发育树的批量化操作,显著提高了处理效率。
3.2 叶绿体基因组结构分析
红景天叶绿体基因组呈现典型的四部分结构(quadripartite structure),包含大单拷贝区(LSC)、小单拷贝区(SSC)和两个反向重复区(IR)。基因组全长在150,893 bp至152,136 bp之间,结构高度保守。IR区边界分析显示,尽管整体稳定,但在ndhF和ycf1基因的3'端重复序列存在长度多态性,导致边界发生轻微移动。
3.3 重复序列特征与密码子使用偏倚分析
重复序列分析显示,单核苷酸重复序列(SSRs)占主导地位。密码子使用偏倚(RSCU)分析表明,红景天叶绿体基因组表现出强烈的A/U结尾偏好,这种偏倚在不同物种间高度一致,暗示了相似的进化约束和翻译效率优化机制。
3.4 基因与基因间间隔区的遗传多样性
核苷酸多样性(Pi)分析揭示了显著的变异热点。在蛋白编码基因(PCGs)中,rps15的变异最高,其次是ycf1、matK等。在基因间区(IGSs),trnR-UCU–atpA的Pi值最高。值得注意的是,研究人员在R. discolor中发现了ndhA–ndhH区间存在108 bp的特异性扩张。此外,研究鉴定出rps15(位点87)、ndhI(位点21, 162, 283)、rps3(位点84, 160, 207)和rpl20(位点33, 165)中的谱系特异性多态性位点,这些位点能够有效区分雌雄同株和雌雄异株谱系。
3.5 系统发育分析与性别分化
基于89个样本叶绿体CDS序列构建的最大似然树显示出极高的节点支持率。系统发育树清晰地解析出两个主要分支(Clade I和Clade II),分别对应雌雄同株和雌雄异株谱系,支持了性别分化与该属早期谱系分歧的紧密关联。然而,R. sachalinensis被归入基部雌雄同株分支,而R. wallichiana及其变种则嵌套于雌雄异株分支,这种分类学描述与系统发育位置的错位暗示了性别系统可能存在平行进化或处于过渡状态。
结论与讨论
讨论部分指出,尽管红景天叶绿体基因组在结构上高度保守,但特定基因(如rps15)表现出的高Pi值和特定位点的固定变异,反映了母系谱系的分化信号,而非直接决定性别分化。重复序列分析进一步证实了叶绿体基因组的保守性,但也揭示了可作为辅助标记的单核苷酸重复特征。系统发育结果不仅验证了前人基于少量代表物种得出的两性系统分化结论,还通过高密度取样揭示了如R. wallichiana等物种复杂的网状进化历史,这些物种可能代表了从雌雄同株向雌雄异株过渡的中间状态。结合核基因组研究的证据,性别系统的转变可能伴随着核基因组结构的剧烈变化。
综上所述,本研究通过开发的批量处理流程,对红景天属进行了迄今为止较大规模的叶绿体基因组分析。研究人员证实,完整的叶绿体基因组数据为解析该属近期辐射进化提供了高分辨率框架。研究鉴定出的高变区域(如ycf1、trnR-UCU–atpA等)为物种鉴定和系统发育重建提供了优质分子标记,而发现的谱系特异性多态性则为探索性别系统演化的母系遗传线索提供了重要依据。这项工作不仅丰富了高山植物适应性进化的理论基础,也为红景天属药用资源的保护利用提供了关键的遗传学数据支撑。