综述:从高密度基因组图谱到精准分子育种:辣椒基因组资源综述

《Genes》:From High-Density Genomic Mapping to Precision Molecular Breeding: A Comprehensive Review of Capsicum Genomic Resources Luyao Wang, Junhu Kan, Weiting Zhong, Shuo Zhang, Yanghe Zhao, Yingke Hou, Luke R. Tembrock, Xiaolin Gu and Yan Cheng

【字体: 时间:2026年03月05日 来源:Genes 2.8

编辑推荐:

  本文系统梳理了辣椒(Capsicum)从参考基因组、泛基因组到细胞器基因组的研究进展,指出高通量测序、T2T(端粒到端粒)组装和泛基因组学等技术突破极大地推动了关键农艺性状(如辣味、果实形状、抗病性)的遗传解析,并展望了整合多组学、基因编辑(如CRISPR/Cas9)和智能育种(Breeding 5.0)的未来方向,为辣椒的遗传改良和分子育种提供了理论和方法参考。

  
从高密度基因组图谱到精准分子育种:辣椒基因组资源全景
近年来,以辣椒(Capsicum)为代表的茄科作物因其重要的经济、营养和观赏价值,成为植物基因组学研究的热点。辣椒基因组庞大(约3 Gb)且复杂,其中超过80%为重复序列,尤其是长末端重复反转录转座子(LTR-RTs),这曾长期制约着对其结构变异和功能基因的深入解析。然而,随着长读长测序、Hi-C(高通量染色体构象捕获)技术和组装算法的进步,辣椒基因组研究已从高度碎片化的草图时代,迈入了高质量甚至端粒到端粒(Telomere-to-Telomere, T2T)完整基因组的新阶段。
辣椒参考基因组的演变历程
辣椒基因组研究是一部由测序技术革新驱动的科学探索史。早期的短读长测序技术难以跨越基因组中的长重复区域,导致组装高度碎片化。例如,基于Illumina技术组装的辣椒品种‘CM334’草案,产生了超过3.7万个scaffold,Scaffold N50仅约2.47 Mb。而随着PacBio、Oxford Nanopore等长读长平台结合光学图谱和Hi-C技术的应用,染色体级别的高质量基因组相继完成。例如,对日本品种‘Takanotsume’的组装,其contig N50达到了~262.7 Mb。更进一步的突破是T2T无间隙基因组的实现,例如在2024年发布的C. annuum和C. rhomboideum的T2T基因组,使得着丝粒、端粒等复杂区域得以解析,为探索基因组结构、进化和功能提供了高分辨率图谱。
转座子扩张是驱动辣椒基因组大小变异的核心力量。大多数辣椒基因组大小在3.0-3.9 Gb之间,而其野生近缘种C. rhomboideum的基因组仅约1.7 Gb。研究表明,这种差异并非源于全基因组复制(WGD)事件,而主要是由转座子(TEs),特别是LTR-RTs的扩张所驱动。辣椒基因组中约80-85%为TEs,其中Gypsy和Copia超家族是核心组成部分。在C. annuum中,Gypsy-CRM亚家族经历了显著扩张,其拷贝数可达数百万,而C. rhomboideum中则缺乏这种扩张。转座子的插入不仅改变了基因组大小,也在结构和功能进化中扮演关键角色。例如,在C. frutescens中,一个Gypsy-Ogre亚家族元件插入到果实大小调控因子FW2.2的上游调控区,引入了新的生长素响应元件(AuxRE),下调了FW2.2的表达,使果实体积增大约40%。在C. annuum中,辣椒素合成酶(CS)基因启动子区的Gypsy-CRM元件插入引入了茉莉酸响应元件(JRE),增强了CS对茉莉酸信号的响应,增加了辣椒素积累。相反,在甜椒中,Pun1基因编码区的一个Copia元件插入导致了翻译提前终止,从而产生了“不辣”的表型。
基于高质量基因组,研究者重建了辣椒属的核型进化。大多数辣椒物种的染色体数为2n = 2x = 24,而安第斯支系(包括C. rhomboideum)的一些物种为2n = 2x = 26。比较基因组学分析揭示,辣椒祖先核型(ACaK)由12条染色体组成。C. rhomboideum的13对染色体是通过ACaK第12号染色体的断裂和易位形成的。这表明,辣椒的基因组进化遵循“双轨”模式:一轨涉及染色体结构的重排,另一轨则是转座子的逐步积累,二者共同驱动了物种形成过程中的多样性。
泛基因组学揭示辣椒遗传多样性全景
为了系统分析辣椒丰富的遗传多样性,研究已从依赖单一参考基因组转向构建更具代表性的泛基因组。泛基因组通常分为核心基因组、壳基因组和云基因组。核心基因组由所有被测序基因组共享的基因/区域组成,壳基因组由多数基因组共享,而云基因组则由少数或单个基因组特有的基因/区域组成。
辣椒的第一个基于图的泛基因组构建自500份材料,在云基因组中鉴定出237个抗逆基因。例如,在野生材料中发现的细菌性枯萎病抗性基因PsyR1启动子区的一个InDel变异,解释了其相较于栽培品种显著更高的抗性。另一个例子是在云基因组中发现的一个辣椒素合成酶基因CS的新等位基因,能使辣椒素含量降低40%,对应“低辣度”性状。对C. annuum、C. baccatum和C. pubescens复合群的16个高质量基因组的整合分析显示,只有约13%的基因属于核心基因,而87%的可变基因集中在云基因组中。这些云基因具有重要的农学价值,例如NBS-LRR基因Rps1可增强对疫病(Phytophthora blight)的抗性达80%。研究表明,辣椒的核心基因主要负责基础代谢和转录调控等维持生命的基本过程,而云基因则多参与调控与环境适应相关的性状,如抗病性、逆境耐受和次生代谢。这表明云基因的多样性越丰富,辣椒适应不同环境和拥有广泛性状(如抗病性和风味变异)的能力就越强。
泛基因组分析也揭示了驯化、物种形成和基因渐渗的模式。对数百份野生和栽培材料全基因组变异的分析,阐明了“野生到栽培”的方向性选择模式。例如,果实大小调控基因CaFW2.2是一个受到强烈选择的核心基因;其在野生辣椒中高表达抑制细胞增殖,而在栽培种中启动子甲基化降低了其表达,从而产生更大的果实。Pun1基因的变异标志着甜椒的驯化:野生辣椒编码有功能的酶,而栽培甜椒携带一个2 bp的移码突变导致功能丧失。泛基因组比较还揭示了基因渐渗的作用。现代栽培辣椒的基因组是多个物种的“嵌合体”。例如,大果型甜椒拥有源自外源物种的、赋予其抗辣椒轻斑驳病毒(PMMoV)能力的片段。在生殖性状方面,泛基因组与表达谱的联合分析鉴定出“orf138-Rf1”模块。线粒体基因orf138仅存在于某些C. annuum不育系中,编码一种有毒蛋白破坏花粉发育。而从C. frutescens渐渗来的育性恢复基因Rf1能抑制orf138的表达以恢复育性。这些发现挑战了传统的“线性驯化模型”,提出了一个涉及物种间频繁基因转移和渗入的“网状模型”。
细胞器基因组学及其在杂交育种中的应用
叶绿体和线粒体基因组虽小,但在植物代谢、发育和育种,特别是细胞质遗传和细胞质雄性不育(Cytoplasmic Male Sterility, CMS)中扮演着不可替代的角色。
辣椒叶绿体基因组是典型的环状双链DNA结构,长约157 kb,包含约130个基因。虽然保守,但辣椒物种间存在插入/缺失(InDels)、单核苷酸多态性(SNPs)等序列变异,这些变异主要集中在非编码区和反向重复区(IR)边界,可作为有效的分子标记用于系统发育和种质鉴定。基于质体泛基因组(pan-plastome)对数百份栽培辣椒材料的分析,为评估质体多样性和结构提供了高分辨率框架,有效解析了物种复合群间的分类界限。
植物线粒体基因组具有基因组大、重复序列丰富、频繁重组和广泛结构重排的特点。在辣椒属中,已完成多个有丝分裂基因组的测序,例如C. annuum var. glabriusculum(505,190 bp)、C. annuum cv. ‘Dempsey’(577,453 bp)和C. pubescens(454,165 bp)。比较分析揭示了不同辣椒品种间有丝分裂基因组在基因块顺序、方向和连接性上的显著差异,表明发生了重排和重组事件。这种结构可塑性和多样性为研究种间差异、细胞质遗传以及与CMS等重要性状的关联提供了基础。
CMS是一种由细胞器基因组控制的 pollen 不育现象,通常由线粒体基因的突变或重排引起。由于其母系遗传特性,理解CMS机制可改进杂交制种。在辣椒中,CMS研究可追溯至20世纪50年代。在分子育种时代,Kim等人鉴定出orf456和线粒体基因atp6是辣椒CMS的强候选基因。后续研究进一步发现了orf507、orf300a、orf314a等基因,它们均与能量代谢密切相关,其异常表达可能干扰细胞色素C氧化酶和F1F0-ATP合酶的正常功能,最终导致花粉发育异常和不育。研究表明,辣椒CMS的形成主要受线粒体基因重组驱动。新产生的嵌合基因(如orf507、orf456)往往会破坏能量代谢,导致花粉败育。
育性恢复基因(Rf)是核编码的、能够恢复CMS植株育性的基因。随着高通量测序和比较基因组学技术的发展,辣椒CMS的分子研究进入了精细定位时代。例如,通过构建BSA(集群分离分析)群体,鉴定出多个与Rf基因连锁的AFLP标记;利用SSR标记将Rf基因精确定位于第6号染色体。研究表明,辣椒的恢复基因CaRf是一个编码线粒体靶向PPR蛋白的单基因,可显著恢复CMS育性,并已应用于杂交育种系。在细胞核与细胞质的互作中,核基因通过调节异常线粒体RNA的加工、剪接或降解,在功能上补偿CMS相关线粒体的异常表达,这是核质互作的核心模式。由于辣椒CMS系统结构复杂,有丝分裂基因组在进化过程中经历了频繁的重组和区段重排,形成了多种嵌合基因,使得不同不育类型间差异显著,这也使辣椒成为研究有丝分裂基因组重塑和CMS形成机制的重要模型。
未来展望:从基因组到集成育种策略
未来的辣椒研究正逐步超越单一基因组视角,进入多组学整合的新阶段。整合基因组学、转录组学、蛋白质组学和代谢组学数据,可全面解析辣椒多样的农艺性状。结合全基因组关联分析(GWAS)和基因-代谢物网络建模,能够更快速准确地识别控制复杂性状的关键基因。尽管辣椒基因组资源迅速扩展,但在田间条件下获取准确、高分辨率、全植株水平的表型数据仍是精准育种的主要瓶颈。高通量表型(HTP)技术,如基于无人机的成像、高光谱和热传感器,以及自动化图像分析流程,使得在大田条件下进行动态、大规模性状量化成为可能。未来辣椒研究应优先建立标准化的田间表型平台、多环境试验,并将稳健的G×E模型框架与GWAS、基因组选择和机器学习方法相结合。
随着作物基因编辑技术的快速发展,建立高效的辣椒遗传转化体系是实现精准分子育种的关键前提。基于“可编辑+可再生”平台,CRISPR/Cas9、CRISPR/Cas12a等基因编辑技术正逐渐成为辣椒精准育种的核心工具。例如,利用CRISPR/Cas9编辑辣椒抗病基因CaMLO2,在多个品种的叶肉原生质体中实现了有效突变;编辑类胡萝卜素合成途径中的CaPDS基因也证实了在细胞水平进行高效基因编辑的可行性。未来,整合CMS系统与基因编辑技术,通过精确编辑线粒体基因和/或核恢复基因(如Rf基因)来实现不育-恢复体系的可控构建,有望显著提高辣椒杂交制种的效率和灵活性。
总体而言,过去十年,辣椒基因组研究已从“寻找基因”发展到“利用基因”。随着T2T基因组和泛基因组的积累,结合多组学和基因编辑,辣椒育种正在进入智能预测设计时代。这种集成策略将加速品种改良,并为全球粮食安全做出贡献。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号