《Journal of Genetics and Genomics》:Population genomic analysis reveals genomic variations associated with domestication and key agronomic traits in bitter gourd (Momordica charantia)
编辑推荐:
苦瓜(Momordica charantia)因营养与药用价值被广泛栽培为蔬菜与药用作物,但其驯化及关键农艺性状的基因组基础仍待深入解析。本研究构建了光滑果苦瓜栽培种Y1745的高质量染色体级基因组,总组装大小为327.14 Mb,contig N50为11.
苦瓜(Momordica charantia)因营养与药用价值被广泛栽培为蔬菜与药用作物,但其驯化及关键农艺性状的基因组基础仍待深入解析。本研究构建了光滑果苦瓜栽培种Y1745的高质量染色体级基因组,总组装大小为327.14 Mb,contig N50为11.33 Mb,scaffold N50为23.47 Mb。比较基因组学分析显示,与胁迫响应和次生代谢相关的基因家族发生了谱系特异性扩张。对192份全球代表性种质资源的群体基因组分析鉴定出中国、东南亚、南亚次大陆3个遗传类群,反映了复杂的人口历史,并挖掘到与驯化及区域适应相关的强烈选择信号。针对35个性状的基因组关联分析(GWAS)共鉴定到893个显著性状关联位点,其中2个候选基因(McWRKY和McFPF1-like 1)与开花时间调控相关,1个候选基因(McEXLB1)与果实大小决定相关。该研究为解析苦瓜驯化机制提供了宝贵基因组资源,也为育种提供了潜在遗传靶点。
论文解读
研究背景与意义
苦瓜属于葫芦科,原产热带非洲,约6000年前在南亚和东南亚完成驯化,现广泛栽培于亚洲热带及亚热带地区,其果实富含三萜类、类胡萝卜素等生物活性成分,具有抗糖尿病、抗炎、抗癌等药理作用,同时是重要的营养蔬菜。尽管黄瓜、西瓜等其他葫芦科作物的基因组研究已较为成熟,但苦瓜的基因组与群体水平研究仍相对滞后,此前发表的基因组组装在连续性和完整性上存在局限,且对驯化及关键农艺性状的遗传基础解析不足。本研究由热带作物种质资源研究团队完成,成果发表于《Journal of Genetics and Genomics》,为苦瓜驯化机制解析与分子育种提供了关键支撑。
主要技术方法
研究以光滑果苦瓜栽培种Y1745为材料,采用PacBio HiFi测序结合Hi-C染色质构象捕获技术完成染色体级基因组组装;收集192份覆盖全球的苦瓜种质资源进行全基因组重测序;通过同源预测与从头预测相结合的方法完成基因组注释;利用比较基因组学分析物种进化与基因家族动态;基于群体遗传学方法解析种群结构与驯化选择信号;开展35个农艺性状的全基因组关联分析(GWAS),挖掘性状关联位点与候选基因。
研究结果
从头测序与基因组组装
研究人员获得366.53 Mb预估基因组大小、0.659%杂合率的苦瓜基因组,最终组装大小为327.14 Mb,将290.40 Mb序列锚定到11条染色体上,仅存在49个组装缺口,72.7%的染色体端粒被成功识别,候选着丝粒区域总长为29.97 Mb。Illumina短读段回贴率达99.79%,基因组覆盖度为99.77%,仅检测到31093个SNP,验证了组装的高连续性、完整性与准确性。
重复序列与蛋白编码基因注释
基因组中重复序列占比41.25%,其中长末端重复(LTR)反转录转座子占28.93%,LTR组装指数(LAI)为17.85,达到参考级组装标准。共注释到36459个高置信度蛋白编码基因,BUSCO评估显示98.1%的保守单拷贝直系同源基因被完整注释。与已发表的三个苦瓜基因组比较发现,Y1745与其他基因组存在整体共线性,但同时伴随大量结构变异(SV),其中缺失和插入占比分别为56.9%和42.2%,大片段结构变异分析表明Mca和OHB3与Y1745的遗传分化程度高于Dali。
葫芦科比较基因组分析
以葡萄为外类群的系统发育分析显示,苦瓜与罗汉果亲缘关系最近,二者分歧时间约为50.44百万年前,与其他葫芦科物种的分歧时间约为57.21百万年前。基因家族演化分析发现,苦瓜基因组中有899个基因家族发生显著扩张,1909个基因家族发生收缩,其中1186个苦瓜特有的基因家族显著富集于胁迫响应(如叶绿体膜、叶绿体内膜)和次生代谢(如倍半萜合酶活性、纤维素生物合成过程)通路。同义替换率(Ks)分析证实苦瓜仅经历了古老的γ全基因组复制(WGD)事件,未出现近期WGD,与南瓜的近期WGD形成明显差异。
苦瓜群体遗传多样性与种群结构
192份种质的重测序共鉴定到6971698个SNP和1158109个InDel,严格过滤后保留891247个高质量SNP。种群结构分析确定最佳分组数为K=3,对应中国、东南亚、南亚次大陆三个遗传类群,部分材料存在混合祖先,提示区域间存在历史基因流或育种交流。连锁不平衡(LD)衰减速度在中国群体中最低,遗传多样性(π)在南亚次大陆最高(1.13×10-3),东南亚次之(8.59×10-4),中国群体最低(5.04×10-4),中国群体与南亚次大陆群体的分化指数(Fst)达0.382,体现了显著的遗传分化。
苦瓜驯化的基因组选择信号
选择性清除分析显示,南亚次大陆与中国比较组共鉴定到85个选择区域,覆盖2.76 Mb,包含297个基因;东南亚与中国比较组共鉴定到79个选择区域,覆盖3.06 Mb,包含284个基因,两组共有57个重叠基因。这些基因显著富集于昆虫防御反应、L-抗坏血酸代谢、细胞壁纤维素沉积、化学稳态、细胞内pH调控等生物学过程,反映了驯化过程中环境适应的选择方向,且选择区域与GWAS信号存在重叠,包含MADS-box、NPR等已知调控农艺性状的基因。
35个农艺性状的相关分析与全基因组关联分析
35个表型性状的变异系数范围为6.22%~63.06%,主成分分析(PCA)前三个主成分分别定义为“果实表面因子”“种子因子”“成熟期因子”。GWAS共检测到893个显著关联信号,33/35个性状均存在显著关联,三种统计模型结果一致。开花时间相关位点位于11号染色体,候选基因为WRKY转录因子17(WRKY17)和开花促进因子1-like蛋白1(FPF1-like 1);果实宽度与果实厚度共享同一关联位点,候选基因为expansin-like B1(EXLB1),该基因属于细胞壁松弛蛋白超家族,参与细胞伸长与果实发育。
讨论与结论
本研究构建的光滑果苦瓜Y1745染色体级基因组填补了该果形类型的基因组资源空白,其组装质量优于此前的短读段组装,为变异检测提供了可靠参考。比较基因组学揭示了苦瓜与葫芦科其他物种的进化关系,以及胁迫响应与次生代谢基因家族扩张的适应性意义。群体遗传学分析明确了苦瓜的三大地理种群结构,中国群体较低的遗传多样性与较慢的LD衰减,反映了现代育种过程中的强选择效应。驯化选择信号与GWAS结果的重叠,证实了McWRKY、McFPF1-like 1、McEXLB1等候选基因在开花时间、果实大小等农艺性状调控中的作用,为分子标记辅助育种提供了靶点。研究同时指出,后续需通过功能验证明确候选基因的作用机制,并结合代谢组等多组学数据解析药用成分的遗传基础。