《Journal of Animal Science and Biotechnology》:Runs of homozygosity reveal population dynamics and selection across global cattle
编辑推荐:
摘要:牛在驯化、迁徙和选择的作用下经历了复杂的进化轨迹。尽管同型纯合子区段(Runs of Homozygosity, ROH)是一种普遍存在的基因组特征,但其解析全球牛种进化历史和功能后果的潜力仍未得到充分挖掘。研究人员分析了来自17个地理区域的102个品种
摘要:牛在驯化、迁徙和选择的作用下经历了复杂的进化轨迹。尽管同型纯合子区段(Runs of Homozygosity, ROH)是一种普遍存在的基因组特征,但其解析全球牛种进化历史和功能后果的潜力仍未得到充分挖掘。研究人员分析了来自17个地理区域的102个品种的全基因组序列(Whole-Genome Sequences, WGS),以对ROH景观、种群结构、基因组近交和功能变异进行全球调查。ROH模式揭示了集约化选择的欧洲品种中存在高同型纯合负担,而中国南方瘤牛(indicine)表现出高比例的短ROH负担,暗示了其独特的古老人口统计学特征。基于ROH的主成分分析(Principal Component Analysis, PCA)和群体结构分析(Admixture)描绘了牛(taurine)-瘤牛谱系、区域特异性祖先、近交和育种效应。基于ROH的近交系数(FROH)在跨种群近交评估中表现出更高的稳定性,与基于纯合过量的近交系数(FHOM)呈高度相关,并与杂合度呈负相关。通过置换检验(permutation test)识别出的区域特异性ROH热点反映了局部适应和人口统计学遗产的结合。以性状为重点的分析结合多种选择扫描(selection scans)交叉验证,鉴定了影响生长、产奶和气候适应的基因。值得注意的是,研究人员发现了CHEK2、SPG7、FANCA和MSRB3中的错义突变(missense mutations),其频率与温度和湿度显著相关。本研究确立了ROH作为阐明驯化、迁徙、近交和选择动态的关键基因组标记。研究结果在推进气候变化压力下的牛种遗传保护和精准育种方面提供了宝贵的资源和见解。
论文解读:基于全基因组ROH的全球牛种进化与适应性研究
研究背景与意义
牛作为全球重要的经济动物,其驯化历史可追溯至约10,000年前的新月沃地(Fertile Crescent)和约8,000年前的印度河流域,分别演化出了普通牛(Bos taurus)和瘤牛(Bos indicus)两大谱系。在人类迁徙、贸易和选择性育种的推动下,牛种在全球范围内扩散,形成了适应多样化环境的丰富品种资源。然而,现有的牛基因组学研究多依赖于低密度SNP芯片,受限于标记密度,难以精确检测短ROH和稀有变异,且多局限于区域性或品种特异性分析。此外,传统研究常采用固定的经验频率阈值定义ROH热点,忽略了种群特异性的种群统计学背景,可能导致小样本或高度近交群体中出现大量假阳性。因此,如何利用全基因组测序(WGS)数据,结合稳健的统计学框架,系统解析全球牛种的基因组纯合片段特征,区分近期近交与古老群体瓶颈信号,并挖掘与环境适应及经济性状相关的功能变异,成为当前动物遗传育种领域亟待解决的关键科学问题。为此,研究人员开展了这项迄今为止规模最大的全球牛种ROH研究,旨在填补上述空白,相关成果发表在《Journal of Animal Science and Biotechnology》上。
关键技术方法
研究人员收集了来自全球17个地理区域的102个牛品种共1,479个个体的血液样本进行全基因组测序。经过严格的质控和过滤后,利用PLINK软件检测ROH,并通过高斯混合模型将ROH划分为短、中、长三个长度等级。为评估种群结构和近交水平,计算了基于ROH的近交系数(FROH)、基于纯合过量的近交系数(FHOM)、基于基因组关系矩阵的系数(FGRM)和基于配子联合的统一近交系数(FUNI)。为了识别非随机共享的ROH热点区域,研究引入了置换检验(permutation test)以控制族系错误率(FWER)。此外,结合群体间和群体内多种选择信号分析方法(包括iHS、CLR、π、FST、XP-EHH)进行交叉验证,并利用ANNOVAR、KOBAS等工具进行功能注释和富集分析。
研究结果
1. ROH的地理景观(Geographical landscape of ROH)
通过对全球样本的235,395个ROH片段分析,研究人员发现欧洲品种(尤其是西欧品种)在所有ROH类别中均表现出最高的纯合负担,这与欧洲牛长期以来的集约化系统育种历史一致。相比之下,中国南方瘤牛表现出显著高于南亚瘤牛的短ROH负担,暗示其独特的古代人口统计学历史。日本Mishima牛和北欧Eastern Finncattle则显示出极高的长ROH负担,反映了地理隔离和近期近交所导致的极高自合性。
2. 基于ROH的种群结构推断(Population structure inferred from ROH)
研究人员利用ROH的存在/缺失数据进行了PCA和Admixture分析。结果显示,短ROH的PCA主要沿PC2轴分离牛-瘤牛谱系,而长ROH的PCA则能有效区分近期存在近交或地理隔离的种群(如Mishima牛)。Admixture分析进一步揭示了西方欧洲、中南欧、东北亚、中国南方、东非和西非等不同地理区域具有独特的ROH祖先成分。这表明不同长度的ROH能够解构不同时间尺度的进化信号,短ROH反映古老的连锁不平衡(LD)模式,长ROH则揭示近期的人口统计学事件。
3. ROH类别间的长度-计数相关性解析全球牛种的人口统计学信号(Length-count correlations across ROH classes resolve demographic signals in global cattle)
通过对不同长度ROH的累积长度和数量进行相关性分析,研究发现全球范围内短、中、长ROH类别内部的长度与数量呈强相关。然而,在区域层面存在差异:西非牛的长ROH相关性较低,而北欧牛的短-中ROH呈显著负相关。这证实了长ROH主要反映近期近交,而短/中ROH捕捉的是群体水平的LD模式,两者在解析人口统计学历史上具有互补性。
4. 全球牛种的基因组近交系数(Genomic inbreeding coefficient across global cattle)
研究比较了四种基因组近交系数。全球平均FROH为0.099,其中Mishima牛最高(0.540),东非最低。FROH与FHOM呈高度正相关,但与FGRM呈负相关。在欧洲和中国南方等地区,不同系数间的一致性较差,表明FROH在跨种群比较中更为稳健。此外,FROH与观测杂合度(Ho)和期望杂合度(He)均呈显著负相关,证实了近交对遗传多样性的负面影响。
5. 区域ROH热点反映局部适应和人口统计学遗产(Regional ROH hotspots reflect local adaptation and demographic legacies)
通过置换检验,研究人员识别出各地理区域特异性的ROH热点。这些热点在不同区域间存在重叠,例如西欧与中南欧共享大量位点,印证了历史上的基因交流。功能富集分析显示,欧洲品种富集于细胞周期、肌肉发育和脂质代谢通路;青藏高原牛种富集于p53信号和DNA修复通路(适应高原缺氧);中国南方牛种则富集于皮肤屏障和花生四烯酸代谢(适应湿热气候)。这表明ROH热点不仅是人口统计学事件的记录者,也是自然选择的靶标区域。
6. 关键经济和适应性性状背后的ROH变异(ROH variants underlying key economic and adaptive traits)
针对特定性状的分析发现,生长性状相关的ROH热点位于BTA6、BTA13和BTA26,其中包含BMP2、NCAPG、LCORL等关键基因,且这些区域内的单倍型在快速生长和慢速生长牛种间存在显著差异。泌乳性状热点基因则富集于蛋白质合成和内分泌调节通路。在环境适应方面,寒冷耐受性相关的错义突变(如CHEK2、WNT8A)频率与年均温呈显著相关;而热耐受性(干热与湿热)相关的MSRB3、FANCA和SPG7基因突变频率则与湿度和温度相关。
结论与讨论
该研究通过全基因组尺度的ROH分析,构建了全球牛种的基因组纯合性图谱。研究证实,ROH作为一种强有力的基因组标记,能够有效区分由古老瓶颈形成的短片段和由近期近交形成的长片段,从而在时间和空间上解析牛种的驯化、迁徙和育种历史。特别是,研究提出的基于置换检验的ROH热点识别框架,克服了传统方法的局限性,成功地将人口统计学噪音与选择信号分离开来。通过多方法交叉验证,研究人员不仅鉴定了大量与生长、产奶等经济性状相关的候选基因,还发现了响应温度和湿度变化的适应性变异。这些发现不仅为理解牛种的宏观进化动力学提供了新的视角,也为在全球气候变化背景下制定精准的遗传资源保护策略和分子育种方案提供了至关重要的基因组依据。