《Integrative Zoology》:Genomic Investigations Unveil the Genetic Underpinnings of Environmental Adaptation in African Goat Populations
编辑推荐:
本文首次系统揭示了非洲山羊适应高温、干旱与病原体感染的多向性机制,通过整合全基因组选择信号分析、野生近缘种基因渗入(Introgression)与景观基因组学(Landscape Genomics),鉴定了涉及免疫防御(RGS家族)、脂质沉积(GSK3B)、能量代谢(HTR4)等关键适应性基因模块(如ABCG1-AGTR1代谢轴),为干旱胁迫下家畜育种提供了精准分子靶点,并为理解哺乳动物环境适应的进化逻辑提供了新范式。
1 引言
山羊(Capra hircus)作为全球最早被驯化的家畜物种之一,因其卓越的适应力、对粗饲料的耐受性及在多样化环境条件下的强韧恢复力,得以在全球广泛传播。目前,全球山羊数量已超过十亿,为人类提供了肉、奶、纤维和皮张等重要产品,在全球农业经济和粮食安全体系中扮演着不可或缺的角色,尤其是在非洲大陆,山羊不仅是数亿人的重要蛋白质和收入来源,更是地方社会文化实践的重要组成部分。
近年来,得益于基因组学的进步,对非洲本地山羊的遗传学研究已取得显著进展。然而,现有研究大多集中于特定国家或区域,缺乏横跨整个非洲大陆、整合多样生态区的系统性比较基因组分析。此外,环境胁迫在非洲常以复杂、多因素相互作用的形式呈现,而多数研究孤立地分析对单一环境因素的适应。同时,许多非洲本地山羊品种的种群历史动态仍有待更精确地阐明。本研究旨在填补这些知识空白,探索非洲山羊适应性状的遗传基础。
2 材料与方法
2.1 样本收集与质量控制
本研究从前期研究中获得了63个非洲家养品种共计1418个个体的Illumina Goat SNP50 BeadChip SNP标记数据。此外,还包括9只野山羊和164只野生近缘种,如山地山羊、伊比利亚羱羊等,用于综合分析家养山羊与野山羊之间的关系。经过质量控制后,保留43,363个SNP用于后续分析。
2.2 遗传多样性与种群遗传结构
使用PLINK v1.9软件估计观测杂合度(Ho)、期望杂合度(He)和近交系数(FIS)。利用主成分分析(PCA)、基于Reynolds遗传距离构建的邻接树(NJ树)以及ADMIXTURE分析,来表征样本间的遗传关系与群体结构。
2.3 基因流与基因组渗入
使用TreeMix v.1.12程序进行群体水平的混合分析,探测种群间的基因流。采用扩散近似人口统计推断(?a?i)方法推断北非山羊与尤拉野山羊(Youra wild goat)之间的人口统计历史。通过D统计量(ABBA-BABA检验)和DSUITE软件进行四分类群比较分析以确认基因流信号。利用f_d分析在全基因组范围内评估家养山羊中的渗入情况,并通过滑动窗口分析对渗入片段进行染色体尺度定位。使用DFOIL统计量确定北非山羊与尤拉野山羊之间基因流的方向。
2.4 选择信号检测
采用滑动窗口方法(100-kb窗口,50-kb步长)对FST(固定指数)和核苷酸多样性(π)比率分布进行全基因组扫描,以检测潜在的环境驱动选择位点。将非洲山羊群体分为东非、西非、南非和北非四组,分别与野山羊进行比较。对FST值进行Z-score标准化,并对θπ比率进行log2转换。同时,使用iHS方法识别非洲山羊群体中近期的正选择信号,将通过等位基因估算和单倍型定相推断的单点iHS值进行归一化,将|iHS|得分前1%的SNP视为潜在的选择信号。
2.5 气候关联分析
本研究使用的生物气候变量源自WorldClim数据库2.1版,涵盖了1970年至2020年的温度和湿度数据。为避免共线性问题,研究聚焦于突出热量和水分变化的关键生物气候指数,包括年均温(BIO1)、最热月最高温(BIO5)、最冷月最低温(BIO6)、温度年较差(BIO7)、年降水量(BIO12)、最湿月降水量(BIO13)、最干月降水量(BIO14)和降水季节性(BIO15)。
采用潜因子混合模型(LFMM)和冗余分析(RDA)两种互补的景观基因组学方法识别SNP与气候变量之间的关联。LFMM分析在100次老化迭代和1000次采样后计算所有SNP的z分数。RDA分析则利用“vegan” R包的内置RDA函数进行。将两种分析方法中FDR < 0.05的SNP视为候选适应性SNP,并对这些SNP侧翼10 kb区域内的基因进行注释,通过Metascape数据库进行基因本体(GO)功能富集分析。
3 结果
3.1 遗传多样性与群体结构
质量控制后共筛选出43,363个高质量SNP。突尼斯品种显示出最高的观测杂合度,而伊比利亚羱羊最低。在期望杂合度方面,Nord品种最高,山地山羊最低。山地山羊的近交系数最高,而Sebei品种最低。
PCA分析显示,野山羊及其野生近缘种(克里特野山羊和尤拉野山羊)与非洲山羊种群具有密切的遗传关系。根据PCA结果,非洲山羊被划分为四个不同的地理区域:东非、西非、南非和北非。不同区域间存在基因流,例如东非与北非品种之间,以及南非与西非品种之间。NJ树分析和ADMIXTURE聚类结果均表明,不同区域的品种之间存在显著的遗传混合,地理分布并非其遗传关系的唯一决定因素。
3.2 基因流与基因组渗入
通过Treemix分析,我们识别出在尤拉野山羊与北非山羊之间存在一条基因流迁移边。D统计分析进一步揭示了野生山羊近缘种向非洲家养山羊的基因流动,其中尤拉野山羊对非洲山羊的基因组贡献最为显著。DFoil分析确定基因流方向是从尤拉野山羊流向北非山羊。在考察的六个?a?i模型中,anc_asym_mig模型的对数似然值最高,被选为最优模型。模型结果与预期情景一致,即在驯化过程中尤拉野山羊向北非山羊发生基因渗入,随后由于地理隔离和人为干预,两个种群间的基因流减少。根据参数估计,这次渗入事件发生在大约7148年前,与新石器时代及马格里布地区驯化扩张的时期吻合。
此外,通过f_d统计量对渗入位点进行分析,共鉴定出34个候选基因。这些基因主要涉及能量代谢(ALAD)、免疫应答(RGS2, RGS1, RGS3, RGS13, RGS18, RGS21)以及营养代谢调控(ADCY1, IGFBP1, IGFBP3)。位于16号染色体上的七个基因(TROVE2, UCHL5, RGS2, RGS13, RGS1, RGS21, RGS18)显示出高f_d值,表明它们可能与尤拉野山羊基因向北非山羊的渗入有关。
3.3 非洲山羊的选择信号
结合FST-π分析和iHS方法,我们检测了非洲各地区山羊相对于野山羊的选择信号。
- •
东非山羊:通过筛选前5%的FST值(Z(FST) > 2.1, log2(π比率) > -1.45),鉴定出727个候选基因;iHS测试(|iHS| > 4)识别出137个候选基因。两者有11个重叠基因,包括GSK3B(参与脂质沉积和葡萄糖代谢)、PNPT1(维持线粒体稳态)和HTR4(调节能量代谢)。
- •
西非山羊:使用调整阈值(Z(FST) > 2.0, log2(π比率) > -1.25)筛选出1207个候选基因;iHS测试(|iHS| > 4)识别出262个候选基因。两者有26个重叠基因,包括GLIS1(与寒冷气候适应相关),以及在东非山羊中也发现的HTR4、PNPT1和GSK3B。
- •
南非山羊:基于筛选标准(Z(FST) > 1.99, log2(π比率) > -1.21)鉴定出1049个候选基因;iHS测试(|iHS| > 3)识别出240个候选基因。两者有11个重叠基因,包括BMPER(通过调节BMP信号通路平衡褐色脂肪产热和能量消耗)。
- •
北非山羊:使用截断值(Z(FST) > 1.96, log2(π比率) > -1.25)鉴定出780个候选基因;iHS测试(|iHS| > 4)识别出191个候选基因。两者有19个重叠基因,包括ALOX12(促进脂肪分解并调节炎症反应)、FBXL3(调节昼夜节律和应激蛋白降解)和TBC1D4(增强胰岛素敏感性以应对食物短缺)。
3.4 景观基因组学分析
为识别基因型-环境关联,我们采用了LFMM和RDA两种方法,并结合了八个生物气候变量进行分析。气候变量的PCA结果揭示了与东、西、南、北非山羊种群相对应的四个明显聚类,与遗传结构分析结果一致。
LFMM方法基于前0.1%的SNP识别出118个基因。在RDA分析中,鉴定出161个与八个气候变量相关的显著SNP,注释出549个基因。LFMM和RDA测试重叠部分识别出5个SNP,进而发现了与这些SNP相关的23个基因。基于这23个基因进行的GO功能富集分析,共鉴定出27个显著富集的GO条目。
分析揭示了非洲山羊在免疫防御、代谢重塑和渗透压调节维度上的环境适应策略。例如,由ITGAM和ITGAX编码的整合素亚基构成免疫应答的核心调节模块。ITGAM/ITGAX-ADAMTS9基因组合能增强免疫细胞的粘附和迁移能力以及细胞外基质的修复功能,形成应对撒哈拉以南非洲湿热环境下病原体感染的双重防御机制。ABCG1通过促进胆固醇逆向转运来维持细胞膜流动性,从而显著提高干旱胁迫下的脂质动员效率。另一方面,AGTR1通过增强血管紧张素II的结合亲和力,将肾单位水重吸收效率提高37%。这种代谢与渗透压协调机制有助于非洲山羊适应干旱环境。
在神经应激反应方面,由SCN7A/SCN9A和ATP6V0D1组成的离子稳态调节模块在环境适应中显示出独特优势。它可以有效缓解东非大裂谷地区高紫外线辐射引起的氧化应激损伤。此外,还识别出一些重要通路,例如“对细菌的应答”通路相关基因(ITGAM, ITGAX, ADAMTS9)以及“无机阳离子跨膜转运活性”通路相关基因(SCN7A, SCN9A, ATP6V0D1),这些基因在应对特定环境压力和维持体内平衡方面发挥着关键作用。
4 讨论
本研究对非洲大陆63个家养山羊品种和13个野生近缘种的遗传多样性、群体结构、基因流、选择信号和景观基因组学进行了综合分析,识别了野山羊与非洲家养山羊之间的基因渗入事件、非洲不同地区山羊独特的选择信号以及差异化的环境适应机制。
与家养山羊相比,野生山羊的遗传多样性水平较低,观测杂合度和期望杂合度值较低,近交系数显著较高。伊比利亚羱羊、山地山羊和努比亚羱羊等物种表现出遗传多样性下降和近交水平升高,凸显了对这些野生种群实施保护举措的必要性。
在群体结构分析中,注意到尤拉野山羊和克里特野山羊与家养山羊表现出更近的遗传亲缘性。进一步的基因流分析、DFoil分析和D统计量均证实了从尤拉野山羊向北非山羊种群的基因流动,估计该事件发生在大约7148年前。通过对渗入基因组区域的分析,我们鉴定出34个候选基因,其中包括RGS家族的关键基因,这些基因可能在响应环境压力(如氧化应激)方面发挥作用。
通过整合FST-π和iHS方法,我们检测了各地区山羊相对于野山羊的选择信号,并讨论了关键候选基因在代谢适应、寒冷气候响应、能量平衡和炎症调节等方面的潜在功能。
通过LFMM和RDA方法对气候变量和基因组数据集进行整合分析,我们检测到五个与气候关联信号显著重叠的SNP,并注释到23个蛋白质编码基因。基于这些发现,我们从免疫防御、代谢重塑和渗透压调节等维度揭示了非洲山羊的环境适应策略,并阐述了关键基因模块在应对撒哈拉以南非洲病原体压力、干旱环境以及东非高原热应激等方面的协同作用机制。
需要指出的是,本研究使用的Illumina Goat SNP50 BeadChip SNP标记可能受到 ascertainment bias 的影响。尽管本研究所用SNP panel的开发使用了包括萨能山羊、阿尔卑斯山羊等在内的多样化山羊序列数据,并在一系列品种和种群中进行了测试,但SNP数据仅覆盖山羊基因组的一小部分。未来需要针对每个品种在其栖息区域进行更详细的环境数据收集和全基因组测序研究,以构建基因型与环境因素之间的多维关联分析,从而更精确地理解其适应机制。
5 结论
本研究通过分析野山羊基因渗入、选择信号和景观基因组学,系统研究了非洲山羊的环境适应机制。非洲山羊通过调控免疫应答、脂质代谢和能量代谢等多种途径,适应了非洲高温、干旱和病原体等挑战性环境。研究结果表明,与这些适应性状相关的特定遗传变异同时受到自然选择和来自野生近缘种基因流的影响,凸显了遗传多样性在增强对气候胁迫因子抵御能力方面的重要性。适应性基因模块,例如ABCG1-AGTR1代谢轴,为干旱地区家畜的干旱胁迫提供了精确的分子靶点,并为理解哺乳动物环境适应的进化逻辑提供了新范式。