综述:猪基因组学的整合进展:从参考基因组与进化史到关键性状的机制解析

《Biology》:Integrative Advances in Pig Genomics: From Reference Assemblies and Evolutionary History to the Mechanistic Dissection of Key Traits Shengguo Tang, Dongfang Li, Ying Lu, Zhendong Gao, Bo Wang, Xingneng Liu, Hongjiang Wei and Jiao Wu

【字体: 时间:2026年03月10日 来源:Biology 3.5

编辑推荐:

  这篇综述系统梳理了猪基因组学的最新整合进展,涵盖从参考基因组构建、进化史重建到关键经济性状的遗传机制解析。文章强调了从单一线性参考迈向多参考、泛基因组(pangenome)和图形基因组(graph genome)对提高结构变异(SV)检测、跨群体比较和重复序列富集区域分析可重复性的重要性。同时,综述整合了古基因组学提供的网络化驯化史视角,并探讨了如何将全基因组关联分析(GWAS)信号与表达数量性状位点(eQTL)、组织特异性调控注释相结合,以揭示生长、肉质、繁殖和抗病性等性状背后的分子通路,为精准育种和生物医学研究提供了清晰的路线图。

  
1. 引言
猪不仅是全球肉类供应的核心(2022年约占全球肉类消费的三分之一),也是研究驯化、适应和复杂性状遗传的大型动物生物医学模型。其基因组学进展正从构建参考序列和变异目录,向更高分辨率地重建群体历史、解析表型分化的机制迈进。在可持续生产和疾病压力(如非洲猪瘟,ASF)的背景下,猪基因组学为平衡遗传进展与多样性保护提供了关键见解。
2. 构建与迭代猪参考基因组
2.1. 猪参考基因组的演变
猪参考基因组的迭代是一个不断提升连续性和准确性的过程。2012年发布的Sscrofa10.2首次提供了共享坐标系,但在重复序列富集和结构复杂区域存在缺口和错误组装。后续更新,如Sscrofa11.1,利用PacBio和牛津纳米孔(ONT)长读长测序及染色质构象捕获(Hi-C)等技术,显著提升了支架N50和基准通用单拷贝直系同源(BUSCO)完整性评分,减少了由参考偏差导致的映射和变异检测问题。最新的进展是趋向于近无缺口(near gap-free)和端粒到端粒(T2T)的组装,例如2025年发布的基于五指山猪的T2T_pig1.0和基于杜洛克猪的T2T-Sscrofa,其重叠群N50超过140 Mb,实现了极高的连续性。这些高质量的组装,特别是针对金华猪、巴马小型近交猪等中国地方品种的基因组,稳定了重复区域的读段映射,改善了结构变异(SV)的检测和解读。
2.2. 品种特异性组装与新出现的猪泛基因组资源
单一的线性参考在SV富集、重复复杂区域以及参考个体缺失序列方面存在弱点。品种特异性组装通过在匹配的遗传背景下重建序列和结构来应对这些缺口,例如淮猪、巴马小型近交猪的染色体级别组装,能揭示品系特异性的结构差异。当分析扩展到群体规模时,泛基因组和图形基因组框架变得至关重要。一个包含250个个体的泛猪泛基因组研究发现了超出Sscrofa11.1参考的308.3 Mb非参考序列和3438个参考中缺失的基因。图形基因组能将单核苷酸多态性(SNP)和SV置于统一的表示中,减少映射偏差,提高群体推断和功能解读中变异描述的稳定性。尽管计算资源要求更高,但这些方法为多品种比较、复杂基因家族和SV驱动的假说提供了互补且强大的分析框架。
2.3. 对下游分析的技术影响
参考基因组的更新首先改变读段定位,进而影响变异可检测性,并最终改变由缺口和错误组装引入的系统性偏差。恢复端粒和着丝粒附近等重复富集区域的序列,可以提高覆盖均匀性、锐化断点定位,并减少实际上是参考假象而非真实多态性的虚假SV信号。关键在于,将相同数据集映射到不同参考基因组很少产生完全可比的结果。坐标可能偏移,等位基因编码可能改变,SV集合可能不同。因此,跨研究整合依赖于明确的坐标转换(lift over)、统一的表示规则和重新注释步骤。从策略上讲,泛基因组和图形基因组将复杂性状分析从仅限SNP的工作流程,推向SNP和SV的联合建模,在候选机制是结构性的情况下,稳定了跨品系比较。
3. 基于测序的猪属进化史重建
3.1. 从稀疏标记到时间分层的古基因组
早期的重建依赖于线粒体DNA(mtDNA)和微卫星标记,但难以区分在反复迁徙和持续基因流下的驯化情景。全基因组重测序和古基因组学增加了决定性的时间维度。在欧洲,古基因组支持近东家猪随早期农业引入,随后主要由本地野猪贡献驱动了近乎全基因组范围的祖先成分更替。在东亚,时间分层的古基因组同样为扩散和相互作用提供了可校准的框架。将现代和古代基因组结合,使得在明确的时间约束下区分更替与连续性成为可能。
3.2. 多阶段驯化与区域谱系:从起源到网络历史
全基因组和古数据日益支持驯化是一个网络过程,涉及多个中心(如近东和东亚)以及野生谱系的反复融合。在欧洲,尽管引入了近东家猪,但与当地野猪的持续回交驱动了祖先更替。在东亚,古DNA支持母系谱系的区域连续性。在中国,大规模重测序面板揭示了地方品种间的强烈分化,以及由长期饲养、跨区域流动和历史杂交形成的密集基因流网络。现代育种计划将这一网络历史延续至今,留下了中西方猪群之间的双向基因渗入。性染色体提供了额外视角,猪Y染色体单倍型显示出与人为驱动杂交和选择一致的模式。总体而言,一个整合了多阶段驯化、区域谱系形成和祖先更替的网络中心框架,为解读跨区域的选择扫描和性状关联提供了基础。
4. 猪的遗传多样性
4.1. 全球结构与中国特色资源
全球猪遗传多样性呈现地方品种与商业化种群趋同并存的状态。中国拥有丰富的本土资源,2024年登记了147个品种。这些品种涵盖了从热带到高纬度的多种环境,在体型、脂肪沉积、繁殖力和适应性等方面存在分化。近年来商业品种的引入导致了欧洲血统在不同程度上的渗入。大规模的基因组资源,如“千猪基因组”计划,为评估谱系关系和种群历史提供了共享坐标空间,支持数据驱动的保护策略。此外,小型猪和实验室品系作为生物医学模型,其参考基因组和群体资源的完善也强化了标准化和可追溯性。
4.2. 变异目录与功能注释框架
机制解读需要跨品种可比的变异目录以及将变异与功能和调控联系起来注释框架。单倍型参考面板和基因型填充对于将异质性的SNP芯片平台和群体对齐到序列水平表示至关重要。随着标准化变得常规,SNP中心工作流程的局限性也日益显现,结构变异正通过大型SV图谱被纳入分析。变异解读也正从简单的编码区与非编码区划分,转向结合进化约束、调控证据以及组织或细胞类型特异性的标准。例如,PigGTEx项目通过多组织eQTL和sQTL图谱将群体变异与转录调控联系起来。PigBiobank平台则组织了多群体GWAS和功能资源,便于开展连接多样性、性状和机制的联合分析。此外,突变负荷(mutational load)从更长的时间尺度量化了育种的遗传成本,它连接了有效群体大小、纯合片段(ROH)结构和推定有害变异的频率谱。
5. 猪主要经济性状的遗传解析
5.1. 生长与胴体组成
生长速度、饲料效率和胴体组成是商业育种的核心目标。其遗传结构通常结合少数大效应位点和广泛的多基因背景。一些经典位点具有明确的生物学联系,例如影响IGF2出生后表达的调控突变与肌肉生长和瘦肉率增加相关;MC4R的错义变异反复与生长和脂肪沉积的协调变化相关。其他如HMGA1LEPRNR6A1等位点也常在不同数据集中出现。大型GWAS和荟萃分析将日增重、背膘厚、瘦肉率和眼肌面积映射到多个小到中等效应的簇。同一性状在不同群体中可能出现位点更替,效应方向也可能不同,因此跨群体综合对于区分共享信号与群体特异性信号至关重要。在实际应用中,多终点性状的性质有利于联合模型和多性状基因组预测以提高准确性。
5.2. 肉品质与肌肉代谢
肉品质包括肌内脂肪、嫩度、滴水损失、色泽、最终pH值和风味相关代谢物。与生长性状相比,这些表型更易受屠宰程序、运输应激和批次效应的影响。PRKAG3RN)基因影响肌糖原代谢和屠宰后酸化,从而改变pH值、滴水损失和加工品质。HAL位点(位于RYR1基因)与应激易感性和苍白松软渗出性(PSE)肉风险相关。此外,SCDFASNACACA及FABP家族成员等与脂质沉积和脂肪酸组成相关的基因也反复被关联到。整合GWAS与转录组学或代谢组学的设计日益增多,有助于区分主要由屠宰过程驱动的变异和反映基础肌肉代谢状态的变异。
5.3. 繁殖与产仔结果
繁殖性状包括总产仔数、产活仔数、断奶前成活率和初产日龄等,通常表现为低遗传力、强环境噪音和复杂的相关性结构。大型记录和长期数据至关重要。一些位点在不同环境中具有可重复的操作价值,例如ESR1基因的有利等位基因与产仔数或产活仔数增加相关。利用跨群体荟萃GWAS结合PigGTEx注释,有研究提出UGT2B31可能是一个高表达的肝脏基因,其顺式eQTL(rs344053754)可能调控表达并影响断奶窝重。在实践中,基因组选择仍然是多基因性下获得稳定遗传进展的最可靠途径,但需要明确管理近交和相关性反应。
5.4. 疾病抗性
随着疾病压力增加和抗菌药物使用减少,疾病抗性和稳健性日益成为首要育种目标。猪繁殖与呼吸综合征(PRRS)是典型例子,其宿主反应存在显著的遗传变异,GWAS定位了一个关键的数量性状位点(QTL),由WUR标记代表,同时存在很大的多基因背景。功能上,编辑CD163基因的SRCR5结构域,在细胞模型和攻毒实验中显示出对PRRSV-1的抗性,且对生长和肉品质无明显不利影响,是迄今最先进的实验案例之一。对于非洲猪瘟(ASF),比较假说涉及免疫信号,疣猪的RELA(NF-κB p65)变异被提出与耐受性相关,但将其导入家猪并未单独重现耐受性,表明其并非单一位点控制。实践中,疾病改良通常结合针对稳健性的广义基因组选择,以及在功能证据强且副作用可控时,针对性使用少数高置信度的因果位点。
6. 总结与展望
猪基因组学正在形成一个证据链:基因组表示、群体历史和性状机制。更好的线性参考、品种匹配组装和基于图形的泛基因组,减少了重复序列富集和SV易发区域的分析偏差,使得跨品种比较、祖先推断和精细定位在共享坐标空间下更加稳定。时间分层的古基因组强化了猪属网络化的历史观。性状遗传学也在转变,有用的结果不仅在于信号的位置,更在于其在何种组织或阶段通过何种调控变化起作用,以及该效应是否能在不同育种背景下保持。当前领域的瓶颈并非另一个组装,而是在不同表示间转换时的一致性。最实际的解决途径是明确和标准化转换步骤:坐标、SV标准化和坐标转换应作为核心方法报告;泛基因组和图形资源应与育种项目已大规模使用的工具(尤其是基因型填充、高通量分型和常规质控)顺畅对接;验证应从具体的元件-基因假说开始,在匹配的组织和阶段进行测试。
7. 结论
近年来猪基因组学发展迅速,从参考基因组的构建转向更广泛地理解进化史和经济重要性状的遗传基础。基因组组装的改进,以及品种特异性基因组和泛基因组资源的日益可用,扩展了捕获结构变异和非参考变异的能力,提高了基因组分析的分辨率。同时,全基因组测序和古DNA研究重塑了我们对猪属复杂群体历史的理解,强调了重复的驯化过程、基因流和区域祖先更替。生产性状的研究重点也从简单定位关联信号,转向识别连接遗传变异与表型的调控和生物学机制。确保不同参考系统与分析流程之间的可比性,对于可靠解读和跨研究整合仍然至关重要。基因组资源与功能注释和基因表达数据的持续整合,将进一步提高复杂性状的解读能力,并支持基因组信息在猪育种和保护中的有效利用。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号