ChickenGTEx项目的现状与未来展望及其在精准育种中的应用
《Poultry Science》:The current and future perspective of ChickenGTEx Project and its applications in precision breeding
【字体:
大
中
小
】
时间:2026年05月16日
来源:Poultry Science 4.2
编辑推荐:
**方凌昭|张海涵|孙从娇|胡向晓|多米尼克·赖特|周怀军**
**丹麦奥胡斯大学定量遗传学与基因组学中心**
**摘要**
“鸡基因型-组织表达(ChickenGTEx)”项目旨在系统地描述鸡基因组的调控景观,并加速将功能基因组学成果应用于精准育种。通过整合全基因组测
**方凌昭|张海涵|孙从娇|胡向晓|多米尼克·赖特|周怀军**
**丹麦奥胡斯大学定量遗传学与基因组学中心**
**摘要**
“鸡基因型-组织表达(ChickenGTEx)”项目旨在系统地描述鸡基因组的调控景观,并加速将功能基因组学成果应用于精准育种。通过整合全基因组测序与多组织转录组分析,ChickenGTEx提供了涵盖多种组织和生理系统的基因表达调控的全面图谱。现有研究表明,复杂的生产性状是由协调的调控网络控制的,而非孤立的基因位点;组织特异性基因表达、结构变异以及基因型与性别的相互作用对此起到了重要作用。性别依赖的调控效应进一步细化了代谢、免疫和生殖性状的遗传结构,突显了在基因组分析中纳入性别这一生物学变量的重要性。在优质蛋鸡群体中应用整合组学框架,揭示了影响产蛋量、饲料效率、代谢健康和蛋壳质量的多层次调控机制。通过将表型变异分解为遗传、调控和宿主-微生物组成分,这些方法超越了基于关联性的分析,迈向了因果推断和生物学解释。重要的是,通过ChickenGTEx及相关分析验证的调控位点为基因组选择提供了可操作的标记,并为精准基因组修饰提供了合理的目标。展望未来,继续扩展调控图谱、整合不同环境条件下的单细胞数据和功能注释,将进一步提升预测准确性并实现可持续的遗传改良。因此,ChickenGTEx项目成为连接功能基因组学与实际家禽育种的重要平台。
**引言**
鸡是全球养殖最广泛的家畜物种,也是可持续动物蛋白生产的基石。过去几十年间,持续的遗传改良显著提高了生长速度、饲料效率和产蛋量以及疾病抵抗力(Zuidhof等人,2014年)。然而,家禽育种的进一步进展越来越依赖于对遗传变异如何在不同组织、发育阶段和环境条件下以特定方式影响复杂适应性状的机制性理解。尽管全基因组测序和全基因组关联研究(GWAS)已在家禽研究中成为常规手段,但将基因组信号转化为可操作的生物学知识仍是一个重大挑战。GWAS的一个普遍结果是,大多数与性状相关的变异位于基因组的非编码区域,通常远离已注释的基因(Maurano等人,2012年;Boyle等人,2017年)。尽管这些位点被认为通过基因调控发挥作用,但确定目标基因、组织和相关分子机制往往很困难。这一限制阻碍了GWAS结果的解释,延缓了功能验证,并限制了基因组信息在精准育种、疾病抵抗力和管理策略中的实际应用。表达数量性状位点(eQTL)映射及相关分子QTL(molQTL)分析为弥合这一差距提供了直接途径,将DNA序列变异与基因表达、可变剪接和转录加工等分子表型联系起来。在人类研究中,“基因型-组织表达(GTEx)”项目表明调控效应通常具有高度的组织特异性和情境依赖性,从根本上重塑了复杂性状的解读方式(GTEx联盟,2020年)。直到最近,家禽领域还缺乏类似的大规模资源,限制了从关联性分析向因果关系推断的进展。为满足这一需求,成立了“农场动物基因型-组织表达(FarmGTEx)”计划,以系统地描述主要家畜物种中基因表达的遗传调控(Fang等人,2025年)。在此框架下,“鸡基因型-组织表达(ChickenGTEx)”项目首次利用来自全球多样化群体的数千个转录组数据与全基因组序列数据,全面绘制了鸡基因组的调控变异图谱。ChickenGTEx试点阶段的结果发现了数万个跨多种组织的molQTL,表明调控变异普遍存在,并在塑造鸡的重要经济性状中起核心作用(Guan等人,2025年)。对于家禽科学而言,许多ChickenGTEx调控变异与生长、胴体组成、繁殖、免疫和代谢性状的GWAS信号共定位。在许多情况下,涉及的调控基因并非与关联标记最接近的基因,这表明传统的注释策略可能存在误导。将ChickenGTEx与FAANG计划生成的功能注释资源整合后,进一步发现调控变异在鸡的各种组织中富集于启动子、增强子和其他活跃染色质区域(Pan等人,2023年),为推断的变异-基因关系提供了生物学依据。
本次小型研讨会总结了ChickenGTEx试点阶段的关键发现,并讨论了其对家禽遗传学和基因组学的影响。我们重点探讨了调控图谱如何改进GWAS的解释、帮助识别因果基因和通路,以及支持下一代育种策略的发展。我们还概述了未来的发展方向,包括扩展到更多组织、发育阶段和环境挑战、单细胞分辨率,以及国际合作的重要性,以在未来十年内建立全面的、特定于情境的鸡基因组调控图谱。这些努力将加强家禽育种的生物学基础,提升动物健康和福利,并巩固鸡作为生产物种和脊椎动物生物学模型的地位。
**建立理解鸡调控机制的基础框架**
以下部分介绍了ChickenGTEx项目的开发过程和当前成就,该项目为后续分析提供了多组织基因组基础设施。
**ChickenGTEx项目:解读鸡基因组的调控景观**
**方凌昭**,丹麦奥胡斯大学定量遗传学与基因组学中心
“鸡基因型-组织表达(ChickenGTEx)”项目是“农场动物基因型-组织表达(FarmGTEx)”计划的一部分,旨在生成鸡在不同组织和生物情境下基因表达的遗传调控系统图谱。基于引言中概述的总体目标,本节重点介绍了ChickenGTEx试点阶段的范围、分析框架和主要发现(Guan等人,2025年),这些成果共同构成了家禽功能基因组学的基础资源。
**项目设计与数据整合**
ChickenGTEx试点研究整合了多个大规模基因组资源,以实现全面的分子数量性状位点(molQTL)映射。具体而言,我们整合了7,015个高质量的大规模RNA-seq数据集(涵盖28种组织)、127,598个细胞的单细胞转录组数据以及2,869个个体的全基因组序列(WGS)数据(Guan等人,2025年)。这种设计使得能够在转录、转录后、组织特异性、细胞和群体层面联合探究遗传调控。为了最大化样本量和分析能力,直接从RNA-seq数据中调用单核苷酸多态性(SNPs),并使用全球WGS参考面板进行推断。该策略产生了约150万个高置信度变异,其统计性能与WGS衍生的基因型相当,证明了基于RNA-seq的推断方法适用于大规模molQTL映射,且具有成本效益。
**多层次的调控变异图谱**
利用这一整合数据集,ChickenGTEx系统地将遗传变异与五类转录组表型相关联:蛋白质编码基因表达、长非编码RNA(lncRNA)表达、外显子使用、可变剪接和3′非翻译区选择性多聚腺苷酸化(APA)。总共检测到13,983个蛋白质编码基因、11,685个lncRNA、124,423个外显子、9,669个剪接事件和8,798个APA位点的显著遗传调控(Guan等人,2025年)。主要调控变异强烈富集在转录起始和终止位点附近,这与顺式调控一致。超过70%的e基因(至少与一个eQTL相关的基因)受到多个独立变异的调控,显示出模块化和多基因的调控结构。携带多个独立eQTL的基因具有更高的顺式遗传率和较低的进化约束。为了评估功能相关性,精细映射的molQTL在23种鸡组织中预测的调控DNA序列(包括启动子和增强子)中显著富集(Pan等人,2023年)。这些调控效应通过基于深度学习模型的计算机模拟突变和等位基因特异性表达分析得到了进一步支持,提供了证据表明所识别的变异直接影响转录调控(Guan等人,2025年)。
**不同分子表型的不同调控机制**
ChickenGTEx发现,不同的分子表型往往由部分不同的调控机制控制。共定位分析显示,主要表达QTL(eQTL)与转录后QTL(包括剪接QTL和APA QTL)之间的因果变异共享程度较低(Guan等人,2025年)。尽管所有molQTL类别在类似启动子的染色质状态和错义变异中均富集,但各调控层之间的重叠程度差异显著。与三维基因组组织的整合表明,20-60%的molQTL-基因对位于相同的拓扑关联域内,特别是在CTCF相关染色质环中富集。这些发现强调了高阶染色质结构在塑造鸡基因组调控变异中的重要性。
**组织特异性和情境依赖性调控**
ChickenGTEx识别的遗传调控具有高度的组织和情境依赖性。血液形成了一个独特的调控外群,反映了鸟类中存在有核红细胞;而胚胎组织的调控景观与成年组织明显不同(Guan等人,2025年)。除了组织层面的效应外,我们还绘制了与性别、转录因子活性和推断的细胞类型组成相互作用的eQTL。细胞间相互作用的eQTL(ci-eQTL)在不同细胞类型间的共享程度远低于组织间共享程度,突显了鸟类基因调控的精细细胞特异性。例如,肝脏中生长激素表达的调控与红细胞富集显著相关,说明细胞情境可以调节遗传效应。
**将调控变异与复杂性状联系起来**
为了将调控变异与生物体水平的表型联系起来,我们利用共定位、孟德尔随机化和转录组范围关联研究(TWAS)方法,将ChickenGTEx molQTL与39个复杂性状的GWAS结果进行了整合。大约38%的GWAS位点与至少一个molQTL共定位,在92%的情况下,涉及的调控基因并非与领先GWAS SNP最接近的基因(Guan等人,2025年)。一个典型的例子是KPNA3,它通过视网膜特异性eQTL被确定为体重增加的候选基因,表明感觉发育与生长调控之间存在先前未被识别的联系。这些结果展示了ChickenGTEx如何改进GWAS信号的生物学解释,并优化了候选基因的优先级。
**比较和转化研究**
进行了比较分析,以评估鸡和哺乳动物之间基因表达和调控结构的保守程度。在鸡、人类、猪和牛中,同源基因表现出广泛的组织特异性表达模式,样本主要按组织而非物种聚类。这一发现表明,支撑主要生理系统的核心转录程序在脊椎动物中高度保守(Guan等人,2025年)。相比之下,基因表达的遗传调控显示出更大的差异。跨物种比较同源基因的顺式遗传率和主要eQTL效应大小显示了显著但总体较弱的相关性。转录组范围关联研究(TWAS)的整合使得跨物种的功能比较成为可能,发现了多个性状的共同调控信号,包括将鸡的体重与猪的生长相关性状联系起来。这些结果表明,比较调控基因组学可以揭示保守的生物学通路,同时也强调了在跨物种转化研究结果时必须考虑的物种特异性调控机制。
**总结**
ChickenGTEx项目提供了目前最全面的鸟类遗传调控参考图谱(https://chicken.farmgtex.org)。通过建立遗传变异、调控机制和复杂性状之间的直接联系,这一资源为精准育种、功能验证和鸟类生物学的系统级研究奠定了基础。未来的扩展将包括全基因组表示、结构变异QTL、生命阶段特异性映射、单核转录组学以及对营养、热应激和传染病等环境挑战的调控响应。这些努力将促进对鸡基因调控的动态、情境感知的理解,并直接支持下一代家禽遗传学和基因组学研究。在此多组织调控图谱的基础上,下一步研究将探讨雄性和雌性之间的遗传调控差异,强调在功能基因组学分析中纳入性别的生物学因素的重要性。
**30种鸡组织中的性别偏向性基因调控**
**张海涵**,中国湖南农业大学动物科学技术学院
性别二态性是鸡的显著生物学特征,也是现代家禽生产系统的基本组成部分。与依赖XY性别决定系统的哺乳动物不同,鸟类采用ZW性别决定系统,其中雄性为同配型(ZZ),雌性为异配型(ZW)(Graves,2016年)。这种染色体结构影响了基因剂量、表观遗传调控和跨组织的转录活性。与哺乳动物不同,鸟类的Z连锁基因表现出不完全的剂量补偿,导致生殖系统之外的基因表达持续存在性别差异(Graves,2016年)。这些基因组特征提供了一个生物学框架,在该框架中,性别偏向的基因调控预计是普遍存在的并且具有功能重要性。鸡的性别偏向不仅包括生殖生物学的差异,还包括生长、代谢、免疫功能和行为方面的差异。即使等位基因频率相同,遗传变异的功能效应也可能在雄性和雌性之间有所不同,这种现象被称为性别偏向或性别依赖的基因调控(Fallahshahroudi等人,2025年;Papanicolaou等人,2025年)。这种效应可能源于性染色体剂量差异、激素响应性转录因子活性、染色质可及性或性别特异性的细胞组成。在禽类生产群体中,这些机制尤为重要,因为雄性和雌性的选择目标存在显著差异。肉鸡种公鸡通常被优化为快速生长、饲料效率和肌肉积累,而雌鸡,尤其是在产蛋鸡和种母鸡品系中,则被选育为具有生殖性能、持续产蛋能力、脂质代谢和免疫能力。为了更好地理解这种二态性的遗传基础,我们最近建立了一个性别平衡的多组织调控资源,称为ChickenSexGTEx(Zhang等人,2026年)。该队列整合了全基因组测序数据与大约8000个RNA-seq数据,这些数据来自在同步发育阶段(90天)统一饲养的雄性和雌性鸡的32个主要组织。通过最小化环境和发育因素的干扰,这种设计为研究基因型与性别(G×Sex)之间的调控相互作用提供了受控的生理框架,而这些相互作用在控制较差的环境中往往难以察觉。
跨组织的广泛转录二态性分析显示,性别偏向的表达非常普遍,至少在一个组织中影响了大量注释的基因组。二态性的程度因组织而异,骨骼、免疫和神经内分泌器官表现出特别强的差异,而几个消化组织则显示出相对较小的差异。尽管由于剂量补偿不完全,Z连锁基因对雄性偏向表达有显著贡献,但大多数性别偏向基因位于常染色体上,表明系统性和调控机制远远超出了性染色体的范围。从功能上看,雄性偏向的表达模式主要集中在肌肉骨骼生长和结构途径上,而雌性偏向的基因则涉及脂质代谢和免疫相关过程。这些模式与性别特异性的生理资源分配一致,并为生长速率、体成分和免疫反应性的已知表型差异提供了分子解释。
尽管存在广泛的差异表达,直接的性别依赖性基因调控似乎更具选择性。利用G×Sex相互作用框架,我们识别出数百个在雄性和雌性之间效应不同的调控变异。这些变异影响了一部分特定的基因,并且通常是组织特异性的,在内分泌和代谢器官中观察到富集现象。重要的是,表现出差异表达的基因与携带性别相互作用eQTL的基因之间的重叠有限。这表明大多数转录二态性源于激素信号和系统性生理环境,而较小的部分反映了真正的基因型与性别相互作用。一些调控变异在雄性和雌性之间表现出不同的效应大小,还有较小的一部分显示出相反的等位基因方向,这与性别对抗和性别特异性选择压力的理论模型一致。
由于批量转录组谱受到细胞异质性的影响,我们整合了互补的单细胞数据来评估组织组成的性别差异。几种免疫和基质细胞群体在不同组织中表现出性别偏向的丰度。调整细胞类型比例后,许多基因的表观性别偏向表达程度降低,表明部分转录组二态性反映了组成差异而非内在的调控变化。同时,可以检测到细胞类型依赖的调控效应,表明遗传变异可能根据组织身份和细胞组成发挥特定情境的影响。这些发现强调了性别二态性是由染色体剂量、内分泌信号和细胞结构的综合效应共同作用的结果。
除了单核苷酸变异外,结构变异(SV)也贡献于组织特异性的调控景观,在某些情况下表现出性别依赖的效应。整合SV可以适度增加解释的基因表达变异比例,并突出了仅通过SNP分析会遗漏的调控信号。将调控图谱与代谢表型相结合进一步表明,一部分性别偏向的调控变异与性别二态性特征相关,包括脂质代谢和生长相关指标。这些观察结果表明,性别依赖的调控有助于更高层次的生理差异,并可能影响经济上重要的特征。
总体而言,这些发现支持了鸡性别二态性的多层次模型。广泛的转录差异源于性染色体剂量效应和系统性激素环境,而一组数量有限但生物学上有意义的调控变异表现出性别依赖的遗传效应。细胞组成和结构变异进一步细化了这一结构。对于禽类育种而言,这些结果强调了将性别仅作为协变量可能会掩盖生物学上相关的调控相互作用。将性别依赖的调控信息纳入基因组分析可以提高GWAS信号的解释,并支持针对性别特定生产目标制定更精确的育种策略。虽然性别依赖的调控效应是表型变异的一个重要层面,但生产特征也受到整个产蛋周期中动态生理过程的影响。以下部分将重点介绍在优秀产蛋鸡群体中进行的多组学分析,以解析延长产蛋性能的遗传调控。
几十年来,全球产蛋行业一直在追求更高的效率、更低的成本和更可持续的生产系统(Bist等人,2024年)。延长母鸡的产蛋周期已成为满足这些需求的核心策略。虽然传统周期通常持续72-80周,产蛋量约为320-360个蛋,但将生产周期延长至100周具有明显的经济和环境优势(van de Braak,2025年)。在100周内产500个蛋代表了现代产蛋系统的新的育种基准。然而,长时间产蛋带来了重大的生物学挑战。包括蛋重、蛋壳强度和饲料效率在内的生产特征在产蛋后期会下降(Molnar,2017年)。代谢紊乱变得更加普遍,肝脂肪变性的风险增加(Guo等人,2023年),以及过量的腹部脂肪沉积会降低效率和胴体质量(Liu等人,2024年)。这些问题反映了累积的生理压力、脂质代谢紊乱和内分泌调节失衡。
在改善后期产蛋性能方面,一个主要瓶颈在于对连接基因型与表型的调控机制理解有限。传统的GWAS可以识别与特征相关的位点,但很少阐明遗传变异如何通过跨组织的调控网络发挥作用。为了解决这一差距,我们在一个高产的罗德岛红纯系群体中建立了综合组学框架。与强调跨群体调控架构的多品种映射工作(如FarmGTEx项目)不同,我们的重点是在单一优秀育种群体内进行机制解析,以实现直接的应用。总共跟踪了953只母鸡到100周龄,进行了全面的表型分析,包括生殖特征、饲料效率、胴体特征、生化指标、腹部脂肪沉积和蛋质。在整个下丘脑-垂体-卵巢轴、代谢器官、肠道和输卵管等十个关键组织中进行了全基因组基因分型和转录组分析。还纳入了肠道微生物组分析,以捕捉与营养利用和脂质代谢相关的宿主-微生物相互作用。
为了量化宿主遗传、基因调控和肠道微生物群的相对贡献,我们开发了一个遗传力-可调控性-微生物可塑性(h2–rb2–m2)框架。该模型通过将分子调控和微生物效应纳入方差分解,扩展了经典的数量遗传学(Lan等人,2025年),并克服了传统数量遗传学模型的局限性(仅考虑遗传效应),允许同时评估多个因果因素。十二指肠和盲肠中残余饲料摄入量(RFI)的微生物可塑性(m2)分别为0.24和0.21(Wen等人,2021年),表明肠道微生物在调节饲料效率方面起着关键作用。对于蛋黄重量,垂体和肝脏的可调控性(rb2)最高(0.25-0.40),突显了这些组织的关键调控作用。通过eQTL映射,我们识别出一种显著的组织特异性调控模式。下丘脑、垂体和肝脏表现出强烈且稳定的顺式调控效应,eGenes的比例超过50%(下丘脑、垂体和肝脏分别为50.37%、56.85%、50.84%),顺式遗传力(hcis2)为0.14-0.16。相比之下,生殖组织的顺式调控效应较弱。输卵管中的eGenes比例仅为26.08%,子宫中的比例为30.51%,hcis2为0.06-0.07。这种模式在不同的分子表型中是一致的,包括转录本、外显子和3′ APA UTR。此外,具有多个独立eQTL的eGenes显示出更高的hcis2值。
使用综合分析和因果推断方法,我们研究了五个经济上重要的特征:持续产蛋能力、饲料效率、肝脂肪变性和蛋壳质量。延长周期中的产蛋量受到下丘脑-垂体-卵巢轴和代谢组织之间协调相互作用的调控。既发现了年龄共享的调控位点,也发现了年龄特异性的调控位点,支持早期和晚期产蛋生产力部分由不同的分子机制控制的观点。饲料效率分析识别出一个影响SUCLA2表达的调控位点,SUCLA2是三羧酸循环中的关键酶(Zhang等人,2024年)。增强SUCLA2表达与改善的能量代谢相关,支持持续产蛋而不积累过多脂肪。对于肝脂肪变性,检测到一个影响PEMT表达的主要调控位点(Sun等人,2024年)。PEMT在磷脂酰胆碱合成和极低密度脂蛋白(VLDL)组装中起核心作用。PEMT活性降低会损害肝脏中的脂质输出,使母鸡在长时间产蛋期间容易积累甘油三酯。腹部脂肪沉积受到宿主调控变异和肠道微生物组成的共同影响。我们在3号染色体上识别出两个与腹部脂肪重量(AFW)相关的eQTL,它们通过影响CHST14基因的表达和十二指肠中唾液乳杆菌的丰度来发挥作用(Lan等人,2025年),表明涉及胆汁酸代谢和肠肝脂质循环的协调宿主-微生物机制。
这些发现表明,延长产蛋特征是由跨越内分泌信号、肝脂质代谢、肠道功能和微生物生态的多层调控相互作用塑造的。重要的是,这些机制发现被整合到了实际的育种策略中。与行业合作伙伴合作,我们开发了一个包含验证过的调控标记的基因组选择平台。定制的基因分型芯片被应用于大规模的性能测试和选择计划。这种综合基因组育种方案促成了“Jinfeng No.6”商业产蛋鸡品系的开发,该品系在100周龄时平均产蛋量约为500个,具有长期的高产蛋率和稳定的蛋壳质量。这些结果表明,将分子调控信息与传统的杂交育种相结合可以加速延长周期性能的遗传进展。
延长产蛋代表了一个复杂的、时间依赖的表型,由内分泌、代谢、肠道和生殖系统的协调调控共同控制。综合组学方法能够解析将遗传变异与生产特征联系起来的因果途径,超越了关联分析,走向机制解析。虽然像ChickenGTEx这样的广泛调控图谱在多种群体中识别出大效应变异,但在优秀育种系内的重点分析允许直接识别主要和中等效应的调控变异,适用于选择。将调控标记和宿主-微生物组相互作用纳入基因组预测模型可以提高选择精度,并支持长期生产力的可持续改进。除了机制洞察之外,将调控发现转化为实际育种策略至关重要。整合基因组、转录组和微生物信息为基因组选择和精确基因组修饰提供了可操作的目标。
使用鸡高级杂交系和多组学数据绘制鸡生长特征的遗传调控图谱。生长特征是禽类遗传改良的核心目标,但由于涉及多个组织、发育阶段和调控机制,将遗传变异与生长性能联系起来的生物学途径仍然非常复杂。尽管人工选择在生长速率和效率方面取得了显著进展(Zuidhof等人,2014年),但许多与生长相关特征的位点仍然难以解释,因为相关变异通常位于非编码区域并且效应较小且依赖于具体情境(Maurano等人,2012年;Boyle等人,2017年)。这种复杂性需要高分辨率的群体映射和结合遗传、调控和功能基因组数据的综合分析框架。传统的动物遗传映射主要依赖于F2群体;然而,这种设计的映射分辨率受到广泛连锁不平衡的限制,限制了定位复杂特征的因果变异的能力(Besnier等人,2011年;Sheng等人,2013年)。高级互交系(AIL)和多亲本高级世代互交(MAGIC)群体在连续几代中积累了重组,显著提高了作图精度,并使得数量性状位点(QTL)的精细解析成为可能(Gonzales等人,2018年;Yang等人,2022年)。这些考虑促使人们开发了一种长期的鸡类AIL,用于高分辨率地绘制与生长相关的性状图谱。
**高分辨率高级互交系的开发**
与此同时,农场动物功能基因组学资源的迅速发展,包括FarmGTEx和FAANG,极大地扩展了鸡类基因表达和调控注释数据的可用性(GTEx Consortium,2020年;Pan等人,2023年;Fang等人,2025年;Guan等人,2025年),为将精细定位的位点与功能基因和调控机制联系起来提供了关键框架。为了提高作图分辨率,超越传统F2群体所能达到的水平,我们建立了一个基于徽阳胡须鸡和岭南黄鸡A03的长期鸡类高级互交系(AIL),这两种鸡在体重上存在显著差异。该群体通过17年的连续随机交配得以维持(Wang等人,2020a)。群体遗传分析显示,其核苷酸多样性稳定,近交系数低,且世代间的连锁不平衡迅速衰减,表明遗传漂变最小,祖先单倍型逐渐破碎。这些特征使AIL成为精细绘制复杂性状的强大资源。
利用F16代,我们对涵盖五个主要性状类别的75个表型进行了全基因组关联研究(GWAS)。发现了43个性状的显著关联,并精细定位了682个QTL。值得注意的是,QTL区间从F2代的平均1.77 Mb缩小到了F16代的238 kb,这证明了通过多代重组实现的作图精度的显著提升。一些先前已鉴定的位点也被重新发现,包括与胡须和羽毛色素相关的HOXB8和SOX10(Gunnarsson等人,2011年;Guo等人,2016年),验证了该方法的可靠性。
**整合调控基因组学以识别功能变异**
尽管作图分辨率有所提高,但功能注释显示,大多数显著SNP位于内含子(55.55%)或基因间(17.17%)区域,这强调了调控机制的重要性。为了解决这一问题,我们整合了多种互补资源,包括全球鸡参考组(GCRP)、FAANG功能注释以及ChickenGTEx的基因表达调控数据(Pan等人,2023年;Guan等人,2025年;Zhu等人,2025b)。在分析的446个QTL中,有245个得到了表达数量性状位点(eQTL)的支持,从而识别出431个候选功能基因。综合分析揭示了四种主要的变异介导的调控模式:(1)直接影响表型的顺式调控变异,例如ST3GAL4,其中一个小肠调控变异影响了血清碱性磷酸酶水平;(2)长距离、组织特异性的调控,如由肌肉、胚胎组织和肠道中不同基因介导的胫骨长度QTL;(3)由等位基因频率变化引起的世代特异性QTL,以NCAPG附近的去内脏重量位点为例;(4)多基因簇状调控,其中多个组织中物理上相连的基因共同影响体重,形成了符合全基因模型的伪主要效应QTL。在不同鸡系中的单倍型分析进一步支持了这种簇状结构的生物学相关性,表明有利单倍型的固定不完全,暗示这些位点仍有持续的遗传改良潜力(Zhu等人,2025a)。
**生长相关调控的保守性和差异性**
为了评估生长性状背后的遗传机制的进化保守性,我们将与多种鸡生长表型显著相关的基因映射到人类中的同源基因。超过80%的与生长相关的鸡基因在人类中有可识别的对应基因,其中许多同源基因与人类的生长、代谢或体成分相关性状有关。这种在基因水平上的高度保守性表明,调控生长的核心生物学途径在脊椎动物中是共享的,进一步强调了鸡作为复杂性状生物学比较模型的相关性(Zhu等人,2025a)。相比之下,在变异水平上的保守性明显较低。只有少数与生长相关的SNP可以直接映射到人类基因组中,且它们的调控注释在不同物种间存在显著差异。此外,鸡类生长相关基因的内含子和基因间区域比人类同源基因更短,反映了基因组结构和调控景观的差异(Zhu等人,2025a)。这些观察结果表明,尽管相同基因在不同物种中经常参与生长过程,但它们的调控变异和基因组背景在脊椎动物进化过程中经历了显著的谱系特异性重组。
总体而言,这些结果突显了保守的生物学功能与不同的调控实现方式之间的关键区别。对于家禽遗传学而言,这意味着功能基因的发现可以从比较基因组学中受益,而识别因果调控变异则需要特定物种的资源,包括高分辨率作图群体和以鸡为中心的功能基因组学数据集,如ChickenGTEx(Pan等人,2023年;Guan等人,2025年)。
**总结**
本研究展示了将长期高级互交系与多组学数据整合起来解析鸡生长性状调控结构的价值。通过利用多代积累的重组,并结合全基因组关联分析、功能注释和基因表达调控,我们能够从单纯定位位点发展到精确的变异-基因-表型关系(Wang等人,2020a;Zhu等人,2025a)。多种调控模式的识别,包括顺式调控效应、长距离组织特异性调控、世代依赖性QTL和簇状多基因结构,突显了生长性状调控的复杂性,并强调了孤立状态下解读GWAS结果的局限性(Boyle等人,2017年;Zhu等人,2025a)。重要的是,几个关键位点上有利单倍型的不完全固定表明,当前鸡群体中仍具有巨大的遗传改良潜力。
展望未来,通过结合多群体GWAS设计来增加遗传多样性和关联信号的稳健性,将进一步提高分辨率和生物学洞察力(Yang等人,2022年)。跨组织和发育阶段的转录组数据集的改进整合,以及新兴的单细胞和单核方法,将使得细胞类型特异性调控机制的精细解析成为可能。这些进展将加强家禽育种的生物学基础,并促进更精确、基于机制的策略的发展,以改善生长及相关性状。虽然基因组选择利用了自然发生的变异,但对关键调控位点的功能验证也为通过靶向转基因和基因编辑技术直接修改数量表型变异提供了机会。
**通过转基因技术识别修改大规模数量表型变异的位点**
Dominic Wright,瑞典农业科学大学动物生物科学系
ChickenGTEx项目定义的不断扩展的调控景观不仅提供了对复杂性状结构的机制洞察,还为下一代遗传改良奠定了战略基础。通过整合多组织表达分析、因果推断和多组学分析,我们现在可以优先考虑那些在生长、代谢效率、繁殖持久性和抗逆性状方面发挥协调作用的调控位点。虽然传统基因组选择利用了现有的等位基因变异,但功能调控元件的精确识别为靶向基因组修饰开辟了新的可能性。转基因和基因编辑技术提供了实验验证候选位点和大规模控制数量表型变异的互补方法。随着调控基因组学的成熟,将功能验证与精准基因组工程相结合,可能会实现更可预测和基于生物学的改良策略,将发现驱动的基因组学与家禽育种的变革性应用联系起来。
随着去灭绝技术的出现,科学正在尝试迄今为止最极端的基因组水平表型改变,这无疑引起了公众的兴趣(Shapiro,2020年)。通常(尽管不完全是),这些技术涉及选取与灭绝物种最近的现存亲属,然后尽可能使其表型与灭绝物种相匹配(Turner等人,2025年)。根据现存物种与灭绝物种之间的差异程度,这可能涉及相当大的改变,不仅在形态上,还包括生理和行为上。例如,在将长毛猛犸象从大象中“复活”的案例中,从长双层毛发、更多的皮下脂肪、较小的耳朵和四肢、增大的扭曲獠牙到更宽的脚等特征都有所不同(Kubiak,1982年)。另一个例子是已灭绝的旅鸽,其最近的现存亲属是斑尾鸽(Murray等人,2017年)。在这种情况下,不仅涉及一些形态特征(更长的尾巴和粉红色的胸部斑块),还有较大的行为差异(旅鸽生活在数十万只的大群体中(Blockstein,2017年))。这种极端的表型修改是一项艰巨的任务,也引发了关于是否可以通过转基因技术实现这种改变的质疑(Shapiro,2017年)。
通过基因组工程实现去灭绝可能是迄今为止最普遍可行的策略,因为体细胞核转移(克隆)需要完整的细胞,而选择性回育则需要仍然具有所需性状的现存亲属,而且非常耗时(Turner、Keyte、Pask和Shapiro,2025年)。尽管产生实际基因组工程和配子的技术已经进步,但仍然存在如何识别需要插入以产生改变表型的确切基因组区域的问题。例如,是否有可能将现存动物的表型修改为另一种相关现存动物或亚型的表型?在这种情况下,有更多工具可用于识别所需的位点。特别是,遗传杂交、全基因组关联和连锁作图可以识别数量性状位点(QTL)和单基因突变或多态性,并常用于尝试在群体内部和之间识别这些遗传位点(Gallagher和Chen-Plotkin,2018年;Lynch和Walsh,1998年;Visscher等人,2012年)。尽管在尝试完整的去灭绝项目时这些工具可能不可用,但这样的测试可以作为去灭绝项目可行性的重要验证。如果无法将现存物种的表型修改为另一种相关物种或亚型,我们可以利用哪些工具来实现这一目标?这样的实验将是对去灭绝技术一般可行性的重要证明。
首先,在考虑去灭绝基因组工程时,我们预期哪些类型的位点最为相关?在识别单基因疾病的致病变异方面已经取得了很大成功(通常是致病位点或极端突变)。然而,当我们考虑想要修改以创造灭绝物种的各种表型时,通常涉及数量性状(例如猛犸象的寒冷适应、旅鸽的聚集和交配行为等)。这些位点通常通过遗传作图技术识别,无论是基于连锁的QTL作图还是自然群体中的全基因组关联研究(GWAS)。这些位点很难精确到核苷酸水平(即识别实际的致病突变),检测到的位点的置信区间可能会有很大差异,效应大小也是如此(Hayes,2013年)。在基于连锁的QTL研究中,这些位点的平均距离为10cM(Darvasi和Soller,1994年),因此取决于基因组的大小,但对于小鼠来说大约为1cM ~1Mb,而QTL的平均效应大小通常约为交叉变异总量的5%(Flint,2003年;Lynch和Walsh,1998年)。相比之下,GWAS研究的置信区间较小,但效应大小也相应较小(通常不到总变异的1%(Stringer等人,2011年)。即使现在可以通过转基因技术修改/重写较大的基因组区域(最多1Mb,但目前实际可行的区域通常较小),这些区域也可能远大于插入大小。这意味着需要对这些区域进行精细作图,使其足够小。此外,如果识别出的位点具有尽可能大的效应,那将更为理想。遗传基因组学是一种可以用来尝试识别和精确定位QTL区域以及确定QTL的致病基因的方法。这些技术通过结合同一个个体的基因型、基因表达和生物特征(包括甲基化表型和开放染色质区域(ATAC)来识别那些能够通过统计方法建立因果关系的位点(H?glund等人,2020;Johnsson等人,2016)。这使得可以在基因型与基因表达之间建立统计联系,进而影响表型(Aten等人,2008),或者实际上是在其他任何参数之间建立联系(例如基因型-甲基化-基因表达(H?glund, Henriksen, Fogelholm, Churcher, Guerrero-Bosagna, Martinez Barrio, Johnsson, Jensen和Wright,2020))。这种遗传基因组学方法可以应用于多种数据类型,例如已经用于识别影响鸡焦虑行为的驯化相关致病基因(Fogelholm等人,2019;Johnsson等人,2018a;Johnsson, Williams, Jensen和Wright,2016)、骨骼分配(Johnsson等人,2015a;Johnsson等人,2015b)、体重(Johnsson等人,2018b)和鸡冠重量(Johnsson等人,2012;Johnsson等人,2014)。然而,即使使用这些工具,由于批量转录组分析的局限性以及连锁作图的分辨率限制,通常只能识别出致病基因而非具体的致病多态性。这意味着虽然可以确定导致表型的基因,但引起这种基因表达变化的具体多态性位置仍然不确定。
在使用表达分析确定因果关系时,最大的限制之一在于基因表达的测量方式,通常是数千个细胞的平均值。如果细胞类型的表达模式差异很大,这种方法往往会导致基因表达的测量不准确。相比之下,单细胞技术可以在每个细胞的基础上测量基因表达,每个样本可以测量数千个细胞。这些技术有可能彻底改变因果关系的研究,但目前尚未有相关进展。虽然目前还没有将单细胞网络用于这一领域,但已被认为是一个有前景的方向(Tanay和Regev,2017),特别是研究基因调控和基因组多态性如何以协调和灵活的方式影响细胞分化和组织形成。最近的单细胞技术进步允许同时捕获单个细胞的基因表达谱和开放染色质(ATAC)区域(使用10X Multiome芯片)。这为因果关系分析提供了完美的平台,因为每个个体都有数千个细胞的数据。另一个主要优势是结合使用ATAC和基因表达数据。ATAC数据可以识别特定细胞中当前处于开放状态的区域,这些区域可能包含调控元件(Grandi等人,2022),从而大大精炼了因果关系分析,因为这些ATAC区域较小,可以显著减少需要研究的因果区域范围。这提供了评估基因型如何影响开放染色质区域(ATAC-QTL)(Mu等人,2026)以及这些区域如何影响基因表达的机会,利用精确的细胞特异性数据。通过确定开放染色质与目标基因表达之间的关系,因果分析可以作为精细定位的方法,识别驱动基因表达变化的启动子、增强子和其他染色质元件。
进一步来说,单细胞技术的一个潜在优势是可以减少实际使用的样本数量。虽然现代eQTL/eGWAS研究的样本量可以达到数百甚至数千个个体(Guan等人,2025),但单细胞技术的成本过高,使得这样的样本量难以实现。然而,尽管样本量较小,仍可以利用数据中包含的大量细胞信息。通常在单细胞QTL分析中,一旦识别出细胞簇,就会对每个簇中每个个体的所有细胞进行表达平均(实际上是细胞类型特异性的批量RNA分析)(van der Wijst等人,2020)。但这会严重减少数据量,并不能充分利用生成的大量个体转录组和ATACseq基因组。一种可能性是包含所有细胞的转录组,并将这些数据嵌套在个体层次模型中,从而充分利用所有生成的数据,特别是在因果关系分析中(从SNP到开放染色质区域再到基因表达的因果关系确定),如果同一细胞同时有ATAC和表达QTL数据的话,这将提高分析的效力。
鸡是一个非常适合进行此类遗传改造的模型。首先,鸟类目前无法使用克隆策略实现复活(Shapiro,2017),因此对于鸟类和爬行动物来说,基因组修饰是复活的唯一途径。鸡拥有最多的遗传学工具(Dequéant和Pourquié,2005;Zhou等人,2025)。它的基因组较小(约1Gb长),重复序列较少(Smith等人,2023),减少了基因组重写和编辑所需的规模。此外,可以利用驯化过程中产生的极端表型变异与原始野生型祖先红原鸡进行比较。这种极端变异使得比较变得容易,而且野生鸡和家鸡之间的变异幅度类似于种间变异而非种内变异(Jensen和Wright,2022;Wright等人,2010)。因此,一个合理的初步测试是使用转基因技术将家鸡改造为野生表型,或者反之亦然。
总之,这篇简短的综述强调了复活过程中的一些问题和可能性,并提出了结合遗传基因组学技术和单细胞技术来验证转基因技术对表型改造的假设,不仅适用于复活,也适用于一般的转基因改造。鸡是一个非常适合此类项目的模型,特别是利用野生鸡和家鸡之间存在的大量表型差异。总的来说,这些贡献展示了ChickenGTEx框架如何将基础调控图谱与性别特异性分析和应用育种策略相结合,形成了一个精确家禽基因组学的连贯平台。
结论:多组织调控基因组学、性别信息分子图谱和整合组学分析的结合正在重塑我们对鸡复杂性状结构的理解。在生长、繁殖、代谢效率和产蛋性能等方面,这些研究表明,定量表型变异是由协调的调控网络控制的,而不是孤立的基因位点。组织特异性基因调控、性别依赖的遗传效应、结构变异以及宿主-微生物组相互作用共同构成了一个多层次的框架,将基因型与表型联系起来。通过解析这一调控结构,我们超越了关联信号,获得了更深入的机制理解。这项工作的核心意义在于识别出能够改变大规模定量表型变异的位点。多组学整合使得能够优先考虑具有明确生物学功能的致病基因和调控变异,从而精炼可用于分子育种的目标。除了改进基因组选择策略外,这些发现还为通过转基因和基因编辑技术进行精确基因组修饰提供了理论基础。针对经过验证的调控位点的靶向操作提供了调整代谢分配、繁殖持久性、疾病抗性和生产效率的潜力,这是传统选择方法无法实现的。这些进展标志着从描述性基因组学向预测性和可操作性基因组学的转变。随着调控图谱的扩展和因果推断模型的成熟,将功能注释与基因组预测和精确编辑相结合将加速可持续的遗传改良。这些方法对于满足未来几十年对高效、抗逆性和环境友好的家禽生产系统的需求至关重要。
未引用的参考文献:Abdellaoui等人,2023;Hillier等人,2004;Lappalainen等人,2024;Bu等人,2024;Cao等人,2020
CRedI作者贡献声明:
Fang Lingzhao:概念化、初稿撰写、审稿与编辑。
Zhang Haihan:初稿撰写、审稿与编辑。
Sun Congjiao:初稿撰写、审稿与编辑。
Hu Xiangxiao:初稿撰写、审稿与编辑。
Wright Dominic:初稿撰写、审稿与编辑。
Zhou Huaijun:概念化、资源准备、初稿撰写、审稿与编辑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号