《Advanced Science》:Pan-3D Genome Analysis Reveals the Roles of Structural Variation in Chicken Chromatin Architectures, Domestication and Production Traits
编辑推荐:
本研究发现结构变异(SV)通过重塑三维基因组来影响鸡的驯化与生产性状。该研究构建了首个鸡的泛三维基因组资源,系统解析了染色质高级结构动态,并鉴定出调控季节性繁殖(TSHR、DIO2轴)和胴体性能(KLF3上游缺失)的关键SV及其远端调控网络,证实SV可显著提高基因组选择(GS)预测精度。
高质量基因组组装与泛基因组特征
本研究新组装了15个中国地方鸡品种的高质量基因组,并与13个已发表的高质量基因组整合,构建了包含28个全球鸡基因组的泛基因组资源。组装评估显示,这些基因组具有高完整性和连续性,为后续分析奠定了基础。泛基因组分析鉴定出28,443个泛基因家族,其中核心家族约占30.51%,私有家族约占27.59%。高度保守的家族显示出较高的dN/dS比值和较低的核苷酸多样性(Pi),表明其经历了长期的正向选择和近期的选择性清除。此外,与端粒到端粒(T2T)参考基因组相比,本研究捕获了总计200.04 Mb的新序列,这些序列富含串联重复(TR)和转座元件(TE)。基于泛基因组资源,共鉴定出81,636个结构变异(SV)。SV在鸡中表现出极高的谱系特异性,保守类型占比不足3%。转座元件插入(TEI)是SV形成的主要机制(61.22%),其次是非同源末端连接(NHEJ, 19.83%)。SV区域通常与降低的转录活性和染色质可及性相关。
高分辨率泛三维基因组图谱的构建与表征
研究整合了15个基因组的Hi-C、ATAC-seq和RNA-seq数据,构建了首个鸡的高分辨率泛三维基因组图谱,涵盖了区室、拓扑关联结构域(TAD)和染色质环等多个层级。与单一参考基因组相比,使用自身组装的基因组进行比对可提高有效配对读段的产出,并显著增加了环和远端顺式调控元件(LT-CRE)的鉴定数量。超过半数的TAD边界在15个基因组中高度保守,而私有边界仅占12%左右。高度保守的TAD边界表现出更强的绝缘强度,且SV在除私有类型外的几乎所有TAD边界区域均显著缺失,表明边界区域受到强烈的选择压力。与TAD不同,染色质环的保守程度较低(核心环约占4.6%)。随着保守程度的降低,环的跨度显著增加,而其锚点处的LT-CRE/基因注释率、互作计数和eQTL注释率则显著降低。核心环显示出显著更高的基因表达水平和ATAC-seq信号强度,并在肌肉发育相关通路中富集,表明其在生产性状中具有重要功能。
TSHR-DIO2轴在鸡驯化过程中的选择
通过将858个全球个体的重测序数据比对至图泛基因组,本研究在驯化过程中鉴定出167个候选SV及180个SV基因。其中,位于甲状腺刺激激素受体(TSHR)基因内的一个240-bp插入(INS)和位于脱碘酶2型(DIO2)基因内的一个81-bp缺失(DEL)表现出强烈的选择信号。这两个基因的SV基因型分布在红原鸡(RJF)和家鸡之间差异显著。三维基因组分析显示,包含这些SV的染色质环几乎都是核心型,并在TSHR和DIO2基因之间介导频繁的相互作用。TSHR-DIO2轴是光周期调节的核心通路,尤其在调控季节性繁殖中起关键作用。这些发现从三维基因组层面证实了该轴是鸡驯化过程中的关键选择靶标,其变异有助于实现稳定的产蛋性能。
SV通过染色质环调控远端基因影响胴体性状
对877个F2个体的重测序数据分析,鉴定出一个位于Krüppel样因子3(KLF3)基因上游的266-bp缺失(DEL),该SV与多个胴体性能性状显著相关。此SV与邻近SNP的连锁程度极低,表明其遗传信息无法通过SNP分析捕获。双荧光素酶报告基因实验证实,该缺失序列具有显著的增强子活性。该SV位于47个完全保守的染色质环的锚点区域,这些环连接着KLF3及其远端的上游基因Tbc1d1和PGM2。捕获Hi-C实验进一步验证,与野生型(WT)相比,该缺失导致KLF3区域的长程互作显著减弱,但与Tbc1d1和PGM2的短程互作显著增强,从而重写了环互作网络。这一网络重编程可能是由SV引起的功能缺失所触发的补偿效应。综上所述,KLF3基因上游的266-bp缺失通过重塑染色质环互作网络,调控远端基因表达,进而影响鸡的胴体性能。
结构变异提高鸡基因组选择的预测精度
研究利用不同遗传标记组合,在49个生产性状上构建了6种基因组选择(GS)模型进行比较。结果显示,在支持向量分类(SVC)、基因组最佳线性无偏预测(GBLUP)、单步最佳线性无偏预测(ssBLUP)和岭回归最佳线性无偏预测(rrBLUP)等模型中,基于SV的预测精度显著优于基于SNP或InDel的模型。SV的加入在多数性状,尤其是胴体和生长性能性状上,提高了GS的预测能力。这为SV在鸡分子标记辅助选择(MAS)育种实践中的应用提供了有价值的工具。
讨论与结论
本研究的核心创新在于构建了鸡的首个综合性、高分辨率泛三维基因组资源,并系统解析了基因家族、SV及染色质高级结构的动态特征。一个有趣的发现是,与植物研究不同,SV在鸡的TAD边界和TAD结构重组事件中并未富集,反而表现出普遍的缺失模式,这可能反映了动物TAD结构更强的功能约束和稳定性。另一方面,研究揭示了SV可通过高度保守的染色质环对远端基因发挥长程调控作用,为理解SV影响复杂性状的机制提供了三维视角。例如,KLF3上游SV引起的环互作网络重写,挑战了SV仅作为基因组不稳定因素的固有观点。该研究提供的资源为深入探索功能基因组学和加速家禽育种实践奠定了重要基础。