《Journal of Genetics and Genomics》:Whole-genome sequencing reveals Yunnan as the crossroads of East and Southeast Asia for human gene flow
编辑推荐:
本研究针对云南少数民族群体遗传结构复杂、历史不清的难题,通过对六个民族(白、傣、哈尼、苗、藏、汉)的366例高深度全基因组测序,鉴定出351万新变异,精细解析了群体遗传结构和混合历史。研究发现云南是东亚、东南亚和青藏高原三大谱系的关键基因交流枢纽,并识别出与免疫、代谢、高海拔适应等相关的正选择信号,为理解东亚南部人群的演化历史与本地适应提供了重要遗传学依据。
在中国西南边陲,坐落着一个民族与文化极为丰富的省份——云南。这里不仅是近半数中国官方认可少数民族的家园,更是连接东亚、东南亚乃至青藏高原的重要枢纽。复杂的地形,层峦叠嶂的山脉与纵横交错的河流,既在一定程度上隔离了不同的族群,使其独特的文化传统得以保存,也深刻地影响了历史上人群的迁徙与交融。考古记录表明,人类在云南的定居历史可追溯至约一万年前的旧石器时代晚期。然而,尽管其地理位置和历史地位至关重要,以往对云南各民族遗传背景的研究,或因标记密度不足,或因测序深度不够,抑或研究设计局限于单一群体,使得我们对其精细的遗传结构和复杂的演化历史仍知之甚少。为了更清晰地描绘这幅基因图谱,一个研究团队对来自云南六个主要民族(白族、傣族、哈尼族、苗族、藏族和汉族)的366个个体进行了高深度的全基因组测序,旨在系统揭示云南人群的遗传多样性与演化历程。相关研究成果已发表在《Journal of Genetics and Genomics》上。
为了开展这项研究,研究人员首先从云南六个民族中采集了366份样本,经过严格的质量控制和亲缘关系评估,最终保留了313个无亲缘关系的个体进行深入分析。全基因组测序的平均深度达到约33倍,确保了数据的高质量。研究团队鉴定出超过2000万个遗传变异,其中包括约351万个此前未被报道的新变异,这些新变异大多为罕见变异。通过主成分分析、群体遗传结构分析和遗传差异指数(FST)计算,研究人员精细地描绘了云南各民族在东亚和东南亚人群遗传背景下的相对位置与亲缘关系。
群体遗传结构
分析显示,云南各民族呈现出清晰的遗传结构,大致可分为北部支系和南部支系。苗族人(MiaoYn)在遗传上相对孤立,与越南、泰国的Hmong群体聚为一类;哈尼族人(HaniYn)则显示出南北混合的祖先成分,表明其复杂的遗传背景。藏族(TBYn)主要与高原藏族人群聚类,而白族(BaiYn)和当地汉族(CHYn)遗传背景最为接近。
基因流动与混合历史
通过等位基因频率谱、f3统计和f4统计分析,研究发现云南是基因流动的热点区域。混合历史推断表明,除苗族和藏族外,其他云南群体均检测到明显的混合信号,其祖先来源可归结为北部东亚、南部东亚/东南亚以及青藏高原三大类。特别值得注意的是,白族和哈尼族的混合事件大约发生在公元550-660年,对应于南诏国时期;而云南藏族的混合则发生较晚,约在440年前(明末时期)。
自然选择信号
通过复合多信号(CMS)方法,研究团队在各个民族中均检测到受到正选择的基因组区域。例如,在藏族中发现了与高原适应密切相关的EPAS1和EGLN1基因;在傣族中发现了与脂质代谢相关的FADS2基因;在白族中发现了与心脏发育和代谢相关的IDH2和TLN2基因。功能富集分析进一步提示,这些选择信号与免疫调节、能量代谢、心脏发育、饮食适应等环境压力密切相关。
人口动态与分化历史
有效种群大小推断表明,云南各民族在约6万年前共享相似的种群动态,此后扩张速率出现分化。分歧时间估算显示,大多数云南群体之间的遗传分离发生在新石器时代(约9600-6600年前),而白族与当地汉族的分化时间较晚(约6500-4100年前)。
基因流动的地理格局
通过估算有效迁移表面(EEMS)分析,研究发现横断山脉和雪峰山脉构成了基因流动的障碍,而云南与周边地区(如北部、东部和西南部边界)则存在基因流动的热点区域,这与历史上的“茶马古道”和“南方丝绸之路”等迁徙走廊相吻合。
本研究通过高深度全基因组测序,首次在如此精细的尺度上揭示了云南少数民族群体的遗传多样性与复杂历史。研究成果不仅证实了云南作为东亚与东南亚人群基因交流枢纽的关键地位,还为理解不同环境压力下的人类适应性进化提供了宝贵线索。这些发现对于追溯东亚南部人群的起源与迁徙历史、阐释复杂性状的遗传基础以及推动精准医学在少数民族地区的应用均具有重要意义。