《Nature Communications》:A catalogue of early diverged contemporary human genome variation reveals distinct Khoe-San populations
编辑推荐:
本研究通过深度全基因组测序,构建了早期分化人类基因组变异图谱,解析了科伊桑人群的遗传多样性与演化历史。研究人员对150名科伊桑人(12个群体)和40名南部非洲人(3个群体)进行测序,发现约3000万个变异位点(含130万个新单核苷酸变异),首次确认桑人(San)和达马拉人(Damara)为独立演化谱系,并揭示其有效种群规模在4.5-15万年前达到峰值。研究开发基于组装的阳性选择检测方法,发现1,376个正选择基因(dN/dS=19.46),其中479个基因与采集狩猎生活方式相关,为人类遗传多样性研究和疾病易感性差异提供重要依据。
在人类基因组研究领域,现代人群的遗传多样性图谱仍存在显著空白。尽管全球范围内已开展多项大规模基因组测序计划,但早期分化的非洲人群——特别是保持传统采集狩猎生活方式和独特吸气音语言的科伊桑人群——的基因组变异尚未得到系统解析。这种知识缺口不仅影响我们对人类演化历史的完整认知,更制约了精准医学的发展:由于当前主流生物医学数据库主要基于非裔人群的衍生变异,可能导致对其他人群疾病易感性和药物反应的误判。
为填补这一空白,研究团队在《Nature Communications》发表最新研究,通过对190名非洲个体(包括12个科伊桑亚群和3个南部非洲参照群体)进行深度全基因组测序,构建了迄今最全面的早期分化人群遗传变异图谱。这项研究不仅揭示了人类演化史上的关键细节,更为理解遗传多样性对健康的影响提供了新视角。
关键技术方法包括:深度全基因组测序(对150名科伊桑人和40名南部非洲人)、系统发育分析(确定人群分化关系)、基于组装的正选择检测(识别dN/dS比值显著基因)以及有效种群规模重建(使用PSMC方法)。样本来源于12个科伊桑群体和3个南部非洲对照群体。
研究结果与发现:
人群遗传结构解析
通过系统发育分析发现,桑人(San)和达马拉人(Damara)代表两个独立的演化谱系。桑人谱系与现代人类的分化时间可追溯至约11.5万年前,而达马拉人的分离相对较晚。值得注意的是,那马人(Nama)基因组中保留了两个来自这些谱系的基因渗入信号,表明历史上存在两次明显的基因交流事件。
有效种群规模动态
重建古代有效种群规模显示,桑人和达马拉人在4.5-15万年前均维持较高的人口数量,这一时期恰好对应现代人类在非洲的扩张阶段。这一发现为理解人类演化关键时期的人口动态提供了直接遗传证据。
正选择基因鉴定
研究团队开发了新的基于组装的检测方法,共识别1,376个经历正选择的基因(dN/dS比值为19.46)。特别值得注意的是,其中479个基因与采集狩猎生活方式显著相关,这些基因保留了与其他人群不同的祖先等位基因,可能在适应传统生存方式中发挥重要作用。
遗传变异图谱特征
研究共鉴定约3000万个遗传变异,包括单核苷酸变异(SNV)、插入缺失(InDel)和结构变异(SV)。其中超过130万个单核苷酸变异为首次发现,显著拓展了人类遗传变异的已知范围。
研究结论与讨论:
本研究构建的高分辨率基因组变异图谱,为理解人类早期遗传多样性树立了新标杆。科伊桑人群作为现代人类中最早分化的谱系之一,其基因组中保存的独特变异不仅重构了人类演化史的关键细节,更揭示了遗传适应与生活方式的深层关联。特别重要的是,研究中发现的大量祖先等位基因在非非洲人群中已被衍生变异取代,这种差异可能解释不同人群对疾病易感性和药物反应性的区别。
该研究的方法学创新——特别是基于组装的阳性选择检测方法——为后续研究提供了新工具。发现的479个与采集狩猎生活方式相关的正选择基因,为理解人类适应特定生态环境的遗传机制开辟了新方向。这些基因中可能包含对现代代谢疾病、免疫反应等重要生理过程的关键调控因子。
从更广阔的视角看,这项研究强调将人类遗传多样性全面纳入生物医学研究的紧迫性。当前主要基于欧洲人群数据的参考基因组和疾病关联研究,可能无法准确反映其他人群的遗传特征。科伊桑人群基因组中保存的祖先变异,为理解人类基础生物学特征和疾病机制提供了不可替代的参照系。
这项研究不仅深化了对人类演化史的认识,更对推动精准医学的公平发展具有重要启示。建立包容不同人群遗传特征的医学研究体系,将是实现真正个性化医疗的关键一步。未来研究需要进一步扩大样本量和人群覆盖范围,完整揭示人类遗传多样性的全貌及其对健康的影响。