《Advanced Science》:Modern and Ancient Genomes Reveal Neolithic Paternal Expansions of Millet and Rice Farmers and Demic Diffusion from China into Mainland Southeast Asia
摘要
该研究构建了迄今分辨率最高的东亚及东南亚古代人群Y染色体系统发育框架,基于14435例古今欧亚个体(含584例新测序全Y染色体基因组)的父系基因组聚合数据集,重建了时间校准的Y染色体系统发育树。研究识别出138个在新石器时代分化的父系支系,其中17个优势支系在中国与中南半岛(MSEA)间共享,其扩张始于约5千年前(kya),于3.5-3千年前达峰值。南北汉族人群父系遗传差异极小,而南方少数民族呈现明显亚结构:沿海群体与侗台语系(Tai-Kadai)人群聚类,西南群体与苗瑶语系(Hmong-Mien)人群关联,高原群体与藏缅语系(Tibeto-Burman)人群对应。研究结果支持新石器时代农业及汉文化的人口扩散模型,强调古代粟黍农民及其汉族后裔对华南及MSEA遗传景观的显著父系贡献,并揭示稻作农民介导的后续扩张的富集效应。
1 引言
古代DNA(aDNA)研究极大增进了对人类迁徙与混合过程的理解。考古与遗传证据支持约6000年前起源于黄河流域的粟黍农业社群向西扩张至青藏高原,并促成汉藏语系人群及其语言的分化。来自长江流域及MSEA的常染色体aDNA进一步揭示了中国南方农民与新石器时代至铁器时代MSEA人群间的遗传联系。然而,尽管常染色体研究已确认 substantial 贡献,Y染色体数据仍有限,制约了对男性驱动演化历史的深入认识。
东亚及MSEA拥有丰富的文化语言多样性,包括全球最大的汉族人口及众多不同民族语言群体。这种多样性由大规模迁徙、地理隔离及环境变异塑造,形成独特的遗传模式及复杂的人群间相互联系。汉族历史上根植于黄河流域的华夏部落,过去两千年来持续扩张,特别是进入青藏高原及华南地区,并与侗台语系、南亚语系及苗瑶语系等土著群体互动。早期关于南北汉族方言及文化差异的解释强调文化扩散,但共享的Y染色体及线粒体DNA(mtDNA)单倍型的存在提示显著的人口扩散贡献。近期研究采用弱分化多源混合模型(Weakly-Differentiated Multi-source Admixture model)阐明了复杂父系奠基支系在塑造汉族遗传结构中的作用。然而,新石器时代东亚农民、汉族及其全新世祖先群体向MSEA的父系扩张主要由人口扩散还是文化传递驱动,仍待解决。
华南地处东亚与MSEA交汇地带,是语言文化多样性的重要中心,产生至少四大语系:侗台语系、苗瑶语系、南岛语系及南亚语系。从父系基因组视角,单倍群O1a-M119、O2a2a1a2-M7及O1b1a1a-M95分别与南岛语系、苗瑶语系及南亚语系人群关联。aDNA技术的进步彻底改变了群体遗传学研究,为理解人类遗传历史及演化过程提供新视角。高山及海门口遗址的古基因组表明,黄河流域新石器时代粟黍农业社群向西南迁徙至四川及云南等地。贵州古人类的基因组分析进一步支持汉文化在西南地区的人口扩散模型。越南古代个体的研究揭示了不同祖先的混合,包括中国农业人群及东亚狩猎采集者,凸显东亚与MSEA人群间的深层遗传联系。这些研究与考古证据共同支持华南新石器时代农民向MSEA迁徙的假说,显著贡献了现代该地区人群的遗传组成。然而,新石器时代农民南迁在多大程度上塑造了华南少数民族及MSEA人群的父系遗传构成,仍不清楚。
当前中国及MSEA的Y染色体测序数据有限,主要集中于汉族人群或低覆盖度数据,凸显对东亚多民族人群更广泛采样的需求。Y染色体基本不受重组影响,为追溯父系支系的起源及迁徙模式提供有力工具。本研究编制了包含13355例现代及1080例aDNA序列的综合Y染色体数据集,填补西南地区采样的关键空白,揭示父系基因组多样性、起源、迁徙及混合的详细模式。
2 结果
2.1 高分辨率Y染色体系统发育树及稳健时间估计
为构建中国及MSEA父系支系的高分辨率图谱,研究编制了5366例全Y染色体序列的全球数据集,构建最大似然(ML)树以追溯全球人群的父系人口历史。其中3618例序列覆盖约8.4 Mb高置信度基因组区域,包括来自中国14个省份多民族群体的584例新报道样本,辅以公共数据库及既往研究数据。值得注意的是,1748例MSEA序列用于探索中国与MSEA间的遗传联系,但覆盖度较低(约2.3 Mb)。重建的ML树及BEAST(Bayesian evolutionary analysis sampling tree)分析识别出138个新石器时代分化的支系及17个中国与MSEA共享的父系支系,归属于D-CTS3946、C-M130、Q-M242、R-M207、N-M231及O-M175的下游支系。这些支系呈现不同分化水平:6个具有长支及深根节点,其余11个为浅层支系。最近共同祖先时间(TMRCA)估计证实了这一观察。分析揭示约51-45千年前(kya)的主要分化事件,随后在大多数支系中出现显著瓶颈期(约10000年,45-35 kya)。此后,单倍群O从更新世晚期至全新世显示明显的多样性增加,而其他共享支系(C、D、N、Q及R)直至新石器时代才显著分支。在20000年时间尺度上,新石器时代开端(约5 kya)节点计数明显增加,与农业兴起驱动人口增长的假说一致。全新世内,节点积累速率在约5千年前显著加速(>50新节点/时间间隔),于3.5-3千年前达峰值(94个新推断的共聚事件)。这些发现提示中国与MSEA间大多数父系遗传交换发生于新石器时代,单倍群O成为两地父系基因库中的优势支系。
ML树拓扑及终端节点地理分布进一步提供这些父系系统发育关系及迁徙模式的深入认识。使用pathPhynder基于系统发育定位,将MSEA序列定位于欧亚Y染色体树的最高分辨率分支上,实现中国及MSEA高分辨率整合系统发育。观察到大多数共享支系在中国及MSEA的明显支系辐射,17个共享支系呈现总体自北向南的从中国迁徙模式,多个支系起源于中国并于不同时间点向MSEA扩散。单倍群O2a2b1a1a作为仰韶相关粟黍农民的已知支系,现广泛分布于中国及MSEA并拥有众多下游亚支系,提示早期快速扩张。许多亚支系中北方汉族及少数民族群体的上游聚类位置进一步支持这些南向扩散显著塑造了华南及MSEA父系遗传结构的假说。
2.2 中国多民族群体的父系遗传结构及塑造因素
2.2.1 遗传景观及多样性
为阐明南向扩散对华南及MSEA父系景观的遗传影响,研究通过经济高效的高分辨率微阵列方法,对7877例来自多民族群体的个体进行基因分型。样本主要来自多语言多民族多样性的华南地区。主要单倍群为O-M175(75.2%)、C-M130(8.6%)、N-M231(5.9%)、D-CTS3946(4.2%)、Q-M242(2.5%)及R-M207(1.6%)。这些单倍群分布在不同人群中显著变异。排除样本量<20的群体后,观察到单倍群O主要由O2-M122代表,在31个多民族群体中的平均频率为47.17%,在6个北方群体(平均50.68%)高于25个南方群体(平均46.33%)。C2-M217及N1-CTS3750支系在北方群体中更常见,但也出现于若干南方少数民族;O1-F265在南方群体中显著富集。D1-M174主要限于藏族群体,C1-F3393、Q-M242及R-M207零星出现,主要在北方地区。
与东南亚参考人群的比较显示,中国群体与MSEA人群共享密切遗传亲缘性及 broadly 相似的单倍群谱。尽管如此,通过Mann-Whitney U检验及Welch's t检验观察到分化模式:O1a及O2a在中国人群中更普遍,而O1b在MSEA群体中显著富集(p<0.05)。语言相关群体间的统计检验揭示这些群体的遗传亲缘性:中国与MSEA的苗瑶语系及侗台语系人群间无显著差异,支持共享起源或频繁基因流。相反,汉藏语系人群在O1a及O2a上显示变异,促成区域群体遗传分化。
为评估父系遗传多样性,研究计算了单倍群多样性(HGD)、单倍型多样性(HD)、平均配对差异(Pi)、Theta(S)、Tajima's D及Fu's FS。汉族人群,特别是北方汉族,表现出最高遗传多样性。少数民族中,西南群体呈现极化模式:部分群体如羌族及侗族具有高多样性,而其他群体显示降低的变异。边疆少数民族包括壮族、畲族及蒙古族显示相对较高多样性。这些趋势与Pi及Theta(S)一致,反映汉族群体的大有效群体规模及丰富父系遗传多样性。若干南方群体如壮族及土家族显示显著负值的Tajima's D及Fu's FS,提示近期父系扩张,特别是在沿海及西南地区。北方汉族及某些西南群体可能保留由复杂混合历史塑造的古老遗传支系。
2.2.2 多社会文化因素促成地理及语言相关的遗传结构
为深入调查东亚及东南亚群体的遗传亚结构及可能的影响因素,研究基于单倍群频率进行主成分分析(PCA)。PC1及PC2分别解释61.52%及18.46%的方差,揭示沿PC2的明显南北分化。PC2与纬度的负相关进一步强调这一空间模式(r=-0.39,p=0.034)。南北汉族群体聚类紧密,而南方少数民族显示更大遗传独特性。语言区别亦明显:北方汉语群体显示遗传同质性,南方汉语群体显示更大异质性。部分藏缅语系及苗瑶语系群体如羌族、苗族及畲族与汉族人群遗传接近,而其他群体(侗族、瑶族、毛南族)显示显著分化。尽管部分群体相对隔离,汉族与某些民族群体间观察到 substantial 遗传联系。
更广的欧亚尺度上,PCA揭示沿PC1的南北梯度及沿PC2的东西梯度,与相关分析一致。东亚及MSEA人群,特别是侗台语系、苗瑶语系及汉藏语系人群,形成密切遗传聚类,凸显其遗传亲缘性。回族人群显示区域遗传变异,提示多起源或分化混合历史。疍家人群远离南方汉语人群,可能因其孤立的海上生活方式。藏族与北方汉族及东干人群聚类,指示新石器时代共同起源或近期遗传交换。贵州瑶族维持独特遗传谱,与其历史记载的地理及文化隔离一致。总体而言,东亚及MSEA的父系遗传结构可能由共享民族起源、文化相似性、多向迁徙及地理隔离的组合塑造。
配对遗传距离(Fst)分析揭示显著的遗传亲缘及分化模式。南北汉族群体显示密切遗传关系(<0.0697),河南与重庆(0.0122)及陕西与重庆(0.0129)间观察到低Fst值。特定汉族人群与少数民族间亦见遗传亲缘,如羌族与广东汉族(0.0209)及福建疍家与海南汉族(0.0173)。相反,藏族(西藏0.1921-0.5920,四川0.1557-0.5757)、瑶族(0.1023-0.7078)及毛南族(0.0956-0.7078)与其他参考群体显示显著分化。纳入MSEA人群后,侗台语系(0.0251-0.3186)、苗瑶语系(0.0245-0.4460)及汉藏语系(0.0177-0.6101)人群间出现明显遗传联系。回族人群内区域聚类明显:海南回族与疍家及孟人群聚类,四川回族与汉族及布依族聚类。藏族与东干及北方汉族聚类,毛南族与拉瓦族及泰族聚类。
为评估驱动观察到的遗传多样性的因素,研究进行分子方差分析(AMOVA)。民族成为中国人群遗传变异的首要决定因素(8.99%),其次为海拔(6.2%)、语言(4.15%)及南北分界(4.03%;1.52%;1.04%)。南北汉族群体间遗传分化极小(0.97%),反映其高内部同质性。相反,少数民族显示相当遗传变异,海拔在其遗传结构塑造中发挥更显著作用。值得注意的是,南北少数民族间遗传变异 substantial(7.53%)。纳入欧亚参考后,东亚与东南亚人群间遗传差异 modest(5.72%),华南与MSEA人群间差异更小(4.33%)。语言多样群体中,侗台语系(6.8%)显示最低遗传分化,而苗瑶语系(9.67%)及汉藏语系(10.04%)群体显示更高遗传分化水平。这些发现强化PCA及Fst结果,强调华南与东南亚人群间的遗传同质性。
2.2.3 东亚人群的遗传结构及奠基支系
尽管既往结果凸显多民族群体间的遗传亲缘性及区别,驱动这些模式的潜在遗传机制仍不清楚。为更好理解南北汉族及汉族与少数民族间的遗传差异,研究分析了单倍群频率变异。使用0.05分化阈值识别高度分化单倍群(HDHs)。区分南北汉族的HDHs中,北方支系如C2、N1及O2a亚支系更普遍,南方汉族显示更高频率的下游O2a1b及O2a2b支系(如O2a2b1a1a1a)。相反,少数民族携带独特单倍群,特别是O2a2a1a2a1a1及O1b1a1a1a1b。这些HDHs凸显秦岭-淮河线等地理障碍及文化认同在驱动汉族与少数民族群体遗传分化中的作用。
进一步分析揭示支系分布与语言群体的关联。藏缅语系及北方起源的汉语群体显示O2a变异,而南方侗台语系及苗瑶语系人群携带O1b及O1a衍生支系。苗瑶语系人群中O2a2a1a2a1a1a1及O2a2b1a1a1c1a1a1a的升高频率可能解释其与汉族在PCA中的密切亲缘性。这些发现强调父系支系与语言归属间的强相关性。
为探索这些HDHs的分布及演化模式,研究构建中值连接(MJ)网络图。MJ网络揭示侗台语系人群中O1b1a1a1a1a1a及苗瑶语系人群中O2a2a1a2a1a1的星状扩张。关键突变的系统地理分析,选取O1b1a1a1a1a1a-F2758的1852例样本及O2a2a1a2a1a1-F1275的3389例样本,识别这些支系在西南沿海及内陆地区最普遍,优化热点分析确认这些区域为可能起源地。与纬度的显著负相关进一步支持这些支系南方扩张中心的假说。纳入MSEA低分辨率单倍群数据(国家级汇总)时,热点进一步延伸至MSEA。鉴于该区域涉及东亚祖源的文献记载遗传更替,这一模式可能进一步提示近期自华南向MSEA的南向迁徙。这两个单倍群因此成为侗台语系及苗瑶语系群体的奠基支系。
2.3 东亚及东南亚古代人群的最高分辨率Y染色体系统发育
某些东亚及东南亚群体间遗传分化明显;然而,南北汉族群体间、汉族与少数民族间及东亚与东南亚人群间仍维持 substantial 联系,如PCA、Fst及AMOVA分析所示。此外,系统发育树拓扑、遗传多样性及单倍群频率分析一致指示南方汉族及若干少数民族的古老北方起源,中国南方人向MSEA父系构成的显著遗传贡献。研究使用单一大规模整合aDNA数据集,绘制东亚与东南亚人群间共享单倍群的时空分布以检验该假说。此外,使用完全解析的现代东亚ML系统发育框架,重建迄今最高分辨率的东亚及东南亚古代人群Y染色体系统发育。古代东亚Y染色体系统发育拓扑显示与现代人群相似的模式,提供现代与古代东亚及东南亚人群间的直接时空联系。结果识别出古代个体或整合古代及现代MSEA群体中多个奠基支系的北南向迁徙信号。
例如,广泛视为黄河流域早期农民代表的O2a2b1a1a,在距今5662年的仰韶村遗址中被识别。其后代随后向北扩张至蒙古,向西至西北中国,向南至青藏高原,并进一步进入泰国。其他广泛支系如O2a2b1a2a,最初于5300-3250年前呈现于黄河流域,后抵达青藏高原及越南(2789-1430年前)。相反,现今MSEA普遍的单倍群如O1a、O1b1a1a1及O2a2a1a2,显示与自长江流域南向迁徙一致的模式,如良渚、吴城及大溪的发现所示。此外,O2a1b1a1a1a1及O2a2b2的最早实例发现于山东,而属于C2b1b1及N1b2支系的古代个体主要发现于庙子沟遗址及青藏高原。这些时空模式为多次南向迁徙波提供 robust 证据。
为更好理解这些迁徙的影响,研究使用时空数据及既往研究,识别与生计策略相关的东亚及MSEA人群共享单倍群。C2b1a、C2b1b1、D1a1a1a1、D1a1b1a、N1b2、O1a1a2、O1b1a2、O2a1b1a1a1a1、O2a2b1a1a、O2a2b2及Q1a1a被归类为粟黍农业考古背景相关支系,而O1a1a1、O1b1a1a1a1、O1b1a1a1b、O2a1b1a2a、O2a2a1a2a1及O2a2b1a2a被归类为稻作农业考古背景相关支系。北方粟黍农业相关支系在中国人群中广泛分布,北方汉族个体平均频率为49.73%。相反,稻作农业相关支系在华南占主导。此外,西伯利亚狩猎采集考古背景相关支系对北方及西南中国群体遗传构成有显著贡献,而西欧亚游牧考古背景相关支系存在更有限。如预期,稻作农业相关单倍群在MSEA最常见(32/37,>25%)。值得注意的是,部分群体显示北方粟黍农业相关支系的升高频率,如越南的Sila、Hanhi及Lachi(>69%),泰国的Karen、Shan及Nyahkur(>50%)。
相关分析揭示显著地理分布模式:粟黍农业相关单倍群与纬度正相关,而稻作农业相关支系与纬度负相关。同时,狩猎采集及游牧相关支系亦与地理坐标显著相关,但方向相反:前者与经度正相关,后者与经度负相关。然而,此类相关反映地理关联而非因果关系。将所有可用数据整合为基于单倍群分配及地理位置的8个元群体后,新石器时代农民对东亚的遗传贡献更加显著。北方汉族及少数民族主要携带粟黍农民相关支系,同时显示北扩稻作农民及其他狩猎采集者的显著影响。相反,南方汉族及少数民族主要继承稻作农业支系,但似乎亦与南扩粟黍农民混合。这些新石器时代农业群体进一步塑造了古代及现代MSEA人群的遗传景观。这些发现提示北方粟黍农业群体的初始南迁影响南方东亚人的父系遗传结构,随后南北农民的进一步南迁运动贡献了MSEA群体的当前父系遗传景观。
3 讨论
3.1 南北东亚人群间人口交流的父系证据
3.1.1 汉文化的人口扩散
人类父系基因组资源在民族语言多样的东亚及东南亚人群中严重 underrepresented。本研究使用包含584例全Y染色体序列、7877例高密度基因分型谱及5974例现代及古代欧亚参考基因组的整合数据集,重建东亚及MSEA的父系遗传历史。该整合数据集填补西南地区采样的关键空白,揭示父系基因组多样性、起源、迁徙及混合的详细模式。研究重建了民族语言多样东亚及东南亚人群的高分辨率Y染色体系统发育,并使用多种统计方法探索其遗传亲缘性,揭示这些群体间的精细父系遗传结构。研究还报道了纳入古代东亚基因组的全解析ML树,提供东亚及东南亚农民间深层系统发育关系的精细解析。
汉文化的扩张引发了人口扩散与文化扩散模型间的长期争论。历史记录记载多次汉族相关南向迁徙,由北方战争及饥荒驱动。三次主要迁徙,包括永嘉之乱(西晋,公元265-316年)、安史之乱(唐朝,公元618-907年)及靖康之变(南宋,公元1127-1279年),涉及逾600万移民。过去两千年来小规模迁徙亦持续发生。这些历史记载强烈支持人口扩散模型,本研究的遗传发现 corroborate 该模型。结果显示汉族人群,特别是北方汉族,较少数民族具有更高遗传多样性,提示更深祖先根源及更大混合。这与既往mtDNA研究 contrast,后者提示南方汉族更高多样性。单亲遗传多样性的对比模式可能反映性别偏倚的人口过程。北方汉族较高的Y染色体多样性可能源于黄河流域重复的男性驱动扩张及大有效群体规模。相反,南向迁徙过程中的连续奠基者效应降低了南方汉族群体的父系多样性。
东亚人群的PCA揭示南方汉族群体与北方汉族聚类比与南方少数民族更密切,在更广的欧亚尺度上这一趋势更明显。此外,南北汉族群体间Fst值低,显著低于汉族与大多数少数民族间观察值。AMOVA分析显示南北汉族群体间遗传分化极小(0.97%),与mtDNA发现一致。尽管南北汉族群体在单倍群水平 slight 遗传分化,共享的上游单倍群(如O2a1b、O2a2b)强调其父系同质性。此外,aDNA及生计策略相关单倍群的时空分布凸显粟黍农业迁徙及与南方稻作农业群体互动在塑造汉族遗传景观中的作用。这些发现证明人口扩张驱动显著迁徙及混合,促进汉文化传播,与重建的侗台语系语言系统发育从中国及MSEA的扩散及分化模式一致。
3.1.2 南方稻作农业者的作用及发展
尽管北方中国被公认为粟黍农业及汉文化的发源地,南方中国被视为稻作农业的摇篮。一万多年前,长江中下游早期农民启动稻作驯化,奠定华南文明发展的基础。这些早期稻作农民可能影响若干东亚及东南亚人群,包括苗瑶语系、南亚语系、侗台语系及南岛语系群体。值得注意的是,近期aDNA证据显示,长江稻作农民与新石器时代至现代东南沿海及南岛语系中国人群遗传密切亲缘,指示后者从长江流域 derive 大部分祖源,反映稻作农业者在华南的深刻人口影响。然而,华南人群的精细父系遗传结构仍 underexplored。
为填补这一空白,研究纳入来自 underrepresented 西南及沿海地区的广泛少数民族采样,识别作为稻作农民初始奠基支系及 incoming 粟黍农民支系的若干O1/O2相关亚支系。PCA及Fst分析揭示语言多样的南方少数民族倾向于聚类,提示Y染色体变异与语言归属间的强相关性。其中,藏缅语系及苗瑶语系人群与汉族显示更近遗传关系,提示可能的历史遗传互动。相反,更隔离的群体如贵州瑶族及毛南族及藏族显示更遗传独特,可能由于地理隔离或独特起源。AMOVA结果证实南方少数民族内的遗传异质性。华南负值的Tajima's D及Fu's FS指示近期父系扩张。分析识别两个关键奠基父系支系:O1b1a1a1a1a1a-F2758(侗台语系)及O2a2a1a2a1a1-F1275(苗瑶语系)。生计策略相关单倍群模式进一步揭示北方粟黍农民对西南少数民族的更大影响及沿海群体中稻作农业支系的更 substantial 存在,与近期古代基因组证据一致。高原少数民族如藏族显示粟黍农业及其他复杂基因流的遗传影响。这些发现提示华南少数民族可 broadly 分为三个遗传聚类:南方沿海少数民族(侗台语系)、西南少数民族(苗瑶语系)及高原少数民族(藏缅语系)。
3.2 新石器时代东亚农民与东南亚人群的父系遗传联系
来自aDNA、考古学、语言学、常染色体DNA及mtDNA的遗传证据提示,源自东亚的两次主要农业扩张在新石器时代及之后显著塑造了东南亚人群的遗传结构。这些扩张影响侗台语系、苗瑶语系、南亚语系及南岛语系人群,提出重要问题:哪些父系支系贡献了这些遗传贡献,程度如何?本研究纳入新采样的侗台语系、苗瑶语系及藏缅语系人群及欧亚参考数据,提供 robust 框架以 address 该问题。结果为支持古代中国农民与现代MSEA人群间直接父系遗传联系提供 compelling 证据。
尽管MSEA数据覆盖度较低,17个支系的共享单倍群指示显著遗传连续性,单倍群O反映更新世及新石器时代的遗传交换。5千年前以来的扩张事件集中可能提示新石器时代农业扩张的潜在影响。约3.5千年前支系扩张的急剧增加进一步与农业生产系统改善、社会复杂性增加及青铜时代国家形成驱动的人口增长一致。系统地理分析揭示广泛的支系辐射,北南向 dispersals 占主导。若干支系显示区域特异性,展示东亚及MSEA间共享祖源及局部分化的并存。值得注意的是,MSEA样本覆盖度较低,含较少信息性SNPs,可能在某些情况下使定位偏向上游节点并降低终端水平的系统发育分辨率。因此,解释聚焦于 robust 的支系水平趋势而非精细终端亚结构。
基因分型数据进一步凸显东亚与东南亚群体间的 striking 遗传相似性,特别是侗台语系及苗瑶语系人群,与近期语言及遗传研究一致。生计策略相关单倍群分布显示,MSEA人群显著受南方稻作农民相关父系支系影响。然而,北方粟黍农民亦对若干东南亚群体的遗传构成有 substantial 贡献。这些发现强调新石器时代南方稻作农民及北方粟黍农民在塑造MSEA人群父系遗传遗产中的双重影响。
4 结论
本研究检测了14435例个体(主要来自东亚)的MSY变异,聚焦东亚及MSEA。通过重建时间校准的现代东亚人高分辨率Y染色体系统发育,提供东亚人群深层演化历史的新见解。研究还呈现了迄今最高分辨率的东亚及东南亚古代人Y染色体系统发育,实现对 Neolithic 中国农民与现代及古代MSEA人群间父系联系的详细探索。结果识别中国内部的精细父系遗传结构,强调汉文化及新石器时代农业技术的人口扩散模型。研究表明,华南遗传景观显著受北东亚人口南迁影响,随后南北新石器时代农民间的进一步互动及迁徙塑造了MSEA的父系构成。