原始微单倍型检测面板及其扩展版本在巴西人群和混血美洲人群中用于人类身份识别与祖先推断的比较评估

【字体: 时间:2026年02月12日 来源:Forensic Science International: Genetics 3.2

编辑推荐:

  本研究首次利用高深度全基因组测序数据,在巴西高混合种群SABE队列中应用微单倍体(MH)技术,开发并评估了MH-Plus扩展面板的性能,发现其优于传统STRs和MH-Base面板,尤其在混合样本分析和祖先推断方面表现更优,验证了前期研究结果,为拉美人群的forensic和人类学应用奠定了基础。

  
卢西埃伦·达维拉·贾科梅尔·科巴丘克(Luciellen d’Avila Giacomel Kobachuk)、维托尔·马塞乌斯·索亚雷斯·莫拉埃斯(Vítor Matheus Soares Moraes)、雅克琳·Y.T. 王(Jaqueline Y.T. Wang)、维克托·雨果·卡莱加里·德托莱多(Victor Hugo Calegari de Toledo)、玛丽亚·丽塔·帕索斯·布埃诺(Maria Rita Passos Bueno)、耶达·A.O. 杜阿尔特(Yeda A.O. Duarte)、玛雅娜·扎茨(Mayana Zatz)、米歇尔·S. 纳斯拉夫斯基(Michel S. Naslavsky)、埃里克·C. 卡斯特利(Erick C. Castelli)、塞尔索·特谢拉·门德斯-琼尼奥尔(Celso Teixeira Mendes-Junior)
圣保罗大学(USP)里贝朗普雷图医学院遗传学系

摘要

微单倍型(Microhaplotypes)是一种新兴的遗传标记类型,由紧密连锁的等位基因组合中的单核苷酸多态性(SNPs)组成,通常长度不超过300个碱基对(bp)。通过下一代测序技术进行分析时,它们被认为是处理混合样本和降解DNA的复杂法医案件中替代传统短串联重复序列(STRs)的有前景的方法。本研究首次应用微单倍型分析方法,对来自巴西圣保罗市高度混合人群(SABE队列)的1,165名个体的基因型进行了分析。这些数据来源于使用Illumina HiSeq X测序平台进行的目标覆盖率为30×的全基因组测序(WGS)数据集。我们评估了原始的130个微单倍型面板(MH-Base)的性能,并通过向MH-Base位点添加额外的SNPs开发了一个扩展面板(MH-Plus),以提高标记的信息量。我们对两个面板的法医参数和祖先推断准确性进行了评估,并将其与其他之前应用于同一队列的基因组标记集进行了比较,包括高密度SNP数据集。此外,我们还研究了这两个MH面板在1000基因组计划(1000 Genomes Project)中的美洲混合人群(AMR populations,包括ACB、ASW、CLM、MXL、PEL、PUR)中的表现。MH-Plus在所有法医参数上均优于MH-Base。在巴西人群和最近混合的美国人群中,MH-Plus在混合成分分离(CPD)和祖先比例(CPE)方面的表现更为出色。MH-Base面板提供的祖先估计结果与SABE队列(四亲模型)和AMR人群(三亲模型)中的WGS参考值更为吻合。此外,MH-Base面板在SABE队列中获得的结果验证了之前在另一个混合巴西人群(里贝朗普雷图-圣保罗)中进行的研究结果,该研究使用基于阵列的方法和推断工具对相同位点进行了基因分型。因此,本研究有助于建立一个基于微单倍型的稳健框架,用于混合拉丁美洲人群的法医和人类学应用。

引言

毛细管电泳(CE)用于分析短串联重复序列(STRs)是全球法医实验室中最广泛采用的人类识别方法。CE技术的普及、成熟的实验方案、商业试剂盒的开发、用于报告结果的标准化统计方法,以及与包含数百万条STR谱型的全球数据库的整合,都是其持续使用并被公认为法医DNA分析黄金标准的原因[1]。然而,由于STRs具有重复序列结构、高突变率、较短等位基因的优先扩增以及相对较大的扩增子大小,它们在分析降解DNA和复杂混合样本时可能存在局限性,有时使得这类分析难以实施[2]。
下一代测序(NGS,也称为大规模并行测序(MPS)技术的进步,使得新型遗传标记得以发现,这些标记在人类识别和复杂法医案件中具有潜在应用价值[3]。NGS方法能够直接对单个DNA链进行测序,当SNPs位于同一扩增片段中时,可以明确区分亲本单倍型[4]。这项技术允许分析微单倍型标记(MHs),即两个或多个紧密连锁的单核苷酸多态性(SNPs)组成的单倍型块,其长度通常不超过300个碱基对[5]。这些标记结合了短串联重复序列(STRs)的关键优势,如多等位基因性和高区分能力,同时克服了STR分析中的多个局限性。与STRs不同,微单倍型不会产生卡顿现象,突变率较低,且在同一位点没有等位基因的优先扩增——这些特点使它们特别适合分析降解DNA、亲缘关系分析和复杂混合物[4]、[6]、[7]、[8]。此外,微单倍型在祖先推断方面表现出色,因为许多微单倍型在不同人群中的等位基因频率存在显著差异[9]、[10]。
鉴于科学界对微单倍型的兴趣日益增加,以及人类基因组中SNP位点的高密度分布,近期有许多研究致力于发现新的、高度多态性的微单倍型标记。已有超过400个微单倍型被描述,并公布了其人群和法医参数[11]。其中最广泛研究的面板是由Kidd等人(2017年)提出的130个微单倍型,该面板已在80多个全球人群中得到验证。这一面板在人类识别、祖先推断以及不同人群中复杂DNA混合物的分离方面展现出强大潜力[7]、[12]、[13]。
提高微单倍型(MHs)的信息量并使其更接近短串联重复序列(STRs)的一种策略是在给定位点发现额外的SNPs和单倍型[14]。针对稍大但仍然较短且不易降解的基因组区域进行测序,可以在保持与降解法医样本兼容性的同时增加标记的信息量。因此,为了在不显著增加位点大小的情况下提高信息量,开展基于人群的研究以识别全球调查中未捕捉到的变异位点至关重要。
尽管涉及微单倍型的人群研究数量不断增加,但关于巴西人群的数据仍然有限,这给法医遗传学中新技术的应用带来了挑战。巴西人群在过去半个世纪中经历了美洲原住民(NAM)、欧洲(EUR)和非洲(AFR)血统的复杂混合过程,最近还受到了东亚(EAS)人群的影响[15]、[16]。鉴于巴西的广阔领土范围,历史上的领土占领过程在全国各地是异质的。因此,不同地理区域的祖先贡献存在显著差异,这凸显了进行区域特定研究以捕捉这些人口和遗传差异的重要性[17]。
首次将微单倍型面板应用于混合巴西人群的研究最近已发表。该研究使用了由SNP阵列和推断方法分析的130个微单倍型[18]。为了验证和扩展这些发现,本研究采用了相同的微单倍型面板,并使用高覆盖率的下一代测序数据对来自圣保罗市(SABE队列)的另一个高度混合人群进行了分析。本研究旨在为两个面板提供全面的法医参数和祖先推断分析,并将其性能与其他之前应用于同一人群的遗传标记集进行比较,包括具有祖先信息的SNP面板和高密度SNP数据集。此外,我们还旨在评估这两个MH面板在1000基因组计划中的最近混合人群中的表现,从而扩展比较范围,涵盖多种生物地理背景。这种综合方法为微单倍型在高度混合人群(如巴西人群)中的人类识别和祖先推断的应用提供了新的见解。

数据集

分析使用了来自“健康、福祉与老龄化队列”(Saúde, Bem-Estar – SABE)的1,165名巴西个体的BAM文件。SABE是一项基于人口普查的纵向研究,研究对象是居住在巴西圣保罗市的高度混合的老年人。SABE队列中的所有参与者都签署了书面同意书,同意参与测序研究,这些研究得到了当地和国家机构审查委员会的批准:COEP/FSP/USP OF.COEP/23/10、CONEP 2044/2014等

巴西人群的法医和人口参数

在圣保罗市(SABE)的1,165名个体中,共对代表MH-Base和MH-Plus集合的128个微单倍型进行了基因分型。两个面板的单倍型频率数据分别见补充表S2和S3。补充表S4(MH-Base)和S5(MH-Plus)提供了每个位点的详细信息,包括染色体位置、SNPs和单倍型数量、有效等位基因数量(Ae)以及分配信息量(In)等

讨论

在之前的研究中,我们首次证明了使用通过阵列基因分型和推断方法获得的SNPs,将全球微单倍型面板应用于混合巴西人群的可行性[19]。该研究评估了Kidd等人(2017年)提出的128个微单倍型在巴西圣保罗州里贝朗普雷托样本中的表现,证实了微单倍型位点在巴西背景下用于法医应用和祖先推断的高信息量。这些结果为

结论

本研究首次利用高覆盖率全基因组测序数据,为高度混合的巴西人群提供了基于微单倍型的法医参数估计和祖先推断结果。MH-Plus在法医参数方面显示出一致且显著的改进,包括累积排除能力和区分能力,无论是SABE队列还是1KG最近混合样本。MH-Base面板在祖先推断方面与WGS参考值的吻合度略高

资金来源的作用

资金来源未参与研究设计、数据收集与分析解释、报告撰写,也未参与决定文章的发表

未引用的参考文献

[41]

CRediT作者贡献声明

塞尔索·特谢拉·门德斯-琼尼奥尔(Celso Teixeira Mendes-Junior):撰写——审阅与编辑、监督、项目管理、方法论、概念构思。埃里克·C. 卡斯特利(Erick C. Castelli):撰写——审阅与编辑。米歇尔·S. 纳斯拉夫斯基(Michel S. Naslavsky):撰写——审阅与编辑。玛雅娜·扎茨(Mayana Zatz):撰写——审阅与编辑。杜阿尔特·耶达·A. O.(Duarte Yeda A. O.):撰写——审阅与编辑。玛丽亚·丽塔·帕索斯·布埃诺(Maria Rita Passos Bueno):撰写——审阅与编辑。维克托·雨果·卡莱加里·德托莱多(Victor Hugo Calegari de Toledo):撰写——审阅与编辑。雅克琳·Y.T. 王(Wang Jaqueline Y.T.):撰写——审阅与编辑。维托尔·马塞乌斯·索亚雷斯(Vítor Matheus Soares):

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作

致谢

本研究部分由巴西高等教育人员培训协调委员会(CAPES)资助(资助代码001.C.T.M.J. (#310016/2022-3) 和 E.C.C (#307031/2022-5),并得到了巴西国家研究委员会(CNPq)的研究奖学金支持(项目编号#2013/15447-0)。作者还感谢CAPES-PROCAD(项目编号#88887.516236/2020-00 和 #88881.516238/2020-01)的资助。

利益冲突声明

作者声明没有
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号