Benchmarking KinSNP?:一项关于法医应用中遗传关系预测的研究
《Forensic Science International》:Benchmarking KinSNP?: A Study on Genetic Relationship Prediction for Forensic Applications
【字体:
大
中
小
】
时间:2026年02月17日
来源:Forensic Science International 2.5
编辑推荐:
准确的家系推断是法医DNA分析的核心,尤其在无直接参考样本或样本链 custody不明确的情况下。本研究通过12人已知家系(关系延伸至第6代)的SNP全基因组数据,对比KinSNP?、GEDmatch PRO?和Shared cM Project 4.0工具的性能。结果显示KinSNP?在7cM阈值下正确识别82%的近亲关系(1-4代)和12%的次亲关系(5-6代),当阈值提升至12cM时假阳性率降低但灵敏度基本保持。该工具在降解样本、STR无法获取的情境下具有实用价值,但远亲关系(≥5代)预测准确性不足。
R. Daniel|J. Raymond|A. Sears|N. Scudder|D. Hartman
澳大利亚维多利亚州维多利亚法医医学研究所
摘要
准确的亲缘关系推断是法医DNA分析的基石,特别是在没有直接参考样本且生前样本缺乏可靠保管链的情况下,涉及无法识别的人类遗骸的案件中。本研究评估了Othram公司开发的法医软件工具KinSNP?使用全基因组单核苷酸多态性(SNP)数据预测遗传关系的性能。我们使用了一个关系明确的家庭群体(12名个体),其亲属关系可追溯至第六代,将KinSNP?与GEDmatch PRO?和Shared cM Project 4.0工具进行了对比测试。使用真实的家谱数据是对之前使用合成数据评估该软件的研究的补充。
[1] 在66对比较中,通过7和12厘摩(cM)的共享阈值来评估亲缘关系预测。KinSNP?在最高预测关系类别中正确识别了82%的已知关系,在第二高预测关系类别中正确识别了另外12%的关系,显示出与现有工具相当的准确性。然而,对于远亲关系(≥第五代),预测置信度下降,并且在不相关的个体之间观察到了虚假匹配,尤其是在较低的cM阈值下。但是,将最小阈值提高到12厘摩可以减少误报,同时不会影响对近亲关系的敏感性。KinSNP?是安全桌面应用程序SNPSuite的一部分,该应用程序用于高级基于SNP的DNA分析,其中提供的工具还可以准确预测生物性别和生物地理祖先,与自我报告的数据一致。尽管样本群体相对较小,但这些发现进一步证明了KinSNP?作为法医环境中基于SNP的亲缘关系分析的安全、离线解决方案的实用性,包括灾难受害者识别和长期失踪人员调查,这些情况下无法获得STR谱型,或者没有直接或近亲的STR参考样本进行比较。
引言
确定身份是法医调查的基本目标,它支撑着解决核心调查问题:谁、什么、哪里、何时以及为什么。在犯罪背景下,通常通过将现场DNA证据与已知个体的参考谱型进行比较,或通过查询执法机构的DNA数据库来确定身份。在没有直接匹配的情况下,可以通过亲缘关系分析来推断身份——即将DNA谱型与失踪者的生物亲属的DNA谱型进行比较。同样,未知人类遗骸的识别通常依赖于将死者的DNA证据与DNA数据库中保存的失踪者的生物亲属的DNA谱型进行比较[2]、[3]、[4]。
亲缘关系的确定基于这样一个原则:具有遗传关系的个体共享的DNA片段比例与他们的亲缘关系程度相关[5]。这种方法在大规模灾难受害者识别和通过家族搜索识别潜在候选人方面证明了其无价的价值;法医调查遗传谱系学(FIGG)还可以进一步帮助重新确定嫌疑人范围[6]。历史上,法医亲缘关系分析依赖于短串联重复(STR)标记,因为它们在识别近亲关系方面具有高变异性和有效性。然而,法医面板中通常使用的STR位点数量有限(且突变率相对较高),这限制了它们仅适用于直系亲属关系的应用[7]。在法医DNA分析中使用单核苷酸多态性(SNP)扩大了亲缘关系推断的范围,根据所使用的SNP数量,可以检测到近亲和更远亲的关系[8]。由于SNP在整个基因组中的密度较高且突变率较低,它们能够检测到在更远亲中发现的稀疏的遗传身份(IBD)片段[9]、[10]。结合大规模并行测序/基因分型能力和改进的统计框架[11],SNP在扩展亲缘关系确定方面比STR具有显著优势。
一旦确定了家族线索,通常通过直接的STR比较来确认身份。然而,在某些情况下——例如大规模灾难中严重降解的遗骸或长期失踪人员案件——获取可行的STR谱型和/或合适的参考样本可能不可行[12]。虽然线粒体DNA和Y-STR分析可以提供特定血统的见解,但这些方法受到遗传模式的限制,当没有母系或父系参考样本时可能不适用。SNP由于在基因组中的丰富性和较小的片段大小,扩展了降解样本的分析方法范围,通常是在这些情况下基于亲缘关系识别的唯一可行选项[13]。在STR谱型生成不可用的情况下,直接的SNP到SNP比较可以作为确定身份的主要证据基础。然而,需要进一步的工作来验证此类比较得出的关系预测和身份结论,以符合法医环境中的使用标准[14]、[15]。
正如Budowle等人[1]所概述和验证的那样,KinSNP? v1.0是由Othram公司开发的一种软件工具,可以从密集的全基因组SNP数据中可视化亲缘关系关联,同时保护遗传隐私[16]。它支持多种基因型输入(例如,微阵列、WGS),并将它们统一到GRCh37坐标,从而实现无需相位校正的IBD检测,其中半相同(HIR)和完全相同(FIR)区域可以直接从非相位SNP数据中推断出来。为了确保在低质量法医样本中也能稳健地检测片段,KinSNP?应用了保守的算法假设——要求最低SNP和厘摩阈值,并允许合并由单个不匹配SNP分隔的片段,以减少基因分型错误或数据丢失。厘摩(cM)值是使用GRCh37位置和HapMap II遗传图谱进行cM插值得出的,这与基于IBIS的工作流程一致[1]。KinSNP?将比较限制在两个样本中都有基因型 calls的位点上,这种方法即使在没有大量数据缺失的情况下也能保持准确性。共享的DNA使用加密的Skyline图进行量化和可视化,以保护敏感的基因组信息,亲缘关系推断结合了共享片段指标、生物性别和Shared Centimorgan Project参考数据,生成适合包含在证据摘要中的综合PDF报告。
本文评估了KinSNP?在法医应用中的准确性、可靠性和实用性,特别是在传统方法可能不够充分的情况下。为了补充Budowle等人[1]验证中呈现的模拟关系,该工具的关系预测针对一个已知家庭群体进行了测试,该群体的亲属关系可追溯至第六代(远房表亲,2C1R),这一群体在之前的研究中已经进行了描述[17]。先前的研究表明,虽然合成数据有助于评估亲缘关系的准确性,但真实家谱提供了模拟无法提供的验证,因为它们捕捉到了难以在计算上建模的生物学上的真实变异[18]、[19]。通过使用详细描述的家谱来验证亲缘关系预测工具,可以更严格地评估它们在操作条件下的性能,特别是对于超过第二代的扩展或复杂关系。
本研究旨在提供更多数据,以验证该软件在近亲和远亲关系中的亲缘关系预测用途,涵盖以下用例:
1.当无法从严重降解的遗骸中生成STR谱型时,使用SNP进行近亲关系的亲缘关系预测,
2.当无法获得近亲进行比较时,使用SNP进行更远亲关系(超过第二代)的亲缘关系预测。
章节片段
样本选择
一个由12名个体组成的家庭群体(样本S1至S12),其亲属关系在图1中有所描绘,之前已经进行了研究并生成了SNP谱型[17]。对于本研究,之前生成的SNP谱型的使用得到了维多利亚法医医学研究所(VIFM)伦理委员会的批准,项目编号为1268。批准过程包括对志愿者样本的数据存储和分析以及隐私和伦理问题的考虑。
不同工具和阈值下的共享厘摩(cM)
在家庭群体内的66对比较中,GEDmatch PRO和KinSNP?对近亲的共享cM总数基本一致。使用7厘摩的阈值,两种工具在第一至第三代关系中的平均共享cM百分比差异为1-3%,在第四至第五代关系中增加到约4%,而在唯一的第六代关系对(S1–S12;2C1R)中为7%(图2)。这种模式表明,随着亲缘关系的降低,片段共享的方差增加。
讨论
本研究评估了SNPSuite中可用于SNP基于DNA分析的工具的性能。KinSNP?使用SNP数据预测遗传关系,并将其准确性与GEDmatch PRO?和Shared cM Project 4.0工具进行了对比。在一个关系明确的家庭群体[17]内的34对比较中,KinSNP?在两个最高预测概率范围内正确预测了94%的已知关系——在最高概率范围内为82%,在第二概率范围内为12%
结论
使用一个已知的家庭群体进行了66次关系比较,KinSNP?成功预测了预期的关系,特别是第一至第四代亲属的关系。然而,对于一些更远的关系(第五代或更高),在最高预测概率范围内没有观察到正确的关系(2C、2C1R、1C2R、GG-Aunt)。这些发现与使用GEDmatch PRO?和Shared cM Project 4.0工具的结果一致。
写作过程中生成式AI和AI辅助技术的声明
在准备这项工作时,作者使用了Microsoft Copilot来提高手稿的清晰度、语法和可读性。使用该工具后,作者根据需要审查和编辑了内容,并对发表文章的内容负全责。
利益冲突声明
作者声明以下财务利益/个人关系可能被视为潜在的利益冲突。Jennifer Raymond报告称设备、药物或用品由Othram Inc.提供。如果有其他作者,他们声明没有已知的财务利益或个人关系可能影响本文报告的工作。
致谢
作者衷心感谢维多利亚法医医学研究所、新南威尔士警察部队、澳大利亚联邦警察以及Othram的支持,以及各机构之间的合作精神,共同努力推进新能力的评估,以改进法医技术。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号