《Forensic Science International: Genetics》:An evaluation of ForenSeq DNA Signature Prep iiSNP mixture interpretation using a probabilistic genotyping method
编辑推荐:
本研究针对法医DNA混合样本解释中SNP标记的应用难题,评估了STRmix? NGS模型在ForenSeq DNA Signature Prep试剂盒94个iiSNP位点混合样本解释中的适用性。研究人员通过验证模型假设(杂合平衡、位点特异性扩增效率、等位基因可加性)后,系统分析了87个样本的LR赋值表现。结果显示该框架可有效解释简单SNP图谱,但在复杂混合物中区分真假供体的能力随位点多样性限制而快速下降,为SNP-STR联合解释奠定了方法论基础。
在法医DNA分析领域,毛细管电泳技术分析常染色体短串联重复序列(STR)仍是全球主导方法。然而,随着下一代测序(NGS)技术的普及,科学家们能够同时扩增包含STR和单核苷酸多态性(SNP)的大规模位点面板,这带来了多重优势。与高度多态性的STR不同,大多数SNP是二等位基因标记,单个SNP提供的证据价值虽不及STR,但其混合样本解释计算更简单——不产生stutter假象且基因型组合更少。随着SNP在亲缘分析、祖先推断、表型特征预测等应用中价值凸显,如何将成熟的STR概率基因分型方法适配于SNP数据成为关键科学问题。
目前美国、英国和大洋洲地区最常用的常染色体STR(aSTR)解释方法已基于概率基因分型技术。本研究创新性地将经过验证的STRmix? NGS模型(原用于NGS生成的aSTR图谱)应用于SNP混合样本解释,重点评估其对ForenSeq DNA Signature Prep试剂盒中94个身份信息SNP(iiSNP)的解释效能。
关键技术方法包括:1)使用356个单源样本验证SNP杂合平衡的log-正态分布特性;2)基于214个样本计算位点特异性扩增效率(LSAE)先验参数;3)通过最大似然估计法验证等位基因读长计数可加性假设;4)对87个ForenSeq样本(含单源/二元/三元混合物)进行STRmix? NGS解释,以似然比(LR)评估系统区分真假供体的能力。
3.1 杂合平衡
通过10,965个杂合位点分析显示,log(Hb)的方差随平均读长计数降低而增加,94.42%观测值落在95%可信区间内,证实SNP杂合平衡行为与序列STR一致(图1)。
3.2 位点特异性扩增效率
20个随机SNP的扩增效率分布显示显著位点间差异(p<2.2×10-16),支持在连续模型中采用位点特异性先验(图2)。
3.3 SNP建模与可加性
单拷贝与多拷贝等位基因信号的log(O/E)分布验证了读长计数可加性假设(图3)。t检验显示多拷贝信号无显著偏差(p=0.6007),单拷贝信号虽显著但效应量极小(Cohen’s d=0.0695),证明模型可靠性。
3.4 SNP图谱解释
单源样本LR呈现预期趋势,但二元/三元混合物中非供体LR在log10LR=0附近分散(图4)。与aSTR结果对比显示,82.4%供体STR-LR高于SNP-LR,97.05%非供体STR-LR低于SNP-LR,证实SNP面板区分能力较弱(图5)。证据效率损失(WL(E|Ks))分析表明SNP平均损失较aSTR高9.4 bans(p<2.2×10-16),且随混合物复杂度增加而加剧(表2)。
研究结论表明,STRmix? NGS框架可扩展至SNP标记解释,但二等位SNP的固有局限性导致复杂混合物解释能力下降。通过验证模型假设与系统性能评估,本研究为SNP概率解释提供了方法论支持,同时指出扩大SNP面板数量(如499个SNP替代22个STR)、开发SNP-STR复合标记或微单倍型分析是未来突破方向。该成果发表于《Forensic Science International: Genetics》,为法医遗传学混合样本解释提供了新的技术路径,尤其在STR信息不足的特殊场景中具有应用潜力。