基于单细胞电泳图的精子单倍体数据模型:以显著性-合法性-可信度框架评估法医应用价值

《Forensic Science International: Genetics》:Salience, legitimacy and credibility of single-cell sperm data and their evaluation

【字体: 时间:2026年03月02日 来源:Forensic Science International: Genetics 3.2

编辑推荐:

  研究推荐:在法医DNA混合样本分析中,难以确定精子捐献者人数、身份及精子数量。本研究将此前为二倍体细胞开发的单细胞电泳图(scEPG)概率模型扩展至单倍体(精子)数据,并集成到EESCItTM系统。研究利用显著性-合法性-可信度(SLC)框架评估该单细胞精子分析系统。结果证实模型具有良好的保真度与校准性,能够准确估计精子捐献者数量、对每个捐献者的精子进行正确聚类,并计算稳健的证据权重(WoE)。该系统不依赖于实际贡献者数量,展现出单细胞数据独特的鲁棒性,为精子细胞DNA分析从研究走向实践提供了有力工具。

在传统的法医DNA分析中,实验室人员通常从包含未知数量细胞的混合物中提取DNA,进行短串联重复序列(STR)扩增和电泳分析,最终得到一张混合了未知数量贡献者(有时是部分贡献)DNA信号的单一电泳图。这种方法有两个固有的短板:其一,混合裂解细胞可能导致姐妹染色单体分离,造成等位基因完全丢失(即drop-out);其二,无法将DNA与特定的细胞类型(如上皮细胞、血液、精子)相关联。例如,从混合样本中,我们可以估算出贡献者1和2分别贡献了0.5 ng和0.25 ng的DNA,但却无法知晓这0.5 ng DNA是来自贡献者1的精子,而那0.25 ng来自贡献者2的血液。
单细胞分析技术的兴起为破解这些难题带来了曙光。这项技术的关键在于,在裂解之前就将单个细胞分离到独立的容器中。这样一来,细胞的全部内容物(即两个染色单体)都有机会被共同扩增,大大降低了等位基因丢失的风险。同时,结合显微成像技术,我们可以明确分离出的细胞是精子、上皮细胞还是白细胞,从而将每张单细胞电泳图(scEPG)与特定的细胞类型关联起来。随着单细胞分析在法医学中受到越来越多的关注,一个核心问题随之浮现:这项新技术,特别是针对精子(单倍体细胞)的分析模型,是否已经足够成熟,能够跨越研究与实际应用的边界,为法庭提供可靠的科学证据?
由Catherine M. Grgicak等人发表在《Forensic Science International: Genetics》上的研究,正是为了回答这一问题。研究人员的目标是描述一个能够刻画精子scEPG中DNA信号的概率模型,并将其整合到一个端到端的分析系统中。这个系统不仅要能够计算特定捐献者(或不)贡献的证据权重(WoE),还要能同时估计精子捐献者的人数以及每个捐献者被分离出的精子数量。为了系统评估这项新方法的“可转化性”,研究者们采用了显著性(Salience)、合法性(Legitimacy)和可信度(Credibility)——即SLC框架。这个框架为评估技术创新是否已具备从研究迈向实践操作的条件,提供了一个结构化的评估体系。
关键技术方法概述:研究人员从6名个体获取精液样本,使用DEPArrayTMNxT系统精确分离单个精子细胞。细胞在含有PicoPureTM提取试剂和二硫苏糖醇(DTT)的溶液中裂解,使用GlobalFilerTM试剂盒进行STR扩增(半反应体积,30个循环)。扩增产物在3500遗传分析仪上电泳,得到单细胞电泳图(scEPG)。使用Osiris软件在5 RFU的分析阈值下分析数据,并手动去除由内标、染料斑等引起的伪迹信号。为评估模型性能,研究人员构建了121个来自已知个体的“单联体”(singlet,即单个精子scEPG)用于模型验证,并在此基础上,通过随机抽样模拟构建了33个包含2至5名捐献者、17至75个细胞的精子混合物用于系统测试。所有数据分析均通过集成单倍体感知模型的EESCItTM软件完成。
研究结果
  • 模型构建与验证:研究构建了一个计算单倍体scEPG(E)在给定(二倍体)基因型(G)下的似然值P(E|G)的概率模型。该模型考虑了配子形成过程中的等位基因分离,并通过位点间条件独立的假设进行简化计算,同时为避免基因连锁的潜在影响,在分析中每个染色体上仅使用一个基因座,共使用了17个常染色体基因座。通过对121个精子单联体的测试,证实模型返回的预测值与经验结果之间的均方误差在任何基因座均不超过3.1×10-5,表明模型具有极佳的保真度。
  • 证据权重的校准性分析:利用LR离散度分析评估证据权重(WoE,即logLR)的校准性。结果显示,H1(PoI是贡献者)和H2(PoI非贡献者)两种情况下的LR相对频率和幅度与声明值一致,在WoE区间[1, 2]内最大离散度仅为0.3。可信度分析表明,没有单联体产生误导性的WoE,并且平均每携带约1200 RFU峰高的单倍体,能产生1个WoE单位。
  • 混合样本的聚类与估计性能:将EESCItTM应用于33个精子混合物(2-5名捐献者)。系统能够准确估计捐献者数量,并将每个捐献者的scEPG正确聚类。当真实贡献者(PoI)仅贡献两个单倍体时,系统常能产生WoE为10的证据;当贡献10个单倍体时,WoE值接近25。值得注意的是,WoE值在不同混合复杂度下保持稳定,不依赖于真实的贡献者数量(n),这展现了单细胞数据独特的鲁棒性。计算时间主要取决于分离的细胞数量,而受贡献者人数n的影响较小。
  • SLC框架下的系统性评估
    • 显著性:研究明确了单细胞精子数据能够解决的法医学相关问题,包括确定精子捐献者人数、身份及其贡献的精子数量,这些是传统体细胞DNA分析无法直接回答的。
    • 合法性:通过使用已知来源的单联体构建混合物,研究设计保留了对“真实情况”的追踪能力。对单联体基因型后验概率的校准分数评估显示,模型预测具有高度的可靠性。LR校准分析进一步证实了模型返回的似然比可以有效地用于贝叶斯更新。
    • 可信度:研究表明,基于单倍体细胞的WoE具有良好的判别能力,并且系统的计算效率高。与之前的二倍体单细胞结果相比,单倍体系统在保持性能的同时,扩展了分析能力。
研究结论与意义:本项研究成功地开发并验证了一个用于分析精子单细胞电泳图(scEPG)的单倍体概率模型,并将其整合到端到端的单细胞评估系统EESCItTM中。通过严格的SLC框架评估,证实该系统在处理精子单细胞数据时,在显著性、合法性和可信度三个方面均表现出色。具体而言,系统能够合法且可信地区分竞争假设,准确估计精子捐献者数量并进行正确的细胞聚类,所产生的证据权重(WoE)数值稳健,不受混合物中贡献者人数多少的影响。这项工作的意义在于,它首次建立了一个能够评估单倍体单细胞数据的完整分析系统,为法医科学中涉及精子细胞的DNA混合物解释提供了全新的、强有力的工具。它标志着单细胞法医分析在解决精子特异性问题方面,已经具备了从研究方法向实际操作性应用过渡的坚实理论基础与技术验证。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号