COSA:一种基于甲基化的综合预测工具,可用于鉴定体液/组织的来源、吸烟状态以及实际年龄。该工具采用扩增子技术结合大规模并行测序技术实现

《Forensic Science International: Genetics》:COSA: a Consolidated Methylation-Based Prediction Panel for Body fluid/Tissue of Origin, Smoking Status, and Chronological Age Using Amplicon-based Massively Parallel Sequencing

【字体: 时间:2026年06月01日 来源:Forensic Science International: Genetics 3.2

编辑推荐:

  杨秀彬(Soo-Bin Yang)|金佳亨(Ga Hyung Kim)| Moon Hyun So | 李松德(Soong Deok Lee)| 李焕英(Hwan Young Lee)韩国首尔国立大学医学院法医学系摘要CpG位点的DNA甲基化已成为一种强大的表观遗传生物标志物,可

杨秀彬(Soo-Bin Yang)|金佳亨(Ga Hyung Kim)| Moon Hyun So | 李松德(Soong Deok Lee)| 李焕英(Hwan Young Lee)
韩国首尔国立大学医学院法医学系

摘要

CpG位点的DNA甲基化已成为一种强大的表观遗传生物标志物,可用于预测与法医学相关的特征,包括实际年龄、法医样本的生物学来源(包括体液和组织来源),以及与生活方式相关的因素(如吸烟)。现有的年龄估计、体液和组织来源鉴定以及吸烟推断模型已经显示出良好的性能,但它们依赖于单独的检测方法,这限制了实际应用。为了解决这一问题,我们开发了COSA(一种用于来源、吸烟和年龄的综合预测面板),这是一种基于扩增子的并行测序(MPS)实现的集成甲基化检测方法。COSA将来自多个经过验证的模型的126个CpG标记整合到67个扩增子中,从而能够通过单次分析同时预测体液和组织来源、吸烟状态以及实际年龄。通过统一这些已建立的标记,COSA为全面的法医表观遗传分析提供了一个可扩展且高效的解决方案。
该面板包含三个功能模块。首先,体液鉴定模块包含了9个特定于血液、精液、唾液、月经血和阴道液的CpG标记,支持在法医学框架中准确确定样本来源。此外,体液和组织来源推断模块通过18个针对血液、肝脏、骨骼肌、心脏、大脑、表皮、真皮、肾脏和肺部的CpG标记来实现。第三,生活方式推断模块通过13个CpG标记进行支持,其中包括在AHRR基因中的特征明确的cg05575921位点,用于吸烟预测。
为了实现平衡的多重扩增,方法上的改进是必不可少的。对于经过亚硫酸盐转化的DNA进行多重PCR时,会遇到引物兼容性和GC含量变化等问题。为了解决这些问题,我们采用了一种触底PCR策略,改善了多个位点的扩增平衡和覆盖均匀性。重新设计或修改了几组引物,以优化扩增子长度和退火温度,确保在67个扩增子面板内的稳健共扩增。重要的是,使用仅20纳克的亚硫酸盐转化DNA,COSA面板就能够支持生物学来源、吸烟状态和实际年龄的推断。
总体而言,COSA将三个主要的法医预测模块整合到一个DNA工作流程中,包括体液和器官组织的来源分类器、特定于流体的年龄估计器以及吸烟状态预测器。该面板代表了法医实验室的一个实用且可扩展的工具,旨在从有限的DNA中获取最大信息量,推动表观遗传学在人类识别和调查情报中的应用。

引言

表观遗传修饰,特别是DNA甲基化,已成为预测多种生物学和生活方式特征的强大生物标志物。在过去的十年中,许多研究基于甲基化特征开发了预测模型,反映了表观遗传调控对内在和外在因素的动态响应[1],[2]。其中最常研究的甲基化相关特征之一是人类的实际年龄,它与基因组中特定CpG位点的DNA甲基化水平有很强的相关性[3],[4]。
Horvath的开创性工作引入了跨组织表观遗传时钟的概念,利用DNA甲基化数据来估计多个组织的实际年龄[5]。此后,提出了多种特定于流体或组织的年龄预测模型,这反映了甲基化谱型取决于体液和组织内的细胞组成[6]。针对特定生物流体和组织的模型(如血液[7],[8]、精液[9]和唾液[10],[11])通过考虑表观遗传背景提高了准确性。最近,还探索了针对固体组织(包括骨骼和内脏器官)的模型[12],[13]。尽管取得了这些进展,在法医学背景下,经常遇到来源不明的生物样本,因此准确识别其生物学来源是应用年龄预测器的前提。鉴于法医样本可能来源于多种难以通过视觉检查区分的器官组织和体液,许多研究集中在确定其生物学来源上,包括体液鉴定(BFID)[14],[15]或组织鉴定(TSID)[16]。然而,这些关于体液和组织来源分类以及年龄估计的进展大多是并行进行的,而不是作为一个集成框架的一部分。
目前,体液和组织来源以及实际年龄的预测依赖于顺序的、独立的工作流程。在这种方法中,首先使用BFID或TSID标记确定生物学来源,然后应用相应的年龄预测模型。这种分段过程不仅增加了实验时间和复杂性,而且在法医案件中还存在重大限制,因为DNA数量通常非常有限。尽管报告了许多表观遗传预测模型,但大多数依赖于基于阵列的发现平台、单碱基延伸(SBE)方法或并行测序(MPS)。这些平台和分析流程的异质性使得模型集成变得复杂,并阻碍了实际应用。法医应用进一步要求稳健性、可扩展性和与低输入量、通常已降解的DNA样本的兼容性。
在法医表观遗传学研究中使用的主要平台中,包括基于阵列的方法、SBE和MPS,基于扩增子的MPS为法医应用提供了独特的技术优势。与基于阵列的方法不同,后者仅限于预定义的探针并且需要高质量的输入DNA,基于扩增子的MPS允许自定义目标选择,从而能够对特定CpG区域进行高深度、精确的分析。它在通量和多重扩增能力上也超过了SBE,同时能够准确且可重复地量化DNA甲基化,允许在单次检测中同时检测数十个CpG位点。这些特点支持将基于扩增子的MPS作为有效的集成法医表观遗传分析平台。
重要的是,表观遗传谱型不仅捕捉了组织特异性特征,还捕捉了与生活方式相关的修饰,为法医调查提供了进一步的区分能力[4],[17]。其中一个研究最深入的生活方式相关甲基化标记是cg05575921,位于AHRR基因中,在包括血液和唾液在内的多种组织中,吸烟者的该标记表现出一致的甲基化程度降低[18],[19]。最近的模型通过识别额外的CpG位点扩展了吸烟预测面板[20]。
在这项研究中,我们旨在开发一个集成的基于甲基化的预测面板,能够同时确定流体和组织来源、实际年龄以及吸烟状态。为此,我们设计了一个针对亚硫酸盐转化DNA的稳健的基于扩增子的平台,提供了稳定和高效的多重扩增。我们将这种集成方法称为用于体液和组织来源、吸烟状态以及实际年龄的综合预测面板(COSA)。

章节片段

研究样本

为了评估该综合甲基化面板的表现,本研究共分析了161个样本。所有161个样本的详细信息,包括性别、样本类型、年龄以及用于敏感性测试的样本指定,总结在补充表1中。共获得了84个来自10名韩国血统的死亡个体的尸检组织样本。这些样本包括9种组织类型:血液(n = 4)、肾脏(

COSA面板开发与优化策略

我们严格优化并建立了用于体液和组织来源、吸烟状态以及实际年龄的综合预测面板,简称COSA,作为一个集成法医工具,旨在同时预测体液和组织来源、吸烟状态以及实际年龄(图1A)。表1提供了预测类别、目标样本类型、建模方法、分析平台、CpG标记及其相应文献的概述

讨论

近年来,基于MPS的目标甲基化分析得到了广泛应用,报道的面板通常包含数百到数千个CpG位点[26],[27]。这些高含量面板大多依赖于基于杂交的捕获方法,虽然能够检测大范围的基因组区域,但通常需要大量DNA和较长的工作流程[28],[29],[30],[31]。相比之下,COSA面板专注于一套精简的67个扩增子,覆盖126个CpG位点

结论

在这项研究中,我们开发了COSA,这是一个用于体液和组织来源、吸烟状态以及实际年龄的综合基于甲基化的预测面板。COSA将来自已建立预测模型的经过验证的CpG标记整合到一个统一的引物混合物中,包含67个扩增子和126个CpG位点,包括用于生物学来源鉴定的BFID和TSID标记,以及针对血液、唾液和精液的特定于流体或组织的年龄预测器,还有与吸烟相关的标记。

伦理

本研究获得了首尔国立大学医院(IRB编号C-1912–053–1087 & 2110-183-1267)和延世大学Severance医院(IRB编号4–2015–0083)的机构审查委员会批准。在收集样本之前,已从提供体液样本的志愿者处获得了书面知情同意。由于使用了尸检样本,因此免除了知情同意的要求,所有实验程序均在

CRediT作者贡献声明

李焕英(Hwan Young Lee):撰写 – 审稿与编辑、监督、项目管理、资金获取、概念构思。李松德(Soong Deok Lee):资源获取、资金获取。Moon Hyun So:资源获取、调查。金佳亨(Ga Hyung Kim):验证、资源、方法学、调查。杨秀彬(Soo-Bin Yang):撰写 – 原稿撰写、可视化、验证、方法学、调查、正式分析、概念构思。

写作过程中生成式AI和AI辅助技术的声明

在准备这项工作时,作者使用了ChatGPT来检查语法。使用该工具后,作者根据需要审查和编辑了句子,并对出版物的内容负全责。

利益冲突声明

作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。作者是该期刊的编委会成员/主编/副主编/客座编辑,并未参与编辑审查或决定发表这篇文章。

致谢

这项研究得到了韩国国家警察局(项目编号PR10-01–000–21)的支持和资助。此外,该研究还使用了来自韩国国家生物库(NBK-2022-046)的生物资源。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号