解码染色质环境在CRISPR基因编辑脱靶效应中作用的研究:基于EGOLD的方法

《Cell Discovery》:Decoding the role of chromatin context in the off-target effects of CRISPR gene editing with EGOLD

【字体: 时间:2026年05月14日 来源:Cell Discovery 12.5

编辑推荐:

  尽管CRISPR在基因组编辑中具有强大功能,但其临床应用受到脱靶效应(off-target effects)的限制;这些效应目前难以在全基因组水平进行评估,但可能涉及染色质环境。在此,研究人员开发了内源性全基因组脱靶文库检测(Endogenous Genome

  
尽管CRISPR在基因组编辑中具有强大功能,但其临床应用受到脱靶效应(off-target effects)的限制;这些效应目前难以在全基因组水平进行评估,但可能涉及染色质环境。在此,研究人员开发了内源性全基因组脱靶文库检测(Endogenous Genome-wide Off-target Library Detection, EGOLD)方法,用于高通量检测脱靶效应及鉴定基因编辑器评估中的染色质环境偏好性。应用EGOLD定义17种碱基编辑工具的脱靶特征揭示了2,145,592个总脱靶位点,每种工具检测到1236–618,774个事件。CRISPR/Cas9及其衍生碱基编辑器(base editors)的脱靶频率范围为40%至80%,且受染色质环境影响显著。利用大规模内源性脱靶数据集并结合严格的靶位点条件以排除序列环境的影响,研究人员发现脱靶效应在开放染色质(open chromatin)基因组区域发生的频率显著高于封闭染色质(closed chromatin)区域。将EGOLD测序(EGOLD-Seq)获得的脱靶染色质环境数据纳入基于机器学习的基因编辑器活性模型训练中,显著提高了脱靶预测的准确性。这些发现及伴随的工具包可指导机制研究和开发安全、精确的基于CRISPR的工具。
论文解读:利用EGOLD解析染色质环境对CRISPR脱靶效应的调控机制
研究背景与意义
CRISPR/Cas9基因编辑技术虽在治疗遗传疾病中展现出巨大潜力,但其临床转化长期受限于广泛的脱靶效应,可能导致非预期的遗传损伤。既往研究表明,细胞类型差异会影响编辑效率,暗示染色质环境可能参与调控脱靶活性,但由于缺乏能够同时捕获内源性基因组信息与染色质状态的高通量检测方法,染色质环境对脱靶效应的具体影响机制尚不明确。为此,研究人员开发了内源性全基因组脱靶文库检测(EGOLD)方法,旨在系统性揭示染色质环境如何调控CRISPR及其衍生工具(如碱基编辑器)的脱靶行为,相关成果发表于《Cell Discovery》。
关键技术方法
本研究首先通过生物信息学流程扫描人类基因组Hg38,筛选出具有大量潜在脱靶位点且序列特征多样的候选靶向位点(protospacers)。利用荧光激活细胞分选(FACS)分选转染后的阳性细胞,提取基因组DNA进行全基因组测序(WGS)。通过自定义脚本分析测序数据以识别脱靶位点。从ENCODE数据库获取组蛋白修饰(如H3K9me3、H3K27ac)、DNA甲基化及染色质可及性(如ATAC-seq、DNase-seq)等表观遗传特征。基于提取的75个特征(包括序列错配信息和表观特征),利用随机森林算法构建机器学习模型以预测脱靶效应。
研究结果
1. 内源性全基因组脱靶文库检测系统的设计
研究人员设计了EGOLD方法,其核心是利用基因组中大量具有单碱基差异的重复序列。通过扫描全基因组,识别出与靶标sgRNA具有高度相似性(如23nt中有13nt相同)但位于不同染色质环境的潜在脱靶位点,并将其组装成文库。通过对223,349,907个候选位点进行严格筛选,最终获得24,116个候选靶位点,每个位点对应5000至629,879个潜在脱靶位点。选择其中排名前3000的位点进行验证,证实了该方法能有效收集不同Cas9变体(如野生型Cas9、高保真变体eCas9、HiFiCas9及PAM宽松变体RYCas9)的脱靶数据。
2. 基于EGOLD的sgRNA依赖性脱靶编辑分析
利用EGOLD流程分析发现,不同Cas9变体的插入缺失(InDel)脱靶数量差异显著,RYCas9介导的脱靶效应最多,而SuperFiCas9最少且保持较高编辑效率。当将这些Cas9变体与腺嘌呤碱基编辑器(TadA-8e)或胞嘧啶碱基编辑器(rAPOBEC1、YE1)融合后,EGOLD检测到大量单核苷酸变异(SNV)脱靶编辑。值得注意的是,同一Cas9骨架融合不同脱氨酶,或同一脱氨酶融合不同Cas9变体,其脱靶位点重叠率极低,表明sgRNA依赖的脱靶编辑在不同编辑器间具有独特性。此外,RYCas9对非NGG PAM的耐受性显著高于其他变体。
3. 开放染色质状态促进CRISPR/Cas9衍生核酸酶的脱靶活性
基于EGOLD产生的大规模数据,研究人员分析了13种染色质特征对脱靶活性的影响。通过Wilcoxon检验比较同一序列类型(type)下被编辑与未被编辑位点的染色质特征,发现高达65.63%至90.70%的脱靶类型至少与一种染色质特征显著相关(P < 0.05)。进一步分析表明,DNase-seq信号(反映染色质可及性)与脱靶编辑呈强正相关,而DNA甲基化和H3K9me3通常与编辑抑制相关。随着sgRNA与靶位点错配数的增加,染色质环境对脱靶活性的正向影响愈发显著。
4. 开放染色质状态促进碱基编辑器的脱靶活性
在碱基编辑器的分析中观察到了类似的规律。不同的碱基编辑器(如TadA-8e、rAPOBEC1、YE1融合的不同Cas9变体)表现出46.67%至82.35%的脱靶类型受染色质特征影响。其中,融合RYCas9的碱基编辑器受染色质环境影响最大,而融合SuperFiCas9的影响最小。总体趋势表明,开放染色质状态是促进碱基编辑器发生脱靶编辑的关键因素。
5. EGOLD为支持机器学习模型的脱靶预测提供数据集
研究人员利用EGOLD提取的75个编辑特征(含62个序列特征和13个表观遗传特征)训练树状集成机器学习模型。结果显示,该模型对多种Cas9变体和碱基编辑器的脱靶预测准确率极高(测试集准确率普遍超过99%)。受试者工作特征曲线(ROC)下面积(AUC)分析进一步验证了模型的高性能。特征重要性分析指出,虽然错配碱基数是最强的影响因素,但表观遗传特征的聚合贡献也对预测性能至关重要。
结论与讨论
本研究证实,EGOLD作为一种新型高通量检测平台,能够有效克服传统方法难以在内源性基因组背景下解析染色质环境影响的局限。研究明确揭示了开放染色质状态是驱动CRISPR/Cas9及其衍生碱基编辑器发生脱靶效应的核心环境因素,特别是在sgRNA与DNA结合稳定性降低(错配数增多)时,这种依赖性更为显著。通过将内源性染色质环境数据纳入训练,研究人员成功构建了高精度的脱靶预测模型。这不仅为理解基因编辑工具的作用机制提供了新视角,也为开发更安全、更精准的临床级基因编辑疗法提供了关键的评估工具和理论依据。该研究特别指出,在临床应用中针对单拷贝基因的编辑,未来仍需进一步优化EGOLD以适应蛋白质编码区的特性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号