新技术专栏 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通 | 新技术专栏
生物通首页  >  新技术专栏  >  正文

DeepCas12a:一种混合深度学习框架,能够基于序列信息和表观遗传信息准确预测AsCas12a的效率

《BMC Genomics》:DeepCas12a: a hybrid deep learning framework for accurate AsCas12a efficiency prediction from sequence and epigenetic information

【字体: 大 中 小 】 时间:2026年05月31日 来源:BMC Genomics 3.7

编辑推荐:

  摘要CRISPR-Cas12a(Cpf1)由于其灵活的、富含T碱基的PAM(短序列识别基序)识别机制,在基因组编辑方面具有显著优势。然而,其切割效率的不确定性——受序列背景和表观遗传特征的影响——仍然是一个挑战,现有工具在模拟多模态特征之间的高阶相互作用方面存在困难。在这里,我们

摘要

CRISPR-Cas12a(Cpf1)由于其灵活的、富含T碱基的PAM(短序列识别基序)识别机制,在基因组编辑方面具有显著优势。然而,其切割效率的不确定性——受序列背景和表观遗传特征的影响——仍然是一个挑战,现有工具在模拟多模态特征之间的高阶相互作用方面存在困难。在这里,我们提出了DeepCas12a,这是一个结合了卷积神经网络(CNN)和视觉变换器(ViT)编码器的混合深度学习框架,能够同时捕捉局部序列模式和长距离依赖关系。该模型以端到端的方式将DNA序列数据与表观遗传信息(如DNA甲基化和染色质可及性)融合在一起。在独立测试集上的评估表明,DeepCas12a的表现优于现有的最先进预测模型,平均精确度达到0.783,AUC为0.868,Spearman相关性为0.630。此外,通过显著性图进行的可解释性分析证实,该模型能够捕捉到生物学上相关的特征,包括PAM特异性和种子区域的敏感性,从而有助于合理设计引导RNA。

CRISPR-Cas12a(Cpf1)由于其灵活的、富含T碱基的PAM(短序列识别基序)识别机制,在基因组编辑方面具有显著优势。然而,其切割效率的不确定性——受序列背景和表观遗传特征的影响——仍然是一个挑战,现有工具在模拟多模态特征之间的高阶相互作用方面存在困难。在这里,我们提出了DeepCas12a,这是一个结合了卷积神经网络(CNN)和视觉变换器(ViT)编码器的混合深度学习框架,能够同时捕捉局部序列模式和长距离依赖关系。该模型以端到端的方式将DNA序列数据与表观遗传信息(如DNA甲基化和染色质可及性)融合在一起。在独立测试集上的评估表明,DeepCas12a的表现优于现有的最先进预测模型,平均精确度达到0.783,AUC为0.868,Spearman相关性为0.630。此外,通过显著性图进行的可解释性分析证实,该模型能够捕捉到生物学上相关的特征,包括PAM特异性和种子区域的敏感性,从而有助于合理设计引导RNA。

订阅生物通快讯

订阅快讯:
免费订阅退订

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号