今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

Spliceread:利用残差块和合成数据增强技术提升规范和非规范剪接位点预测的准确性

《BMC Bioinformatics》:Spliceread: improving canonical and non-canonical splice site prediction with residual blocks and synthetic data augmentation

【字体: 大 中 小 】 时间:2026年05月23日 来源:BMC Bioinformatics 3.3

编辑推荐:

  摘要准确的剪接位点预测对于理解基因表达及其相关疾病至关重要。然而,大多数现有模型都偏向于常见的规范剪接位点,这限制了它们检测罕见但生物学上重要的非规范变异的能力。这些模型通常依赖于大型且不平衡的数据集,无法捕捉非规范剪接位点的序列多样性,从而导致较高的假阴性率。在这里,我们提出了

  

摘要

准确的剪接位点预测对于理解基因表达及其相关疾病至关重要。然而,大多数现有模型都偏向于常见的规范剪接位点,这限制了它们检测罕见但生物学上重要的非规范变异的能力。这些模型通常依赖于大型且不平衡的数据集,无法捕捉非规范剪接位点的序列多样性,从而导致较高的假阴性率。在这里,我们提出了SpliceRead,这是一种新颖的深度学习模型,它通过结合残差卷积块和合成数据增强技术来改进规范和非规范剪接位点的分类。SpliceRead使用数据增强方法生成多样化的非规范序列,并利用残差连接来增强梯度流动并捕捉细微的基因组特征。在包含400个和600个核苷酸序列的多物种数据集上进行训练和测试后,SpliceRead在所有关键指标(包括F1分数、准确率、精确度和召回率)上均优于现有最先进模型。值得注意的是,它的非规范剪接位点误分类率显著低于基线方法。广泛的评估,包括交叉验证、跨物种测试和输入长度泛化,证实了其鲁棒性和适应性。我们进一步通过将该增强技术应用于其他最先进模型来评估其适应性,证明了其持续的改进和有效的泛化能力。SpliceRead为剪接位点预测提供了一个强大且可泛化的框架,特别是在具有挑战性的、低频序列场景中,并为模型生物和非模型生物中的更准确基因注释铺平了道路。SpliceRead的开源代码和详细文档可在https://github.com/OluwadareLab/SpliceRead获取。

准确的剪接位点预测对于理解基因表达及其相关疾病至关重要。然而,大多数现有模型都偏向于常见的规范剪接位点,这限制了它们检测罕见但生物学上重要的非规范变异的能力。这些模型通常依赖于大型且不平衡的数据集,无法捕捉非规范剪接位点的序列多样性,从而导致较高的假阴性率。在这里,我们提出了SpliceRead,这是一种新颖的深度学习模型,它通过结合残差卷积块和合成数据增强技术来改进规范和非规范剪接位点的分类。SpliceRead使用数据增强方法生成多样化的非规范序列,并利用残差连接来增强梯度流动并捕捉细微的基因组特征。在包含400个和600个核苷酸序列的多物种数据集上进行训练和测试后,SpliceRead在所有关键指标(包括F1分数、准确率、精确度和召回率)上均优于现有最先进模型。值得注意的是,它的非规范剪接位点误分类率显著低于基线方法。广泛的评估,包括交叉验证、跨物种测试和输入长度泛化,证实了其鲁棒性和适应性。我们进一步通过将该增强技术应用于其他最先进模型来评估其适应性,证明了其持续的改进和有效的泛化能力。SpliceRead为剪接位点预测提供了一个强大且可泛化的框架,特别是在具有挑战性的、低频序列场景中,并为模型生物和非模型生物中的更准确基因注释铺平了道路。SpliceRead的开源代码和详细文档可在https://github.com/OluwadareLab/SpliceRead获取。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:剪接位点预测|深度学习模型|规范与非规范变异|数据增强|基因组特征|基因注释

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号