新技术专栏 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通 | 新技术专栏
生物通首页  >  新技术专栏  >  正文

利用扩散模型在计算机上生成基因表达谱

《BMC Bioinformatics》:In silico generation of gene expression profiles using diffusion models

【字体: 大 中 小 】 时间:2026年06月02日 来源:BMC Bioinformatics 3.3

编辑推荐:

   摘要 背景 RNA-seq 数据被用于精准医疗(例如癌症预测),深度学习方法有助于分析复杂的基因表达数据。然而,与深度学习的标准数据集相比,转录组数据集的样本数量通常较少。因此,人们正在探索合成数据生成技术来解决这一数据稀缺问题。到目前为止,只有变分自

摘要

背景

RNA-seq 数据被用于精准医疗(例如癌症预测),深度学习方法有助于分析复杂的基因表达数据。然而,与深度学习的标准数据集相比,转录组数据集的样本数量通常较少。因此,人们正在探索合成数据生成技术来解决这一数据稀缺问题。到目前为止,只有变分自编码器(VAEs)和生成对抗网络(GANs)等深度生成模型被用于这一目的。鉴于扩散模型(DM)在图像生成方面的最新成功,我们提出了一种基于扩散模型的生成流程,该流程利用了这些生成模型在转录组数据上的强大能力。

结果

本文介绍了两种先进的扩散模型(DDPM 和 DDIM),并展示了它们在转录组领域的应用。由扩散模型生成的 L1000 个标志性基因的数据在 TCGA 和 GTEx 数据集上的预测性能优于传统方法。我们还比较了线性和非线性重建方法来恢复完整的转录组。结果表明,这些重建方法可以提高扩散模型、VAEs 和 GANs 的性能。

结论

总体而言,通过对各种生成模型使用数据质量指标的广泛比较,可以看出扩散模型属于表现最好的方法之一,使其成为有前景的合成转录组数据生成工具。

背景

RNA-seq 数据被用于精准医疗(例如癌症预测),深度学习方法有助于分析复杂的基因表达数据。然而,与深度学习的标准数据集相比,转录组数据集的样本数量通常较少。因此,人们正在探索合成数据生成技术来解决这一数据稀缺问题。到目前为止,只有变分自编码器(VAEs)和生成对抗网络(GANs)等深度生成模型被用于这一目的。鉴于扩散模型(DM)在图像生成方面的最新成功,我们提出了一种基于扩散模型的生成流程,该流程利用了这些生成模型在转录组数据上的强大能力。

结果

本文介绍了两种先进的扩散模型(DDPM 和 DDIM),并展示了它们在转录组领域的应用。由扩散模型生成的 L1000 个标志性基因的数据在 TCGA 和 GTEx 数据集上的预测性能优于传统方法。我们还比较了线性和非线性重建方法来恢复完整的转录组。结果表明,这些重建方法可以提高扩散模型、VAEs 和 GANs 的性能。

结论

总体而言,通过对各种生成模型使用数据质量指标的广泛比较,可以看出扩散模型属于表现最好的方法之一,使其成为有前景的合成转录组数据生成工具。

订阅生物通快讯

订阅快讯:
免费订阅退订

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号