今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

统一的基因组与化学表示方法支持双向的生物合成基因簇及天然产物的检索工作

《Scientific Reports》:Unified genomic and chemical representations enable bidirectional biosynthetic gene cluster and natural product retrieval

【字体: 大 中 小 】 时间:2026年05月10日 来源:Scientific Reports 3.9

编辑推荐:

  摘要天然产物的发现越来越依赖于分析微生物基因组以寻找编码次级代谢产物的生物合成基因簇(BGCs)的能力。虽然现有的方法已经成功地将BGCs与广泛的化学产品类别关联起来,但它们通常只采用单一的模式(基因组学或化学),从而限制了双向预测的范围。在这项工作中,我们提出了一个多模态框架,

  

摘要

天然产物的发现越来越依赖于分析微生物基因组以寻找编码次级代谢产物的生物合成基因簇(BGCs)的能力。虽然现有的方法已经成功地将BGCs与广泛的化学产品类别关联起来,但它们通常只采用单一的模式(基因组学或化学),从而限制了双向预测的范围。在这项工作中,我们提出了一个多模态框架,该框架通过将来自预训练语言模型的嵌入投影到一个共同的表示空间中来整合基因组信息和化学信息。我们使用基于BGC的基础模型对基因组序列进行嵌入,并通过化学语言模型来表示分子,然后利用度量学习模型将BGCs及其相关的化学结构共同嵌入到一个空间中。这种共同嵌入空间使我们能够使用相似性度量来量化BGCs与化合物之间的相似性,从而实现对检索任务的高效支持(包括正向检索和反向检索)。我们的方法始终优于非对齐方法,并代表了一种通用且可扩展的策略,用于在天然产物发现过程中连接生物学和化学领域。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:多模态框架|共享嵌入空间|基因组化学整合|相似性度量检索|预训练语言模型应用|双向优化策略

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号