TCM-MS2Link:一个统一的、适用于AI的数据集,整合了中医药草本知识与质谱(MS/MS)光谱数据 作者:李倩进(Qianjin Li)、赵飞帆(Feifan Zhao)、张吉航(Jihang Zhang)、周恒(Heng Zhou)、郭林(Lin Guo)和熊兴创(Xingchuang Xiong)

《Data》:TCM-MS2Link: A Unified AI-Ready Dataset Integrating TCM Herb–Compound Knowledge and MS/MS Spectral Data Qianjin Li, Feifan Zhao, Jihang Zhang, Heng Zhou, Lin Guo and Xingchuang Xiong

【字体: 时间:2026年05月11日 来源:Data 2

编辑推荐:

   摘要 本研究介绍了TCM-MS2Link,这是一个基于标准化质谱技术的传统中医(TCM)关联数据集,为中医领域的天然产物研究提供了重要的资源。该数据集采用双层“知识-数据”架构:第一层TCM-MolLink包含了精心整理

  

摘要

本研究介绍了TCM-MS2Link,这是一个基于标准化质谱技术的传统中医(TCM)关联数据集,为中医领域的天然产物研究提供了重要的资源。该数据集采用双层“知识-数据”架构:第一层TCM-MolLink包含了精心整理的草药-化合物关联数据,通过整合多个异构数据库并经过严格的一致性过滤,建立了中医草药与其化学成分之间的高可信度关联;第二层MS2-MLReady是一个基于质谱技术的机器学习基准数据集,在经过系统的数据清洗、标准化预处理以及合理的数据分割后,可以直接支持人工智能模型的训练和评估。通过解决现有公共资源中的关键问题,如数据碎片化、注释不一致以及计算可用性不足等问题,TCM-MS2Link有效地克服了中医成分系统分析和数据驱动研究中的主要瓶颈。本研究显著提高了草药-化合物关联的可靠性以及质谱数据的建模适用性,为中医知识库构建和自动化光谱-结构识别等应用提供了高质量、标准化且可重复使用的数据基础,从而推动了中医信息学和数据驱动研究的进步。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号