TCM-MS2Link:一个统一的、适用于AI的数据集,整合了中医药草本知识与质谱(MS/MS)光谱数据
作者:李倩进(Qianjin Li)、赵飞帆(Feifan Zhao)、张吉航(Jihang Zhang)、周恒(Heng Zhou)、郭林(Lin Guo)和熊兴创(Xingchuang Xiong)
《Data》:TCM-MS2Link: A Unified AI-Ready Dataset Integrating TCM Herb–Compound Knowledge and MS/MS Spectral Data
Qianjin Li,
Feifan Zhao,
Jihang Zhang,
Heng Zhou,
Lin Guo and
Xingchuang Xiong
【字体:
大
中
小
】
时间:2026年05月11日
来源:Data 2
编辑推荐:
摘要
本研究介绍了TCM-MS2Link,这是一个基于标准化质谱技术的传统中医(TCM)关联数据集,为中医领域的天然产物研究提供了重要的资源。该数据集采用双层“知识-数据”架构:第一层TCM-MolLink包含了精心整理
摘要
本研究介绍了TCM-MS2Link,这是一个基于标准化质谱技术的传统中医(TCM)关联数据集,为中医领域的天然产物研究提供了重要的资源。该数据集采用双层“知识-数据”架构:第一层TCM-MolLink包含了精心整理的草药-化合物关联数据,通过整合多个异构数据库并经过严格的一致性过滤,建立了中医草药与其化学成分之间的高可信度关联;第二层MS2-MLReady是一个基于质谱技术的机器学习基准数据集,在经过系统的数据清洗、标准化预处理以及合理的数据分割后,可以直接支持人工智能模型的训练和评估。通过解决现有公共资源中的关键问题,如数据碎片化、注释不一致以及计算可用性不足等问题,TCM-MS2Link有效地克服了中医成分系统分析和数据驱动研究中的主要瓶颈。本研究显著提高了草药-化合物关联的可靠性以及质谱数据的建模适用性,为中医知识库构建和自动化光谱-结构识别等应用提供了高质量、标准化且可重复使用的数据基础,从而推动了中医信息学和数据驱动研究的进步。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号