IFTP-TCM:一个无额外组分的可解释框架,用于传统中医中的目标预测和机制阐明

《Computational Biology and Chemistry》:IFTP-TCM: An Ingredient-Free explainable Framework for Target Prediction and Mechanistic Elucidation in Traditional Chinese Medicine

【字体: 时间:2026年02月22日 来源:Computational Biology and Chemistry 3.1

编辑推荐:

  传统中药的化学复杂性阻碍了其作用机制研究,本文提出基于反向因果推理的IFTP-TCM框架,通过整合多组学数据与组织特异性调控网络,直接预测中药靶蛋白。该方法突破传统依赖化学成分的局限,成功验证As?O?抗肿瘤机制并预测10.6%已知靶点,特别适用于非植物来源及炮制中药分析。

  
陈凤鸣|赵然然|韩星星|李欢|唐志书
中国中医科学院中药资源中心道地药材质量保障与可持续利用国家重点实验室,北京,100700,中华人民共和国

摘要

克服传统中药(TCM)的化学复杂性以阐明其治疗机制仍然是TCM研究中的一个核心挑战,这需要透明的人工智能驱动的假设生成工具。研究TCM整体机制的传统范式,如网络药理学(NP),依赖于化学成分数据来构建“草药-化合物-靶点”网络。然而,TCM固有的化学复杂性常常在这些草药-靶点关联中引入大量噪声,导致高假阳性率。同时,传统的差异组学分析在机制精度上存在局限。在此,我们提出了IFTP-TCM,这是一个可解释的人工智能框架,用于预测TCM的直接靶点。该框架不依赖于化学成分,整合了多模态生物医学数据,并使用数学人工智能模型将TCM引起的基因水平变化反向传播到蛋白质水平,以识别真正的功能靶点,为TCM的整体直接靶点预测提供了一种新方法。我们使用TCM扰动后的基因表达数据评估了IFTP-TCM的性能,并将其与基线方法和已建立的NP数据库进行了比较。结果证实了其在识别TCM直接靶点方面的强大能力。使用具有注释靶点的小分子化合物进行验证表明,IFTP-TCM在排名前50的预测中成功预测了10.6%的已知靶点。此外,将IFTP-TCM应用于基于矿物的TCM三氧化二砷(As?O?)成功再现了其实验验证的抗癌机制。这突显了该方法在无需明确化学成分数据的情况下预测TCM靶点的独特优势。值得注意的是,IFTP-TCM在研究非植物性TCM和加工TCM产品(炮制药材)方面显示出独特价值,这些类别由于化学复杂性和传统依赖成分的方法的局限性而历来难以分析。总之,我们的发现不仅验证了IFTP-TCM框架的稳健性和通用性,更重要的是,它为推进精准医学和传统草药药物的现代化研究提供了创新的技术工具。

引言

传统中药(TCM)拥有数千年的历史,在疾病预防和治疗方面积累了丰富的临床经验(Cheung, 2011; Yan et al., 2017; Xu et al., 2019)。然而,一个能够阐明其宏观表型特征与微观分子机制之间关联的系统框架仍然难以捉摸(Xiang et al., 2019; Gan et al., 2023)。现有研究表明,TCM配方通过多组分、多靶点的协同机制发挥治疗效果(Wang et al., 2020; Chen et al., 2023; Luo et al., 2020)。然而,TCM高度复杂的化学成分通常包含数十到数千种生物活性化合物(Zhang et al., 2022; Hou et al., 2019),再加上多草药之间的潜在协同效应(Luo et al., 2024),在没有有效假设生成工具的帮助下,对其分子作用机制(MOA)的实验阐明面临重大挑战(Xu et al., 2021)。为了解决由TCM化学复杂性引起的机制阐明难题,当前研究迫切需要建立一个超越“成分依赖范式”的假设生成框架。作为主流方法(Wang et al., 2021; Zhao et al., 2023a),网络药理学的“草药-成分-靶点”层次模型作为假设生成工具存在关键局限性:(1)成分层知识缺口导致系统性偏差:不同成分数据库之间的显著异质性(Wang et al., 2024)降低了靶点预测的可靠性,而高频同质成分(例如槲皮素)的泛靶特性(Bai et al., 2022; Wang et al., 2022a; Zhou et al., 2022; Wang et al., 2022b; Ye et al., 2021)稀释了TCM特有的机制;(2)机制还原主义困境:当前模型将整体效应分解为离散的成分-靶点对,无法表征多组分协同调节产生的新兴特性。该模型无法解析组织特异性反应(例如肝/肾选择性),也无法通过成分变化(例如加工方法或植物来源)动态调节整体机制结果(Huang et al., 2017; Zuo et al., 2025)。
除了网络药理学(NP)之外,整合的多组学数据(例如蛋白质组学、转录组学、代谢组学)是破译TCM复杂机制的关键技术方法(Yuan et al., 2023; Cui et al., 2025)。特别是转录组学在表征TCM干预的整体反应方面提供了前所未有的深度和广度。主要的分析范式仍然严重依赖于差异表达基因(DEG)识别和通路富集分析。虽然这些方法可以检测到相关的信号变化,但它们未能充分揭示潜在的调控逻辑,如转录调控网络或上游信号驱动因素。更根本的是,现有方法需要大量的人工整理,并且产生的机制预测置信度低,实验验证率也有限。因此,在TCM机制研究的初始探索阶段,迫切需要先进的计算工具能够:(1)直接从多组学数据中提取可解释的机制洞察;(2)最小化对复杂化学成分的先验知识的依赖(从而绕过成分定义不清带来的瓶颈)。
高通量测序的出现和系统生物学的进步促进了使用组学数据进行药物靶点预测的计算算法的发展。最近的研究,包括KORE-Map(Park et al., 2024)、ITCM(Tian et al., 2023)和Herb-CMAP(Wang et al., 2024),已经将这些方法应用于TCM的复杂系统分析。这些方法采用表达谱相关性策略(Subramanian et al., 2017; Wei et al., 2022; Struckmann et al., 2021),利用模式匹配算法通过建立扰动实体之间的转录组相似性来推断生物学关联,显示出药物重新定位和新靶点发现的潜力(Kwon et al., 2019; He et al., 2023; Zhao et al., 2023b; Liang et al., 2022)。然而,它们对现有基因表达库的依赖限制了新靶点的预测。另一种方法是基于临床证据的框架,通过网络传播、图嵌入或随机游走算法来整合TCM的临床疗效数据以预测靶点(Wang et al., 2019; Yang et al., 2018; Duan et al., 2024)。然而,这些方法仅依赖于整体临床表型,无法区分由分子水平异质性(包括不同的植物来源、加工方法、提取协议和组织特异性作用)引起的机制变化,因此存在根本性的限制。
为了解决这些差距,本研究提出了IFTP-TCM——一个基于逆向因果推断的预测框架,用于阐明TCM机制。我们的核心假设是,通过从转录重编程到组织特异性调控网络中的靶蛋白扰动的数学重建因果途径,我们可以克服当前基于相关性或仅基于表型的方法的根本局限性。IFTP-TCM引入了两个关键创新:(1)建立了一个用于整体TCM效应的定量表征系统;(2)动态建模分子表型数据,以真实反映生物系统对TCM干预的反应。该框架的重要性体现在两个关键方面:首先,它克服了对成分信息的传统依赖,使得包括加工引起的修饰和非植物性TCM成分在内的整体效应的机制分析成为可能。其次,通过整合组织特异性生物网络,它显著提高了靶点预测的生物学相关性和机制的可解释性。这种方法不仅解决了基于成分的方法在表征协同效应方面的技术限制,更重要的是扩展了复杂TCM机制的研究维度,为传统方法难以处理的药理学研究提供了新的方法支持。

章节片段

在伪稳态假设下估计未解释的基因扰动

IFTP-TCM模型基于系统生物学的因果层次结构:TCM化合物不是直接改变基因表达,而是通过调节蛋白质活性(例如通过翻译后修饰)来发挥药理作用,从而间接诱导转录变化。我们关注的主要是驱动最大调控影响的主要上游蛋白质靶点。

IFTP-TCM概述

IFTP-TCM模型基于系统生物学的因果层次结构。它认为TCM化合物的治疗效果主要源于蛋白质活性的调节(例如通过翻译后修饰),而不是直接改变目标基因本身的表达(图1)。因此,尽管直接靶蛋白的表达水平在药物干预后可能保持不变,但可以观察到显著的转录失调。

讨论

本研究提出了IFTP-TCM,这是一种基于高通量数据的TCM整体靶点预测方法。IFTP-TCM是TCM机制研究的有效假设生成工具。其核心策略涉及基因调控网络的反向推断分析,能够将TCM在基因表达水平上引起的整体扰动效应反向映射到潜在的蛋白质靶点。我们证明了IFTP-TCM能够有效识别TCM的整体靶点。

数据可用性

数据和代码将应要求提供。

资助

本工作得到了国家中医药管理局的启航学者支持计划(2021年)和中央政府层面的重点项目:建立有价值的中药资源可持续利用能力(2060302项目)以及国家自然科学基金(NSFC)项目(批准号U24A20787)的支持。

CRediT作者贡献声明

李欢:方法学、形式分析、概念化。唐志书:写作——审稿与编辑、监督、资源管理、项目管理。赵然然:写作——审稿与编辑、方法学、形式分析。韩星星:形式分析、概念化。陈凤鸣:写作——审稿与编辑、原始草稿编写、可视化、验证、形式分析、概念化。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号