传统中药(TCM)拥有数千年的历史,在疾病预防和治疗方面积累了丰富的临床经验(Cheung, 2011; Yan et al., 2017; Xu et al., 2019)。然而,一个能够阐明其宏观表型特征与微观分子机制之间关联的系统框架仍然难以捉摸(Xiang et al., 2019; Gan et al., 2023)。现有研究表明,TCM配方通过多组分、多靶点的协同机制发挥治疗效果(Wang et al., 2020; Chen et al., 2023; Luo et al., 2020)。然而,TCM高度复杂的化学成分通常包含数十到数千种生物活性化合物(Zhang et al., 2022; Hou et al., 2019),再加上多草药之间的潜在协同效应(Luo et al., 2024),在没有有效假设生成工具的帮助下,对其分子作用机制(MOA)的实验阐明面临重大挑战(Xu et al., 2021)。为了解决由TCM化学复杂性引起的机制阐明难题,当前研究迫切需要建立一个超越“成分依赖范式”的假设生成框架。作为主流方法(Wang et al., 2021; Zhao et al., 2023a),网络药理学的“草药-成分-靶点”层次模型作为假设生成工具存在关键局限性:(1)成分层知识缺口导致系统性偏差:不同成分数据库之间的显著异质性(Wang et al., 2024)降低了靶点预测的可靠性,而高频同质成分(例如槲皮素)的泛靶特性(Bai et al., 2022; Wang et al., 2022a; Zhou et al., 2022; Wang et al., 2022b; Ye et al., 2021)稀释了TCM特有的机制;(2)机制还原主义困境:当前模型将整体效应分解为离散的成分-靶点对,无法表征多组分协同调节产生的新兴特性。该模型无法解析组织特异性反应(例如肝/肾选择性),也无法通过成分变化(例如加工方法或植物来源)动态调节整体机制结果(Huang et al., 2017; Zuo et al., 2025)。
除了网络药理学(NP)之外,整合的多组学数据(例如蛋白质组学、转录组学、代谢组学)是破译TCM复杂机制的关键技术方法(Yuan et al., 2023; Cui et al., 2025)。特别是转录组学在表征TCM干预的整体反应方面提供了前所未有的深度和广度。主要的分析范式仍然严重依赖于差异表达基因(DEG)识别和通路富集分析。虽然这些方法可以检测到相关的信号变化,但它们未能充分揭示潜在的调控逻辑,如转录调控网络或上游信号驱动因素。更根本的是,现有方法需要大量的人工整理,并且产生的机制预测置信度低,实验验证率也有限。因此,在TCM机制研究的初始探索阶段,迫切需要先进的计算工具能够:(1)直接从多组学数据中提取可解释的机制洞察;(2)最小化对复杂化学成分的先验知识的依赖(从而绕过成分定义不清带来的瓶颈)。
高通量测序的出现和系统生物学的进步促进了使用组学数据进行药物靶点预测的计算算法的发展。最近的研究,包括KORE-Map(Park et al., 2024)、ITCM(Tian et al., 2023)和Herb-CMAP(Wang et al., 2024),已经将这些方法应用于TCM的复杂系统分析。这些方法采用表达谱相关性策略(Subramanian et al., 2017; Wei et al., 2022; Struckmann et al., 2021),利用模式匹配算法通过建立扰动实体之间的转录组相似性来推断生物学关联,显示出药物重新定位和新靶点发现的潜力(Kwon et al., 2019; He et al., 2023; Zhao et al., 2023b; Liang et al., 2022)。然而,它们对现有基因表达库的依赖限制了新靶点的预测。另一种方法是基于临床证据的框架,通过网络传播、图嵌入或随机游走算法来整合TCM的临床疗效数据以预测靶点(Wang et al., 2019; Yang et al., 2018; Duan et al., 2024)。然而,这些方法仅依赖于整体临床表型,无法区分由分子水平异质性(包括不同的植物来源、加工方法、提取协议和组织特异性作用)引起的机制变化,因此存在根本性的限制。
为了解决这些差距,本研究提出了IFTP-TCM——一个基于逆向因果推断的预测框架,用于阐明TCM机制。我们的核心假设是,通过从转录重编程到组织特异性调控网络中的靶蛋白扰动的数学重建因果途径,我们可以克服当前基于相关性或仅基于表型的方法的根本局限性。IFTP-TCM引入了两个关键创新:(1)建立了一个用于整体TCM效应的定量表征系统;(2)动态建模分子表型数据,以真实反映生物系统对TCM干预的反应。该框架的重要性体现在两个关键方面:首先,它克服了对成分信息的传统依赖,使得包括加工引起的修饰和非植物性TCM成分在内的整体效应的机制分析成为可能。其次,通过整合组织特异性生物网络,它显著提高了靶点预测的生物学相关性和机制的可解释性。这种方法不仅解决了基于成分的方法在表征协同效应方面的技术限制,更重要的是扩展了复杂TCM机制的研究维度,为传统方法难以处理的药理学研究提供了新的方法支持。