综述:基于图的深度学习在药物相互作用预测中的应用:系统综述
《Frontiers in Chemistry》:Graph-based deep learning for drug-drug interaction prediction: a systematic review
【字体:
大
中
小
】
时间:2026年05月11日
来源:Frontiers in Chemistry 4.2
编辑推荐:
摘要
识别潜在的药物-药物相互作用(DDIs)对于药物开发和治疗安全至关重要,这促使人们不断加大计算DDI预测的投入。尽管已有几项调查总结了最近的进展,但从基于图的深度学习范式角度系统性地整理现有研究的综述仍然缺乏。在这项工作中,我们全面回顾了基于图的方法用于DDI预测,特别关注
摘要
识别潜在的药物-药物相互作用(DDIs)对于药物开发和治疗安全至关重要,这促使人们不断加大计算DDI预测的投入。尽管已有几项调查总结了最近的进展,但从基于图的深度学习范式角度系统性地整理现有研究的综述仍然缺乏。在这项工作中,我们全面回顾了基于图的方法用于DDI预测,特别关注三种代表性技术路径:图卷积网络(GCNs)、图注意力网络(GATs)和图对比学习(GCL)。我们根据这三种范式回顾并分类了代表性的DDI预测模型,突出了它们在捕捉分子结构、异质相互作用和鲁棒表征方面的策略、优势以及局限性。然后,我们讨论了关键挑战和未来的研究方向,强调多模态数据整合和模型可解释性。本综述旨在提供当前领域的结构化概述,并为开发更准确、更鲁棒、更具解释性的DDI预测模型提供实用参考。
1 引言
药物-药物相互作用(DDIs)指的是当两种或更多药物同时给药时产生的药理学或毒理学效应,可能导致治疗效果增强或减弱,甚至引发意外的不良反应。此类相互作用可能改变治疗结果,在严重情况下引发重大的安全问题,包括毒性增加或治疗失败(Levy和Ragueneau-Majlessi,2019)。随着个性化医疗和多药疗法在临床实践中的日益采用,DDI的预测和评估受到了广泛关注。传统的DDI预测策略通常依赖于基于已知相互作用模式的实验验证或规则推理。然而,这些方法存在显著局限性。首先,实验检测成本高昂、耗时且难以扩展到快速增长的药物空间。其次,基于规则的推理严重依赖于现有的DDI知识,无法发现新的或以前未报告的相互作用,从而限制了预测范围。此外,这些方法往往缺乏对药物结构和生物活性的机制理解,导致揭示潜在DDI模式的能力不足。这些缺点突显了迫切需要高效准确的计算框架来改进DDI发现。
生物医学数据的快速增长,以及机器学习、深度学习和网络建模的进步,为计算DDI预测带来了新的机会。特别是图神经网络(GNNs)——一类专为图结构数据设计的深度学习框架——在模拟复杂的药物相互作用网络方面表现出显著的成功。在DDI图中,节点通常代表药物,边编码药理关联或相互作用事件。通过迭代图卷积或消息传递,GNNs捕获药物与其分子靶标之间的结构依赖性和生化关系,从而提高预测准确性(Lin等人,2023)。
在GNNs的基础上,图对比学习(GCL)最近作为一种强大的自监督范式出现,用于DDI预测。GCL的核心思想是构建药物相互作用事件的多个图视图,生成正样本对和负样本对,并通过对比目标优化嵌入表示。通过鼓励相似的药物对在嵌入空间中保持接近,同时将不同的药物对分开,GCL使模型能够更好地学习潜在的相互作用模式,尤其是在数据稀缺的情况下,使其非常适合标注样本有限的DDI任务。
为了解决这些挑战,研究人员提出了一系列将GNNs与对比学习相结合的DDI模型。例如,Wang等人(Wang等人,2021)引入了一个多视图图对比表示学习框架,以同时捕捉分子结构和药理关联。Jiang等人(Jiang M.等人,2024)进一步开发了一种关系感知图嵌入机制,并结合协作对比学习来改进多关系DDI的表示学习。尽管这些策略显著提高了捕捉药物相互作用模式的能力,但DDI预测仍面临几个未解决的问题。数据稀疏性仍然是一个关键瓶颈,特别是对于新批准的具有有限相互作用记录的药物,这限制了预测模型的泛化能力(Ma等人,2018)。此外,当前的DDI算法主要是黑盒架构,可解释性有限,使得临床医生难以理解决策过程并在医疗实践中应用预测结果(Chen等人,2016;Lin等人,2020;Zitnik等人,2018)。
随着越来越多的证据表明揭示潜在的DDIs对药物开发和治疗安全至关重要,越来越多的研究致力于计算DDI预测。尽管之前的调查从不同角度回顾了进展,但专注于基于图的计算方法的全面分析仍然缺乏。在这项工作中,我们提供了基于图的深度学习方法进行DDI预测的系统性和综合性回顾。首先,我们介绍了基于图的深度学习技术的基础概念。接下来,我们总结了代表性的GNN和GCL基DDI预测模型。最后,我们讨论了当前面临的挑战并概述了未来的研究方向。
2 基于图的计算方法用于预测DDIs
图神经网络(GNNs)是一类专为图结构数据设计的深度学习模型,其理论基础根植于图论和表示学习。GNNs通过消息传递机制运作,其中节点特征从邻居节点中迭代聚合和更新,从而学习节点级、边级或图级嵌入。代表性模型如图卷积网络(GCNs)和图注意力网络(GATs)分别利用卷积操作和注意力机制来有效捕捉复杂的拓扑依赖性。在此基础上,图对比学习(GCL)引入了一种自监督范式,进一步增强了GNNs中的表示学习。通过生成原始图的多个增强视图,GCL在嵌入空间中进行对比学习。其核心思想是最大化正样本对(同一节点或图的不同增强视图)之间的一致性,同时最小化负样本对之间的一致性,从而使正样本更接近,负样本更分离。
尽管传统的临床实验分析方法在药物-药物相互作用(DDI)预测方面具有高准确性,但由于耗时、劳动密集和成本高昂等弊端,其广泛应用受到严重限制。近年来,包括机器学习和深度学习技术在内的自动化计算方法已被广泛用于DDI预测。传统的基于机器学习的DDI预测模型主要使用化学指纹和基于相似性的特征作为输入。化学指纹是基于序列的表示,能够描述药物的具体属性,如化学亚结构、相关靶标和副作用。最近,越来越多的基于深度学习的技术被应用于DDI预测任务,因为它们可以从数据中自动学习更具表现力的特征表示,从而显著提高DDI预测模型的性能。
2.1 基于GNN的计算方法用于预测DDIs
多年来,提出了几种基于GNN的DDI预测框架,大致可以分为基于GCN的模型和基于GAT/注意力的模型(表1)。这些方法在处理分子图、多模态信息的整合、注意力机制和可解释性方面有所不同。
表1 方法 机制 技术
Ref DP DDI
GCN 结构GCN + 成对预测 Feng等人(2020)
GCN-BMP
基于补丁的GCN Chen等人(2020)
MR-GNN
GCN 多分辨率 + 双图 Xu等人(2019)
BDN-DDI
GCN 双线性双视图 Ning等人(2023)
DSN-DDI
GCN 双视图 + 泛化 Lin等人(2023)
MDN
GCN 多模态融合 Lyu等人(2021)
Kang等人
GCN 特征 + 拓扑融合 Kang等人(2022)
MK-GCN
GCN 多核卷积 Wang等人(2022a)
多核GNN
GCN 自适应核整合 Zhao等人(2025)
稀疏超图GCN
高阶超图 Nguyen等人(2022)
BM GNN
GCN 基线分子GNN Abbas等人(2025)
AutoDDI
GCN 神经架构搜索 Gao等人(2024)
SSI-DDI
GAT 子结构注意力 Nyamabo等人(2021)
DeepDDS
GAT 基于注意力的协同预测 Wang等人(2022b)
大小自适应GNN
GAT
模体级可解释注意力 Nyamabo等人(2022)
子结构GNN
GAT
模体级可解释性 Yang等人(2022)
MathEagle
GAT 异构图 + 多头 Hou等人(2024)
DrugDAGT
GAT 双注意力 + 对比学习 Chen等人(2024)
DA-GAT
GAT 领域自适应 + 可解释注意力 Zhang等人(2025)
MASMDDI
GAT 软掩码消息传递 Lin等人(2024)
GRACE
GCL
图编码器和对比损失 Zhu等人(2020)
EGCL
基于增强的对比学习 Zhu等人(2021)
GraphCL
GCL
节点/边增强,对比损失 You等人(2020)
AD-GCL
GCL
图对抗增强,对比损失
Suresh等人
BGRL
GCL
自举目标表示,对比对齐 Thakoor等人(2021)
Barlow Twins
GCL
互相关损失,自监督 Zbontar等人(2021)
VICReg
GCL
方差不变性-协方差正则化 Bardes等人(2021)
MRGCDDI
GCL
多关系图编码器,对比损失,无增强 Li等人(2026)
CLD
GCL
对比预训练 + 双视图融合 Xu等人(2023)
Deep GCL
GCL
图编码器和对比预训练 Jiang等人(2024b)
Sim
GRACE
GCL
图编码器,对比损失,无增强 Xia等人(2022)
MPHGCL-DDI
GCL
基于元路径的异构GNN,对比损失 Hu等人(2024)
GCL-DDI
分子图,药物相似性,双视图对比对齐 Ding等人(2025)
MMFF-DDI
分子图和副作用,对比对齐 Zhong等人(2025)
MOLGAECL
GCL
通过图自编码器预训练,对比微调 Li等人(2025)
MSHGCL
GCL
层次图聚合,多尺度对比损失 Ge等人(2025)
DDVR
GCL
药物视觉嵌入,对比损失 Xie等人(2025)
2.1.1 基于GCN的方法
图卷积网络(GCNs)是学习药物结构表示的基础方法。基于GCN的DDI模型通常将每种药物视为一个分子图,通过消息传递机制聚合来自相邻原子的特征(图1A)。早期的工作如DPDDI(Feng等人,2020)和GCN-BMP(Chen等人,2020)证明,仅使用GCNs就可以通过学习原子级特征和成对相互作用来实现具有竞争力的二元分类性能,而无需外部生物注释。
图1 基于图的计算方法用于药物-药物相互作用预测的概述。(A)基于GCN的计算方法用于DDI预测的概述。根据两种药物的化学结构构建分子图和相应的节点及边特征,图卷积网络(GCN)模型分别从每个药物分子图学习特征表示(嵌入),然后将学习到的药物表示融合并输入多层感知器(MLP)进行二元或多类DDI预测。(B)基于GAT的计算方法用于DDI预测的概述。首先提供两种输入药物的分子结构,然后使用图注意力网络(GATs)从每个药物分子图学习层次化特征表示。通过多头注意力机制选择性地聚合和融合信息特征,然后将融合后的表示输入多层感知器(MLP)进行二元或多类DDI预测。(C)基于GCL的计算方法用于DDI预测的概述。首先提供两种输入药物的分子结构。首先使用分子间图对比学习(Inter-GCL,指琶鸪细胞层与相邻视网膜层之间的关系、差异或相互作用)模块来捕获不同结构级别的特征表示,同时使用分子内图对比学习(Intra-GCL,指琶鸪细胞层内部发生的特征、测量或结构变化)模块来学习每个药物分子内细微结构单元的表示。学习到的表示进一步通过多头注意力机制整合,然后将融合后的特征输入多层感知器(MLP)进行二元和多类DDI预测。
为了提高结构表达能力,一些模型引入了多分辨率和多视图聚合。MR-GNN(Xu等人,2019)采用了层次聚合和双图表示,而BDN-DDI(Ning等人,2023)和DSN-DDI(Lin等人,2023)实现了双线性双视图表示学习,以进行更通用的相互作用建模。随后,MGDDI(Geng等人,2024)扩展了这一概念,通过建模多尺度图特征来捕获细粒度和粗粒度的分子模式。
认识到DDIs源自复杂的生化机制,一些模型整合了多模态信息。MDNN(Lyu等人,2021)和Kang等人(Kang等人,2022)将分子图与蛋白质靶标、副作用谱或拓扑嵌入相结合,以预测多类相互作用事件,表明从二元检测向临床可解释的相互作用类型分类的转变。
为了进一步提高表达能力,引入了基于核的GCNs和高阶图结构。MK-GCN(Wang F.等人,2022)和Multi-Kernel GNN(Zhao等人,2025)利用多个卷积核来捕获多样的结构模式,而Sparse Hypergraph Networks(Nguyen等人,2022)采用超图建模来表示高阶多药关系。像Abbas等人(Abbas等人,2025)这样的基础基线重新证明了基本分子GCNs的有效性,而AutoDDI(Gao等人,2024)应用神经架构搜索(NAS)来自动优化GCN架构。
单视图结构编码器演变为多分辨率和多视图模型,然后是多模态融合和高阶相互作用建模,最终实现了自动化架构优化。GCNs仍然是结构化信息DDI预测的核心构建块。
2.1.2 基于GAT/注意力的方法
虽然GCNs均匀地聚合邻域信息,但图注意力网络(GATs)引入了可学习的注意力权重,以强调最相关的子结构和分子相互作用(图1B)。这一系列模型强调可解释性、异质性和可 Transferable 表示。
早期的基于注意力的方法如SSI-DDI(Nyamabo等人,2021)模型化子结构-子结构相互作用,为模体分配注意力得分以提高可解释性。这一想法发展为大小自适应子结构学习,实现在DeepDDS(Wang J.等人,2022)、大小自适应GNN(Nyamabo等人,2022)和Substructure-aware GNN(Yang等人,2022)中,允许模体级解释并适应异构功能组。
后来的工作将注意力机制扩展到异构网络。MathEagle(Hou等人,2024年)在异构属性图中对药物进行了建模,结合了药理信息和副作用信息,并使用了多头注意力机制。DrugDAGT(Chen等人,2024年)引入了带有对比学习的双注意力图变换器,反映了在分子图建模中类似变换器架构的广泛采用。基于注意力的模型还解决了领域迁移和泛化问题。Substructure DA-GAT(Zhang等人,2025年)将可解释的子结构注意力与领域适应学习相结合,实现了强大的跨数据集和跨领域预测能力——这是临床应用的关键要求。这些方法从用于解释性的子结构注意力发展到用于异构图集成的多头注意力,再到双注意力变换器和领域适应架构。它们提供了一个灵活、可解释的框架,这与生物学现实相符,即并非所有分子子结构对药物-药物相互作用(DDI)的贡献都是相同的。
2.2 基于图对比学习(GCL)的计算方法用于预测DDI
图对比学习(GCL)是一种自监督学习范式,通过构建图的增强视图并执行对比学习来学习节点或图级嵌入。GCL的核心思想是最大化正样本之间的相似性,同时最小化负样本之间的相似性,从而使正样本对在嵌入空间中更接近,而负样本对则被分开。通过这种机制,模型能够捕捉图中的关键结构信息。通用的对比损失函数如下所示:
```python
sim(hi, hj) = ∥hi∥ / ∥hj∥
sim_hi, hj = hiThj * hj
L_contrast = -∑(i, j) ∈ P * log(exp(sim(hi, hj)) / τ
+ ∑(k ∈ N) * exp(sim(hi, fk)) / τ
```
其中,(hi, hj)表示一对正样本(例如,同一药物在不同增强视图下的表示),hk表示负样本(例如,不同药物的表示),P表示所有正样本的集合,N表示包括正负样本在内的比较样本集合。sim(hi, hj)表示相似度度量(如余弦相似度),τ是控制分布平滑度的温度参数。
图对比学习(GCL)作为一种有前景的DDI预测方法,通过结合自监督学习和图表示学习而脱颖而出(表1)。GCL方法通过最大化图增强视图之间的相似性来学习稳健的药物嵌入,同时最小化冗余,减少了对标记数据集的依赖,并增强了模型的泛化能力(图1C)。
早期的GCL方法关注图级自监督预训练和增强策略。深度图对比表示学习(Zhu等人,2020年)引入了图级对比预训练,通过标准图编码器和对比损失函数来学习嵌入。经验图对比学习(Zhu等人,2021年)实证评估了不同的图增强策略,表明适当的增强显著提高了嵌入质量。同样,带增强的图对比学习(You等人,2020年)利用节点和边的扰动来生成多个视图以进行对比对齐。为了提高鲁棒性,对抗性图增强(Suresh等人,2021年)在对比学习流程中引入了对抗性扰动,增强了模型对噪声或不完整分子图的适应能力。自举图表示学习(Thakoor等人,2021年)采用了自监督的自举机制,在不需要负样本的情况下对齐不同视图的目标表示。此外,像Barlow Twins(Zbontar等人,2021年)这样的冗余减少方法和VICReg中的方差不变性-协方差正则化(Bardes等人,2021年)提供了额外的自监督约束,以稳定图嵌入学习。
由于DDI预测涉及复杂的分子相互作用,几种方法将GCL扩展到了多关系和双视图场景。多关系图对比DDI(MRGCDDI)(Li等人,2026年)在对多关系药物图上应用对比学习,无需增强即可捕捉不同药物模式之间的异构相互作用。CLDDI(Xu等人,2023年)和深度GCL for DDI(Jiang Z.等人,2024年)引入了双视图对比学习,对分子图和药物相似性网络的嵌入进行对齐,实现了稳健的多类DDI事件预测。SimGRACE(Xia等人,2022年)提出了一个简化的GCL框架,表明即使是最简单的对比方法也能在没有显式增强的情况下实现有效的二元DDI预测。
为了更好地捕获结构和关系语义,几种方法采用了异构图建模和分层学习。MPHGCL-DDI(Hu等人,2024年)在对比学习框架中利用了基于元路径的异构GNN,对药物、靶点和副作用网络之间的关系语义进行了编码。MSHGCL(Ge等人,2025年)引入了多尺度分层聚合,通过对比目标将局部子结构与全局图上下文相结合。双视图GCL-DDI(Ding等人,2025年)利用双视图分子图和相似性图来增强多类DDI预测,对来自互补表示的嵌入进行对齐。多模态GCL方法整合了多种与药物相关的信息,进一步提高预测性能。MMFF-DDI(Zhong等人,2025年)使用对比学习目标融合了分子图、蛋白质靶点和副作用信息,实现了稳健的多类DDI事件预测。MOLGAECL(Li等人,2025)结合了图自动编码器预训练和对比微调,在DDI预测之前利用了无监督的分子结构学习。双药物视觉表示(Xie等人,2025年)嵌入了双药物视觉特征并应用了对比对齐,表明分子结构的视觉嵌入可以补充基于图的特征。
3 讨论
近年来,图神经网络(GNN)在药物-药物相互作用(DDI)预测领域引起了越来越多的关注,并经历了快速的发展。本文系统地回顾了基于图学习的DDI预测方法,特别关注了三种代表性的技术范式:图卷积网络(GCNs)、图注意力网络(GATs)和图对比学习(GCL)。现有研究表明,GCNs在建模药物分子结构和药物-药物关系网络方面非常有效,能够捕捉到强烈的局部拓扑特征。基于GAT的方法通过结合注意力机制,为相邻节点分配不同的权重,在表征异构相互作用和关键关系模式方面表现出增强的表达能力。相比之下,基于GCL的方法通过无监督或弱监督策略提高了表示学习的鲁棒性,在标记数据有限或噪声较高的场景中显示出独特的优势。总体而言,GNN为整合结构信息和关系语义提供了一个有效的建模范式,显著推动了DDI预测的发展。
尽管基于深度学习的DDI预测方法取得了显著进展,但仍面临几个关键挑战,未来的研究可能会集中在以下两个方向的进一步探索和优化上。首先,在多模态数据集成和利用方面,药物-药物相互作用涉及复杂的生物过程。这些相互作用不仅受化学结构的影响,还受到基因组表达谱、蛋白质-蛋白质相互作用网络、代谢途径和现实世界药物行为的影响。仅依赖单一数据模式不足以全面描述DDI的多层特征。未来的研究可以利用多模态深度学习框架,如多模态图神经网络(MGNNs)或统一表示学习模型,联合建模和推理异构数据源,包括药物结构、基因表达数据和电子健康记录。通过构建统一的嵌入空间,可以捕捉潜在的跨模态关联,从而提高DDI预测模型的准确性和泛化能力。随着公共生物医学数据库的不断扩展,这一研究方向得到了数据可用性和实际应用场景的有力支持。
其次,在增强模型可解释性方面,尽管许多基于深度学习的DDI预测模型实现了优异的预测性能,但其黑箱性质限制了它们在临床决策和药物开发中的应用。未来的研究可以将GNN中的结构注意力机制与可解释性方法(如GNNExplainer和PGExplainer)相结合,以可视化关键的分子子结构、重要靶点或潜在的相互作用路径。此外,结合基于知识图的规则推理和路径挖掘技术可以帮助从现有的药理学知识中提取生物学上的解释性证据。这些策略可以提高模型预测的透明度和可信度,并有助于发现潜在的相互作用机制。
总之,随着多模态生物医学数据的不断积累和图神经网络及深度学习技术的不断发展,DDI预测正朝着更加系统、智能和可解释的方向发展。未来的研究应致力于提高模型整合复杂异构数据的能力,同时平衡预测性能和生物可解释性。这将进一步促进基于GNN的模型在实际临床药物安全评估和新药开发中的应用。通过持续优化模型架构、训练策略和知识整合机制,可以建立更加高效和可靠的DDI预测系统。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号