用于结合社交媒体与药物描述进行药物-药物相互作用预测的融合状态空间模型（FSSM-DDI）

《BMC Biology》：FSSM-DDI: Fusion State Space Model for predicting drug-drug interaction using social-media and drug descriptions

【字体：大中小】 时间：2026年06月03日 来源：BMC Biology 4.5

编辑推荐：

　　摘要背景基于社交媒体与药物描述预测药物-药物相互作用（drug-drug interactions, DDIs）对于医疗保健、药品监管与药物研发至关重要，但该任务仍具有较高挑战性。现有深度学习（deep learning, DL）与基于 Transfor

摘要背景
基于社交媒体与药物描述预测药物-药物相互作用（drug-drug interactions, DDIs）对于医疗保健、药品监管与药物研发至关重要，但该任务仍具有较高挑战性。现有深度学习（deep learning, DL）与基于 Transformer 的方法在建模句内长程句法与语义依赖时往往存在不足，或者具有较高的计算代价，从而限制了其在大规模药物安全筛查中的实际应用。

结果
为克服上述局限，研究人员提出了一种用于药物-药物相互作用预测（drug-drug interaction prediction, DDIP）的融合状态空间模型（Fusion State Space Model, FSSM）。FSSM 利用选择性状态空间模型（selective State Space Model, SSM）高效捕获句子内部的长程句法与语义依赖，同时通过基于交互的选择性过滤（Interaction-based Selective Filtering, ISF）模块缓解多模态输入带来的信息冗余。在 DDIExtraction-2013 语料库上的实验表明，FSSM 的 F1 值达到 75.23%，在性能上与最先进的 Transformer 模型相当，同时训练时间显著更低。消融研究进一步证实，各架构组件均具有实际贡献，其中社交媒体嵌入带来的性能增益最大，去除后性能下降 8.93%；ISF 模块带来 4.80% 的性能提升。

结论
FSSM 在药物-药物相互作用预测中实现了预测性能与计算效率之间的良好平衡。该模型的线性复杂度使其能够支持大规模筛查、实时应用以及资源受限场景下的部署，因此可作为药物发现与药物安全性评估中的有价值工具。

该文发表于《BMC Biology》，围绕药物-药物相互作用预测（drug-drug interaction prediction, DDIP）这一药物信息学与生物医学文本挖掘交叉领域的重要问题展开。研究背景在于，多药联合治疗已成为复杂疾病尤其是老年多病共存患者中的常见策略，虽然联合用药能够增强治疗效果，但也可能诱发未预期的药物-药物相互作用（drug-drug interactions, DDIs）及不良反应，严重时甚至危及生命。现有数据库如 PharmGKB、DrugBank 4.0 和 Therapeutic Target Database 虽然收录了部分已知 DDI，但仍无法覆盖全部潜在相互作用；与此同时，大规模实验穷举所有药物组合在现实中并不可行。正因如此，利用计算方法从现有文本资源中自动识别和预测 DDI，成为提高药物警戒与药物安全评估效率的重要路径。

论文指出，社交媒体语料与药物描述知识（drug description knowledge, DDK）中蕴含大量与 DDI 相关的线索，例如用法、剂量、不良反应、警示信息以及与其他药物的关系。然而，现有方法仍存在若干关键问题。首先，传统机器学习方法依赖人工特征，其泛化能力有限。其次，常规深度学习模型虽然能够学习非线性关系，但对句子内部长程依赖的提取不足，难以准确捕获相隔较远的药物提及及其交互语义。再次，Transformer 模型虽然在长程依赖建模方面表现突出，但自注意力机制通常伴随较高计算复杂度，不利于大规模筛查。除此之外，多模态特征融合容易引入冗余信息，而正负样本严重不平衡也会干扰分类器对少数类正样本的学习。因此，开展一种兼顾长程依赖建模能力、融合外部药物知识并具备较高计算效率的新方法，具有明确的理论价值与应用需求。

在此基础上，研究人员提出了融合状态空间模型（Fusion State Space Model, FSSM），将社交媒体文本信息与药物描述知识进行显式整合，以实现高效的 DDI 预测。该模型以选择性状态空间模型为核心，借鉴 Mamba 架构在线性复杂度下处理长序列的优势，从而提升句内远距离句法和语义关联的捕获能力。与此同时，研究人员设计了面向任务的基于交互的选择性过滤（Interaction-based Selective Filtering, ISF）模块，不再将药物特征彼此独立地处理，而是依据药物对之间的交互特征进行动态加权，从而抑制跨模态噪声与共享但无关的药理学冗余信息，突出与相互作用真正相关的判别性信号。

简要而言，作者主要采用了以下关键技术方法：以 DDIExtraction2013 数据集作为实验基准样本来源，该数据集包含 792 篇 DrugBank 文档和 233 篇 MEDLINE 摘要，带有句子级药物实体与药物对标注；对文本进行分词、归一化、药物实体标准化标注、定长序列化与向量化编码；构建由嵌入层、Mamba 特征提取模块、ISF 模块、特征融合模块和 Softmax 分类器组成的多模态框架；采用 5 折交叉验证（5FCV）并以精确率、召回率和 F1 值作为评估指标，同时与多种深度学习及 Transformer 基线模型进行统一环境下比较，并通过消融实验评估各组成模块的独立贡献。

以下为论文主体结果的分项解读。

Experimental setup
研究人员在 DDIExtraction2013 语料库上系统评估 FSSM 的泛化能力与可靠性，并选择 HNNBL、DBGRU-SE、CNN-DDI、TP-DDI、MTrans 和 SCATrans 六种代表性方法作为对照。所有实验均在统一硬件与软件环境中完成，以保证结果的可重复性。该部分明确了模型比较的实验基础，也说明研究结论建立在统一评价框架之上。

Overall performance comparison
在总体性能比较中，FSSM 的 F1 值达到 75.23%，与性能最优的 SCATrans 基本相当，但训练时间仅为 115 min，显著低于 SCATrans 的 230 min 以及 MTrans 的 254 min。传统深度学习方法虽训练更快，但 F1 值明显偏低。该结果表明，FSSM 在性能与效率之间实现了更优平衡。进一步从标准差结果可见，FSSM 在不同数据划分上的 F1 波动仅为 ±0.46%，稳定性优于 Transformer 与常规深度学习模型，说明该方法不仅有效，而且具有较好的鲁棒性。

Performance across sentence lengths
研究人员进一步比较了不同模型在不同句长区间上的表现，以验证 Mamba 架构是否适合句子级生物医学文本。结果显示，在极短句中，各模型差异不大；而随着句长增加，性能差异逐渐扩大。Mamba 从最短序列到最长序列的性能下降仅为 1.1%，明显优于 BiLSTM 的 7.9% 和 Transformer 的 2.0%。这一结果说明，基于状态空间模型（SSM）的序列建模方式在处理长句时更能保持关键语义线索，尤其适用于临床叙述中药物实体间被多个从句分隔的复杂表达。

Type-wise performance analysis
在按 DDI 类型进行分析时，研究人员比较了保留与去除负样本条件下的分类结果。去除负样本后，四类正向 DDI 的 F1 值均显著提高，其中 Int 类型提升最为明显，约增加 17%。该结果直接揭示了原始数据中负样本占绝对优势这一事实会严重干扰模型对正向交互，尤其是稀有交互类型的学习。换言之，类别不平衡是影响 DDIP 性能的重要因素，而针对交互信息的筛选与聚焦对少数类识别具有特殊价值。

Ablation study results
消融实验用于严格评估 FSSM 各组成部分的贡献。结果表明，社交媒体文本嵌入是最关键的信息来源，一旦移除，性能下降 8.93%，说明用户生成内容中确实蕴含丰富的 DDI 信号。ISF 模块的移除会导致 4.80% 的性能下降，验证了其在噪声过滤和交互相关特征聚焦方面的有效性。加入药物描述知识可带来 2.79% 的性能提升，说明 DDK 作为外部知识源对多模态融合具有明确增益。相比标准 SSM，选择性 SSM 的提升幅度为 0.33%，虽然幅度较小，但结合其内容感知过滤能力与计算效率，仍构成模型设计中的重要组成。

Discussion
讨论部分主要围绕关键发现的意义展开。首先，FSSM 在保持较高预测精度的同时，大幅缩短了训练时间，这一效率—性能折中对于大规模药物安全筛查尤具现实意义。其次，消融实验进一步量化了各模块贡献，证明社交媒体文本是最主要的信息来源，ISF 则在去除无关药理信息方面起到关键作用，而 DDK 的引入则强化了多模态知识整合能力。与依赖二次复杂度自注意力的 Transformer 方法相比，FSSM 依赖选择性 SSM 实现线性复杂度，因此能够在维持竞争性 F1 的同时显著降低计算开销。与传统深度学习方法相比，FSSM 更擅长处理句内长程依赖，这从不同句长条件下的性能变化已得到验证。

讨论部分还概括了模型在不同 DDI 类型上的差异性收益。尤其是稀有的 Int 类型在负样本过滤后获得最大改善，提示该模型对弱信号和少数类交互具有较强敏感性。论文同时指出若干局限，包括：当前仅凭一次消融结果尚不足以充分刻画 ISF 在不同噪声水平下的行为；可解释性分析仍较初步；研究范围主要限于 DDIExtraction2013 的句子级长程依赖；选择性 SSM 相对标准 SSM 的优势仍有进一步细化验证空间。这些内容均作为后续工作的方向被明确提出。

Methods and dataset
方法部分显示，FSSM 框架由嵌入、Mamba 特征提取、ISF、特征融合与 DDIP 分类五个模块组成。数据集方面，DDIExtraction2013 包含 5002 个正例与 33,486 个负例，正例分为 mechanism、effect、advice 和 int 四种亚型。预处理中，研究人员将文本统一小写、利用正则表达式处理数字，并将目标药物标记为 Drug1 和 Drug2，其余药物标记为 Drug0，将任务形式化为三元组（Drug1, DDI, Drug2）预测。文本随后经 Word2Vec 编码为 300 维向量；同时提取 11,930 个药物及其 DDK 条目，药物描述使用 GloVe 嵌入表示，缺失 DDK 则以零向量替代。

在模型结构上，Drug1 与 Drug2 的嵌入向量先拼接并经主成分分析（principal component analysis, PCA）降至 128 维，再送入特征提取模块。Mamba 模块通过池化、线性映射、1-D 卷积、SiLU 激活以及 SSM 操作提取具有判别性的空间结构特征。随后，ISF 模块通过联合 VF₁ 与 VF₂ 计算融合权重 VFW，并生成关键交互特征 VISF，从而实现对成对药物特征的软选择。最终，VFW 与 VISF 拼接得到 VDDI，经线性层与 Softmax 分类器完成 DDI 类型判别。训练过程中采用交叉熵损失函数，性能则以平均精确率、平均召回率和平均 F1 值进行评价。

论文结论部分可译为：
本文提出了 FSSM，这是一种将社交媒体文本与药物描述知识（DDK）整合于一体的多模态混合框架，用于药物-药物相互作用预测（DDIP）。通过引入具有线性复杂度的 Mamba 模块，FSSM 能够高效捕获句内长程依赖，并显著降低计算开销。基于交互的选择性过滤（ISF）模块可对药物对特征进行动态整合，过滤冗余信息并聚焦于与相互作用相关的信号。基于 DDIExtraction-2013 的实验表明，FSSM 在训练时间不足最先进 Transformer 模型一半的条件下，取得了与之相当的性能（F1 为 75.23%）。这种效率与性能之间的权衡使该方法适用于大规模筛查、实时应用以及资源受限环境下的部署。总体而言，该研究为面向药物发现与药物安全评估的高效 DDIP 提供了一种具有应用潜力的新框架。

订阅生物通快讯

订阅快讯：

免费订阅退订

限时促销

会展信息

联系信箱：

粤ICP备09063491号

订阅生物通快讯

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯