《ACM Transactions on Asian and Low-Resource Language Information Processing》:A Prescription Recommendation Method Based on Knowledge Graph in Traditional Chinese Medicine
编辑推荐:
本文提出一种基于知识图谱(KG)与图神经网络的中医处方智能推荐新框架CETCMKG。该框架通过构建中医知识图谱(TCMKG),整合患者个体差异,并运用ComplEx模型与图卷积神经网络(GCN)学习节点特征,结合多头注意力机制提升处方推荐的准确性与可解释性,为解决中医智能辅助诊疗中的关键挑战提供了创新性方案。
在中医(Traditional Chinese Medicine, TCM)智能辅助诊疗领域,如何有效推荐个性化、精准的处方是一个核心挑战。现有方法往往未能充分整合中医知识图谱(TCM Knowledge Graph, TCMKG)与患者个体差异这两大关键因素。为此,本文提出了一种创新的中医处方推荐框架,命名为CETCMKG(ComplEx-based TCM Knowledge Graph),旨在通过深度融合结构化知识图谱与患者特异性信息,显著提升推荐的准确性与可解释性。
该框架的工作流程始于一个精心构建的中医知识图谱(TCMKG)。TCMKG以三元组(主体,谓词,客体)的形式系统化地组织中医实体(如症状、证候、中药)及其复杂关系(如“治疗”、“禁忌”)。为了确保知识的完整性与权威性,框架整合了公共知识库(如SymMap)与临床数据,并通过领域预训练模型TCMERE(TCM Entity and Relation Extraction)进行命名实体识别与关系抽取。图谱的构建充分考虑了中医知识的抽象性、多样性和逻辑性特点,例如“气血”、“阴阳”等抽象概念以及“相生”、“相克”等逻辑关系。
如图1所示,以逍遥散处方适配流程为例,展示了从症状集(如头晕、头痛)到证候分析(如肝郁脾虚湿阻),再到治疗法则(如疏肝解郁、健脾燥湿)和基础方选择,最终根据患者具体情况进行草药加减的动态个性化推荐过程。
为了从构建的知识图谱中有效提取特征,CETCMKG采用了ComplEx模型进行表示学习。ComplEx模型为知识图谱中的每个实体(e∈E)和关系(r∈R)学习一个d维的复向量表示(e, r∈Cd),能够有效捕获图谱中复杂的对称与非对称关系。同时,为了纳入患者个体化信息(如年龄、性别)和中药属性信息(如药性、归经),框架对ComplEx进行了扩展,通过类型特定的嵌入向量(如年龄a∈Cd、性别g∈Cd)和投影矩阵(如Wa, Wg∈Cd×d)进行信息融合,生成增强后的节点表示s‘和h’。
核心的推荐任务是将一组症状实体(S)映射到一个与之治疗上相匹配的中药子集(H?E)。CETCMKG利用图卷积神经网络(Graph Convolutional Neural Network, GCN)和GraphSAGE聚合器,通过消息传递机制在症状节点与中药节点之间进行多层次的信息聚合与更新。对于在训练集中覆盖度较低的图谱实体,其嵌入向量被冻结以保持稳定性;而对于覆盖度高的实体,则允许进行微调以优化模型性能。这一过程能够学习到包含高阶邻域信息的节点表示rsk和rhk。
如图2所示,CETCMKG框架全景展示了从知识图谱构建、特征提取到最终推荐输出的完整流程。随后,通过一个多头注意力(Multi-head Attention)机制对融合了图谱特征与个体化属性的节点表示(如es′ 和 rs)进行信息整合。该机制通过计算查询(Q)、键(K)、值(V)矩阵及注意力分数(As, Ah),最终得到更富语义信息的症状与中药特征表示向量es*和eh*。
在证候识别阶段,针对一个具体的症状集合sc,模型首先将其转化为一个多热向量xsc∈{0, 1}N。然后,利用该向量对整体的症状嵌入矩阵Es*进行掩码操作,筛选出与当前症状对应的特征向量,并通过平均池化得到一个综合的症状集表示向量esc。最后,通过一个多层感知机(Multi-Layer Perceptron, MLP)处理该向量,输出针对目标中药的预测概率,完成个性化处方推荐。
综合而言,CETCMKG框架通过构建并利用结构化的中医知识图谱,结合先进的图神经网络与注意力机制,不仅建模了中药、症状、证候间复杂的网络关系,还创新性地融入了患者个体差异与中药属性,从而实现了更精准、可解释的中医智能处方推荐。实验验证表明,该框架在多项性能指标上超越了现有的先进方法,为中医数字化与智能化发展提供了有力的技术支撑。