时序与空间信息增强的异质信息网络嵌入方法

《IEEE Access》:Temporal and Spatial Information Enhanced Heterogeneous Information Network Embedding

【字体: 时间:2026年03月16日 来源:IEEE Access 3.6

编辑推荐:

  本研究针对异质信息网络(HIN)嵌入任务中,时序与空间信息利用不充分、现有随机游走策略难以区分边间不同时间间隔等难题,提出了时序与空间信息增强的异质网络嵌入(TSHE)方法。该方法通过改进随机游走以同时遵循时间戳与元路径来生成序列,并在序列学习中引入时间间隔信息、利用注意力机制融合多语义空间嵌入,从而有效提升节点表示能力。在链接预测任务上的实验表明,TSHE模型性能优于现有先进基线,为复杂网络分析提供了更优的嵌入解决方案。

  
在当今大数据时代,由多种类型节点和关系构成的复杂网络无处不在,从社交网络、引文网络到生物医学知识图谱,它们承载着海量且结构丰富的信息。为了对这些复杂网络进行高效的分析与挖掘,例如进行链接预测、节点分类或社群发现,研究者们通常需要先将网络中的节点映射为低维、稠密的向量表示,这个过程被称为网络嵌入(Network Embedding)。当网络中包含多种类型的节点和关系时,它便成为一个异质信息网络(Heterogeneous Information Network, HIN)。对HIN进行嵌入学习,旨在捕获其复杂的结构和丰富的语义信息。
然而,现有的许多HIN嵌入方法面临着一个共性挑战:未能充分挖掘和利用网络内在的时序与空间信息。在现实网络中,许多关系(边)的产生具有明确的时间戳,例如论文的发表时间、社交用户间的交互时刻,这些时序信息对于理解网络演化动态至关重要。同时,异质网络中的“空间”或语义空间信息,通常由不同的元路径(Meta-path)所定义,它们从不同角度揭示了节点间的复杂语义关联。尽管一些方法已经尝试在随机游走过程中考虑节点顺序,但它们通常无法精细区分不同边之间具体的时间间隔差异,这限制了模型对网络动态特性的捕捉能力。此外,如何有效融合从不同元路径(即不同语义空间)学习到的节点表示,也是一个待优化的关键问题。这些局限共同制约了HIN嵌入的表征能力,进而影响了其在下游任务(如链接预测)上的性能。
为了攻克上述难题,一项发表于《IEEE Access》的研究提出了一种新颖的时序与空间信息增强的异质网络嵌入方法,简称为TSHE(Temporal and Spatial information enhanced Heterogeneous network Embedding)。该研究的目标是通过更充分地利用时序与空间信息,来全面提升HIN嵌入的性能。研究团队设计了一套创新的技术框架,首先改进了传统的随机游走策略,使其生成节点序列时能够同时遵循时间戳的先后顺序和预定义的元路径结构,从而保证游走序列在时间和语义上都具有合理性。接着,在序列学习阶段,模型进行了双重增强:针对时序信息,TSHE创造性地将时间间隔信息直接引入学习目标,使得模型不仅能够学习节点在不同时刻的嵌入,还能让学到的嵌入有效区分不同边的时间戳差异;针对空间(语义)信息,TSHE采用注意力机制(Attention Mechanism)来自适应地融合从多条不同元路径学习到的节点嵌入,从而生成包含多语义空间信息的最终节点表示,增强了嵌入的语义丰富性。
为了验证TSHE模型的有效性,研究者在链接预测(Link Prediction)任务上进行了系统的实验。实验结果表明,TSHE模型在多个真实数据集上的预测性能显著优于一系列先进的基线模型。这充分证明了该模型通过增强时序与空间信息利用,确实学习到了更具区分力和表征能力的节点嵌入。这项工作的意义在于,它为处理富含时序与复杂语义关系的异质网络提供了一种更为强大的嵌入学习工具,不仅提升了链接预测的准确性,其方法论也有潜力推广至节点分类、推荐系统等更广泛的网络分析应用中,推动了复杂网络表示学习领域的发展。
主要关键技术方法
该方法主要包含几个关键技术环节:首先,设计了一种能同时遵从时间戳顺序和元路径结构的改进型随机游走策略,以生成兼顾时序与语义的节点序列。其次,在基于这些序列的嵌入学习过程中,显式地引入了边之间的时间间隔(Time Interval)信息作为约束,以增强嵌入对时序动态的刻画能力。最后,采用注意力机制(Attention Mechanism)来融合从多条不同元路径(Metapath)学习到的节点嵌入向量,从而集成多语义空间信息,生成最终的节点表示。
研究结果
1. 改进的随机游走策略
通过约束随机游走过程,使其生成的节点序列既符合元路径定义的语义模式,也遵循网络中边的时间戳递增顺序。这为后续学习提供了同时富含语义和时序信息的序列基础。
2. 时序信息增强
在序列学习目标中引入时间间隔信息。这使得模型学习到的节点嵌入能够反映节点在不同时间点状态的差异,并且能够有效区分连接边上不同时间戳所带来的影响,从而捕获网络的演化特征。
3. 空间(语义)信息增强
通过为不同的元路径分配可学习的注意力权重,模型能够自适应地融合从各条元路径视角下学到的节点嵌入。这使得最终生成的节点表示聚合了多个相关语义空间的信息,提升了表示的全面性和鲁棒性。
4. 链接预测性能评估
在多个真实世界异质信息网络数据集上执行链接预测任务,并将TSHE模型与多种先进的网络嵌入基线方法进行对比。实验结果显示,TSHE模型在预测精度等关键指标上 consistently 且显著地优于所有对比基线,证明了其增强时序与空间信息策略的有效性。
结论与讨论
本研究表明,充分且精细地利用异质信息网络中的时序与空间(语义)信息,对于学习高质量的节点嵌入至关重要。所提出的TSHE模型通过集成改进的时序感知随机游走、时间间隔增强的序列学习以及基于注意力的多语义融合,成功地提升了异质网络嵌入的性能。在链接预测任务上的优越表现验证了该方法的有效性。这项工作不仅为解决现有HIN嵌入方法在利用时序和复杂语义信息方面的不足提供了新思路,其框架也具有较好的通用性,有望应用于更广泛的动态异质网络分析场景。未来的研究方向可以包括探索更复杂的时间动态模型,或将类似思想应用于其他类型的网络学习任务中。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号