社交媒体的出现使得人们之间的交流变得更加方便。用户经常在Twitter和Douban等社交平台上分享他们的状态和轶事(Jiao等人,2021年)。伴随着这些分享行为,产生了大量的信息(Jiao等人,2024c;Lin和Cohen,2010年)。在线社交网络中的信息扩散影响了许多社会和工程问题,包括推荐(Krishnan等人,2019年;Wu等人,2019年)、流行度预测(Jiao等人,2025年;Xu等人,2023b;Zhou等人,2020年)以及假新闻控制(Vosoughi等人,2018年)。因此,全面理解扩散机制在实践上非常重要,同时在科学上也具有挑战性。
存储信息传播路径的载体被称为级联(Wang等人,2022b)。相关研究分为两类:微观级联(Sun等人,2022年)研究和宏观级联研究(Xu等人,2023a)。它们的关注点和应用场景不同。宏观级联研究根据过去的信息传播规模预测未来的流行度。微观级联研究,也称为扩散预测,主要根据已知的信息传播路径预测哪些用户将来会受到影响。
大多数早期的扩散预测方法基于线性阈值(LT)模型(Talukder等人,2019年)和独立级联(IC)模型(Kempe等人,2003年)。随后,基于特征工程的方法出现了(Guo和Shakarian,2016年),这些方法根据信息扩散过程中的特征来建模用户特征,包括主题(Barbieri等人,2013b)、角色(Yang等人,2015年)、社区(Barbieri等人,2013a)和结构模式(Zhang等人,2017年),以完成扩散预测。然而,这些方法需要手动特征提取,且预测效果受到数据质量的限制。
深度学习模型(Pan等人,2022年;Wang、Chen、Xi、Huang、Xie,2022a;Wang、Ji、Shi、Wang、Ye、Cui、Yu,2019年)已成为模拟信息扩散过程的主流方法。级联序列是扩散预测过程中不可或缺的组成部分,因为它象征着用户信息传播的时间顺序(Wang等人,2021年)。最先进的方法将社交网络结构(GE和CHEN,2020年)与级联序列结合起来,微建模用户特征(Sankar等人,2020年),以实现预测信息传播路径的目的。如图1所示,社交网络结构和级联序列被输入到预测模型中,以捕捉用户特征。它挖掘了已知扩散过程中种子用户与其他用户之间的隐藏共性,并选择未来可能受到影响的用户(Zhong等人,2023年)。
现有的微观扩散预测方法已经取得了显著的进展,但仍存在一些持续的局限性。社交网络中的信息扩散本质上遵循逐层传播模式,其中影响从种子用户通过连续的邻居层级传播(Wu等人,2021年)。传统的欧几里得嵌入和浅层图神经网络无法充分模拟这种层次传播结构,原因有两个:它们将所有邻居同等对待,没有区分基于距离的影响衰减,且缺乏捕捉级联中用户激活时间顺序的机制。此外,用户倾向于从最近被转发的用户那里获取信息,而不是从信息来源获取。尽管许多用户转发了相同的信息,但他们之间的影响是不同的(Qiu等人,2018年)。用户的特征会随着信息的转发而变化,而不是保持静态(Tang等人,2021年)。这些差距激发了以下研究需求:
(i) 如何根据社交网络的层次结构来建模用户特征? 在欧几里得空间中,图结构只能显示节点之间的连接关系,但不能表达现实世界社交网络中用户之间的层次结构。将节点映射到双曲空间并建模用户特征是一项具有挑战性的任务(Zhou等人,2023年)。
(ii) 如何捕捉信息扩散过程中用户的动态互动? 当用户转发信息时,过去用户的影响可能会随时间变化。用户在特定时间段内主要受到某些用户的影响(Jiao等人,2024a;Liu等人,2023年)。因此,有必要融合级联序列中相邻用户的特征来建模用户的局部特征。
(iii) 如何将社交网络中的静态特征与用户的动态特征结合起来? 用户的静态特征表达了他们的固有属性和潜在的扩散路径。动态特征可以表达用户参与扩散过程的动态变化,以及级联特征。因此,结合这两者可以提供更全面的用户表示,并获得更好的预测结果。
我们提出了一个深度学习模型,该模型通过双曲表示来整合用户特征。首先,将社交网络中的节点映射到双曲空间,并通过图重建过程生成双曲表示来挖掘网络结构中存在的层次信息。它利用双曲几何来编码层次距离,自然地表示树状传播结构。其次,我们使用池化层来聚合级联中用户的局部特征。它采用滑动窗口的局部聚合来模拟级联中时间相邻用户之间的顺序影响模式。第三,通过共注意力融合级联中用户和社交网络显示的特征,以获得级联的整体特征。最后,计算用户和级联之间的相似性,以确定哪些用户将来可能会转发信息。
我们的主要贡献总结如下:
•我们研究了社交网络中用户关系之间的层次结构、信息扩散的模式以及不同时间用户影响力的差异,然后进行了完整的扩散预测建模。
•我们通过欧几里得空间和双曲空间之间的相互映射来捕捉社交网络中的层次信息,并设计了一种共注意力机制来模拟信息扩散过程中的用户动态变化。
•我们在四个真实数据集上验证了我们模型的有效性,并展示了每个模块的作用。与最先进的方法相比,我们在MAP@K和Recall@K指标方面具有优势。