利用双曲表示法挖掘用户特征以进行扩散预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Neural Networks》：Mining User Features with Hyperbolic Representations for Diffusion Prediction

【字体：大中小】 时间：2026年03月16日 来源：Neural Networks 6.3

编辑推荐：

　　信息扩散预测中，现有模型难以有效捕捉社交网络的层级结构和动态用户交互。本文提出Hyper-MUF框架，通过超球面嵌入重构社交网络拓扑，同时利用池化和注意力机制提取信息级联中的动态特征，最终融合静态与动态特征进行预测。实验表明，相比SOTA方法，在四个真实数据集上MAP@K和Recall@K指标提升10%-20%。

乔鹏飞|严鹏|张吉林|赵志东|苏芳芳|张旺

杭州电子科技大学网络空间学院，中国杭州310018

摘要

信息扩散的研究在现实世界的应用中具有重要的实践意义，已经吸引了许多学者的关注。尽管取得了显著的进展，现有的扩散预测模型仍然存在几个关键限制：(i) 基于欧几里得的嵌入方法无法捕捉社交网络中的层次结构；(ii) 大多数模型忽略了用户之间的逐层传播动态和相互影响，导致行为建模效果不佳。为了解决这些不足，我们提出了一个名为Hyper-MUF的新深度学习框架，该框架利用双曲表示来挖掘静态和动态的用户特征以进行扩散预测。具体来说，该模型首先在双曲空间中重建社交网络以捕捉用户之间的层次关系。除了社交网络中的静态用户表示外，我们还使用池化和注意力机制来挖掘用户在不同时间序列中的动态特征，以适应扩散过程。通过整合这两个方面，Hyper-MUF提供了一种统一的表示方法，既反映了信息扩散的结构层次，也反映了时间演变。我们在四个真实数据集上验证了该模型的性能，并展示了该方法中每个模块的有效性。在大型数据集中，与最先进的方法相比，我们的模型预测性能提高了10%到20%，显示出该模型的优越性。

引言

社交媒体的出现使得人们之间的交流变得更加方便。用户经常在Twitter和Douban等社交平台上分享他们的状态和轶事（Jiao等人，2021年）。伴随着这些分享行为，产生了大量的信息（Jiao等人，2024c；Lin和Cohen，2010年）。在线社交网络中的信息扩散影响了许多社会和工程问题，包括推荐（Krishnan等人，2019年；Wu等人，2019年）、流行度预测（Jiao等人，2025年；Xu等人，2023b；Zhou等人，2020年）以及假新闻控制（Vosoughi等人，2018年）。因此，全面理解扩散机制在实践上非常重要，同时在科学上也具有挑战性。

存储信息传播路径的载体被称为级联（Wang等人，2022b）。相关研究分为两类：微观级联（Sun等人，2022年）研究和宏观级联研究（Xu等人，2023a）。它们的关注点和应用场景不同。宏观级联研究根据过去的信息传播规模预测未来的流行度。微观级联研究，也称为扩散预测，主要根据已知的信息传播路径预测哪些用户将来会受到影响。

大多数早期的扩散预测方法基于线性阈值（LT）模型（Talukder等人，2019年）和独立级联（IC）模型（Kempe等人，2003年）。随后，基于特征工程的方法出现了（Guo和Shakarian，2016年），这些方法根据信息扩散过程中的特征来建模用户特征，包括主题（Barbieri等人，2013b）、角色（Yang等人，2015年）、社区（Barbieri等人，2013a）和结构模式（Zhang等人，2017年），以完成扩散预测。然而，这些方法需要手动特征提取，且预测效果受到数据质量的限制。

深度学习模型（Pan等人，2022年；Wang、Chen、Xi、Huang、Xie，2022a；Wang、Ji、Shi、Wang、Ye、Cui、Yu，2019年）已成为模拟信息扩散过程的主流方法。级联序列是扩散预测过程中不可或缺的组成部分，因为它象征着用户信息传播的时间顺序（Wang等人，2021年）。最先进的方法将社交网络结构（GE和CHEN，2020年）与级联序列结合起来，微建模用户特征（Sankar等人，2020年），以实现预测信息传播路径的目的。如图1所示，社交网络结构和级联序列被输入到预测模型中，以捕捉用户特征。它挖掘了已知扩散过程中种子用户与其他用户之间的隐藏共性，并选择未来可能受到影响的用户（Zhong等人，2023年）。

现有的微观扩散预测方法已经取得了显著的进展，但仍存在一些持续的局限性。社交网络中的信息扩散本质上遵循逐层传播模式，其中影响从种子用户通过连续的邻居层级传播（Wu等人，2021年）。传统的欧几里得嵌入和浅层图神经网络无法充分模拟这种层次传播结构，原因有两个：它们将所有邻居同等对待，没有区分基于距离的影响衰减，且缺乏捕捉级联中用户激活时间顺序的机制。此外，用户倾向于从最近被转发的用户那里获取信息，而不是从信息来源获取。尽管许多用户转发了相同的信息，但他们之间的影响是不同的（Qiu等人，2018年）。用户的特征会随着信息的转发而变化，而不是保持静态（Tang等人，2021年）。这些差距激发了以下研究需求：

(i) 如何根据社交网络的层次结构来建模用户特征？ 在欧几里得空间中，图结构只能显示节点之间的连接关系，但不能表达现实世界社交网络中用户之间的层次结构。将节点映射到双曲空间并建模用户特征是一项具有挑战性的任务（Zhou等人，2023年）。

(ii) 如何捕捉信息扩散过程中用户的动态互动？ 当用户转发信息时，过去用户的影响可能会随时间变化。用户在特定时间段内主要受到某些用户的影响（Jiao等人，2024a；Liu等人，2023年）。因此，有必要融合级联序列中相邻用户的特征来建模用户的局部特征。

(iii) 如何将社交网络中的静态特征与用户的动态特征结合起来？ 用户的静态特征表达了他们的固有属性和潜在的扩散路径。动态特征可以表达用户参与扩散过程的动态变化，以及级联特征。因此，结合这两者可以提供更全面的用户表示，并获得更好的预测结果。

我们提出了一个深度学习模型，该模型通过双曲表示来整合用户特征。首先，将社交网络中的节点映射到双曲空间，并通过图重建过程生成双曲表示来挖掘网络结构中存在的层次信息。它利用双曲几何来编码层次距离，自然地表示树状传播结构。其次，我们使用池化层来聚合级联中用户的局部特征。它采用滑动窗口的局部聚合来模拟级联中时间相邻用户之间的顺序影响模式。第三，通过共注意力融合级联中用户和社交网络显示的特征，以获得级联的整体特征。最后，计算用户和级联之间的相似性，以确定哪些用户将来可能会转发信息。

我们的主要贡献总结如下：

•

我们研究了社交网络中用户关系之间的层次结构、信息扩散的模式以及不同时间用户影响力的差异，然后进行了完整的扩散预测建模。

•

我们通过欧几里得空间和双曲空间之间的相互映射来捕捉社交网络中的层次信息，并设计了一种共注意力机制来模拟信息扩散过程中的用户动态变化。

•

我们在四个真实数据集上验证了我们模型的有效性，并展示了每个模块的作用。与最先进的方法相比，我们在MAP@K和Recall@K指标方面具有优势。

本文的其余部分组织如下。第2节回顾了扩散预测和双曲表示学习的相关工作。第3节介绍了必要的预备知识，包括问题表述和双曲几何。第4节详细介绍了提出的Hyper-MUF框架。第5节描述了实验设置，并报告了在四个真实世界数据集上的结果，包括与最先进基线的比较、消融研究和敏感性分析。最后，第6节总结了本文并讨论了未来的研究方向。

初步

我们的研究目标是根据已知的信息传播路径预测谁将来会进一步传播信息。在进行预测研究之前需要准备的信息如下所述。

G = (V, E)

，其中

V = {v_{1}, v_{2}, ?, v_{N}}

表示用户集合，

E ? V \times V

表示它们之间的社交链接集合（例如，友谊、关注或回复关系）。社交网络捕捉了静态的结构连接

提出的模型

我们提出了一个用于信息扩散预测的深度学习模型Hyper-MUF。图2展示了提出的Hyper-MUF框架的概览，说明了端到端的工作流程及其主要组件之间的交互。该框架从双曲图重建开始，将社交网络中的用户表示嵌入到双曲空间中以捕捉层次结构信息。随后，级联序列模块执行局部聚合

数据集

我们使用了来自问答网站（Android和Christianity）和社交平台（Douban和Twitter）的数据。表2提供了所有数据集的详细信息。

•

Android 数据来自Stack-Exchanges，这是一个社区问答网站。用户之间的链接包括提问或回答。

•

Christianity 数据包含Stack-Exchanges上与基督教主题相关的用户问题和回答关系。

•

Douban

讨论与结论

社交网络内部的复杂层次结构对信息传播有显著影响。很明显，用户的偏好会随着他们遇到的各种信息而演变。通过识别用户行为的动态性质，本研究通过深入探讨层次结构并细致建模用户特征的时间动态，与现有方法区分开来。我们的实验发现验证了这一点

CRediT作者贡献声明

乔鹏飞：调查。严鹏：撰写——原始草稿。张吉林：数据整理。赵志东：方法论。苏芳芳：验证。张旺：撰写——原始草稿。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

这项工作部分得到了浙江省重点研发计划项目（项目编号2025C01023和2024C01102）以及国家自然科学基金（项目编号62372146和62506106）的支持。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号