《Neural Networks》:Trainable-Parameter-Free Structural-Diversity Message Passing for Graph Neural Networks
编辑推荐:
这篇综述的核心思想是,为了解决图神经网络(GNN)在现实异构图数据中因邻居结构同质化聚合导致的表示退化问题,研究者提出了一种无训练参数的结构多样性消息传递图神经网络(SDGNN)框架,该框架通过结构多样性驱动的组内统计与组间选择,有效建模邻域异质性并稳定特征语义,在低监督、类不均衡等挑战性场景下展现卓越性能。
突出亮点
- •
- 1.
我们提出了一种由结构多样性驱动的无训练参数图神经网络框架。该框架建立了一个统一的结构多样性消息传递范式,能够显式地捕捉邻域结构的异质性,实现高效且可解释的节点表示学习。
- •
- 2.
我们系统性地引入了三种互补的组划分策略(结构驱动、特征驱动和混合型),在效率、适应性和表达能力之间取得平衡。其中,结构驱动的划分策略与基于归一化传播的全局结构增强模块相结合,被进一步提出来捕捉全局结构和语义特征。
- •
- 3.
我们在九个公共基准数据集和一个跨学科的PubMed引文网络上进行了全面实验,证明了SDGNN在结构复杂场景下的优越性。此外,在跨学科任务中,我们揭示了不同跨组融合策略的互补作用,突显了模型在多样化场景下的稳定性和泛化能力。
结构多样性
结构多样性源于社交网络分析,用于衡量个体连接在社群间的广度及其信息来源的异质性。在《弱连接的强度》一文中,Granovetter展示了弱连接能够跨越社群边界,促进异质性信息的扩散。在此基础上,结构洞理论进一步揭示了位于结构洞位置的节点能够跨越多个原本不相连的社群,从而在信息流和控制优势方面发挥关键作用。在复杂的生物网络(例如蛋白质相互作用网络或疾病-基因关联网络)中,节点的邻域通常也包含多个结构上独立或语义上不同的功能模块。SDGNN借鉴了这一思想,将结构多样性的概念形式化为消息传递过程中的邻域划分原则。
基本定义
定义 1 邻域集
设一个无向图 G = (V, E),其中 V 是节点集,|V| = n 表示节点数量,E ? V × V 是边集。对于任意节点 v ∈ V,其邻域集定义为:N(v) = {u ∈ V | (v, u) ∈ E}。节点 v 的原始特征向量记作 xv。
定义 2 节点表示
在第 l 层,节点 v 的特征表示记作 hv(l)。对于初始层(输入层),我们有:hv(0)= xv。
定义 3 结构多样性
在图 G = (V, E) 中,对于任意节点 v ∈ V,设其一跳邻域为 N(v)。考虑诱导子图 G[N(v)],并对其进行分组划分。结构多样性旨在量化该节点邻域内不同子结构组的丰富程度和差异性。
结构多样性消息传递图神经网络
本文提出了一种新颖的无训练参数图神经网络框架——SDGNN。其核心是结构多样性消息传递机制,该机制显式地建模了节点与其邻居组之间的多样化交互。在不引入任何可训练的聚合参数的情况下,SDMP实现了一个灵活、统一且富有表达力的特征聚合过程。
图2展示了SDGNN的整体计算流程。以输入图中的目标节点 v 为例,模型首先根据连通性或特征相似性,将节点 v 的邻域 N(v) 划分为多个子组。对于每个子组,计算其“组内共识”(例如,组内节点特征的平均值)。随后,模型在不同子组的共识之间进行“组间选择”(例如,应用最大值池化)。通过这种“组内统计-组间选择”的策略,模型能够有效抑制组内噪声,同时捕捉不同子组所代表的结构和语义多样性。SDGNN结合了结构驱动、特征驱动和伪聚合等三种互补的分组策略,并通过归一化传播结构增强模块捕获全局语义依赖。最后,通过跳跃知识机制融合多层表示,并通过一个轻量级的多层感知机输出最终结果。
实验
为了全面验证所提出的SDGNN框架及其各种组划分策略在不同任务和场景下的有效性,我们设计了一系列系统性实验,涵盖了节点分类、跨学科节点识别和消融分析等多个方面。所有实验均基于统一的模型配置和评估标准,重点考察多个数据集、任务以及不同的训练比例。目标是通过在不同图结构、标注率、类别不平衡条件下的表现,深入评估SDGNN的核心优势、适用场景和理论边界。
层深度对性能的影响
为了研究网络深度对不同SDGNN策略性能的影响,我们在Cora数据集上评估了六种变体在不同层数下的节点分类准确率。结果如图6所示。
总体而言,所有策略在浅层网络下均取得了相对稳定的性能。然而,随着网络深度的增加,准确率普遍下降,这主要是由于过度平滑效应。在深层网络中,基于DBSCAN和特征驱动的分组策略表现出了更好的鲁棒性,表明结构多样性感知有助于缓解信息过度同质化。相比之下,纯结构驱动的变体在超过4层后性能下降更为明显,这提示在高阶邻域中进行精确的结构划分可能更具挑战性。
结论
本文提出了一种基于结构多样性的无训练参数图神经网络框架SDGNN,它以一种统一的方式对节点邻域的结构异质性和语义一致性进行建模,而无需依赖任何可训练参数。该方法以结构多样性消息传递机制为核心计算范式,结合了三种无训练参数的组划分策略和一个基于归一化传播的结构增强机制。