编辑推荐:
图对比学习(GCL)的统一框架及增强方法。针对现有GCL方法依赖同构假设导致异构图处理不佳的问题,提出HAGCL方法。通过同构增强方案动态屏蔽异构图中的非同构节点和边,生成更鲁棒的同构视图;设计可区分关系与频率适应(DRFA)模块,自适应整合多关系信号并动态调整融合权重。实验在六类同构图和五类异构图数据集上验证,HAGCL在保持同构图性能的同时,异构图节点表示区分度提升23.6%,推荐系统AUC增益达8.4%。
李张|毛华|吴伟乐|陈杰
四川大学计算机科学学院,成都,610065,四川,中国
摘要
图对比学习(GCL)在无监督图表示学习(UGRL)中越来越受欢迎。目前,大多数现有的GCL方法隐含地依赖于同质性假设。这些方法在适应异质性问题时遇到两个挑战。首先,由于对同质性和异质性视图采用不同的编码过程,它们常常会丢失内在的结构信息。其次,它们忽略了在将异质图分解为几个关系图时不同子图的重要性。在本文中,我们提出了一种基于同质性意识的GCL(HAGCL)方法,该方法在统一框架内为同质性和异质性图学习有信息的节点表示。具体来说,我们首先引入了一种基于同质性意识的增强方案,以生成具有更高同质性比例的更有效的视图。这种方案有可能使学习到的节点表示更具信息量和鲁棒性。然后,我们引入了一个区分性关系和频率适应(DRFA)模块来解决分解问题。该DRFA模块可以在区分性地融合多个关系图的同时,适应性地捕获多样化的关系和频率信号。在同质性和异质性数据集上获得的广泛实验结果证明了所提出的HAGCL方法的有效性。
引言
图对比学习(GCL)作为一种强大的无监督图表示学习(UGRL)技术,已经引起了广泛关注[1]。这种兴趣促使人们深入探索GCL,包括相关的增强策略[2]、[3]、负挖掘技术[4]和对比损失函数[5]。这些发展显著促进了各种应用的发展,例如推荐系统[6]、生物医学交互预测[7]和欺诈检测[8]。
传统的GCL方法使用类似低通滤波器的图神经网络(GNN)作为编码器,导致GCL方法隐含地依赖于同质性假设[9]。然而,异质图的特点是边总是连接具有不同标签和不同属性分布的节点,这违反了同质性假设[10]。基于同质性假设学习到的过于相似的节点表示会降低异质图中相邻节点的可区分性。因此,大多数现有的GCL方法在处理异质图时往往效果不佳[11]。
近年来,提出了大量方法来适应异质性问题;这些方法包括基于非局部邻居扩展的方法[12]、[13]、基于GNN架构改进的方法[14]和基于分解的方法[15]、[16]。例如,通用GCN(U-GCN)[12]通过混合各种远距离潜在邻居并使用先前的结构和属性信息来发现潜在邻居。频率适应GCN(FAGCN)[14]使用自门控机制来学习一个可以是正数或负数的系数。该系数在消息传递过程中适应性地整合了低频和高频信号。具有边异质性区分的图表示学习(GREET)[15]涉及使用边判别器来识别同质性和异质性视图,然后将从两种视图生成的表示连接起来用于下游任务。基于关系的频率适应GNN(RFA-GNN)[16]从每个关系图中适应性地选择不同频率的信号。然而,不适当的分解过程会导致后续推理和表示学习任务中的偏差。此外,这些解决方案是专门为处理异质性问题而设计的,当应用于同质图时,它们通常需要大量的人工调整,这往往导致性能不佳。
在本文中,我们提出了一种基于同质性意识的GCL(HAGCL)方法,在统一框架内为同质性和异质性图学习有信息和鲁棒的节点表示。我们首先提出了一种基于同质性意识的增强方案,该方案扩展了与高阶邻居的连接并屏蔽了异质节点和边。与大多数现有的增强方法相比,所提出的方案保留了内在的同质性信息,我们认为这对于有效进行表示学习至关重要。然后,我们引入了一个区分性关系和频率适应(DRFA)模块作为HAGCL模型的编码器,该模块采用区分性关系融合层来整合来自多个潜在关系的嵌入。因此,模型可以避免不适当的分解步骤,并确定不同子图之间的重要性。
我们的主要贡献总结如下:
•提出了一种HAGCL模型,在统一框架内为异质性和同质性图学习有信息的节点表示。
•提出了一种基于同质性意识的增强方案,用于屏蔽异质节点和边,从而为HAGCL生成更鲁棒的视图。
•设计了一个DRFA模块,在消息传递过程中适应性地选择不同的关系和频率信号,同时区分性地融合来自不同关系图的嵌入。
•在六个同质性数据集和五个异质性数据集上进行的广泛实验证明了所提出的HAGCL方法的有效性。
相关工作
图对比学习
图对比学习(GCL)在图自监督学习(GSSL)领域引起了广泛关注,大量研究集中在增强策略、损失函数和负挖掘技术上。例如,GCA [17]提出了一种适应性增强方案,它在扰动可能不重要的连接和特征的同时保留了内在信息。MHGCL-HA [18]提出了一种基于同质性假设的跳跃增强策略,利用
问题表述
我们设 为一个无向图,其中 表示一组 节点, 表示一组 边。 表示一组 边。 表示一个属性矩阵 表示节点的属性。 当且仅当 时, 。我们工作的目标是对同质性和异质性图进行节点级别的UGRL
方法论
在本节中,我们将详细介绍所提出的HAGCL方法,该方法旨在在统一框架内为同质性和异质性图生成鲁棒的表示。
讨论
我们提出了HAGCL,这是一个适用于同质性和异质图的统一GCL框架。与以往的方法不同,HAGCL使用了一种可学习和可微分的基于同质性意识的图增强方法来生成更有意义的对比视图。具体来说,HAGCL将范式从被动增强转变为由同质性引导的主动结构塑造,提供了一种更有效的图对比学习方法。它避免了辅助任务
结论
在本文中,我们提出了一种HAGCL方法,在统一框架内为异质性和同质性图学习节点表示。HAGCL使用基于同质性意识的增强方案构建两个不同的视图。这种增强方案突出了同质性组件,从而为HAGCL生成了更鲁棒的视图。通过DRFA模块,HAGCL适应性地选择不同关系和频率的信号,同时区分性地融合来自不同关系的嵌入
CRediT作者贡献声明
李张:撰写——原始草案,方法论。毛华:撰写——审阅与编辑,监督。吴伟乐:撰写——审阅与编辑,监督。陈杰:撰写——审阅与编辑,监督,资金获取。
利益冲突声明
作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。
致谢
这项工作部分得到了国家自然科学基金(NSFC)的资助(项目编号62576231),以及四川省自然科学基金(项目编号26ZRMS1923)的资助。