以边缘为中心的社区在属性网络中基于持久性进行隐藏

《Neurocomputing》:Edge-centric community hiding based on permanence in attributed networks

【字体: 时间:2026年02月06日 来源:Neurocomputing 6.5

编辑推荐:

  针对有属性网络社区检测中的隐私泄露问题,本文提出APERM算法,通过计算节点间属性和结构相似性识别紧密同质节点(CHN),缩小边扰动搜索空间,有效破坏社区结构。实验表明该方法在六个真实数据集上优于现有方案。

  
冯志超|张博涵|景俊昌|刘东
河南师范大学计算机与信息工程学院,新乡市,453007,河南,中国

摘要

属性网络既包含结构连接,也包含丰富的节点属性,这些对于社区结构的形成和识别至关重要。尽管整合属性数据可以提高社区检测算法的准确性,但也增加了隐私泄露的风险。为了解决这个问题,社区隐藏成为了一种有前景的解决方案。然而,大多数现有研究都集中在拓扑网络上,对属性网络的研究相对较少。针对这些问题,我们提出了属性持久性(APERM)——一种专门为属性网络设计的新社区隐藏方法,该方法通过量化持久性损失来识别对扰动具有结构影响的边。我们的扰动策略旨在破坏全局社区结构,这通常涉及考虑网络中所有现有的和潜在的边,从而引入了相当大的计算复杂性。为了解决这个问题,我们引入了一种策略,通过整合结构相似性和属性信息来识别紧密同质节点(CHN),从而显著减少了边扰动的搜索空间。来自八个社区检测算法(四个针对属性网络,四个针对非属性网络)在六个真实世界数据集上的实验结果表明,我们提出的APERM算法不仅实现了有效的社区隐藏,而且还保持了良好的性能。

引言

随着社交网络[1]、[2]和在线平台的快速发展,大量用户及其互动在网络中变得越来越复杂。社交网络不仅反映了节点(用户)之间的结构关系,还经常携带大量的节点属性信息,如用户的年龄、兴趣、地理位置等。这种包含节点属性的网络被称为属性网络。属性网络[4]中的社区结构[3]通常比拓扑网络更复杂、更具表现力,因为节点属性在确定社区划分中起着重要作用。因此,属性网络的社区检测算法不仅依赖于网络的拓扑结构,还依赖于节点的属性信息,从而在社区识别方面具有更高的精度[5]。
近年来,由于社区检测算法能够分析和从属性网络中提取有效信息,它们受到了广泛关注,并提出了多种检测算法,例如基于标签传播的SAS-LP[6]算法、基于图卷积网络的MGAE[7]算法、基于自适应图卷积方法的AGC[8]算法等。然而,社区检测算法的过度数据挖掘导致了隐私泄露[9],从而侵犯了用户的权利。
为了减轻恶意社区检测算法造成的隐私泄露,研究人员提出了社区隐藏[9],通过修改网络的结构来保护用户隐私。然而,目前研究人员提出的社区隐藏算法针对的是非属性社区检测算法,并未应用于攻击属性社区检测算法。因此,迫切需要设计保护用户隐私的属性网络社区隐藏算法。
现有的整个社区结构隐藏算法通常会考虑网络中所有现有的和潜在的边,导致解决方案空间过大。为了更有效地应对这一挑战,我们引入了一种策略,通过整合结构相似性和属性信息来识别紧密同质节点(CHN),从而显著缩小了解决方案空间。据我们所知,这是首次引入CHN概念以减少属性网络社区隐藏中的解决方案空间。
在图1中,三个节点——杰克(Jack)、艾玛(Emma)和萨姆(Sam)在结构上是相连的,并且有共同的邻居,它们在属性方面也极其相似。这些节点被称为紧密同质节点,通常会在网络中聚集成簇。这样的簇通常会被社区检测算法分配到相同的社区中。因此,为了有效攻击各种社区检测算法,我们通过重新连接紧密同质节点来扰动网络,从而实现社区隐藏并保护用户隐私。
当前工作的挑战如下:
  • 1)
    为了在属性网络中有效实施社区隐藏,可以将全局属性网络的社区隐藏问题形式化为一个优化问题,以策略性地扰动图结构。
  • 2)
    现有的属性网络隐藏算法仅对非属性网络检测算法有效,尚未考虑如何有效对抗属性网络检测算法。
  • 3)
    大多数当前的全球隐藏社区隐藏算法考虑了网络中所有存在的和不存在的边,这使得解决方案空间异常庞大,因此如何将解决方案空间置于有效范围内是当前的问题。
  • 我们工作的主要贡献总结如下:
  • 1)
    在属性网络中,每个节点不仅在结构上相连,还与一组属性相关联。基于这一特点,我们将全局属性网络社区隐藏问题形式化为一个优化问题。
  • 2)
    我们通过识别和扰动网络中的紧密同质节点(CHN)将解决方案空间缩小到有效范围内。这种策略显著减少了候选边的数量,从而提高了我们社区隐藏算法的效率。此外,为了有效攻击属性网络上的社区检测算法,我们提出了属性持久性(APERM)算法,该算法通过量化持久性损失来识别需要修改的高影响力边。
  • 3)
    算法的有效性已经得到验证。我们在几个真实网络上对各种属性网络社区检测算法进行了实验。实验结果表明,与现有的社区隐藏算法相比,我们的算法在保护用户隐私方面更有效。
  • 本文的其余部分结构如下。第2节回顾了相关工作并介绍了社区隐藏领域的当前研究进展。第3节描述了符号表示和社区隐藏问题。第4节详细阐述了社区隐藏方法APERM,第5节通过真实世界数据集上的实验评估了APERM算法的性能,并与该领域的基准算法进行了比较。第6节提供了本文的全面总结,并探讨了未来研究的潜在方向。

    相关工作

    相关工作

    社区检测算法旨在检测网络中的密集子结构(即社区),在这些子结构中,节点之间的连接比与子结构外的节点更紧密。作为图论中的一个关键研究课题,社区检测在社交网络分析、推荐系统[10]、生物学[11]和智能交通场景[12]、[13]中得到了广泛应用。因此,社区检测算法最近引起了广泛关注

    符号表示和社区隐藏问题描述

    属性网络可以表示为一个三元组,其中是节点集,是表示节点之间结构关系的边集,表示属性向量集。中的节点相关联,并描述了它们的特征。术语表示顶点总数,定义为。术语表示边总数,定义为。术语表示属性向量的维度。表示属性社区

    研究方法

    在本节中,我们描述了从网络中提取CHN的程序。然后,我们解释了如何将持久性损失扩展到属性网络,以指导边的添加和删除,从而实现有效的社区隐藏。

    实验结果

    在实验部分,我们通过真实世界数据集上的实验和与基准方法的比较来验证所提算法的有效性。

    结论

    社区检测算法是通过揭示图的内在结构来分析和优化各种现实世界问题的重要工具。然而,它们也可能导致隐私泄露——特别是在属性网络中,由于敏感属性信息的丰富,这种风险进一步增加。为了解决这个问题,我们提出了一种基于CHN概念的属性网络社区隐藏方法。该方法实现了有效的社区隐藏

    CRediT作者贡献声明

    冯志超:撰写——原始草案,验证,软件,方法论。张博涵:调查,数据整理。景俊昌:可视化,资金获取,形式分析。刘东:撰写——审稿与编辑,监督,资金获取,概念化。

    利益冲突声明

    作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

    致谢

    本工作得到了国家自然科学基金(62072160)和河南省重点科技项目(242102211076)的支持。
    冯志超目前正在河南师范大学计算机与信息工程学院攻读硕士学位,他的研究兴趣是复杂网络中的信息隐藏。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号