通过多任务嵌入学习解析社交媒体数据中的政治偏见

《IEEE Transactions on Computational Social Systems》:Disentangling Political Bias in Social Media Data Through Multitask Embedding Learning

【字体: 时间:2026年02月20日 来源:IEEE Transactions on Computational Social Systems 4.9

编辑推荐:

  社交媒体知识图谱中的偏见分离与多任务嵌入学习

  

摘要:

社交媒体是了解社区事件、个人交流和其他社交活动的重要信息来源。因此,从社交媒体数据中挖掘信息已被广泛研究。最近的研究表明,可以从社交媒体数据中构建知识图谱,并有效地对其进行挖掘,这些知识图谱生成的嵌入向量通常包含了关于社交媒体实体的结构信息。然而,也发现从社交媒体数据中学习得到的嵌入向量可能包含社会偏见。虽然嵌入向量中的偏见通常被认为是不希望出现的,但目前能够将偏见从嵌入向量中分离出来的研究工作仍然较少。在本文中,我们提出了一种偏见分离模型,该模型将嵌入向量分为两部分:一部分保留了通用信息但去除了偏见,另一部分则包含了经过处理的偏见。这两组嵌入向量可以用于具有不同信息需求的计算任务。我们的方法——通过多任务嵌入学习(DisMEL)来分离偏见——基于知识图谱嵌入技术和监督式分离模型。除了对生成的嵌入向量进行定性分析外,我们还在两个下游任务中对该方法进行了测试,分别是用户政治偏见预测和推文推荐。我们使用收集并准备的大规模日本政治社交媒体数据集,将我们的方法与几种基线方法进行了实验评估。结果表明,当使用去偏后的嵌入向量集时,与政治偏见无关的任务性能得到了提升;而当使用带有偏见的嵌入向量集时,与政治偏见相关的任务性能也得到了提升。虽然本文主要关注政治偏见问题,但我们的方法也可以应用于其他类型的偏见,如性别或种族偏见。

引言

像X(前身为Twitter)、YouTube和Reddit这样的社交媒体平台,由于数亿用户在这些平台上的活动,产生了海量数据[1]、[2]。因此,近年来,从社交媒体中提取有用信息已成为信息科学研究的一个重要课题。这些有用信息可能包括事故和自然灾害的位置[3]、[4],以及犯罪指标[5]、[6]。它还可能包含用户的隐藏信息,如政治意识形态[7]、地理偏好[8]和产品偏好[9]。在本文中,我们重点关注可能与社交媒体实体(如用户、位置和标签)相关的政治偏见。此前,人们通常通过用户网络[7]或基于文本的方法[8]来推断用户的政治偏见。我们发现,目前还缺乏一种结合文本和用户关系的方法。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号