TriTSP:一种用于目标姿态预测的三角关节推理网络

《Computer Speech & Language》:TriTSP: A triangular joint reasoning networks for target–stance prediction

【字体: 时间:2026年02月23日 来源:Computer Speech & Language 3.4

编辑推荐:

  目标-立场预测任务通过联合建模解决传统两阶段方法的错误级联和特征交互不足问题,提出TriTSP模型并融入扩展立场三角形框架实现端到端预测。

  
JiaYu Zhang|HongLi Zhang|ChunYu Liu|ZeShu Tian|Chao Meng|YuXiang Ma
哈尔滨工业大学网络空间科学学院,中国黑龙江省哈尔滨市150001

摘要

目标-立场预测是一项从传统立场检测任务发展而来的新任务,旨在从每条推文中预测目标与立场的关系。目前,目标-立场预测任务通过两阶段方法来解决。尽管这种方法有效减轻了对手动标注的目标信息的依赖,但第一阶段目标识别任务中产生的错误会直接影响第二阶段立场检测任务的性能,从而导致明显的错误累积。此外,很难在两个子任务之间建立有效的特征交互。为了解决上述问题,我们提出了一个名为TriTSP的三角联合推理模型。该模型以联合预测的方式统一了目标特征和立场特征,以捕捉它们之间的关联和交互。此外,受人类表达立场方式的启发,我们将扩展的立场三角形框架纳入模型中,通过社交媒体中包含的显式配对来推断指定的目标-立场对。我们提出的模型不仅消除了错误累积,还有效提高了目标-立场预测任务的性能。在两个基准数据集上的实验表明,我们的模型比现有的最先进模型具有显著优势。

引言

随着数十亿人使用各种社交媒体,这些平台已成为用户之间信息传播和观点表达的重要渠道。通过对社交媒体上用户生成的内容进行立场检测,我们可以有效地及时了解公众对热点新闻、畅销产品及公共政策等社会事件的态度和立场(Li和Caragea,2021)。因此,立场检测任务在现实场景中具有重要的研究意义和应用价值。
近年来,立场检测任务引起了研究人员的广泛关注。现有研究从多个角度系统地定义和解决了这一任务,包括单目标立场检测、多目标立场检测和多模态立场检测,在政治、新闻和产品评论等领域取得了显著进展。然而,这些研究主要集中在已知目标的情况下进行立场检测。在实际应用中,尤其是在处理大量社交媒体数据时,这些方法需要手动标注推文以识别目标,这大大增加了人力成本并降低了实用性。
为了更好地适应现实世界场景,Li等人(2023a)首次提出了目标-立场预测任务。如图1(a)和1(b)所示,与传统立场检测任务不同,该任务仅提供推文,而相应的目标和立场都是未知的。因此,该任务不仅需要预测立场,还需要预测目标,这使得它比传统任务更具挑战性。为了解决这个问题,他们提出了一种两阶段方法。在第一阶段,使用文本分类模型或文本生成模型从推文中识别目标。基于第一阶段的结果,第二阶段进行立场检测以获得目标-立场对。尽管这种方法可以解决目标-立场预测任务,但目标识别阶段产生的错误会负面影响立场检测阶段的性能,导致错误累积。如图1(b)所示,如果在第一阶段识别出错误的目标,第二阶段将基于这个错误的结果进行立场检测。此外,两阶段方法难以在两个子任务之间形成有效的特征交互,进一步降低了预测质量。
在这项工作中,我们提出了一个基于扩展立场三角形框架的联合目标-立场预测模型TriTSP。该模型基于编码器-解码器架构构建。为了解决错误累积和两个子任务之间信息交互不足的问题,我们采用联合预测方法来统一子任务特征的建模,旨在捕捉不同特征之间的关联和相互影响。如图1(c)所示,联合预测方法以端到端的方式同时预测推文的目标和立场。此外,受人类表达立场方式的启发,我们将扩展的立场三角形框架(Liu等人,2023)纳入模型中。该框架如图2所示,从语言学角度描述了人类表达立场过程中的关键组成部分和推理路径,旨在通过推文中的显式目标和指定目标之间的关联进一步对齐立场标签。由于目标-立场预测任务与传统立场检测任务不同,我们在框架中将目标和立场视为一个整体来进行推理计算。我们将该框架总结为三个部分:配对推理部分、对齐部分和输出生成部分,以促进模型的构建。本文的主要贡献如下:
(1) 我们提出了一个用于目标-立场预测任务的联合预测模型TriTSP。据我们所知,这是首个针对该任务的联合预测模型研究。
(2) 我们将扩展的立场三角形框架纳入模型中,使其能够通过人类表达立场的认知过程推断推文的目标和相应立场。
(3) 在两个基准数据集上的实验结果表明,我们提出的模型显著优于现有的最先进(SOTA)模型,验证了模型的有效性。

部分摘录

传统立场检测

立场检测方法通常可以分为:基于机器学习的方法和基于深度学习的方法(Kü?ük和Can,2021)。基于机器学习的方法通常首先从推文中提取语义特征,然后根据提取的特征对立场进行分类。常见的方法包括支持向量机(Mohammad等人,2016;Addawood等人,2017)、朴素贝叶斯(Anand等人,2011;Rajadesingan和Liu,2014)和逻辑回归(Igarashi等人)

TriTSP模型

针对当前目标-立场预测研究中的挑战,我们提出了一个名为TriTSP的三角联合推理模型。该模型基于编码器-解码器结构,其中解码器是本研究的重点。模型的整体架构如图3所示。编码器模块包括序列编码器和情感编码器。解码器模块根据扩展的立场三角形框架的三个步骤构建,由三个模块组成:

数据集

为了全面评估TriTSP模型的性能,我们选择了两个基准数据集:TSE-Merged(Li等人,2023a)和PStance(Li等人,2021),分别用于模拟复杂和常规场景下的目标-立场预测任务。这些数据集的具体细节见表1。
TSE-Merged数据集是专门为目标-立场预测任务构建的,包含19个目标类别,涵盖了广泛的领域和主题:

目标识别的详细结果

目标识别是目标-立场预测任务中最基础和关键的子任务。其准确性直接决定了整体性能。因此,对于目标-立场预测模型来说,具备出色的目标识别能力至关重要。在我们的实验中,我们使用微平均F1分数(Li等人,2023a)作为评估指标来评估TriTSP模型的目标识别能力。实验结果如图7所示。

结论

在本文中,我们提出了一个名为TriTSP的三角联合推理模型。该模型通过联合预测统一了目标特征和立场特征,不仅可以探索不同特征之间的深度关联,还可以有效消除现有方法中的错误累积。此外,通过纳入扩展的立场三角形框架,我们使模型能够通过人类表达立场的方式推断推文的指定目标-立场对。

CRediT作者贡献声明

JiaYu Zhang:撰写——原始草稿、验证、软件、方法论、概念化。HongLi Zhang:撰写——审阅与编辑、监督、资金获取。ChunYu Liu:形式分析。ZeShu Tian:形式分析。Chao Meng:形式分析。YuXiang Ma:形式分析。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

本工作得到了关键技术研究与发展计划(授权号:2017YFB0803304)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号