用于抽象对话摘要的语义结构融合图

【字体: 时间:2026年03月04日 来源:Neurocomputing 6.5

编辑推荐:

  对话摘要旨在生成简明文本摘要,需捕捉多说话者对话中的关键语义信息。现有图构建方法与总结模型脱节,导致全局语义依赖捕捉不足、跨图信息交互困难及训练目标对齐问题。本文提出语义结构融合图(SSFG)模型,通过整合意图特征图、时序依赖图和交互强度图等多维度语义图,结合二维卷积实现早期跨图结构融合,并引入门控机制动态调节结构信息注入强度,实现图构建与训练目标对齐。实验表明SSFG在DialogSum、TODSum和MediaSum-NPR三个基准数据集上ROUGE 1/2/L指标显著优于基线模型。

  
Furui Wang|Zhenfang Zhu|Qiang Lu|Shuai Gong|Hongli Pei|Zhenrui Fu|Dawei Zhao
山东交通大学信息科学与电气工程学院,济南,250357,山东,中国

摘要

摘要性对话摘要旨在通过捕获关键信息,从多方对话中生成简洁的文本摘要。现有研究通常采用图构建方法来捕捉对话中的动态关键信息。然而,这些图构建方法通常与摘要模型是分离的。因此,它们往往难以捕捉全局语义依赖关系,实现跨异构图结构的信息交互,并保持图学习与模型训练目标的一致性,这可能导致学习到的图表示与最终生成的摘要之间存在脱节。在本文中,我们提出了一种新的对话摘要模型——语义结构融合图(SSFG),旨在弥合这一差距。SSFG将对话的语义结构与摘要过程集成在一起,而不是将它们视为两个独立的任务。具体来说,我们利用先验知识和句法结构来指导多个语义图的构建。然后,我们采用二维卷积进行早期结构融合,以实现这些不同图结构之间的有效交互。此外,我们引入了一种门控机制,在训练过程中动态控制融合策略,明确对齐图构建和学习阶段。在三个基准数据集(DialogSum、TODSum和MediaSum-NPR)上进行的广泛实验表明,SSFG的性能优于大多数现有基线模型。代码可在此处获取:
https://github.com/fffrey/SSFG

引言

随着即时通讯、在线会议和社交媒体平台的日益普及,以非正式文本表达的随意对话迅速成为日常交流的主要媒介[1]。此类对话通常表现出跨轮次的信息分散和口语噪声,导致关键信息分散在多个主题和说话者之间[2]、[3]。因此,提出了摘要性对话摘要方法,以基于对对话中语义交互的深入理解来生成准确且简洁的摘要,这已成为文本摘要领域的一个突出研究焦点[4]。
当前关于摘要性对话摘要的研究主要采用端到端生成范式。这一范式内的关键研究方向包括使用数据增强来提高摘要的多样性[5];设计具有辅助目标(如主题预测)的多任务框架来指导生成[6];以及整合来自人类反馈的强化学习(RLHF)来优化摘要策略[7]。然而,对话摘要仍然具有挑战性,因为关键信息通常在多个轮次和说话者之间动态分散,需要模型捕捉跨轮次依赖关系,并在局部上下文之外聚合语义相关的内容[8]。为了更好地说明这一固有挑战并激发显式结构建模的必要性,图1展示了TODSum中的一个对话示例。传统的序列到序列方法(左)通常将对话历史视为线性文本序列,这使得难以一致地聚合跨轮次和说话者的分散关键信息。基于图的方法(右)通过构建多类型语义图并将其集成到端到端生成中,提供了一种明确这些结构信号的方式。在我们的方法中,意图特征图(FWG)连接具有相似意图相关语义的发言;序列依赖图(SDG)突出显示对话时间线上的局部时间依赖关系;说话者交互图(SIG)模拟说话者之间的交互强度。通过第4.6节中的受控模块级和图级消融实验,验证了引入这些语义图的有效性以及融合和对齐设计的必要性。
研究人员提出了一系列基于异构图的对话摘要模型。Chitale等人[9]从说话者交互的角度来处理这一任务,使用角色感知的 discourse 图来捕捉非线性叙述中的结构线索;然而,由于受限于单一异构图,它无法捕捉全局语义。Lei等人[10]引入了四种细粒度的对话语义结构,以帮助模型理解基本话语单元层面的语义关系,但没有对这些细粒度结构之间的交互进行建模。Gao等人[11]在句子层面构建图结构,以探索多个主题之间的长距离依赖关系和多个说话者之间的语义交互;然而,训练阶段与图学习阶段并未有效对齐。尽管这些方法在一定程度上推进了对话摘要的发展,但我们总结了现有基于图的方法中的三个共同挑战:
  • 关键信息的语义捕获。现有的单一图或局部图方法可能不足以有效捕获在多个对话轮次和说话者之间动态分散的全局语义依赖关系,从而限制了生成摘要的丰富性和一致性。
  • 图结构之间的信息交互。多个异构图通常是独立构建的,并以粗粒度方式集成,缺乏有效的图间信息传递和语义对齐,从而阻碍了一致的全局语义表示和跨粒度融合。
  • 图学习与模型训练之间的对齐。异构图通常将固定边作为先验结构信息输入模型,将结构学习与生成目标分开。这可能会阻碍语义特征有效地为图构建提供反馈,导致阶段之间的不匹配,从而限制了结构先验对生成策略的解释能力。
  • 为了解决这些问题,我们提出了语义结构融合图(SSFG)模型,该模型将先验语义图集成到摘要生成过程中。这种方法使得显式结构信息与隐式生成阶段的无缝集成成为可能,促进了图构建和模型优化之间的端到端训练。首先,我们利用先验知识和句法结构来指导语义图的构建,明确捕获意图特征、时间特征和对话交互的关键语义信息。其次,考虑到各种图结构之间的语义粒度差异,我们引入了一种二维卷积机制,以捕获局部2跳语义单元之间的交互模式并提取相关的语义组合特征,从而在语义表示的早期阶段实现图结构的融合。此外,为了在训练过程中有效对齐语义融合图与图注意力,我们设计了一种门控机制,动态控制结构信息融合的强度,从而实现图构建和图学习阶段之间更高效的语义对齐。
    为了评估SSFG的性能,我们使用ROUGE在三个广泛使用的对话数据集(DialogSum、TODSum和MediaSum-NPR)上对其进行了评估。我们的主要贡献如下:
  • 我们构建了一个由外部知识库支持的图,以及两个基于句法-语义特征的图,使模型能够捕获超出句子级别结构的语义信息以及话语之间的特征。
  • 我们引入了一种图融合策略,该策略在摘要生成的早期阶段使用二维卷积有效融合结构信息,而门控机制在训练过程中动态调节结构信息融合的程度。
  • 全面的实验结果和案例分析表明,SSFG在ROUGE 1/2/L上的表现显著优于大多数主流基线模型,并在事实准确性和摘要连贯性方面表现出色。
  • 部分摘录

    摘要性对话摘要

    对话摘要是文本摘要领域中一个新兴的子领域,吸引了大量关注。与传统的文档摘要不同,它通常在多种对话场景中进行研究,例如媒体采访[12]、会议讨论[13]、在线对话[1]和日常对话[2]。与通过选择关键句子或关键词生成摘要的提取方法相比,摘要性方法能够理解

    方法论

    为了解决现有图构建方法在摘要性对话摘要中的三个关键限制,我们提出了SSFG。如图2所示,所提出的模型引入了四种类型的语义特征图来捕获对话中的多维结构信息。它使用二维卷积实现早期跨异构图的融合,并结合了门控机制来动态调节结构信息的注入强度

    实验

    为了系统评估SSFG,我们在涵盖不同领域和对话长度的三个基准对话摘要数据集上进行了实验。我们测试了通过SSFG显式建模多粒度语义结构可以带来更好摘要质量的中心假设,并通过补充评估检验了所提出框架的鲁棒性、组件贡献和可解释性。本节的组织结构如下:第4.1节介绍

    案例研究

    如表9所示,本节展示了测试集中的几个具体案例。通过将参考摘要与多个模型生成的摘要进行比较,进一步证明了SSFG生成的摘要的文本质量。
    在DialogSum案例中,对话的核心在于[D1],其中Polly因工作疲劳想要买一杯软饮料作为短暂的放松。然而,由于Person1的老板恰好在商店里,因此在[D2]中请求帮助被拒绝了。BART-Large错误地绘制了

    结论与未来工作

    本文提出了一种语义结构融合图(SSFG)模型,以解决现有基于图的摘要性对话摘要模型的不足之处。SSFG通过结合显式的图结构和隐式的端到端训练,实现了结构信息与语义表示之间的有效协作。具体来说,SSFG在模型的早期阶段构建了多个语义图,并促进了不同图结构之间的信息融合。

    CRediT作者贡献声明

    Furui Wang:撰写——原始草稿、可视化、验证、软件、项目管理、方法论、调查、形式分析、数据整理、概念化。Zhenfang Zhu:撰写——审阅与编辑、验证、资源管理、项目管理、资金获取。Qiang Lu:撰写——审阅与编辑、验证、项目管理。Shuai Gong:撰写——审阅与编辑、验证、调查。Hongli Pei:撰写——审阅与编辑、验证、调查。

    伦理批准

    本术语不适用。

    利益冲突声明

    作者声明他们没有已知的利益冲突或个人关系可能影响本文报告的工作。

    致谢

    本工作部分得到了教育部人文社会科学青年基金(24YJC740057)和济南市“20新大学”项目(Grant 20233302)的支持。
    Furui Wang是山东交通大学信息科学与电气工程学院(人工智能学院)的研究生。他的研究兴趣在于自然语言处理,特别是对话和文本摘要。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号