EditCoT:一种用于多意图文本修订的逐步思维链推理框架

《ACM Transactions on Asian and Low-Resource Language Information Processing》:EditCoT: A Stepwise Chain-of-Thought Reasoning Framework for Multi-Intent Text Revision

【字体: 时间:2026年02月16日 来源:ACM Transactions on Asian and Low-Resource Language Information Processing

编辑推荐:

  多意图文本修订框架EditCoT通过分步推理解决复杂文本缺陷,在MITR数据集上实现SARI 65.80和BERTScore 88.27,相比传统单意图模型更具灵活性和跨任务迁移能力。

  

摘要

AI 摘要

AI 生成的摘要

该摘要由基于已发表文章文本的自动化系统生成。

生成日期:2026年2月14日。

本研究介绍了 EditCoT,这是一个新颖的框架,它将思维链推理应用于多意图文本修订任务。该框架将修订过程分解为一系列顺序推理步骤,每个步骤针对特定的文本缺陷,如语法、流畅性、连贯性或清晰度。EditCoT 不需要为不同类型的编辑分别使用不同的模型,而是通过一个编辑链结构,使单个大型语言模型能够系统地解决多种文本质量问题,从而引导逐步推理。

核心创新在于构建了一个编辑链,这本质上是一个从编辑意图模式构建的推理模板。每个推理步骤都包含对编辑意图的自然语言描述以及相应的演示,展示如何解决该特定类型的缺陷。一个步骤修订后的句子成为下一个步骤的输入,从而形成一个迭代改进过程。有三条关键规则确保模型正确遵循编辑链:句子必须根据给定的意图进行重写;如果句子没有相应的缺陷,则保持不变;所有步骤必须按顺序执行,不得跳过。

为了支持这项研究,作者创建了 MITR,这是一个多意图文本修订数据集,包含317个样本,涵盖六种编辑意图类别,其中每个句子包含多个缺陷。他们还重新标注了现有的单意图数据集,通过为每个句子生成多个有效的修订版本来提高多样性,以解决原始数据集中输入和输出对非常相似、无法捕捉到所有可能编辑情况的局限性。

实验结果表明,EditCoT 在多意图任务上达到了先进的性能水平,其 SARI 和 BERTScore 指标优于 CoEDIT 等监督方法。当与 GPT-4 和其他大型语言模型结合使用时,EditCoT 在单意图任务上的表现优于专门微调的模型。值得注意的是,该框架对未见过的编辑意图具有很强的泛化能力,使从业者可以轻松为新的编辑任务构建新的编辑链,而无需重新训练模型。

消融研究显示,编辑链的顺序对性能有显著影响,默认顺序遵循先处理低级语言问题再处理高级语义问题的层次原则。分析表明,像 GPT-4 这样的更强模型在推理步骤之间保持了更好的语义一致性,而像 Llama 2 这样的较弱模型则会出现语义偏差,从而降低质量。研究指出了一些重要限制,包括多次调用大型语言模型导致的计算成本增加,以及在数据集增强过程中使用 GPT-4 可能带来的偏差,但仍然确立了 EditCoT 作为一种有效且灵活的方法,用于处理复杂的多意图文本修订挑战。

摘要

文本修订对于使书面文本符合人类可接受的要求是必要的。然而,多意图文本修订需要在同一个计算模型中解决所有潜在的文本缺陷,这对传统的基于单意图的文本修订建模方法提出了新的挑战。传统方法通常依赖于针对特定编辑意图定制的模型,这限制了它们处理多样化或未见过的编辑意图的能力。受大型语言模型(LLMs)推理能力的启发,我们提出了 EditCoT,这是一个用于多意图文本修订的新框架。EditCoT 将修订过程分解为一系列顺序推理步骤,每个步骤针对特定的文本缺陷。这种结构化的方法可以通过在统一模型内实现精确的、特定于意图的修订来增强 LLM 的编辑能力。我们评估了 EditCoT 在多意图/单意图文本修订任务上的效果。对于多意图任务,EditCoT 达到了先进的性能水平,SARI 得分为 65.80,BERTScore 为 88.27。对于单意图任务,EditCoT 与 GPT-o1 结合使用时,其性能可与专门微调的模型相媲美。此外,当与 GPT-o1 或 DeepSeek 结合使用时,EditCoT 通过自定义编辑链展示了出色的泛化能力。总体而言,这项研究提供了一个有效的框架,用于建模和解决文本编辑任务,并提供了一个多意图数据集和一个增强型的单意图数据集,以支持文本修订研究的发展。

AI 生成的摘要(实验性摘要)

此摘要是由自动化工具生成的,并非由文章作者撰写或审核的。它旨在帮助发现、帮助读者评估相关性,并协助来自相关研究领域的读者理解这项工作。它旨在补充作者提供的摘要,后者仍然是论文的主要摘要。完整文章才是权威版本。点击此处了解更多

点击 此处 对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进未来的版本。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号