基于依赖关系引导的词嵌入的空间角色标注

《ACM Transactions on Asian and Low-Resource Language Information Processing》:Spatial Role Labeling Based on Dependency Guided Word Embeddings

【字体: 时间:2026年02月16日 来源:ACM Transactions on Asian and Low-Resource Language Information Processing

编辑推荐:

  空间角色标注(SpRL)研究提出并实现了一种基于句法依赖的LSTM-CRF模型,通过融合依赖词嵌入、POS标签和CNN字符级表示,有效捕捉长距离空间关系。实验在标准数据集上验证,该模型优于传统方法,其中Global Vectors结合依赖上下文效果最佳,消融实验证明各组件不可或缺。

  

摘要

摘要

近年来,文本已成为重要的空间数据资源。管理文本中传达的空间数据的一项关键任务是空间角色标注(SpRL),其目的是从文本中提取形式化的空间知识。我们没有将文本简单地视为单词序列,而是结合了句法依赖关系来识别表达空间语义的实体。首先,我们研究了基于依赖关系的词嵌入在SpRL中的影响。接着,我们提出了一种基于依赖关系的LSTM-CRF深度学习模型,以利用单词之间的句法关系。随后,我们通过词性标签和基于CNN的字符级表示来增强这些依赖关系特征。实验在标准的SpRL-2012和SpRL-2013数据集上进行。实验结果表明,所提出的模型优于其他机器学习方法。这些发现强调了在SpRL任务中考虑依赖关系的重要性。

人工智能总结

人工智能生成的摘要(实验结果)

本摘要是由自动化工具生成的,并非由文章作者撰写或审核。它旨在帮助读者发现相关内容、评估文章的相关性,并协助来自相关研究领域的读者理解文章内容。它是对作者提供的摘要的补充,作者提供的摘要仍是文章的正式摘要。完整文章才是权威版本。点击此处了解更多

点击此处对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进未来的版本。

人工智能生成的摘要

该摘要由基于已发表文章文本的自动化系统生成。

版本创建于2026年2月14日。

本研究探讨了空间角色标注任务,即通过识别表达空间语义的实体来从文本中提取空间知识。研究分析了将句法依赖关系纳入词嵌入中如何提高空间角色的识别能力,这些空间角色包括移动对象(轨迹)、地标(位置)和空间指示词(表示空间关系的词汇)。

研究提出了一种基于依赖关系的LSTM-CRF深度学习模型,该模型利用单词之间的句法关系来提升空间角色标注的性能。该模型结合了多种特征类型,包括基于依赖关系的词嵌入、词性标签以及通过卷积神经网络生成的字符级表示。该方法分为两个层次:首先使用依赖关系上下文而非传统的线性上下文构建词向量;其次将完整的依赖关系树直接整合到神经网络架构中。

研究人员比较了三种词嵌入模型——连续词袋模型(Continuous Bag-of-Words)、全局向量(Global Vectors)和连续跳过模型(Continuous Skip-Gram)——以及两种上下文类型:线性上下文和基于依赖关系的上下文。他们还探讨了包含或不包含单词相对于目标的位置信息的受限上下文和不受限上下文表示。实验使用了SemEval-2012和SemEval-2013共享任务中的标准数据集,这些数据集是空间角色标注研究的参考语料库。

实验结果表明,所提出的模型优于之前的机器学习方法和基线系统。分析发现,在Wikipedia上训练的词嵌入比仅在空间角色标注语料库上训练的词嵌入产生了更好的结果。分析显示,具有受限依赖关系上下文配置的全局向量表现尤为出色。消融研究证实了各个组成部分的重要性:字符嵌入、词性标签和依赖关系都对性能提升有显著贡献。缺少其中任何一个元素都会导致性能明显下降。

错误分析表明,当某些单词缺乏空间意义时,模型可能会错误地将其分类为空间角色;反之,模型也可能无法识别实际的空间角色。研究表明,将句法依赖关系纳入词嵌入和神经网络架构中对空间角色标注任务具有显著优势。基于依赖关系的方法能够有效捕捉简单线性上下文窗口可能忽略的长距离单词关系,这对于涉及介词和介词短语的空间表达尤为重要。这项工作证明,基于句法的表示方法显著提升了空间角色标注的性能,超越了忽略句法结构的传统方法。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号