《Expert Systems with Applications》:IFSA-CE: Interpretable fine-grained sentiment analysis with concept embedding
编辑推荐:
细粒度多类情感分析模型IFSA-CE通过构建概念空间提升可解释性,整合语义情感词典与文本聚类,优化预测精度与决策透明度。
毛艳英|刘群|张宇|陈俊林
重庆邮电大学计算智能重点实验室,中国重庆400065
摘要
随着人工智能(AI)的进步,基于深度学习的细粒度情感分析(FSA)已成为一个重要的研究领域。文本FSA旨在通过分析文本结构和内容来推断评论者的具体情感倾向,从而为制定产品服务策略、监测公众意见以及为大型语言模型生成响应提供决策支持。然而,深度学习模型的黑箱性质掩盖了其可解释性,削弱了它们的可靠性和可信度。此外,现有模型未能有效利用细粒度语义情感词典条目的语义解释和含义作为先验知识来指导预测,缺乏对细粒度情感标签的具体内容和复杂关系的深刻理解,这限制了它们的预测性能。为了解决这些局限性,本研究提出了一种基于概念嵌入的可解释细粒度多类情感分析方法(IFSA-CE)。该方法考虑了评论文本与语义情感词典条目之间的关系,通过文本匹配和聚类算法构建了一个描述情感特征的概念空间,并将该概念空间嵌入到情感预测模型中作为决策依据。在情感预测过程中,计算评论文本的编码表示以在可解释的概念空间中进行分布,从而获得判断结果。在四个中文和英文数据集上进行的广泛实验表明,所提出的IFSA-CE优于现有的细粒度多类情感分析模型,在保持高透明度和可解释性的同时展示了出色的区分能力和准确性。
引言
随着在线平台的发展,评论数据的量急剧增加。从如此大量的信息中手动提取见解既耗时又容易出统计错误。因此,情感分析(SA)技术成为了一个关键的解决方案。情感分析涉及研究公众对实体、个人、问题、趋势事件及相关主题的情绪、观点和态度(Wankhade等人,2022年)。通过利用文本情感分析技术,可以从大量评论数据中有效地挖掘评论者的意见。这一能力对于电子商务平台制定更好的产品和服务策略、社交媒体平台分析用户情感趋势以及政府有效监测公众意见和应对公共紧急情况非常宝贵(Mao等人,2024年;Rodríguez-Ibánez等人,2023年)。
近年来,尽管高质量的多标签语料库在规模和质量上仍然不足,但情感分析,特别是细粒度多类情感分析,引起了研究人员的兴趣。尽管深度学习方法在细粒度多类情感分析任务上取得了显著进展,但由于深度学习模型的黑箱性质,它们的可解释性有限,这阻碍了它们在现实世界应用中的实际部署。为应对这一挑战,研究人员专注于提高模型的可解释性并开发相应的方法。然而,当前方法仍存在两个根本性局限。首先,深度学习模型本身的复杂性使其内部机制不透明,导致决策过程的可解释性不足。具体来说,当使用情感分析模型处理评论数据时,预测情感类别的逻辑基础并不直观。这种缺乏透明度的情况削弱了预测的可靠性和可信度。此外,现有的情感分析方法未能有效利用细粒度情感标签词的解释和语义含义作为先验知识来指导模型预测。对细粒度情感标签中包含的细微内容和复杂关系的有限理解限制了它们的预测性能。
为了解决上述挑战,本研究提出了一种基于概念嵌入的可解释细粒度多类情感分析方法。该方法研究了评论文本与语义情感词典条目之间的关系,通过文本表示学习和聚类算法构建了一个描述情感特征的概念空间,并将该概念空间嵌入到情感预测模型中作为决策依据。在情感预测阶段,计算评论文本的编码表示以在可解释的概念空间中进行分布,从而获得判断结果。在四个中文和英文数据集上进行的广泛实验表明,所提出的IFSA-CE优于现有的细粒度多类情感分析模型,在保持高透明度和可解释性的同时展示了出色的区分能力和准确性。
介绍
随着在线平台的发展,评论数据的量急剧增加。从如此大量的信息中手动提取见解既耗时又容易出统计错误。因此,情感分析(SA)技术成为了一个关键的解决方案。情感分析涉及研究公众对实体、个人、问题、趋势事件及相关主题的情绪、观点和态度(Wankhade等人,2022年)。通过利用文本情感分析技术,可以从大量评论数据中有效地挖掘评论者的意见。这一能力对于电子商务平台制定更好的产品和服务策略、社交媒体平台分析用户情感趋势以及政府有效监测公众意见和应对公共紧急情况非常宝贵(Mao等人,2024年;Rodríguez-Ibánez等人,2023年)。
近年来,尽管高质量的多标签语料库在规模和质量上仍然不足,情感分析,特别是细粒度多类情感分析,仍然引起了研究人员的兴趣。尽管深度学习方法在细粒度多类情感分析任务上取得了显著进展,但由于深度学习模型的黑箱性质,它们的可解释性有限,这阻碍了它们在现实世界应用中的实际部署。为应对这一挑战,研究人员专注于提高模型的可解释性并开发相应的方法。然而,当前方法仍存在两个根本性局限。首先,深度学习模型本身的复杂性使其内部机制不透明,导致决策过程的可解释性不足。具体来说,当使用情感分析模型处理评论数据时,预测情感类别的逻辑基础并不直观。这种缺乏透明度的情况削弱了预测的可靠性和可信度。此外,现有的情感分析方法未能有效利用细粒度情感标签词的解释和语义含义作为先验知识来指导模型预测。对细粒度情感标签中包含的细微内容和复杂关系的有限理解限制了它们的预测性能。
为了解决上述挑战,本研究提出了一种基于概念嵌入的可解释细粒度多类情感分析方法。该方法研究了评论文本与语义情感词典条目之间的关系,通过文本表示学习和聚类算法构建了一个描述情感特征的概念空间,并将该概念空间嵌入到情感预测模型中作为决策依据。在情感预测阶段,设计了一个可解释的混合模型。该模型使用预训练模型作为编码器,并计算测试样本的编码表示与预定义概念之间的相似性。然后使用相似度最高的概念作为决策标准来生成分类结果。最后,对情感预测模型进行了细粒度的可解释性分析,以验证其学习行为的合理性。
所提出的模型在预测准确性和可解释性之间取得了平衡,使自然语言处理(NLP)专业人士和普通用户都能理解预测结果背后的理由。
本研究的主要贡献总结如下:
- 1.
提出了一种基于概念嵌入的评论文本可解释细粒度多类情感分析方法。该方法将评论文本聚类成描述相关情感的概念,然后将这些概念嵌入到预测模型的潜在空间中作为决策依据,提高了决策过程的透明度。
- 2.
提出了一种创新的文本匹配算法。通过将评论文本与嵌入空间中最语义一致的语义情感词典条目对齐,该方法减少了对可能错误标注标签的依赖,生成了一个精确且全面的概念空间。
- 3.
使用潜在空间可视化和分层神经元可视化方法对模型进行了细粒度的解释性分析,从而提供了对模型学习行为的更深入见解。
- 4.
通过与其他现有方法进行广泛的比较实验分析,验证了所提出方法的有效性。
本文的其余部分安排如下:第2节介绍相关工作。第3节提出了基于概念嵌入的可解释细粒度多类情感分析模型。第4节详细介绍了数据集、实验设置、基线模型、性能比较实验、可视化结果和讨论。最后,第5节总结了本研究并概述了潜在的未来研究方向。
部分摘录
细粒度情感分析
细粒度情感分析旨在通过超越文档级别或句子级别的粒度(Guo等人,2021年)来实现对文本情感的更细致描述,并超越粗粒度的二元(正面/负面)或三元(正面/负面/中性)情感分类(Wang等人,2023年)。目前,该领域有两个代表性的研究方向:维度情感分析(DSA)和基于方面的情感分析(ABSA)(Lighthart等人,2021年)。
提出的模型
基于概念嵌入的评论文本可解释细粒度多类情感分析模型包括两个组成部分:(1)与语义情感词典条目集成的概念空间初始化;(2)通过嵌入概念的可解释情感预测,如图1所示。算法工作流程如下:首先,在概念空间初始化模块中,模型接收语义情感词典条目对和评论文本数据集
本研究使用四个数据集评估所提出的模型,包括三个中文数据集——OCEMOTION(Li等人,2016年)、NLPCC20131和NLPCC20142——以及一个英文数据集EnglishCorpus3。所有四个数据集都是细粒度多类情感分析语料库,包含七种情感类别:悲伤、快乐、厌恶、愤怒、喜欢、惊讶等
结论与未来工作
本研究提出了一种基于概念嵌入的可解释细粒度多类情感分析方法。首先,将识别适用于评论文本的语义情感词典条目的过程抽象为文本匹配过程。对语义情感词典条目进行表示学习,并对评论文本的表示进行聚类,以获得描述相关情感的概念。从文本聚类中得出的概念展示了
未引用的参考文献
Tan等人,2024年;Tan等人,2024年;Wang等人,2024年;Wang等人,2024年;Zhang等人,2022年;Zhang等人,2022年。CRediT作者贡献声明
毛艳英:概念化、调查、软件开发、撰写——原始草稿、方法论。刘群:资源获取、方法论、撰写——审阅与编辑、监督。张宇:监督、资金获取、撰写——审阅与编辑。陈俊林:调查、概念化、方法论。
利益冲突声明
作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。
致谢
资助:本研究得到了国家自然科学基金(批准号:72204033、72474039、62221005)、重庆市教育委员会的科学技术研究项目(批准号:KJQN202303120)、中国教育部的人文社会科学项目(批准号:21YJC630169)以及中国博士后科学基金(批准号:2022M711457)的支持。