DCID:一种基于双重路径和认知启发式的中文讽刺检测框架,采用大语言模型(LLM)增强数据
《Expert Systems with Applications》:DCID: A Dual-Path Cognitive-Inspired Framework for Chinese Sarcasm Detection with LLM-Augmented Data
【字体:
大
中
小
】
时间:2026年06月01日
来源:Expert Systems with Applications 7.5
编辑推荐:
王子轩|冯志勇|拉菲乌尔·哈克|曾岩|曹文琪|廖桥摘要中文的语言特性以及中国文化特有的表达方式,使得在中文社交媒体上检测讽刺言论变得极其困难。本文提出了双路径认知讽刺检测器(DCID),这是一种模拟人类平行认知过程的神经网络架构,用于识别讽刺内容。该框架包含两个专门模块:多维语义
王子轩|冯志勇|拉菲乌尔·哈克|曾岩|曹文琪|廖桥
摘要
中文的语言特性以及中国文化特有的表达方式,使得在中文社交媒体上检测讽刺言论变得极其困难。本文提出了双路径认知讽刺检测器(DCID),这是一种模拟人类平行认知过程的神经网络架构,用于识别讽刺内容。该框架包含两个专门模块:多维语义冲突检测器(MSCD),它利用分层的三层注意力机制逐步识别语义矛盾;情感演化轨迹追踪器(EETT),则结合多尺度卷积分析和情感感知序列建模来捕捉动态的情感变化。为了解决数据稀缺问题,我们基于DeepSeek语言模型提出了一种新的数据增强方法,该方法在生成标签时能够保留讽刺特征的同时丰富表面形式。在中国TikTok讽刺语料库上的实验结果表明,DCID的F1分数为89.29%,准确率为89.43%,AUC为96.06%,创下了新的最佳水平。我们的研究表明,受认知启发的架构有助于检测复杂的语言现象,并为构建基于认知的自然语言理解技术提供了实用的建议。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号