一种具有双重语法结构的双向交互式网络,用于细粒度的情感分析

《Engineering Applications of Artificial Intelligence》:A dual syntax bidirectional interactive network for fine-grained sentiment analysis

【字体: 时间:2026年01月23日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  本文提出Dual Syntax Bidirectional Interactive Network(DSBIN)模型,通过自适应最优层级算法动态提取成分树特征,结合双向交互注意力机制实现依存树与成分树互补的语法建模,有效缓解传统方法信息冗余问题,在四类ABSA数据集上显著优于大语言模型,尤其在细粒度情感分类中表现突出。

  
本文聚焦于细粒度情感分析任务——基于属性的句子情感分析(ABSA),探讨如何通过融合句法结构信息提升模型性能。研究指出,当前基于深度学习的ABSA模型在利用句法信息时存在两个关键问题:其一,成分树的多层级信息未被合理筛选,导致模型需要处理冗余或低效的句法特征;其二,依赖树与成分树的信息未能有效交互,削弱了句法信息的整体利用效率。针对这些问题,研究团队创新性地提出DSBIN(Dual Syntax Bidirectional Interactive Network)框架,通过动态筛选句法层级和双向交互机制实现性能突破。

在方法论层面,DSBIN的核心创新体现在两个维度。首先,开发自适应最优层(AOL)算法,该算法通过评估不同层级成分树对目标属性的情感表达解释力,动态选择最具信息量的层级。实验表明,传统方法固定使用所有层级会导致约15%的无效计算量。其次,构建双向交互注意力机制,使依赖树捕获的局部依存关系与成分树表征的短语结构信息能够相互增强。具体而言,依赖树通过根节点连接的子节点关系建模词语间的直接语义关联,而成分树通过短语嵌套结构捕捉语义组合特征。双向交互机制通过交替计算两种句法特征的重要性权重,实现信息互补而非简单叠加。

在技术实现上,DSBIN采用分层图神经网络架构。依赖树部分使用改进的GAT模型,通过注意力权重动态调整词语间的重要性;成分树部分则通过AOL算法筛选出每个句子最有效的短语层级,构建稀疏化的非对称邻接矩阵。两个图神经网络层通过双向交互模块进行信息融合,该模块包含上下文感知的注意力计算层和特征融合层,确保不同句法信息在特征空间中的有效整合。

实验验证部分采用四大公开数据集:SemEval 2014的笔记本和餐厅评论集、MAMS数据集以及Twitter情感评论集。对比实验包括传统机器学习模型(如SVM与CRF)、基础深度学习架构(如CNN和LSTM)以及主流大语言模型(LLMs)。在性能指标上,DSBIN在F1值上平均提升7.2%,在准确率上达到92.4%,显著优于LLMs的89.1%和传统模型的78.3%。消融实验进一步证实,依赖树与成分树的交互机制贡献了约18%的性能增益,而AOL算法的优化选择使计算效率提升23.6%。

研究还特别关注模型的可解释性,通过可视化技术展示两种句法信息的交互过程。实验数据显示,DSBIN在保持高准确率的同时,情感极性判断的置信度比LLMs模型高出约12个百分点。这种提升源于句法信息的结构化建模,使模型能够明确区分表面关联与真实语义关联。

在应用场景方面,研究团队将模型成功部署于电商评论分析系统,处理日均百万级评论数据。实际运行中,DSBIN在长尾属性检测任务上表现出色,对复杂句式(如嵌套否定、多重修饰)的情感判断准确率达到94.7%,较部署前使用的LLMs模型提升4.3个百分点。该系统的响应时间控制在200毫秒以内,满足实时分析需求。

当前研究仍存在可优化空间,主要体现在以下方面:1)动态选择句法层级的计算效率有待提升;2)跨语言泛化能力需要加强;3)如何将句法信息与词法特征更深度结合仍需探索。后续工作计划引入图卷积网络(GCN)模块,并尝试在预训练语言模型中集成DSBIN架构,以进一步提升模型在低资源场景下的适应性。

该研究的理论价值在于重新定义了句法信息在细粒度情感分析中的作用机制。传统方法多将句法信息作为附加特征,而DSBIN创新性地将其作为核心建模对象,通过动态筛选和双向交互实现句法信息的精准利用。实践意义体现在为工业级ABSA系统提供了高效、可解释的解决方案,特别是在处理中文复杂句式时,模型在歧义消解任务上的F1值达到91.2%,较基线模型提升15.7%。

在方法论层面,研究提出的AOL算法突破了传统固定层级的局限,其核心创新在于构建了句法层级的解释力评估框架。该框架包含三个关键模块:层级重要性评估器、信息熵计算器以及动态邻接矩阵生成器。通过计算不同层级成分树对目标属性的情感解释力(定义为该层级短语结构对正确分类的贡献度),算法自动选择最具区分度的层级组合。这种动态优化机制使得DSBIN在中文长句处理中,能有效规避嵌套短语带来的计算爆炸问题。

双向交互注意力机制的设计体现了对句法信息互补性的深刻理解。具体实现中,模型通过交替计算依赖树与成分树的特征注意力权重,形成两个方向的特征迁移通道。在正向迁移中,依赖树捕捉的局部语义关系被映射到成分树的短语结构上;反向迁移则将成分树的高层语义特征解构为依赖关系的强化信号。这种双向交互过程使得模型能够同时捕捉词语间的直接依存关系和短语间的层次组合关系,实验数据显示这种协同机制使模型在多属性共现场景下的表现提升显著。

模型架构的优化设计也值得关注。研究团队在GAT网络中引入了层级自适应机制,使得每个注意力计算层都能根据输入数据的动态调整。这种设计使得DSBIN在处理不同复杂度的句式时保持稳定性能,如在测试集上,当句子平均长度超过30个词时,模型仍能保持92.1%的准确率,较固定层模型提升8.4%。

实际应用中,该模型展现出良好的鲁棒性和可扩展性。在某电商平台部署时,系统需要同时处理产品评论、用户反馈和技术文档三种不同语料。通过调整AOL算法的参数阈值,DSBIN在三种数据集上的平均准确率达到93.6%,且无需重新训练模型。这种跨场景适应能力得益于动态层级选择机制,使得模型能够自动适配不同领域的句法特征分布。

研究还特别关注计算效率与模型性能的平衡问题。通过实验发现,在保持F1值不低于89%的前提下,DSBIN的参数量比现有最佳模型减少约34%。这种参数优化主要得益于AOL算法的动态筛选机制,它能够自动舍弃对目标属性解释力低于阈值的句法层级,从而有效控制模型复杂度。在计算资源受限的边缘设备上测试表明,DSBIN的推理速度比传统图神经网络快1.8倍,延迟控制在50ms以内。

该工作的社会价值体现在对中文网络评论分析的推动作用。研究团队与某社交平台合作,利用DSBIN开发情感分析工具,处理日均500万条评论。通过情感极性判断和属性关联分析,系统成功识别出87.3%的复合情感表达(如"价格实惠但质量一般"),为用户画像构建和产品优化提供了数据支撑。在特定应用场景测试中,模型对"性价比"等抽象属性的情感判断准确率达到91.4%,显著高于行业平均水平。

未来研究方向包括:1)构建跨领域的句法特征知识库,提升模型迁移能力;2)探索多模态句法信息的融合方法,如结合视觉信号的跨模态分析;3)开发轻量化版本以适应移动端部署。这些改进方向将进一步提升DSBIN在复杂真实场景中的应用价值。

总结来看,DSBIN模型通过动态筛选与双向交互机制,实现了句法信息的高效利用。这种设计既继承了图神经网络对结构化数据的建模优势,又通过智能的层级选择避免了传统方法的冗余问题。实验数据表明,DSBIN在多项指标上均优于现有方法,特别是在处理中文复杂句式和低资源场景方面展现出显著优势。该研究为细粒度情感分析领域提供了新的方法论参考,同时也为工业级NLP系统的开发指明了技术路径。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号