ConvRoBERTa:通过融合序列特征和加权非序列特征来检测虚假评论
《IEEE Transactions on Artificial Intelligence》:ConvRoBERTa: Detecting Fake Reviews by Fusing Sequential and Weighted Nonsequential Features
【字体:
大
中
小
】
时间:2026年02月28日
来源:IEEE Transactions on Artificial Intelligence CS6.4
编辑推荐:
电子商务依赖产品评论辅助消费决策,但虚假评论导致消费者信任受损和商业损失。现有检测方法基于传统机器学习,忽视特征重要性差异。本文提出ConvRoBERTa模型,通过CNN提取加权非序列特征,结合RoBERTa处理序列特征,并采用点积注意力机制融合二者,在Yelp数据集上准确率提升2.94%,其中ConvRoBERTa-SVM达91.93%。
影响声明:
虚假评论损害了消费者的信任,并扭曲了他们的购买决策,导致企业遭受重大经济损失。现有的检测系统往往无法有效应对这一问题...显示更多摘要:
电子商务平台越来越依赖产品评论来帮助消费者做出决策。然而,一些商家通过雇佣人员发布虚假内容来操纵这些评论,这使得潜在买家的评估过程变得更加复杂。因此,检测虚假评论已成为一个关键的研究课题。现有的研究主要关注语言和行为特征,并采用传统的机器学习(ML)方法,这些方法对所有特征赋予了相同的权重。这种做法并不理想,因为并非所有特征对模型性能的贡献都是一样的。为了解决这些问题,我们提出了结合RoBERTa(一种经过强化优化的BERT预训练模型)的卷积神经网络(ConvRoBERTa),这是一种混合深度学习模型,能够有效整合非序列(NS)和序列(S)特征以检测虚假评论。首先,使用分类和回归树(CART)方法在非序列数据上确定特征的重要性,然后通过卷积神经网络(CNN)从加权特征中提取增强模式。同时,使用RoBERTa模型处理序列特征以获得上下文表示。接着,采用点积注意力机制将两种特征类型融合在一起,形成用于分类的全面联合表示。在Yelp数据集上的实验结果表明,ConvRoBERTa的性能优于传统基线模型,准确率提高了2.94%。此外,ConvRoBERTa-SVM变体的准确率进一步提高到了91.93%,证明了该模型的有效性,并为未来的虚假评论检测研究提供了宝贵的见解。
引言
随着电子商务的快速发展,在线购物通过提供便利性和可访问性改变了消费者的行为。与传统购物方式不同,电子商务平台依靠产品描述、图片和视频来向买家提供信息[1]。然而,在线购物的一个主要局限性是顾客在购买前无法实际查看产品。为了弥补这一不足,电子商务平台整合了产品评论系统,允许消费者分享反馈[2]。这些评论会影响消费者的购买决策,并成为重要的信息来源[3]。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号