ConvRoBERTa：通过融合序列特征和加权非序列特征来检测虚假评论

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《IEEE Transactions on Artificial Intelligence》：ConvRoBERTa: Detecting Fake Reviews by Fusing Sequential and Weighted Nonsequential Features

【字体：大中小】 时间：2026年02月28日 来源：IEEE Transactions on Artificial Intelligence CS6.4

编辑推荐：

　　电子商务依赖产品评论辅助消费决策，但虚假评论导致消费者信任受损和商业损失。现有检测方法基于传统机器学习，忽视特征重要性差异。本文提出ConvRoBERTa模型，通过CNN提取加权非序列特征，结合RoBERTa处理序列特征，并采用点积注意力机制融合二者，在Yelp数据集上准确率提升2.94%，其中ConvRoBERTa-SVM达91.93%。

影响声明：

虚假评论损害了消费者的信任，并扭曲了他们的购买决策，导致企业遭受重大经济损失。现有的检测系统往往无法有效应对这一问题...显示更多

摘要：

电子商务平台越来越依赖产品评论来帮助消费者做出决策。然而，一些商家通过雇佣人员发布虚假内容来操纵这些评论，这使得潜在买家的评估过程变得更加复杂。因此，检测虚假评论已成为一个关键的研究课题。现有的研究主要关注语言和行为特征，并采用传统的机器学习（ML）方法，这些方法对所有特征赋予了相同的权重。这种做法并不理想，因为并非所有特征对模型性能的贡献都是一样的。为了解决这些问题，我们提出了结合RoBERTa（一种经过强化优化的BERT预训练模型）的卷积神经网络（ConvRoBERTa），这是一种混合深度学习模型，能够有效整合非序列（NS）和序列（S）特征以检测虚假评论。首先，使用分类和回归树（CART）方法在非序列数据上确定特征的重要性，然后通过卷积神经网络（CNN）从加权特征中提取增强模式。同时，使用RoBERTa模型处理序列特征以获得上下文表示。接着，采用点积注意力机制将两种特征类型融合在一起，形成用于分类的全面联合表示。在Yelp数据集上的实验结果表明，ConvRoBERTa的性能优于传统基线模型，准确率提高了2.94%。此外，ConvRoBERTa-SVM变体的准确率进一步提高到了91.93%，证明了该模型的有效性，并为未来的虚假评论检测研究提供了宝贵的见解。

引言

随着电子商务的快速发展，在线购物通过提供便利性和可访问性改变了消费者的行为。与传统购物方式不同，电子商务平台依靠产品描述、图片和视频来向买家提供信息[1]。然而，在线购物的一个主要局限性是顾客在购买前无法实际查看产品。为了弥补这一不足，电子商务平台整合了产品评论系统，允许消费者分享反馈[2]。这些评论会影响消费者的购买决策，并成为重要的信息来源[3]。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号