“在线产品评论正成为现代AI的战场”。——Annie Probert/ NBC News [1]
在线评论在塑造消费者在电子商务平台上的行为方面继续发挥着关键作用,因为消费者在做出购买决策时依赖这些评论,这一点在之前的研究[2]、[3]、[4]中得到了证明。值得注意的是,近90%的在线购物者表示,真实的评论会影响他们的购买选择,他们更信任同行反馈而不是产品本身的价格。1然而,某些商家的不道德行为破坏了评论系统的可靠性,他们使用工具来提升产品排名并损害竞争对手的声誉[5],这反过来又侵蚀了消费者的信任,并损害了评论系统的完整性和效率[6]。
为了解决这一日益严重的问题,平台公司已经部署了决策支持系统来检测和过滤虚假评论[7]、[8]。这些技术干预不仅旨在遏制虚假内容的传播,还旨在减轻其对平台生态系统的更广泛负面影响[9]、[10]。通过增强用户生成内容的真实性,这些系统在维护数字市场的可信度和功能方面发挥着关键作用。
近年来,GAI的出现加速了虚假评论在数字平台上的传播,因为商家可以利用GAI快速生成大量虚假评论,而无需付出太多努力。23与传统的虚假评论不同,GAI生成的评论往往更具说服力,也更难以检测。这是因为GAI具有生成连贯、与上下文相关且类似人类语言的先进能力,这紧密模仿了真实用户反馈的语气和结构[11]、[12]。因此,这些由GAI制作的评论对消费者信任和平台完整性构成了更大的威胁。GAI提供的优越语言特性吸引了更多恶意行为者利用GAI生成欺骗性内容,从而加剧了电子商务平台上虚假评论的传播。
同时,那些真正打算分享自己的体验并推荐产品或商家的普通消费者也开始使用AI工具来生成评论。虽然这可能简化了评论写作过程,但它引入了一个关键的限制:AI缺乏完全理解个别消费者细微、真实体验的能力。4因此,AI生成的评论可能比人类撰写的评论表现出更高的偏见程度。图1展示了一条在ChatGPT的帮助下生成的评论(注意:产品细节是虚构的)。AI生成内容中的这种固有偏见可能会削弱消费者对产品和相关商家的信任。3鉴于这些挑战,迫切需要提出一种专门用于识别AI生成的虚假评论的新检测方法。这样的系统使平台能够迅速标记或过滤掉不真实的内容,从而维护用户反馈的完整性,并保持平台生态系统内的信任。
尽管AI生成的虚假评论可能看起来与人类撰写的评论无法区分,但它们通常表现出微妙但可识别的语言模式,表明它们是人工生成的[13]。值得注意的是,这些评论经常复制企业在传统欺骗性内容中常用的风格标记。例如,虚假评论倾向于使用夸张的情感表达,因为它们的主要目的是过度赞扬或不公正地批评产品的声誉[14]。同样,当商家使用AI工具时,评论往往显示出强烈的情感强度。这种模式强调了将传统语言线索纳入检测策略的重要性。通过分析这些文本特征,平台可以更有效地识别和标记AI生成的虚假评论,即使这些评论与真实用户反馈非常相似。
此外,AI生成的评论中的词汇选择通常是由底层大型语言模型(LLM)计算出的概率最高的单词决定的。因此,这类评论的文本输出相比人类创作的内容显示出较低的随机性。这种语言变异性的减少可以使用两个先进的语言指标来定量评估:困惑度和突发性[15]、[16]。这些指标评估了文本的可预测性和分布不规则性,提供了对LLM生成行为的洞察。鉴于它们的诊断潜力,将这些新颖的语言特征纳入AI生成的虚假评论检测框架中至关重要。这样做可以通过识别区分合成内容和真实人类表达的细微统计模式来提高检测系统的准确性。
除了基于语言的方法外,自动化技术,特别是那些利用深度学习算法的技术,在检测AI生成的内容方面也取得了进展。一个值得注意的例子是OpenAI,它对LLM进行了微调,开发了一种可以识别高达95%由GPT-2生成的文本的检测器。5尽管性能令人印象深刻,但这些模型面临两个关键限制:缺乏可解释性以及在应用于在线评论等短文本时效果降低。这些限制阻碍了它们在现实世界中的实际应用。
先前的研究通过将非典型评论者行为建模为识别虚假评论的手段来探索异常检测方法[6]、[9]。例如,Kumar等人提出了一种技术,该技术构建了代表各种评论者行为特征的最优子分布,然后将它们聚合到一个复合分布中以检测异常评论者[17]。同样,李等人引入了一种基于累积概率密度的方法,将异常值识别为位于分布尾部的罕见事件[18]。然而,这些方法中的一个持续挑战在于确定适当的概率阈值,以区分异常值和正常行为。如果没有明确的界限,这些模型的准确性就会受到限制。因此,迫切需要开发一种创新的异常检测方法,特别是通过改进阈值校准和可解释性,以实现更精确地识别AI生成的虚假评论。
为了解决这些限制,我们提出了一个多方面的方法论框架。首先,我们构建了一组全面的变量,整合了传统的语言特征和新型的语言指标。这一丰富的特征集使得对评论真实性的分析更加细致。接下来,我们引入了一种基于累积概率密度(CPD)的创新技术来估计给定评论由AI生成的可能性。这种概率度量作为后续分类阶段的基础输入。最后,我们使用计算出的CPD值来训练一系列成熟的分类模型。然后使用这些模型来开发能够准确识别AI生成的虚假评论的分类器。据我们所知,这项研究是首次尝试开发专门用于检测AI生成的虚假评论的可解释机器学习方法之一。通过提供透明且有效的检测机制,我们的方法为平台运营商提供了标记不真实内容的关键决策支持。这一贡献对电子商务平台的声誉至关重要。
本研究的其余部分组织如下。首先,我们回顾了现有的关于检测AI生成的虚假评论的方法的文献。其次,我们介绍了本研究中构建的两种变量类别——传统的语言特征和新型的语言特征。第三,我们介绍了基于累积概率密度的异常检测方法。接下来,我们使用三个真实世界数据集评估了所提出方法的性能。最后,我们讨论了研究结果,并提出了结论和未来的研究方向。