深度伪造的语言特征分析：一个用于下一代深度伪造检测的开放数据库

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Pattern Recognition》：Linguistic Profiling of Deepfakes: An Open Database for Next-Generation Deepfake Detection

【字体：大中小】 时间：2026年03月05日 来源：Pattern Recognition 7.6

编辑推荐：

　　本文构建了大规模多任务深度伪造检测基准DFLIP-3K，涵盖27种T2I模型生成的80万图像及65万文本提示，支持检测、模型识别和提示预测任务，为可解释性深度伪造检测提供标准化数据资源。

王亚斌|洪晓鹏|李雅琪|马志恒|黄志武

中国哈尔滨工业大学

摘要

文本到图像的生成模型的出现彻底改变了深度伪造领域，使得可以直接从文本描述创建出真实且令人信服的视觉内容。然而，这一进步在检测此类内容的真实性方面带来了更大的挑战。现有的深度伪造检测数据集和方法往往无法有效捕捉到新兴深度伪造的广泛范围，并提供令人满意的解释性信息。为了解决这一重要问题，本文介绍了一个深度伪造数据库（DFLIP-3K），用于开发具有说服力和可解释性的深度伪造检测系统。该数据库包含了大约80万张来自3K个社区检查点的多样化深度伪造图像，这些检查点涵盖了27种主要的基础架构，同时还包含了大约70万对语言足迹。在这项工作中，我们对27种基础架构类别进行了架构级模型识别基准测试，而通过对数千种内部变体的细粒度检查点归属分析仍是一个未解决的问题，这得益于我们发布的元数据。这两个显著特点使DFLIP-3K能够推动深度伪造语言分析的进步，包括三个子任务：二进制AI生成图像检测、模型识别和提示预测。生成模型和提示是每个深度伪造的两个关键组成部分，因此从语言学角度剖析它们可以为深度伪造检测提供宝贵的可解释证据，我们认为这是下一代深度伪造检测的关键。此外，DFLIP-3K被设计为一个开放数据库，旨在促进透明度并鼓励合作努力以进一步增强其发展。我们对开发的基准测试进行的广泛实验验证了DFLIP-3K数据库能够作为评估和比较基于语言的深度伪造检测、识别和提示预测技术的标准化资源。项目页面是https://github.com/iamwangyabin/DFLIP-3K。

引言

近年来，深度伪造领域经历了重大转变，从专注于真实图像和视频的传统生成模型转向了文本到图像（T2I）生成模型的出现。这些新模型为创建高度真实且令人信服的深度伪造内容开辟了新的可能性。特别是，像Stable Diffusion [1]、[2]、Imagen [3]和GPT-Image [4]这样的最新T2I生成模型通过直接从文本描述或提示合成图像彻底改变了深度伪造领域。然而，T2I生成模型的普及引发了严重的伦理问题。滥用潜力和误导性或虚假信息的快速传播进一步加剧了人们对视觉内容真实性和可信度的担忧。

尽管已经提出了几种深度伪造检测方法（例如[5]、[6]、[7]），但它们存在显著的局限性。首先，这些方法仅关注二进制分类任务，即区分真实图像和AI生成的图像，而不提供任何解释性信息。然而，在实践中，要有效挑战伪造内容，需要全面的证据和解释，而不仅仅是简单的二元判断。其次，如表1所示，现有的数据集通常由有限的生成模型生成，导致缺乏对最近出现的先进AI生成图像的广泛多样性的表示。关键的是，这些数据集中的伪造样本主要是在受控实验室环境中合成的，无法反映在线社区或现实世界中流通的深度伪造的复杂分布。

为了解决这些紧迫问题，本文专注于开发具有说服力和可解释性的深度伪造检测，这是迈向下一代AI生成图像检测的基础步骤。我们认为，关键不仅在于二进制深度伪造检测，更重要的是以人类可理解的方式解析结果并呈现它们。因此，我们非常重视这一新的且具有挑战性的任务，我们将其称为深度伪造检测的语言分析。虽然“深度伪造”通常与FaceSwap视频相关联，但我们将其范围扩大到包括所有AI生成的图像。如图1所示，深度伪造检测的语言分析任务可以进一步分解为三个子任务，即深度伪造的检测、源模型的识别以及用于生成的文本提示的预测。我们认为，提示不仅仅是AI生成图像的文本标签，而是反映了创作者意图（描绘的内容和原因）和工程风格的痕迹。因此，推断提示提供了支持调查的可解释证据。例如，推断出的提示可以作为语义指纹，将具有相同叙事、实体和位置的合成图像聚类在一起。然后，审计人员可以分析不允许的意图。此外，预测的提示与模型识别一起提供了合理的“生成配方”，使调查人员能够进行基于可重复性的验证。为了促进这项新兴研究，我们整理了一个开放数据集（DFLIP-3K），它标准化了分析深度伪造内容的语言特征的资源，并提供了一个评估和比较深度伪造检测语言分析新方法的基准。

特别是，建立的DFLIP-3K数据库包含了大约768,586个AI生成的样本，这些样本来自大约3,162个生成模型，这是深度伪造检测领域中规模最大的数据库。此外，我们还收集了大约651,226个用于创建图像的文本提示。收集到的提示允许在深度伪造检测、识别和提示预测中同时利用语言分析。除了整理这个数据库外，我们还彻底研究了与大规模数据收集相关的伦理考虑和潜在缺陷。通过公开DFLIP-3K，我们为社区提供了进一步增强此类应用和规模数据库的初始机会。

为了评估DFLIP-3K的潜在价值，我们建立了一个用于深度伪造检测、识别和提示预测的语言分析基准。基于这个基准，我们进行了几项实验。我们的评估重点关注适用于深度伪造分析的先进视觉和视觉-语言模型。结果表明，这些视觉-语言模型在检测和识别深度伪造方面优于传统的视觉模型。与基于视觉的模型不同，我们推荐的视觉-语言模型能够生成常规图像标题或特定格式的文本提示以用于图像生成。评估表明，使用我们收集的提示训练视觉-语言模型可以产生更合理的提示预测，从而生成的图像在感知、语义和美学上与输入的深度伪造图像非常相似。此外，我们还展示了深度伪造分析有助于生成内容的可靠解释性。

尽管有验证结果，但DFLIP-3K目前仍不是一个最终的数据产品。鉴于生成模型的持续出现，DFLIP-3K的全面整理超出了单篇研究论文的范围。因此，除了发布数据集外，我们还在分享我们为组装DFLIP-3K开发的软件栈。我们认为这次初步的数据发布和伴随的论文是创建适用于更广泛语言分析任务的广泛适用的深度伪造数据集的初步步骤。因此，我们公开提供了所有收集方法、元数据和数据库中的深度伪造数据，以充分发挥其在下一代深度伪造检测中的潜力。

部分片段

数据库收集

DFLIP-3K是通过抓取公开可用的高质量AI生成图像构建的。它包含了由27种著名基础架构生成的图像，包括Stable Diffusion [1]、FLUX [31]、GPT-Image [4]以及大量社区模型。表2概述了DFLIP-3K数据库。

基准测试设置

基于DFLIP-3K，我们开发了一个基准，以验证其作为评估深度伪造检测语言分析方法的标准化资源的有效性，这些方法包括三个子任务：1）深度伪造检测，2）深度伪造模型识别，3）提示预测（图1）。

深度伪造检测是一个基本子任务，特别是考虑到最近大规模T2I生成模型的进步，这些模型使个人能够创建高质量的深度伪造。

实验和结果

在本节中，我们介绍了我们的实验设置和详细的训练程序。我们报告了基线方法的性能并讨论了局限性。

结论与讨论

DFLIP-3K在推进下一代深度伪造检测方面展现出巨大的潜力。其庞大的规模和高质量使其成为进一步研究深度伪造语言分析的宝贵资源。

预期用途：在收集和处理DFLIP-3K数据库的过程中，我们付出了巨大努力以确保其高质量。所有数据均来自AI生成的图像，并经过了仔细的选择过程以确保其高美学价值。

CRediT作者贡献声明

王亚斌：写作——审阅与编辑，撰写——初稿，可视化，验证，方法论，正式分析，数据整理。洪晓鹏：写作——审阅与编辑，撰写——初稿，方法论，资金获取。李雅琪：写作——初稿，数据整理。马志恒：资源，项目管理。黄志武：写作——审阅与编辑，撰写——初稿，项目管理。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

本项工作得到了中国国家重点研发计划（编号2025YFC3811300）和中国国家自然科学基金（批准编号62376070和62076195）的资助。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号

摘要

引言