基于多CNN与可解释AI的深度伪造检测新框架：模型配置与训练策略的协同优化

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《IEEE Access》：Seeing Through the Fake: Explainable AI With Multiple CNNs for Deepfake Detection

【字体：大中小】 时间：2026年01月06日 来源：IEEE Access 3.6

编辑推荐：

　　本研究针对深度伪造技术对数字内容可信度构成的严峻挑战，提出了一种融合深度学习特征提取与机器学习分类的检测框架。研究人员系统探索了不同CNN模型（如DenseNet201、XceptionNet）与分类器（如随机森林）的组合效能，并创新性地设计了三种训练策略（LL、LF、FL）。结果表明，DenseNet201与随机森林组合在Fixed-Learnable模式下达到99.10%的准确率，且通过Grad-CAM、SHAP等XAI技术增强了模型可解释性。该研究为构建高效、透明的深度伪造检测系统提供了重要理论与实践依据。

在数字化信息时代，人工智能技术的飞速发展催生了深度伪造（Deepfake）这一新型数字内容篡改技术。通过先进的神经网络算法，深度伪造能够生成高度逼真的虚假图像和视频，模糊了真实与虚构的界限，对数字媒体的可信度构成严重威胁。从政治宣传到金融诈骗，从名誉侵害到舆论操纵，深度伪造技术的滥用已演变为全球性的社会问题。尽管研究者们已开发出多种检测方法，但现有技术仍面临泛化能力差、计算成本高、决策过程不透明等瓶颈，难以应对快速演变的伪造技术。

发表在《IEEE Access》的这项研究，由Muhammad Aleem领衔的跨国团队开展，旨在突破现有深度伪造检测技术的局限。研究人员创新性地提出了一种融合深度学习（DL）与机器学习（ML）的协同检测框架（DFDF），系统探索了模型配置与训练策略对检测性能的影响。该研究不仅追求检测精度，更致力于提升模型的可解释性和实用价值，为构建可靠、透明的深度伪造防御体系提供了新思路。

研究团队采用了几项关键技术方法：首先从DFDC、Celeb-DF和FaceForensics++等公开数据集中提取视频帧并进行人脸裁剪预处理；然后利用五种预训练CNN架构（DenseNet201、InceptionResNet、XceptionNet、VGG16、ResNet）进行特征提取；最后结合五种机器学习分类器（逻辑回归、决策树、随机森林、K近邻、朴素贝叶斯）进行分类。特别值得关注的是，研究设计了三种训练策略（Learnable-Learnable、Learnable-Fixed、Fixed-Learnable）来评估不同组件冻结或训练对性能的影响，并通过Grad-CAM和SHAP等可解释AI技术可视化关键特征。

模型配置对检测性能的影响

通过系统比较不同DL-ML组合，研究发现DenseNet201与随机森林分类器的组合表现最为突出。该组合在DFDC数据集上达到了99.10%的准确率、97.18%的精确度和98.4%的召回率。混淆矩阵分析显示，该组合仅产生52个假阳性和95个假阴性，错误率显著低于其他组合。相比之下，朴素贝叶斯分类器在所有CNN模型中都表现较差，表明其难以有效处理高维特征空间中的复杂关系。

训练策略的优化效果

在三种训练策略中，Fixed-Learnable（FL）配置表现最佳，即冻结预训练CNN的特征提取器，仅训练机器学习分类器。这种策略不仅取得了最高准确率，还大幅降低了计算成本。例如，DenseNet201与随机森林在FL模式下达到99%的准确率，而Learnable-Learnable（LL）和Learnable-Fixed（LF）配置分别仅为98%和77%。这表明利用预训练模型的迁移学习能力，结合轻量级分类器微调，是实现效率与性能平衡的理想方案。

对抗攻击下的稳健性

研究采用快速梯度符号法（FGSM）生成对抗样本测试模型稳健性。结果显示，随着扰动强度从0.01增加到0.1，DenseNet201-随机森林模型在DFDC数据集上的准确率从97.92%降至91.19%，在Celeb-DF和FaceForensics++数据集上也呈现类似下降趋势。尽管性能有所降低，但模型在适度扰动下仍保持可靠检测能力，证明了其具有一定的抗攻击韧性。

可解释AI的价值体现

通过集成Grad-CAM和SHAP等可解释AI技术，研究使模型的决策过程变得透明可视。热力图清晰显示，模型主要关注面部区域（如眼睛、嘴巴周围）的细微异常进行真伪判别。定量分析表明，应用XAI技术后，DenseNet201-随机森林组合的置信度从98.60%提升至99.47%，显著增强了结果的可信度。这种可解释性对于法律证据分析、媒体内容认证等高风险应用场景至关重要。

计算效率的平衡优化

通过对推理时间、内存占用和浮点运算量的综合分析，研究发现DenseNet201-随机森林组合在151毫秒内完成推理，内存占用为307MB，在精度和效率间实现了良好平衡。相比之下，VGG16等更复杂模型虽然检测精度相当，但内存消耗高达1980MB，难以满足实时部署需求。

本研究通过大规模实验验证了所提框架的有效性。深度特征提取与机器学习分类的协同设计，结合科学的训练策略优化，使深度伪造检测系统在保持高精度的同时，兼具可解释性和实用价值。特别是DenseNet201与随机森林的强强联合，在多项指标上超越现有方法，为应对快速演变的深度伪造威胁提供了可靠解决方案。

研究结论强调，深度学习与机器学习的有机结合是提升深度伪造检测性能的关键。Fixed-Learnable训练策略被证明是资源受限环境的理想选择，而可解释AI技术的融入则解决了模型决策"黑箱"问题。这些发现不仅对学术研究有启示意义，更为实际应用中构建透明、可信的深度伪造检测系统指明了方向。随着深度伪造技术的持续进化，这种灵活、可解释的框架设计思路将有助于开发更具适应性的下一代检测工具。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号