AdDetector：利用文本信息和社会网络数据检测社交媒体平台上的中文广告宣传内容

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《ACM Transactions on Asian and Low-Resource Language Information Processing》：AdDetector: Detecting Chinese Advertorials on Social Media Platforms with Textual and Social Information

【字体：大中小】 时间：2026年02月16日 来源：ACM Transactions on Asian and Low-Resource Language Information Processing

编辑推荐：

　　隐蔽广告检测研究提出双塔模型AdDetector，结合文本语义分析和社交信号（如作者画像、用户互动模式）识别社交媒体中伪装成普通文章的广告。构建ZHIHU-16K多主题数据集，采用层级文本编码和图神经网络分析社交特征，通过细粒度句子分类提升跨领域泛化能力。实验表明模型在同类数据集上F1值提升1.29%-1.52%，并验证社交特征与文本分析的协同效应。研究为平台内容审核提供技术方案，同时指出AI生成广告可能绕过检测的潜在风险。

摘要

人工智能概述

人工智能生成的摘要

该摘要由基于已发表文章内容的自动化系统生成。

生成日期：2026年2月14日。

本研究旨在解决在社交媒体上检测隐蔽广告（即伪装成普通文章的广告）的挑战。这类内容将商业意图融入看似中立的叙述中，由于主题多样和宣传手段隐蔽，使得检测变得困难。为了解决这一问题，作者创建了ZHIHU-16K，这是一个来自知乎（Zhihu）的大规模中文广告数据集，其中包含了作者资料和用户互动等社交信息。这有助于探索社交线索如何与文本特征相结合，以识别隐藏的广告。

研究介绍了一种名为AdDetector的双塔深度学习模型，该模型同时处理文本和社交信号。文本塔使用分层编码来捕捉句子之间的语义变化，有助于识别微妙的营销意图；社交塔则利用图神经网络分析作者特征和用户互动模式（如可疑评论或集体质疑——这些行为可能是广告的迹象）。此外，细粒度的句子级分类有助于精确定位文章中的广告部分，从而提高模型的准确性和跨主题的泛化能力。

实验结果表明，AdDetector在领域内和跨领域测试中的精确度和召回率均优于之前的模型。消融研究证实，结合社交特征、分层文本建模和句子级监督显著提升了模型性能。尽管其推理速度较快，适合实际应用，并且比大型语言模型具有优势，但作者也指出了其一些局限性：改写或品牌掩盖可能会通过改变语义来降低模型的效果，同时仍保留原意。

除了技术贡献外，这项工作对于平台管理和法规遵从也有重要意义，因为它能够实现可扩展的自动化广告检测，提高内容透明度。尽管该研究仅使用中文文本数据来自一个平台，从而限制了其即时泛化能力，但它为扩展到整合图像或视频的多模态方法奠定了基础（这些在其他平台上较为常见）。

展望未来，关键挑战包括不断发展的AI生成广告（需要新的检测方法来应对机器生成的文本）；通过动态量化等压缩技术优化延迟；以及通过构建更丰富的数据集和多功能分类器，扩大检测范围，以识别广告之外的欺骗行为（如隐蔽宣传）。

总体而言，本研究通过创新地将先进的文本分析与丰富的社交背景理解相结合，推动了隐蔽广告检测技术的发展，并发布了有价值的数据集和源代码，以促进在线信息完整性的进一步研究。

摘要

随着社交媒体平台的广泛使用以及人们对它们的依赖程度不断增加，社交媒体已成为广告传播的重要渠道之一。然而，目前关于在社交媒体平台上检测广告的研究还相对较少。本研究专注于检测广告，这种广告通常隐藏在普通文章中，混淆了广告的本质并欺骗用户。为了有效开展广告检测研究，我们构建了一个包含丰富社交信息的中文多主题广告数据集。该数据集来自中文问答平台知乎（ZHIHU），并向公众开放，以促进进一步的研究。此外，我们提出了AdDetector，这是一种双塔模型，它通过结合文章的文本和社交信息来检测广告。我们还使用细粒度的句子级分类标签来提高模型对未见过的主题文章的泛化能力。实验结果表明，与几种强大的基线模型相比，我们的模型在领域内广告检测任务中的F1分数提高了1.29%，在迁移任务中的F1分数提高了1.52%。广泛的消融研究和全面的性能分析也验证了AdDetector各组件的互补性和有益性。我们还将源代码公开，以支持未来的研究。

人工智能生成的摘要（实验结果）

本摘要由自动化工具生成，未经过文章作者的撰写或审核。它旨在帮助读者发现内容、评估其相关性，并协助相关领域的读者理解本研究的工作。它是对作者提供的摘要的补充，而作者提供的摘要仍是文章的官方总结。完整文章才是权威版本。点击此处了解更多

点击此处对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进未来的摘要版本。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号