《PLOS One》:Mapping Japan’s China-related twitter discourse (2010–2024) using BERTopic
摘要
鉴于中国对日本的深远影响,日本的对华舆论一直是辩论的焦点。然而,对于这种认知如何在数字公共领域内随时间演变,人们知之甚少。本研究利用一个包含2010年至2024年间日本发布的超过一百万条涉华推文的数据集,结合BERTopic主题建模和大语言模型驱动的情绪分析,追踪日本对华认知的动态演变。实证分析发现:(1)公众对中国的关注度稳步增长,主要集中在四个领域:外交与安全、环境与健康、经济与贸易以及文化与社会;(2)整体情绪以负面为主,中性和正面态度出现在特定主题中;(3)主题-情感关联分析揭示了不同主题间不同的情感倾向,表明舆论演变不仅是对外部事件的反应,也受到主题内在特征的影响。通过将计算分析应用于大规模社交媒体数据,本研究揭示了日本涉华舆论的动态结构,为理解舆论形成机制及其对中日关系的影响提供了见解。在方法论上,本研究为跨国公共话语分析贡献了创新方法。
引言
中国和日本作为世界第二和第三大经济体,在塑造地区安全和全球繁荣方面发挥着关键作用。双边关系不仅影响其国内事务,也对东亚及以外的稳定产生重大影响。然而,日本长期以来以“美国为中心”的外交政策传统,加上2000年代中期以来反华情绪的高涨,使得两国关系日益复杂。最近,COVID-19大流行、中美竞争的加剧以及中国的迅速崛起,迫使日本重新审视其地缘战略定位,并开展地区外交以缓解战略焦虑。
在此背景下,公众对中国的看法已成为影响日本外交政策制定的关键因素。在代议制民主国家,公众舆论既限制政策选择,也为政治决策提供关键线索。因此,理解日本如何看待中国,对于解释中日关系的社会基础以及预测未来的政策方向至关重要。先前的研究探讨了国家政策、领土争端、重大国际事件和媒体叙事对日本对华态度的影响。然而,这些研究——主要依赖于调查数据或短期的事件驱动观察——倾向于将舆论简化为“积极-消极”的二元框架。因此,在全面分析公众认知的细微差别及其随时间演变方面仍存在差距。
Twitter等社交媒体平台已成为公众表达和政治辩论的核心舞台,为观察日本对中国的看法提供了独特的机会。与传统的民意调查相比,社交媒体数据规模更大、更动态、更多样化。精细化的分析可以捕捉情绪实时波动,并揭示公共话语背后的主题结构。尽管有这些优势,但很少有研究利用社交媒体来系统追踪日本对华舆论的长期动态。
相关研究
日本对华舆论研究
日本对中国的认知对双边关系和政策制定具有深远意义。现有研究主要集中在精英层面的动态,包括外交互动、经济政策和主流媒体叙事,考察这些行为体如何塑造公众认知和议题框架。在公众认知层面,研究主要采用调查方法来考察对中国的印象、态度和政策偏好。研究表明,日本对华态度总体上变得越来越负面,由地缘政治紧张、文化亲近感、历史记忆和感知的安全威胁等因素共同塑造。与许多发展中国家的经济导向评估模式不同,日本公众倾向于通过意识形态视角看待中国。
最近,越来越多的研究转向社交媒体数据,以调查特定事件期间涉华舆论的动态。例如,在国际关于日本核污水排放的辩论中,中国被塑造成主要的反对者。在COVID-19大流行期间,中国仍然是日本社交媒体讨论的中心,公众情绪主要表现为焦虑和担忧。虽然这些研究展示了社交媒体捕捉舆论动态的潜力,但它们仍然局限于特定事件或横截面分析,对长期或演变中的情绪模式提供了有限的见解。因此,日本涉华数字话语的纵向动态仍有待探索。
社交媒体研究中的主题建模
社交媒体内容由于其碎片化性质、层次化主题结构和多维表达,带来了独特的分析挑战。对于提取的Twitter数据,潜在狄利克雷分配(LDA)是一种常用的主题建模方法,长期以来被用于识别舆论主题及其时间动态。然而,这种方法通常存在主题语义模糊、处理多语言和嘈杂文本的能力有限以及对短文本性能差等问题,难以从社交媒体数据中提取有价值的信息,并且容易忽略小众但重要的主题。
随着机器学习的快速发展,基于BERTopic的主题建模已成为一种能够以高语义精度提取动态演变的主题单元、自动生成层次化主题结构并提供模型组件的灵活组合的方法。这种方法不仅能准确捕捉主流话语主题,还能突出被边缘化或忽视的声音,特别适用于处理非结构化、短文本和多语言的社交媒体数据。
情感分析
情感分析是社交媒体研究的另一个关键维度,旨在揭示公众态度和情绪分布及其时间演变。早期的基于词典的方法从情绪词汇推断极性和强度,在小规模标注语料库上表现尚可,但在处理上下文模糊性和细微语义解释方面存在困难。随后,研究者采用基于特征工程的传统机器学习方法,如支持向量机和逻辑回归,以提高分类性能,但这些方法受到对手工构建特征的重度依赖和泛化能力有限的制约。
近年来,基于神经网络的预训练语言模型在推文情感分类方面显示出显著效果。特别是基于BERT的情感分析,通过捕捉上下文依赖和深度语义表征,显著提高了准确性。实证证据一致表明,BERT及其变体在多语言社交媒体情感分析中优于传统方法。然而,大多数现有研究集中在英语或西班牙语上,对日本公众社交媒体话语的情感研究仍然相对较少。
数据与方法论
本研究的数据和方法包括数据集的建立、层次化主题结构的构建、主题和情感演化分析。
数据构建
基于主题标签在社交媒体上划分话语社群的功能,本研究使用“#中国”和“#中華”作为搜索关键词,系统地捕捉日本关于中国的公共讨论轮廓。使用Twitter API收集了2010年1月1日至2024年12月31日期间包含这些主题标签的所有日语推文,形成了一个涵盖15年、包含超过130万条数据的语料库。选择2010年为起点,是基于当年日本在钓鱼岛/尖阁诸岛附近扣押中国渔船的事件,这标志着中日关系进入战略竞争和频繁紧张的新阶段,对公共话语实践产生了深远影响。
检索的推文包括用户ID、发布时间、用户昵称、用户名、推文内容、点赞数和转发数。推文分为四种主要类型:原创推文、转发、引用推文和回复推文。所有原创推文均保留在语料库中。转发在语义上与原创推文相同,可能造成放大效应,为了保持主题表征的稳定性,将其移除。引用推文在引用原文时通常包含用户添加的评论,这部分额外语义内容被提取并作为单独条目处理。回复推文由于其互动性和通常简短、口语化的性质,被排除在语料库之外。
对于原始数据,根据用户ID和发布时间合并并删除了重复推文,并删除了完全相同的推文,最终得到1,099,786条有效推文。预处理包括三个步骤:数据清洗(移除HTML标签、URL、表情符号和多余空格,规范化全角和半角字符);保留推文文本和相应时间戳;使用MeCab分词器对日文文本进行分词。
方法论
为解决两个研究问题,本研究进行了层次化主题提取、主题演化分析和情感演化分析。
- 1.
层次化主题提取:使用BERTopic构建层次化主题模型。步骤包括:使用paraphrase-multilingual-MiniLM-L12-v2模型对预处理后的推文进行嵌入;通过UMAP降维;使用HDBSCAN对降维后的嵌入进行聚类;使用c-TF-IDF算法提取主题标签;使用GPT-4o-mini生成简洁、语义精确的主题摘要;这些摘要通过XLM-RoBERTa模型映射到最底层,产生62个细粒度主题。
- 2.
主题演化分析:旨在揭示主题随时间、事件或环境变化的动态变化。采用基于语义相似性的方法。具体而言,使用c-TF-IDF算法提取主题关键词。以2010年的关键词作为“起始词”,对于后续每一年,计算当年关键词与上一年关键词的语义相似度。选择与上一年最相似的前五个关键词代表该时期的主题演变。主题标签使用paraphrase-multilingual-MiniLM-L12-v2模型转换为向量,并使用余弦相似度衡量关键词之间的语义关系。
- 3.
情感演化分析:为了调查日本涉华讨论中情绪的分布和演变,使用multilingual-sentiment-analysis模型对每条推文进行细粒度情感分类,将其分为五个类别:非常负面、负面、中性、正面和非常正面。基于此,分析每个主题的情感分布,从而捕捉每个主题内公众情绪的变化和波动。
结果
层次化主题结构概览
为回答第一个研究问题(RQ1),本研究分析了2010年至2024年所有相关的日本推文,统计了年度推文数量,并将其聚类为层次化主题结构。
图表显示,涉华推文的总数随时间稳步增长。层次化主题架构呈现三层结构。顶层包括10个核心主题:“外交与安全”、“文化与社会”、“环境与健康”、“经济与贸易”、“政策与治理”、“技术与产业”、“教育”、“法律与人权”、“娱乐与体育”以及“历史与民族认同”。底层清晰地呈现了62个细粒度主题,涵盖了主流公共话语以及AI成就、中医药、核能等较小但重要的主题。
除了细粒度的层次分析,主题讨论强度的时间趋势也提供了丰富的见解。
“外交与安全”主题的讨论强度逐年增加,在2019年达到顶峰;“环境与健康”主题在2020年因疫情而显著激增。“文化与社会”、“经济与贸易”和“技术与产业”自2021年以来呈现波动上升趋势,反映了随着中国经济快速发展,这些主题在日本舆论中的能见度逐渐提高。
图表还显示主题类别间存在明显的长尾分布。“外交与安全”、“环境与健康”、“经济与贸易”和“文化与社会”这四大主题占据了讨论的主导地位,合计占所有推文的69.87%。其余六个主题的推文量相对均衡,“历史与民族认同”占比最少。这种长尾分布表明,虽然公众注意力主要集中在四大主题上,但“娱乐与体育”和“历史与民族认同”等小众主题也不容忽视。
主题演变视图
本研究将碎片化的公共话语数据整合成一个连贯且易于解释的叙事视图。
“外交与安全”主题(红色)在2010年至2024年间持续出现并保持突出地位。该主题下的关键议题包括台湾问题、朝鲜核计划、南海中越争端、中日钓鱼岛/尖阁诸岛争端以及中美对抗。这些讨论通常由重大外交事件和历史问题引发。“经济与贸易”和“技术与产业”主题与“外交与安全”表现出强关联。早期讨论集中在经济规模和市场机遇上,随后技术创新和对外投资成为焦点。“环境与健康”主题包含与事故、流行病和食品安全相关的叙述,讨论高峰主要由公共安全事件触发。相比之下,“文化与社会”、“法律与人权”、“教育”和“娱乐与体育”等主题保持了相对稳定的讨论水平,集中在文化交流、中文学习、体育赛事和一些社会事件上。
情感分布
为了探究日本涉华话语的情感分布和演变模式(RQ2),本研究对收集到的涉华推文进行了细粒度情感分类,分为五类:非常负面、负面、中性、正面、非常正面。
研究发现,日本涉华社交媒体话语的整体情感分布呈现负面主导,非常负面和负面情感合计占42.5%,而非常正面和正面情感仅占30.3%,显示出不利评价明显多于有利评价。
如图所示,每个主题的中性情感比例大致相似,在20%到30%之间,表明大约四分之一的涉华讨论保持了相对中立的基调。此外,在所有主题中,正面和负面情感的占比相对较小,而非常正面和非常负面情感的比例相对较大。
非常负面情感在五个领域中尤为突出:“外交与安全”、“政策与治理”、“环境与健康”、“法律与人权”和“历史与民族认同”。相比之下,非常正面情感在另外五个主题中明显更高:“文化与社会”、“经济与贸易”、“技术与产业”、“教育”和“娱乐与体育”。
主题-情感关联分析
结合情感热力图和主题-情感演变堆叠图,本研究揭示了日本涉华社交媒体话语中不同主题情感的时间动态。
情感热力图显示,不同主题的情感趋势差异显著。“外交与安全”、“法律与人权”、“政策与治理”、“环境与健康”和“历史与民族认同”整体呈现明显的负面偏移。相比之下,“文化与社会”、“教育”和“娱乐与体育”保持主要的正面偏移,而“经济与贸易”和“技术与产业”则在正面和负面情感之间波动。
主题-情感演变堆叠图提供了更细致的追踪。例如,在2012年日本“国有化”钓鱼岛/尖阁诸岛事件后,“外交与安全”中的负面和非常负面情绪飙升至54.92%。“历史与民族认同”中的负面情绪比例在2014年至2015年间保持在60%左右,在2014年10月达到63.51%的峰值。此外,“环境与健康”在2020年COVID-19疫情期间经历了负面情绪的急剧上升,而“法律与人权”在2019年香港反修例运动期间达到了负面情绪峰值。
同时,积极情绪最显著地聚集在社会互动性主题中。“娱乐与体育”中正面和非常正面情绪持续占20-40%,而“文化与社会”则维持在30-50%的较高范围,反映出持续向正面情感的两极分化。值得注意的是,在2020年COVID-19疫情期间,“娱乐与体育”中的正面情绪份额保持在40%左右,同年10月,随着中国手机游戏《原神》在日本App Store排行榜登顶,正面情绪上升至55.41%。
“经济与贸易”和“技术与产业”中的情绪随着政策和事件而明显波动。在“经济与贸易”中,负面情绪在2013年区域经济紧张时期上升至47.35%,并在2018年中美贸易战期间再次飙升至47.86%。2020年《区域全面经济伙伴关系协定》(RCEP)签署后,正面情绪反弹至39.37%。“技术与产业”虽然总体评价积极,但波动更为剧烈:2018年美国对华为实施制裁,日本随即将其从政府采购名单中移除,导致该主题下的负面情绪达到43.82%。然而到了2019年,情绪迅速转回正面。
讨论
本研究旨在阐明日本对华公众认知和态度的多维复杂性及其动态演变。与先前主要依赖传统民意调查的研究不同,它提供了一个细粒度的“主题-情感”映射框架。数据分析揭示了以下几点:
首先,主题建模结果表明,公众对中国的关注度普遍提高,核心焦点是“外交与安全”,其次是“环境与健康”、“经济与贸易”和“文化与社会”。这很大程度上支持了安全关切是日本对华认知基石的观察,同时也揭示了一个更细致的情况:在“外交与安全”内部,公众的关注点超越了台海危机、军演和中美对抗,还通过“技术霸权”和“军民两用技术”等话语纳入了“技术与产业”主题。此外,疫情过后,公众对文化、经济和技术主题的关注度显著增加,突显了公众对华认知的多元化。
其次,情感分析显示,日本对华态度整体偏向负面,但中性情感约占四分之一。正面和负面情感大致平衡,非常正面和非常负面情感相对突出。与早期研究相比,本研究更高的中性情感比例表明,相当一部分公众对华保持细致、非两极化的立场,而非局限于尖锐对立的观点。
主题-情感关联分析表明,日本的态度在不同主题中表现出多样化的模式。“外交与安全”和“历史与民族认同”等高政治化主题充满负面情绪,是数字民族主义的爆发点。相比之下,文化和社会领域在很大程度上仍然是积极参与的、去政治化的空间。经济和科技主题表现出动态的矛盾心理,既被框定为威胁也被视为机遇,而健康危机则引发了与治理失败和“风险外溢”认知相关的负面情绪。这种模式强烈表明,舆论形成是一个双重过程,由外部事件驱动,但通过主题特定的情感可供性进行调节。
总体而言,本研究超越了“积极-消极”态度的二元框架,将日本对华认知概念化为在数字公共领域展开的沟通过程。研究结果表明,舆论不仅仅是地缘政治事件的反映,更是一种话语建构,其中外交、文化、健康和技术等主题充当了情感协商的场所。因此,社交媒体构成了一个混合场域,数字民族主义与日常话语在此交汇,随时间塑造、竞争和重构中国的形象。这一视角强调数字媒体不仅仅是信息交换的渠道,更是东亚公共外交和跨国身份构建的构成性空间。
通过将细粒度情感分析与BERTopic相结合,本研究通过引入动态的社会认知视角,扩展了日本涉华舆论研究的理论边界。我们证明,日本对华公众态度不仅仅是个人经验的静态反映,而是通过重大事件、用户参与和话语框架之间的相互作用而演变的。这一分析框架阐明了主题突出度的动态性和相关的情感价,从而为研究社交媒体上的涉华话语提供了方法论和理论指导。
局限性
尽管本研究解决了两个研究问题,但仍存在一些局限性。首先,社交媒体上表达的公众舆论可能存在抽样偏差。日本涉华社交媒体数据可能主要反映了年轻用户、城市居民或有特定兴趣的个体的观点,而老年人、低收入者和偏远地区的用户代表性不足,这可能会引入抽样偏差,并限制对日本社会不同阶层涉华态度的全面理解。其次,推文数据的收集依赖于预定义的关键词搜索。这种方法可能遗漏了与研究主题密切相关但不包含选定关键词的内容。第三,尽管本研究使用的情感分析模型和LLM辅助的主题标注方法在当前文本挖掘研究中已很成熟,但其预训练性质不可避免地具有“黑箱”特征,包括训练语料库中潜在的偏见和不透明的推理机制,这可能给情感识别和主题标注带来误差,并带来公平性和伦理风险。尽管如此,这些误差主要影响模型输出的精确度,不会改变整体主题趋势或研究结论,这些结论仍然是稳健的。
结论
基于2010年至2024年日本Twitter平台上涉华推文,本研究对日本的对华认知和态度进行了长期、多层次、精细化的阐述。本研究在三个方面有所贡献。首先,通过将大规模社交媒体数据与详细的“主题-情感”分析相结合,它超越了依赖民意调查的传统量化方法,揭示了日本在不同主题上的差异化态度模式和演变轨迹,从而为研究日本公众舆论提供了更具解释力的框架。第二,凭借其大样本量和长时段覆盖,该研究提供了一个从宏观到微观分析的系统性、动态性视角。第三,首次将BERTopic主题建模与大规模情感分析相结合,考察了日本涉华社交媒体话语中主题与情感的耦合演变,并提供了可指导未来舆论研究的方法工具和分析框架。
未来的研究可以从几个方向扩展。首先,未来研究可以在数据允许的范围内纳入性别和年龄等人口统计学变量,以考察不同群体在表达方式、情绪模式和互动行为上的差异,从而更全面地理解公众态度的形成机制。其次,可以进行跨国比较研究,考察涉华话语在日本与英美等国的社交媒体平台上是如何构建的,以揭示这些差异背后的文化、社会和制度机制。第三,未来的研究可以基于本研究的分析框架,整合领域专家知识,构建针对社交媒体上涉华话语的本体,并将其与LLM驱动的文本分类和主题识别流程相结合,以提高跨语境和事件分析的稳健性和可解释性。