一种扩展的EDFM方法,用于模拟在二氧化碳储存和地能开发过程中,耦合热液-化学-机械(THMC)过程中断裂的演化

《Journal of Cleaner Production》:An eXtended EDFM approach to modeling fracture evolution in coupled THMC processes during CO 2 storage and geo-energy development

【字体: 时间:2026年01月30日 来源:Journal of Cleaner Production 10

编辑推荐:

  中国工业化威胁水系统及公众健康,本研究利用大语言模型对抖音17万条水污染相关评论进行分类,分析九大主题与七种情感表达的省级异质性。通过Beta回归框架控制空间自相关和多重检验后,发现省级社会经济因素(如平均受教育年限β=1.638)显著影响主题分布,但对情感表达无显著预测。首次揭示“话题-情感分离”现象,为精准环境治理提供新方法。

  
张普|姜娜|李一良|魏峥|潘辉
香港科技大学(广州),中国广州

摘要

中国的工业化进程对水系和公共卫生构成了威胁。本研究利用大型语言模型将17万条抖音评论分为9个主题和7种情感类型,并分析了不同省份之间的差异性。随后,我们采用了一种稳健的Beta回归框架,结合12个省级变量,并控制空间自相关性和假发现率(FDR),来探讨这种差异性的驱动因素。分析结果显示:省级因素能够显著预测公民讨论的内容,但无法预测他们的情绪表达方式。我们确定了10个主要的影响因素;其中,较高的“平均受教育年限”与“公共卫生”相关话题的讨论显著相关(beta = 1.638,q < 0.001)。相比之下,在经过同样严格的校正后,没有任何省级变量能够显著预测情感表达(所有q > 0.1)。这种“主题-情感”的分离为环境治理提供了新的思路,使机构能够针对具体的、由情境驱动的话题制定策略,而不仅仅是关注普遍的情绪反应。

引言

环境问题已成为21世纪的主要挑战,在全球公共讨论、政策制定和学术研究中受到了越来越多的关注(V?r?smarty等人,2010年)。在这些关键问题中,水污染对人类福祉和生态系统健康构成了严重威胁。工业排放、农业径流以及污水处理不足导致了全球淡水资源的恶化,尤其是在快速发展中的经济体中这一问题更为严重(Schwarzenbach等人,2010年)。在中国,数十年的工业化推动了前所未有的经济增长,但也导致了严重的环境退化(Han等人,2016年)。水污染影响了全国的主要河流系统,危及数亿人的饮用水安全、农业生产力和公共卫生(Zhang等人,2017年)。随着人们对环境问题认识的增加,公众的关注度也随之提高,环境保护已从一个边缘性问题上升为政府政策和公民参与的核心议题。
随着移动互联网技术和社交媒体平台的发展,记录、报告和讨论环境问题的方式已经转移到了线上平台(例如中国的TikTok——抖音)。这些平台允许用户记录并分享污染事件的视觉证据,如图片或视频。由于视觉内容的特性,那些展示水质变差、生态系统受损和工业排放的图片和视频在环境传播中具有特别强的影响力(Yu等人,2023年)。现有研究表明,这种方式比抽象统计数据或技术报告更能有效地传达污染信息(Liu和Lin,2019年)。此外,这些分享活动还成为了公众情绪、地方知识和集体行动的丰富来源,有助于提高对高污染企业和政府机构的监管力度(Wu等人,2023年)。
现有研究主要关注中国社交媒体平台上污染话题的内容模式(例如点赞和转发数量的基本统计)、情感分析(例如公众对水污染看法的变化)、空间差异(例如不同城市或省份对同一事件的讨论差异)以及信息传播机制(Jiang等人,2024年)。然而,很少有研究专门探讨导致空间差异的具体因素。为什么来自不同社会经济背景的人会对同一污染事件有不同的关注点和关注焦点?此外,不同的水污染可以通过不同的污染指标来反映。例如,有些水污染虽然无法通过视觉直接察觉,但可以通过气味感知;而有些则可以通过明显的颜色变化来识别。不同地点的污染指标差异是否会影响公众的关注点和关注焦点?因此,在本研究中,我们利用基于大型语言模型(LLMs)的少量样本学习技术,将来自抖音的大量视频评论数据(包含大致的位置信息)分类为不同的讨论特征(例如8种情感和10个主题),以反映公众对水污染的关注,并识别出省份间的差异性。为进一步解释这种差异性,我们探讨了由LLMs分类的环境讨论特征与省级社会经济因素和污染指标之间的关系。
在本文的其余部分,我们将讨论社交媒体在环境讨论中的作用,识别影响公众环境关注度的驱动因素,并阐述使用大型语言模型的合理性。第3节将详细介绍研究方法,第4节将展示研究结果,第5节将总结全文。

参考文献

文献综述

首先,我们阐述了使用抖音上的环境讨论数据的原因。接下来,我们将讨论使用大型语言模型(LLMs)对环境讨论数据进行分类的合理性。最后,我们发现目前尚未充分探讨环境讨论特征与区域特征之间的关系,以及如何解释这些潜在的关系。
近年来,关于公众对环境问题认知的研究取得了显著进展

概述

如前一节所述,我们希望探讨不同的讨论特征,以反映公众对水污染的关注,并通过分析讨论特征与社会经济因素及污染指标之间的关系来解释空间差异。本研究的目标有两个:(1)提取讨论特征并识别省级层面的差异性;(2)评估讨论特征的相关性。

结果

本节主要展示了使用ChatGPT对与工业水污染事件相关的评论进行分类后的整体结果。首先,我们报告了情感和主题的基本统计信息,然后利用第3.2节提到的参与度指标(即评论的点赞数)进一步分析了每种情感和主题的深层含义。

讨论

正如引言中提到的,我们的目标是解释省级层面水污染相关讨论的差异性。在本研究中,我们利用大型语言模型将抖音上的17.2万条评论分类为不同的讨论特征(例如8种情感和10个主题类别),并展示了这些特征之间的差异性。随后,我们采用了一种稳健的统计框架——结合10个省级变量进行Beta回归分析,以探讨这些差异性的原因。

结论

本研究通过利用新型的大型语言模型分类方法和稳健的回归框架,解释了中国在线水污染讨论中的省级差异性。通过对16个因变量(9个主题、7种情感)与10个省级变量进行严格分析(同时控制数据构成、空间自相关性和多重检验),我们发现了重要的差异。
我们的研究结果表明,社会经济现实与环境状况密切相关

CRediT作者贡献声明

张普:撰写——审稿与编辑、初稿撰写、可视化处理、数据验证、软件开发、资源整理、方法论设计、调查实施、数据分析、概念构建。姜娜:初稿撰写、概念构建。李一良:初稿撰写。魏峥:初稿撰写。潘辉:项目监督、资金筹措。

伦理批准和知情同意声明

本文不涉及任何涉及人类或动物的研究。

利益冲突声明

作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。

致谢

本研究得到了中国国家重点研发计划(2024YFC3307602)和广东省人才计划(2023JC10X009)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号