综述：基于社交媒体的多尺度洪水监测：从全球监测到社区抗灾能力的应用系统综述

《Journal of Environmental Management》：Social media-driven multi-scale flood sensing: A systematic review of applications from global monitoring to community resilience

【字体：大中小】 时间：2026年05月10日 来源：Journal of Environmental Management 8.4

编辑推荐：

　　金瑞|文静公伦敦国王学院地理系，Bush House，东北翼，40 Aldwych，伦敦，WC2B 4BG，英国 **摘要** 随着气候变化和城市化的加速，洪水发生的频率越来越高。社交媒体已成为洪水监测的宝贵数据来源。然而，当前关于社交媒体的洪水研究仅限于单一的空

　　金瑞|文静公
伦敦国王学院地理系，Bush House，东北翼，40 Aldwych，伦敦，WC2B 4BG，英国

**摘要**
随着气候变化和城市化的加速，洪水发生的频率越来越高。社交媒体已成为洪水监测的宝贵数据来源。然而，当前关于社交媒体的洪水研究仅限于单一的空间尺度，忽视了在不同空间尺度上使用此类数据的异质性和方法论挑战。本研究提出了一个多尺度分析框架，以系统地评估社交媒体在洪水相关研究中的当前应用和未来发展方向。我们采用了一种由大型语言模型支持的半自动化方法，结合了PRISMA协议和KeyBERT进行关键词提取，并分析了105篇相关出版物。该框架涵盖了四个空间尺度：全球、区域、城市和社区，并使用GPT-4o整合了提取的见解。研究结果表明：（1）全球和国家尺度强调跨平台灾害识别和政策反馈机制；（2）区域尺度突出了风险认知的差异和区域间信息协调；（3）城市尺度关注实时监测和精细的空间建模；（4）社区尺度集中于个人疏散行为和邻域网络分析。社交媒体数据表现出很强的时效性、高公众参与度，并与传统数据来源有显著的互补性。尽管如此，仍存在一些关键挑战，包括有限的跨语言和文化建模能力以及多源数据整合机制不足。此外，数字弱势群体的代表性不足以及伦理和隐私治理的滞后进一步限制了研究。这项研究为开发更具弹性的多尺度城市灾害信息系统提供了理论和方法论指导。

**1. 引言**
洪水是全球最具破坏性的自然灾害之一，每年都会造成大量人员死亡、财产损失和社会经济中断。随着气候变化的加剧和快速城市化，洪水的频率和强度显著增加，表明全球洪水风险明显上升（Guo等人，2025；Siegrist和Gutscher，2006；Vinh Hung等人，2007）。传统的洪水监测和灾害管理系统主要依赖于水文监测站、遥感技术和现场调查。虽然这些方法具有高精度，但在实时响应、空间覆盖范围以及捕捉公众认知和行为反应方面存在局限性（Sadiq等人，2022；Songchon等人，2021；Young等人，2022）。

近年来，社交媒体迅速成为一种独特而有效的数据来源，为洪水监测和管理提供了新的机会和可能性（Li等人，2024；Soomro等人，2024）。与传统数据来源不同，Twitter（现为X）、Facebook、Weibo、Instagram和YouTube等平台提供了丰富的文本、多媒体内容和地理空间信息（Guo等人，2023，2025；Songchon等人，2021）。这些平台上的用户生成内容可以动态捕捉洪水事件的发生和发展，同时反映受影响人群的即时反应和情绪反应。因此，社交媒体越来越多地被整合到洪水灾害管理的多个阶段中，包括灾前风险感知评估和早期预警传播（Bryan-Smith等人，2023a；Shoyama等人，2021；Young等人，2022）、洪水期间的应急响应和实时监测（Y. Li等人，2023；Yan等人，2024；Guo等人，2023），以及灾后影响评估、恢复需求识别和经验教训总结（Hao等人，2022；Ogie等人，2022；Tan和Schultz，2021；Young等人，2022）。

尽管一些文献综述试图探讨社交媒体在灾害管理中的应用，但仍然缺乏专门针对洪水情景并将空间尺度作为主要分析维度的系统综述。例如，Ogie等人（2022）回顾了社交媒体在灾后恢复中的作用，强调其在情感支持、信息传播和恢复协调方面的贡献。然而，他们的研究并未将洪水作为一种独特的灾害类型进行专门探讨，也没有将空间尺度作为核心分析框架。同样，Songchon等人（2021）通过多个城市案例研究了社交媒体如何促进洪水风险沟通和公众响应，但他们的主要关注点在于情感分析和主题建模，没有建立一个系统的基于尺度的框架。虽然这些综述为社交媒体在洪水相关研究中的应用提供了有价值的见解，但它们往往只关注洪水预测、监测或风险评估等单一维度。这些工作往往忽视了社交媒体作为独立数据来源的潜力，未能充分考虑空间尺度对其应用的影响。这一限制可能导致低估了社交媒体数据的多维价值，并忽视了其在不同尺度上的异质性和操作挑战，最终限制了研究结果的普遍性和灾害响应的及时性和精确性。

最近的综合性综述也系统地分析了人工智能驱动的洪水预测模型及其与多种数据源的整合，揭示了洪水检测和早期预警系统算法方法的显著进步（Li等人，2025；Liu等人，2025）。然而，这些综述主要关注技术模型性能和计算效率，而未能充分讨论数据代表性的社会空间维度以及社区韧性（Lopes等人，2025；Pakati等人，2025）。此外，现有的洪水风险管理综述通常将社交媒体数据视为另一种技术输入，而没有将其视为一种反映并可能放大灾害准备和响应中现有不平等的社会嵌入信息系统（Eskandarinejad等人，2025；Souza和de Amorim Silva，2025）。最关键的是，当前的综述方法未能捕捉不同空间尺度上技术进步与社会脆弱性之间的动态相互作用，从而限制了它们为公平灾害治理提供可操作见解的能力。

此外，现有的综述依赖于传统的手动文献筛选和分析方法，在处理社交媒体和洪水研究这样的快速发展的跨学科领域时存在明显局限。首先，相关文献的数量庞大且分散在多个学科中，包括水文学、灾害管理、计算机科学、地理信息科学和社会科学，每个学科都有各自的术语和方法论，使得传统的手动方法难以实现全面和系统的整合（Kellens等人，2013；Ogie等人，2022）。其次，技术方法和应用实践发展迅速，而手动综述耗时较长，往往无法及时反映最新的研究进展。

为应对现有综述的碎片化性质和缺乏综合分析的问题，本研究创新性地采用了大型语言模型（LLM）辅助的半自动化文献综述方法，以全面评估社交媒体在不同空间尺度上的应用、挑战和未来发展方向。LLM具备强大的自然语言处理和知识整合能力，能够高效处理和分析大量文献，识别关键主题和模式，并提取相关见解（Cantini等人，2025；Zhu等人，2024）。值得注意的是，LLM可以支持跨学科术语的映射和整合，发现研究趋势和空白，并促进多维度分类和分析。通过这种人机协作回顾方法，本研究全面展示了社交媒体在洪水研究中的应用。该综述通过提供系统的多尺度分析，填补了现有文献中的关键空白。我们超越了以往综述的单维度技术焦点。我们的工作还提供了一个经过验证的基于LLM的协议，解决了传统手动方法的局限性，为未来的研究奠定了系统基础。

**2. 方法论**
**2.1. 方法论依据和架构决策**
本研究的方法论框架旨在解决基于社交媒体的洪水研究中的三个关键挑战：尺度异质性、跨学科整合和高效知识合成。选择GPT-4o作为核心分析引擎是由于其在多语言文本理解和复杂推理任务方面的卓越性能，这对于处理多学科和地理背景下的多样化学术文献至关重要。KeyBERT的集成用于关键词提取，利用BERT的上下文嵌入能力来捕捉传统关键词匹配方法常忽略的语义关系，从而提高了文献筛选的准确性。PRISMA（系统评价和元分析的优选报告项目）协议确保了方法论的严谨性和透明度，解决了系统评价中的可重复性问题。多尺度分析框架（全球、区域、城市、社区）专门设计用于捕捉社交媒体应用的空间敏感性，认识到由于基础设施、数字素养和治理结构的不同，洪水相关的社交媒体使用模式在不同地理尺度上存在差异。我们的数据库选择优先考虑分析深度而非全面覆盖：Scopus索引了90%的高引用跨学科洪水研究，仅限于期刊文章，以确保最小的LLM验证错误。

**2.2. 半自动化综述框架**
本研究提出了一种创新的半自动化文献综述方法，将传统的系统评价过程与大型语言模型（LLM）技术相结合。该方法提高了综述的效率和质量，同时确保了研究结果的准确性和可重复性。如图1所示，整个工作流程包括三个主要阶段：（1）文献准备；（2）信息提取；（3）知识整合。在第一阶段，通过系统检索、筛选和下载相关出版物，建立了一个全面且精心策划的文献数据库，排除了与洪水和社交媒体主题关联性较弱的研究。在第二阶段，使用GPT-4o模型提取文本内容并生成基于准备好的文献语料库的结构化摘要。在第三阶段，进一步使用GPT-4o模型整合提取的内容，揭示文献中的关键见解和潜在联系。这一逐步过程使得对审查内容的系统化和精细分析成为可能。

**图1. 半自动化文献综述工作流程，整合了PRISMA协议、KeyBERT关键词提取和GPT-4o内容合成。**
- 第1阶段：通过Scopus数据库搜索和基于KeyBERT的筛选进行文献准备（n = 105篇文章）。
- 第2阶段：使用GPT-4o API进行23个结构化提示的信息提取。
- 第3阶段：通过基于Web的GPT-4o合成在四个空间尺度（全球、区域、城市、社区）上进行知识整合。

为了确保文献筛选过程的标准化和可追溯性，本研究在第一阶段采用了国际公认的PRISMA协议。选择Scopus作为主要数据库的原因在于其优秀的跨学科覆盖范围和标准化的元数据结构，这对于基于KeyBERT的提取和LLM验证一致性至关重要。虽然排除会议论文可能会低估尖端计算方法的代表性，但我们对同行评审期刊的关注确保了验证LLM辅助协议的方法论严谨性。PRISMA框架提供了一个结构化的检查表和流程图，记录了整个筛选过程，从而提高了综述的透明度和完整性（Page等人，2021）。在权威的Scopus数据库中进行了针对性的高级搜索，使用预定义的搜索词（见图2），结合了洪水相关关键词（如“flooding”、“flood risk”、“flood vulnerability”、“flood nowcasting”、“flood situational awareness”）与社交媒体相关术语（“social media”、“social media analytics”、“social media platforms”、“social media data”、“social media mining”）。搜索范围限于2004年后发表的英文期刊文章，涵盖工程、环境科学、气候研究、公共卫生和风险管理等相关领域。共检索到228篇潜在相关的出版物，其元数据以CSV格式导出以便后续分析。根据三个标准将研究分配到不同的空间尺度：数据收集的空间范围、主要决策范围和干预水平，跨尺度研究（9%）根据其主要的分析重点进行分类，并为多尺度整合分析单独编码。下载：下载高分辨率图像（354KB）下载：下载全尺寸图像图2. Scopus高级研究。在筛选阶段，我们结合了自动化算法和专家意见，以确保选择过程的准确性和效率。具体来说，我们使用了KeyBERT（v0.8.0）与‘all-MiniLM-L6-v2’句子转换器、n-gram范围（1,2）、NLTK停用词、多样性=0.7（MMR），并提取每篇文档的前10个关键词（Sharma和Li，2019）。关键词与27个目标术语进行了匹配（表S1：15个与洪水相关，12个与社交媒体相关）。评分公式化：设F = {洪水关键词}，S = {社交媒体关键词}。每个关键词k∈(F∪S)获得2分；其他关键词获得1分。相关性标准：(1) 来自F和S的关键词数量均≥1，或 (2) 总分≥3。关键词列表构建：(1) PRISMA搜索词（图2）；(2) 专家咨询（n = 3）；(3) 对228篇摘要的术语频率分析。验证：手动审查得分最高的/最低的20篇文章，确认准确率为95%（38/40正确）。敏感性分析：阈值变化（2.5-3.5）仅使样本量变化了±3篇文章（±3.1%）。这识别出96篇文章；另外手动添加了9篇文章，总共105篇。第二阶段的重点是从全文中提取关键内容。为了提高大型语言模型（LLM）的处理效率，我们移除了图片、表格和参考文献列表。这对提取的影响很小，因为：(1) 提示（表S2）针对摘要/方法/结果中的文本；(2) 引用计数保留在正文中；(3) 验证（表S3）显示0%的幻觉错误和0.9%的事实错误。承认的局限性：当文本引用图表时，这些图表内容是手动编码的。我们使用Python脚本，通过向每篇文章提出预定义的问题来调用GPT-4o应用程序编程接口（API）以提取结构化信息。GPT-4o在自然语言理解、多文档上下文整合和指令遵循方面表现出色，非常适合高精度信息提取任务（Shahriar等人，2024）。共设计了23个结构化提示：前16个涉及基本研究特征，如学科领域、使用的社交媒体平台、分析方法和数据可访问性；剩余的7个关注研究内容，包括背景、研究问题和局限性。图S1–S3提供了GPT-4o回复的代表性示例。完整的提示和API配置在表S2中。在此基础上，第三阶段涉及根据空间尺度对研究进行分类，并使用基于网络的GPT-4o接口进行深入综合。这一阶段旨在揭示潜在联系，并在审查的文献中构建知识图谱。GPT-4o的逻辑推理、逐步分析和细致判断能力使其能够产生适合系统综合任务的连贯且复杂的文本输出（Lehr等人，2025）。鉴于幻觉风险——输出与源材料不一致（Farquhar等人，2024），所有模型生成的内容都经过了手动验证和完善，以确保事实准确性和逻辑严谨性。2.3. 半自动化审核方法的验证为了验证我们半自动化方法的可靠性，我们对40篇文章的分层随机样本进行了系统手动验证，将所有23个结构化提示与原始源材料进行了交叉核对（总共920次验证检查）。我们采用了双重验证机制：两位独立审稿人分别检查每个模型回复与源文本，然后对涉及复杂概念或潜在歧义的回复进行三轮交叉验证，直到达成完全共识。表S4展示了所有提示类别的评分者间一致性指标。在920次验证检查中，发现了59个初始分歧（6.4%），并通过交叉验证过程解决了这些问题。表S5描述了这些分歧的分布和解决模式。我们建立了详细的错误分类框架和质量评估标准，特别关注模型在提取技术术语、数值数据和研究结论方面的表现。根据我们的操作定义，幻觉（即与源材料直接矛盾或完全缺失的虚构信息），在验证样本中未检测到任何幻觉实例。所有提取的信息都与源内容一致，尽管我们承认可能发生了轻微的改写变化或重点转移，但在我们的验证框架下没有将其归类为幻觉。我们进一步认识到，这一发现仅限于我们研究中使用的特定验证范围和提示结构。这种高准确性可以归因于我们故意采用的方法论设计，即提出单独的、具体的问题，而不是复杂的多部分查询，这种策略减少了大型语言模型在处理长或复合提示时生成幻觉的倾向（Farquhar等人，2024）。表S3提供了验证过程中遇到的错误类型的详细分解。图S4以二维混淆矩阵的形式展示了准确度等级和错误类型之间的关系，而图S5提供了所有错误类别的详细水平条形图分解。此外，我们记录了模型信心水平的模式和潜在的系统偏见，以指导未来的方法论改进。然而，我们承认这种验证并不能消除所有潜在风险，并在讨论研究限制时指出了基于大型语言模型的方法的固有局限性。通过将大型语言模型集成到审核工作流中，本研究实现了内容的自动化提取和文献的深入综合，提高了传统审核方法的效率和准确性，同时减少了研究人员的工作负担。该方法还展示了强大的可转移性，为未来的智能和系统化文献审核工作提供了宝贵的参考。3. 结果3.1. 研究地点的地理空间背景图3展示了审查研究的地理分布，揭示了关于社交媒体和洪水的研究的空间集中和不平衡。研究地点主要集中在更发达的地区，包括东亚、东南亚、欧洲和美国，这些地区的研究密度相对较高。大多数研究位于沿海城市，表明沿海洪水事件比内陆河流洪水吸引了更多研究关注。这可能是由于沿海洪水在社交媒体平台上更容易突然发生、影响更广泛且可见度更高。值得注意的是，在中国，研究不仅集中于东部沿海地区，还扩展到长江和黄河等主要河流流域的内陆城市，表明在复合洪水风险条件下，不同易受洪水影响的地区具有重要的研究价值。下载：下载高分辨率图像（597KB）下载：下载全尺寸图像图3. 审查文献的研究地点的地理分布。相比之下，拉丁美洲、中亚和非洲的研究代表性不足，许多南半球国家的研究覆盖范围很小或没有研究。这种空间不平衡可能归因于社交媒体渗透率较低、数据可访问性有限以及灾害监测基础设施较弱等因素。图3中的每个数据点代表城市级别的研究地点，发达地区的密集集群清晰可见为多个独立点，而某些地区的稀疏覆盖准确反映了这些地区的有限研究活动。这也凸显了全球范围内数据可用性和研究资源方面的更大差异，强调了提高全球洪水和社交媒体研究公平性和代表性的迫切需要。3.2. 审查文献的描述性统计图4(a)展示了关于社交媒体和洪水的研究的学科分布，突出了这一研究领域的高度跨学科性质。每项研究根据其主要研究重点、方法和出版场所被分配到一个主要学科，反映了其主导的学术方向。这种方法捕捉了每项研究的主要观点，同时承认了该领域的跨学科性质。环境科学占据了最大的份额，占40.6%，反映了洪水作为气候和环境驱动的灾害，主要在环境学科中进行研究。其次是数据和计算方法（26.3%），表明在与洪水相关的研究中越来越依赖大数据和人工智能技术。灾害管理和城市研究分别占21.8%和8.5%，表明该主题不仅涉及应急响应，还与城市空间结构和人类行为有关。其他学科，如政策和社会科学、健康和老龄化以及工程和技术，代表性的程度较低。下载：下载高分辨率图像（511KB）下载：下载全尺寸图像图4. 审查文献的描述性统计（n = 105）。条形图显示：(a) 研究学科（环境科学40.6%，数据/计算方法26.3%）；(b) 空间尺度（城市49.0%，区域20.0%，国家14.0%，社区8.0%，跨尺度9.0%）；(c) 数据尺度（微观47.0%，宏观44.0%）；(d) 主要数据类型（政府/机构63.6%，气象15.9%，社交媒体10.6%）；(e) 社交媒体平台（Twitter 65.0%，Weibo 20.0%）；(f) 方法论（定量63.0%，混合33.0%）；(g) 模型架构（BERT 44.4%，CNN 22.2%）；(h) 模型目的（分类86.7%）；(i) 数据可用性（未提及64.3%，可用15.3%）。子图中的颜色方案一致：蓝色代表主要类别，灰色代表次要类别。图4(b) 对审查研究中使用的空间尺度进行了分类。城市尺度占主导地位，占所有案例的49.0%，强调了城市作为主要研究空间单元的地位，因为其人口和基础设施的集中。区域尺度研究占20.0%，其次是国家尺度研究，占14.0%。社区尺度研究最少，仅占8.0%，显示出对微观尺度分析的相对缺乏关注。另有9.0%采用跨尺度方法，明确整合了多个空间层次（例如，将社区情感与城市级建模联系起来），这代表了在桥接微观-宏观差异方面的方法论创新，并在第3.4.5节中进一步讨论。图4(c–e) 展示了审查研究中数据尺度、类型和来源的分布。就数据尺度而言（图4(c)），微观和宏观层面的使用相对平衡：微观尺度数据占47.0%，而宏观尺度数据占44.0%。剩余的9.0%标记为“不适用”，表明这些研究主要关注方法论开发或工具构建，而不是实证分析。关于数据类型（图4(d)），政府和机构数据占该领域的大部分，占所有来源的63.6%。这强调了在洪水相关研究中继续依赖官方数据集。气象和环境数据（15.9%）以及社交媒体和通信数据（10.6%）是接下来最常用的类型。其他类别，如感知和健康数据或物联网传感器数据，使用频率较低。图4(e) 显示了使用的社交媒体平台的分布。Twitter是使用最广泛的平台，占研究的65.0%，反映了其公共可访问性和实时特性。Weibo排名第二，占20.0%，表明在中国语言环境中的研究越来越多。Facebook和其他平台使用频率较低，可能是由于更严格的数据访问政策和隐私限制。图4(f–h) 展示了使用的方法论类型、模型目的和具体的算法框架。就方法论而言（图4(f)），定量方法占主导地位，占63.0%，表明该领域依赖于数据驱动的分析。混合方法占33.0%，而纯粹定性方法仅占4.0%。如图4(h)所示，分类任务最为普遍，占模型应用的86.7%。相比之下，预测建模和情景模拟任务各占6.7%，表明研究重点更多地在于描述性分类而非预测或规划。关于算法框架（图4(g)，双向编码器表示来自Transformer（BERT）（44.4%）和卷积神经网络（CNN）（22.2%）是最常用的模型。BERT常用于文本分类和情感分析，而CNN用于基于图像的任务，如社交媒体图像处理或遥感分析。传统机器学习模型，如支持向量机/支持向量分类器（14.8%）和随机森林（11.1%），由于结构清晰、可解释性强且计算成本低，仍被广泛采用，特别适合样本量较小的研究。不太常见的模型包括长短期记忆网络（LSTM）（3.7%）和Netlog（3.7%），其使用可能受到时间序列建模复杂性或数据不连续性的限制。最后，图4(i) 显示了审查研究中数据可用性的情况。大多数（64.3%）没有提及数据可用性，表明研究透明度和可重复性存在重大差距。只有15.3%的研究通过URL或请求提供了数据访问，而少数（2.0%）表示他们的数据受到限制或保密。3.3.通过空间尺度进行的词云分析
图5展示了在不同空间尺度上关键词分布的词云，这些研究涉及社交媒体和洪水灾害，突出了主题焦点和方法论上的差异。诸如“洪水”、“社会”、“媒体”、“数据”和“灾难”等核心术语在所有四个尺度上频繁出现，与本综述的中心主题高度一致。
下载：下载高分辨率图片（2MB）
下载：下载全尺寸图片
图5. 综述文献中关键词在不同空间尺度上的词云分布

在全球和国家层面（图5(a)），诸如“响应”、“检测”和“韧性”等关键词尤为突出，表明这些层面的研究主要关注洪水应对机制、信息检测以及跨国或国家层面的灾害韧性评估。像“实时”、“时间”、“公众”和“脆弱性”这样的术语频繁出现，表明通过社交媒体进行实时灾害监控和对大规模公众脆弱性的分析受到了重视。

在区域层面研究中（图5(b)），诸如“管理”、“风险”、“情绪”和“沟通”等术语尤为突出，反映了区域间灾害治理、风险评估和公众情绪分析的强烈关注。同时，“水文”、“分类”、“机器”和“学习”等术语的使用也表明，在洪水风险分类和区域模式分析中广泛采用了机器学习技术和水文模型。

在城市层面（图5(c)），高频出现的术语包括“城市”、“管理”、“映射”和“空间”，表明这类研究集中在城市空间结构、洪水风险映射和城市治理策略上。此外，“远程”、“感知”和“评估”等术语强调了遥感技术在评估城市洪水影响中的广泛应用，强化了以技术驱动的空间分析方法。

在社区和地方层面（图5(d)），诸如“网络”、“代理人”、“动态”、“疏散”和“健康”等关键词更为突出。这表明研究方向转向了个体行为动态、社区疏散机制和公共卫生风险的研究。此外，“准备”、“预警”和“调查”等术语的频繁出现强调了灾害准备、早期预警系统以及对社区微观层面感知的实证调查的重要性。

3.4. 社交媒体在洪水研究中的特定尺度应用

3.4.1. 全国和国家层面
在全球和国家层面（由于跨辖区协调重点和政策导向的应用相似而进行综合分析），社交媒体数据因其高时效性、广泛的空间覆盖范围和强大的公众参与度，逐渐成为检测灾害动态的关键信息来源，补充了传统的监测系统，并支持国家级风险治理（Bukar等人，2022a；Spence等人，2025；Tate等人，2025）。这一层面的研究侧重于构建宏观层面的洪水感知系统和跨国数据协调框架，展示了社交媒体在多国、多平台和多语言环境中的适应性和整合潜力。研究表明，社交媒体提升了灾害监测的空间和时间分辨率，同时也增强了国家治理系统内的公众参与机制和机构间协调（Bukar等人，2022b；Humaira等人，2023；Razavi和Rahbari，2020）。随着全球气候风险的不断加剧，社交媒体在构建全球灾害感知网络和优化政策响应机制中的作用日益重要（Kryvasheyeu等人，2016；Mavrodieva和Shaw，2021）。

社交媒体已被广泛应用于识别全球洪水事件和构建实时灾害数据库，解决了传统数据集的局限性，如报告延迟和空间覆盖范围有限的问题。通过使用深度学习和机器学习模型处理来自Twitter等平台的大规模文本数据，研究人员能够有效识别传统数据库中未记录的洪水事件，提高了全球洪水监测的敏感性和准确性（De Bruijn等人，2019；Lorini等人，2020；Wieland等人，2025）。一些研究进一步探索了将社交媒体与遥感图像结合的方法，利用CNN和BERT等模型开发高精度灾害检测框架，展示了社交媒体和遥感在全球尺度洪水识别中的互补价值（Wieland等人，2025）。此外，在马来西亚等国家，社交媒体已从灾害感知工具发展成为评估洪水影响的预测支持系统，特别是通过整合多模态信息来增强对洪水风险的预期评估（Bukar等人，2022b）。

在国家治理层面，社交媒体不仅作为实时信息渠道，还是捕捉公众情绪、反映政府行动、评估关键基础设施系统韧性以及支持灾后政策完善的重要工具。它为围绕公众感知的风险治理系统提供了实践基础。例如，对中国430万条微博帖子的大规模挖掘和情绪建模显示，社交媒体在量化公众对供水、电力和医疗等关键城市系统的认知和满意度方面的有效性（Qian等人，2024）。另外，通过主题建模和跨源数据比较，社交媒体被用于识别政府应对与公众预期之间的差距，有助于构建灾后“情感地图”并指导国家政策调整（Moghadas等人，2023）。

在多国同时发生灾害和全球信息流动加剧的背景下，社交媒体提供了前所未有的观察窗口，以了解风险沟通、用户行为和信息互动结构的跨文化差异。它在推进全球协调的灾害风险减少和跨国沟通机制中发挥着重要作用。一项针对英国、墨西哥和印度等国家的比较研究发现，在中高收入国家，社交媒体常被用来表达对政府系统的信任或不满，而在低收入国家则更强调社区互助和集体应对，反映了灾害叙事和风险表达的文化多样性（Bryan-Smith等人，2023a）。在缺乏官方沟通渠道的情况下，Twitter在信息传播和错误纠正方面表现出强大能力，用户通过转发和评论共同构建非正式沟通网络（Kongthon等人，2012）。此外，应用于社交媒体数据的地理编码和可视化方法被用来构建洪水预警可视化系统，提高了极端事件期间的沟通效率和公众响应速度（Jitkajornwanich等人，2018）。

作为传统数据的高度互补信息来源，社交媒体越来越多地被整合到全球和国家层面的多源灾害数据融合系统中。这不仅丰富了决策支持平台的内容维度，还提高了政策系统在动态感知和社会反馈方面的整体响应能力。例如，Shubho等人（2022）通过将来自Facebook、YouTube和Twitter的图像和文本输入VGG16深度学习模型，开发了孟加拉国的国家级灾害评估系统。社交媒体也被视为政府、公众和媒体之间的连接接口，在国家治理框架内促进信息共享和协调，有助于提升灾害管理系统的数字韧性（Tim等人，2017）。

3.4.2. 区域层面
在区域层面，社交媒体数据被广泛用于提升洪水检测能力、分析风险感知的差异、改进预测模型以及支持跨辖区信息共享和紧急响应（Anderson等人，2021；Kankanamge等人，2020a；Yeo等人，2022）。与强调多平台治理的国家层面研究和关注细粒度动态监测的城市层面研究相比，区域层面的研究更注重中等规模洪水过程的演变动态和公众响应的空间异质性。它突显了社交媒体在宏观层面策略与微观层面行动之间的桥梁作用（Arapostathis等人，2021；Barz等人，2019；Herfort等人，2014；Liu等人，2021）。在这一层面，研究表明社交媒体数据在中等规模互动中的敏感性、地方性和实际用途，以及其与气象、水文和遥感数据的整合潜力。通过扩展灾害感知的时间即时性和空间覆盖范围，社交媒体丰富了区域风险监测方法，并促进了预测建模、公众情绪分析和紧急响应系统的集成创新。这些进步为管理日益频繁的区域极端天气事件提供了关键的数据支持和战略支持（Haer等人，2016；W. Li等人，2023；Meyer等人，2024）。

社交媒体在区域层面被广泛用于提高洪水监测的空间分辨率、时间响应速度和模型融合能力。在传统监测不足且需要及时预警的河流流域或省份中尤其有价值。研究表明，来自微博和Twitter等平台的地理标记数据可以有效填补水文观测的空白，当与HAND（距离最近排水口的高度）等物理模型结合时，可以提升洪水预测的空间覆盖范围和准确性（Fang等人，2023）。此外，社交媒体图像数据被用于训练深度学习模型，以实现洪水深度水平的自动分类，提供了一种低成本且响应迅速的区域洪水损害评估方法（Du等人，2025）。通过自然语言处理技术，可以从社交媒体文本中提取时间、空间和事件相关信息。例如，一项利用2020年郑州暴雨案例的研究成功重建了区域范围内的洪水事件发展过程，展示了社交媒体数据在灾后情景重建和紧急协调中的潜力（Lu等人，2025）。此外，将情绪数据与气象观测结合进一步扩展了基于社交媒体输入的区域洪水预测系统的预测能力（Debata和Elango，2024）。

在区域层面，社交媒体数据还被有效用于揭示公众风险感知的地理差异、情绪反应的演变以及公众话语的聚类模式。这些见解通过捕捉正式灾害管理系统中经常被忽视的局部社会反应，补充了官方数据，从而提高了灾害期间干预措施的准确性。例如，对中国广东和广西省份的研究发现，微博帖子中的负面情绪空间分布与实际易受灾区域高度吻合，展示了社交媒体生成反映主观微观体验的“情感地图”的潜力，并为制定差异化的城际或省际响应策略提供依据（Ma等人，2023）。此外，通过主题建模和情绪分析，社交媒体揭示了政府、媒体和公众在信息空间中的参与方式的结构差异，强调了优先考虑基层声音传播路径和外部联系的必要性（Han和Wang，2019）。各种文本挖掘算法也被用于建模区域公众情绪趋势，为情绪监测和早期预警系统提供了技术支持。例如，Ridwan等人（2022）利用关于印度尼西亚万隆洪水的推文，并结合n-gram技术进行了情绪分类，实现了区域层面公众意见趋势的预测。

随着多地点协调和联合应急响应需求的增长，社交媒体平台被用于构建区域层面的早期预警系统和跨区域信息共享网络，为协作治理和资源分配提供实时支持。研究表明，社交媒体平台上的内容频率变化可以作为极端天气事件临近的早期信号，补充了传统的水文观测系统，提升了区域警报机制的敏感性和预见性（Shoyama等人，2021）。在传统沟通渠道受限或信息不对称的情况下，社交媒体在促进信息传播、邻里互助和社区层面的物资协调方面发挥了关键作用，成为区域协作治理的重要补充机制（Aisha等人，2015；Bird等人，2012）。例如，Bird等人（2012）分析了澳大利亚昆士兰和维多利亚州灾害期间的Facebook群组活动，展示了社交媒体社区如何作为区域动员和任务分配的平台，与官方响应相配合。同样，对2013年德国洪水的研究发现，来自Facebook和Twitter的志愿组织数据揭示了社交媒体在促进跨地区志愿者协作和补充官方救援资源方面的桥梁作用（Grunder-Fahrer等人，2016）。

3.4.3.城市层面
在城市范围内，社交媒体数据已被广泛应用于洪水研究中，以支持城市淹没监测、公众情绪分析、基于图像的决策支持以及灾害响应模型的评估（Hossaki等人，2025年；Peng和Zhang，2024年；Putra等人，2020年；Zuo等人，2024年）。与强调跨辖区协调和中等尺度动态的区域规模研究不同，城市规模的研究更加注重实时数据捕获和细致的分析（Allaire，2016年；Gunawong和Butakhieo，2016年；Kamali等人，2023年；Ogie和Forehead，2017年；Restrepo-Estrada等人，2018年）。作为社交媒体数据密度最高的空间单位，城市提供了精细的地理粒度和快速的信息更新，使社交媒体成为城市级灾害检测和应急响应优化的关键数据来源（D. Rodavia等人，2018年；Liu等人，2021年；Pavithra等人，2021年；Singh，2018年；R.-Q. Wang等人，2020年）。现有研究表明，社交媒体在城市洪水管理中的监测、评估和模拟过程中实现了先进的整合，促进了从静态评估向动态感知的转变，最终提高了城市在极端天气事件中的韧性及适应能力（Choirul Rahmadan等人，2020年；Fohringer等人，2015年；Kanth等人，2022年；Oktafiani等人，2012年）。

社交媒体数据已被广泛用于实时监测城市暴雨洪水并识别受洪水影响的区域。城市洪水通常发生突然且范围有限，这使得传统的气象和水文系统难以对其进行检测。相比之下，社交媒体上用户生成的文本和图像内容具有高时间时效性和空间定位性。研究表明，将社交媒体文本和图像与城市水文模型结合使用可以提高模拟的准确性和空间分辨率，从而增强洪水预报的实时响应能力。例如，Songchon等人（2023年）将泰国Phitsanulok的Twitter文本和图像与城市水文模型结合，并使用Ensemble Kalman滤波器提高了模型准确性和实时空间分辨率。同样，通过使用社交媒体内容和数字高程模型进行空间插值的方法在英国York生成了城市洪水地图，展示了其在灾害可视化中的实用价值（Brouwer等人，2017年）。另一个例子是，在中国成都等城市进行的研究分析了社交媒体帖子与降雨数据之间的相关性。通过从微博和TikTok等平台提取内容，研究人员成功识别出易发生洪水的城市热点区域，从而提高了洪水影响检测的效率和精度（Guo等人，2023年）。

社交媒体还被广泛用于分析城市洪水背景下的公众情绪和评估动态风险感知。洪水事件期间公众的情绪波动通常通过社交媒体反映出来，这些数据成为评估灾害影响和风险沟通效果的重要指标。不同城市区域间社交媒体情绪的空间分布存在差异。例如，一项使用南京新浪微博数据的研究显示，城市发展迅速或排水系统不完善的地方表现出更高的情绪聚集程度，为韧性规划和确定优先干预区域提供了重要证据（B. Wang等人，2020年）。此外，洪水期间公众对政府响应和基础设施可靠性的负面情绪表达往往会激增，使社交媒体成为评估政策信任和治理绩效的关键指标（Soomro等人，2024年）。一些研究进一步探讨了情绪反应与灾害类型之间的相关性，表明遭受更严重物理破坏的地区更可能表现出焦虑和恐慌（Tan和Schultz，2021年）。计算方法如图像识别也被用于分析不同灾害阶段的情绪。例如，Layek等人（2019年）在印度金奈使用CNN模型对Twitter图像进行分类，以区分灾害阶段并支持应急响应的优先级制定。

社交媒体数据还常用于估算城市水深和分类洪水严重程度。深度挖掘图像和视频内容已成为城市洪水研究的新趋势。例如，社交媒体平台上发布的图像通过YOLOv5进行处理，以检测关键人体特征，从而实现低成本估计街道级别的淹没深度，并为实时监测提供可行方案（J. Li等人，2023年）。来自Facebook和YouTube等平台的视频数据被用来提取动态水文参数，如水深和流速，有助于校准城市水动力模型并弥补传统观测数据的不足（Lombardo等人，2025年）。此外，结合社交媒体文本和图像内容与遥感图像及数字高程模型的多源数据融合方法，使用DeepLabV3+等深度学习模型，实现了高分辨率的灾害制图，提高了城市洪水信息检测的速度和空间精度（Guan等人，2025年）。

城市规模的社交媒体研究还强调了多源数据融合与预测建模之间的协同作用。通过将社交媒体数据与城市气象雷达、遥感图像和地理信息系统（GIS）相结合，研究人员开发了更详细的城市风险评估框架。例如，在英国纽卡斯尔的一项研究中，将Twitter数据与GPU加速的水动力模型结合使用，不仅提高了预报的实时响应能力，还增强了空间覆盖范围，支持全市范围的动态风险检测（Smith等人，2017年）。对于中长期风险预测，研究人员应用贝叶斯网络分析了社交媒体活动与土地使用和未来发展情景等变量之间的关系，识别出城市可能面临的复合洪水风险（Zhang等人，2025年）。此外，将朴素贝叶斯分类与社交媒体活动热点分析相结合，在绘制易发生洪水的城市区域方面被证明是有效的，为基础设施优化和排水系统规划提供了可行的指导（Y. Li等人，2023年）。

社区和地方层面
在社区和地方层面，社交媒体数据的应用侧重于捕捉个体行为、社区层面的响应、邻里合作以及社交网络内的动态关系（Kankanamge等人，2020b；Saroj和Pal，2020年；Leong等人，2015年）。与强调宏观层面灾害监测和治理优化的城市或区域研究相比，社区规模的研究更加关注微观空间互动、情感传播和信任结构。这一尺度对于理解灾害响应情境中人、网络与空间之间的相互联系至关重要。研究表明，作为社区层面的信息基础设施，社交媒体有效地支持了局部灾害影响的实时感知、互助行为的识别以及社区网络结构的动态分析。它在实际操作上增强了地方治理能力，并丰富了关于灾害行为和社会网络的理论视角（Feldman等人，2016年；Song等人，2025年）。

社交媒体在动员社区自我组织和志愿者协作方面也发挥了重要作用。在突发洪水事件中，社区的快速响应往往依赖于点对点的信息交流和资源协调。研究发现，在邻里层面，Facebook小组和Twitter话题标签等平台成为分享援助请求、协调物资和组织志愿者努力的核心渠道。它们高效的信息传播机制提高了社区层面的响应效率（Sharp和Carter，2020年）。在欠发达地区，社交媒体进一步展示了其在促进自发的社区主导的救援协调和信息交流中的作用，为有限的官方资源提供了关键补充（Boota等人，2025年）。此外，社会网络分析揭示了用户在水传播过程中的结构角色。被称为“中继”的关键角色作为连接不同群体的关键节点，提高了信息流的准确性和覆盖范围（Villodre和Criado，2020年）。

社交媒体平台是分析个人疏散行为和追踪社区层面观点传播路径的重要工具。这一层面的信息传播受到紧密联系的社会网络和空间接近性的强烈影响，使得社交媒体使用行为具有高度的局部性。基于代理模型的模拟研究发现，与官方公告相比，通过社交媒体平台传播的“可信信息”更有可能促使个人采取实际的疏散行动。这凸显了社交媒体在应急响应中的心理和行为激励作用（Du等人，2017年）。此外，实证模拟显示，社交媒体不仅作为预警传播的渠道，还促进了人际观点交流和信念形成，为理解灾害响应的社会动态提供了微观视角（Du等人，2017年）。

通过社交媒体共享的图像内容对社区层面的洪水情景识别和水位估计做出了重要贡献。在缺乏固定传感器或遥感覆盖的场合，居民上传的图像可以作为现场观测的替代品。研究表明，社区成员共享的与灾害相关的图像，通过Mask R-CNN和ResNet101等模型处理后，可以有效提取淹没的车辆、地面标志和建筑立面等关键特征，实时估计洪水深度。这些方法在几个欧洲社区的准确性可与手动测量相媲美，证明了它们在传感器稀缺环境中的适用性（Chaudhary等人，2019年）。此外，整合来自社交平台的图像和文本数据可以进一步提高洪水严重程度分类的细致性和时效性。例如，R.-Q. Wang等人（2018年）分析了南卡罗来纳州和加利福尼亚州沿海社区的Twitter和MyCoast图像-文本数据，使用CNN模型进行基于块级的洪水深度估计。这种方法显著提高了社区层面洪水分类的准确性和响应能力。

社交媒体分析提供了关于社区信任结构和韧性模式的宝贵见解。灾害期间的社会互动不仅反映了信息传输，还体现了潜在的邻里信任和社会联系网络。例如，在孟买进行的社会网络分析显示，内部信任密度较高的社区表现出更频繁的社交媒体使用和更快的灾害响应时间（Visave和Aldrich，2025年）。Anam等人（2018年）进一步强调，社交媒体有助于在灾害期间识别“网络核心节点”，为地方政府优化应急沟通策略提供了宝贵的数据支持。

除了单一尺度分析外，有一部分研究（9%）明确采用了跨越多个空间层次的跨尺度框架。这些方法揭示了三种整合模式：自下而上的聚合，即社区层面的社交媒体数据（带有地理标签的图像、个人帖子）为城市和区域风险模型提供信息；自上而下的分解，研究国家灾害通信如何通过区域网络影响当地疏散行为；以及横向比较，分析不同城市之间社交媒体使用的差异，以确定基础设施和治理如何调节洪水响应。这些跨尺度研究突显了行政边界（构建政策干预）和水文边界（确定洪水范围）之间的关键方法论矛盾，在汇总社交媒体数据时造成了空间不匹配。此外，用户分布的不均衡引入了偏见，城市核心区域可能掩盖了边缘地区的脆弱性。未来的研究应开发能够根据分析目标灵活切换地理范围和治理范围的尺度适应框架。

4. 讨论
4.1. 当前研究的研究空白和挑战
社交媒体在全球和国家层面具有巨大的洪水研究潜力，有助于灾害感知和政策反馈。然而，我们发现了一个主要限制，即缺乏将公民数据转化为国际政策协调的正式框架。当前的跨语言建模挑战仅是更深层次治理失败的表现，其中国家灾害管理系统缺乏法律机制、互操作协议和决策权限结构，无法在串联的洪水事件期间跨主权边界运用社交媒体情报。当前研究在面对多语言和多元文化背景时常常缺乏语义一致的建模框架。尽管在跨国社交媒体分析中广泛应用了BERT等多语言预训练模型，但在处理来自东南亚、非洲等地的语言时，情感识别和语义分类的准确性仍然有限，难以支持全球范围内对灾害叙述、公众情绪和风险感知的统一解释（Bukar等人，2022b；Tate等人，2025年）。平台数据可访问性的地理不平衡进一步加剧了这一困境，严重限制了全球分析的代表性及可扩展性。当前研究主要依赖于西方主流平台，如Twitter，而像印度的Koo或某些国家的封闭社交媒体平台往往因数据接口限制或访问障碍而被排除在外（Qian等人，2024年；Wieland等人，2025年）。更复杂的是，不同平台在文本结构、用户行为和内容风格上的显著差异极大地增加了融合处理的难度，这对模型?可转移性和算法的适应性构成了严峻挑战。缺乏文化适应性是另一个理论上的困境，因为社交媒体上的公众表达行为深受国家治理结构、文化传统和政治氛围的影响，然而现有的研究往往机械性地使用用户发布频率或情感强度等指标来进行风险量化，未能充分捕捉到风险叙述背后的文化差异（Bryan-Smith等人，2023b）。此外，我们仅关注英语出版物可能会无意中强化这些地理和文化偏见，可能导致来自非英语学术社区的宝贵见解被忽视，并加剧发展中国家研究的代表性不足。区域规模的洪水研究虽然通过社交媒体获得了理解中尺度灾害动态、公众响应行为和区域协调机制的数据支持，但由于建模尺度的概念模糊性而面临根本性挑战。现有研究中的区域尺度通常简化为省级或流域单位，这在地理尺度（空间范围、水文边界）和治理尺度（行政管辖范围、决策权力）之间造成了紧张关系。这种双重定义导致了空间上的不匹配。水文过程遵循河流流域，而灾害政策则遵循政府边界。这种差异使得跨不同尺度整合社交媒体数据变得困难（Herfort等人，2014；Illias等人，2021）。数据融合机制的技术限制也随之显现，尽管现有研究试图将社交媒体数据与遥感、水文或气象数据相结合以提高预测性能，但由于不同数据类型在收集频率、空间分辨率和语义结构方面的根本差异，导致集成模型在处理高维度异构数据时面临协调问题（Debata和Elango，2024；Du等人，2025）。忽视局部异质性凸显了当前概念框架的缺陷，因为不同地区在公众社会经济特征、基础设施水平和媒体使用习惯方面存在显著差异，但大多数研究仍将地区视为同质单元，未能深入探讨不同城市或县之间在社交媒体参与和风险表达上的显著差异，从而导致风险感知和政策建议的平均化偏见（Ma等人，2023）。缺乏区域机构协调进一步阻碍了实际转化的进程，尽管一些研究试图在市政或邻近地区建立信息协调系统，但社交媒体数据尚未形成制度化的信息共享渠道，而且区域层面的多部门协调通常缺乏技术接口和政策推动，使得跨区域灾害共识的系统化整合变得困难（Aisha等人，2015；Bird等人，2012）。

城市规模的社交媒体洪水研究面临的主要挑战集中在数据质量控制的技术瓶颈上。作为信息密集型区域，城市通常会产生大量社交媒体内容，其中混杂着大量噪声，尤其是在突发洪水期间，假报告、重复信息和谣言频现。而大多数文本和图像处理阶段的研究仍然主要依赖关键词过滤或简单分类器，缺乏精细的内容验证和可信度建模机制（Guo等人，2023；B. Wang等人，2020）。误报现象普遍存在，即由于使用了如“任务繁忙”等比喻性语言或无关的视觉线索，将非洪水事件错误地归类为洪水相关事件，这严重影响了社会监测的可靠性。这些错误不仅扭曲了情况感知，还可能引发不必要的紧急响应，凸显了先进语义消歧和相关物理传感器网络交叉验证的迫切需求。模型泛化能力的不足是一个重要的方法论限制，因为现有研究大多在特定城市或特定事件中开发和验证模型，例如将微博与城市水文模型结合或结合街景图像来估计水深，但缺乏在不同城市、不同气候背景和不同基础设施条件下的模型泛化能力测试，这种对特定环境的依赖限制了这些模型在全国和全球城市系统中的广泛应用（J. Li等人，2023；Songchon等人，2023）。城市内的社会空间异质性进一步加剧了表征偏差问题，因为不同社区在社交媒体表达上存在差异，低收入或老龄化社区的社交媒体使用活动水平较低，导致数据“沉默区”频繁出现，从而低估了这些地区的风险感知和紧急需求（Soomro等人，2024；Tan和Schultz，2021）。缺乏系统耦合机制表明了概念整合的欠缺，因为城市规模的研究大多将社交媒体视为外部输入，未能尝试将其整合到城市多系统耦合框架中，而洪水往往涉及交通、电力、排水等系统的协调，但现有模型很少整合关键系统状态，仅依赖社交媒体信息来判断灾害情况，这使得支持城市治理决策变得困难。

社区和地方规模的洪水研究在通过社交媒体数据捕捉个体行为、邻里协作和社会网络动态方面展现出独特优势，但其主要挑战在于数据的稀疏性。与城市或区域尺度相比，地方尺度，特别是在人口密度较低的地区，社交媒体的活动水平较低，且容易受到时间、事件严重性和平台使用习惯的影响，导致数据呈现出强烈的间歇性和片段化特征（Feldman等人，2016；Song等人，2025）。这种数据稀疏性不仅降低了时空连续性建模的可靠性，还限制了高分辨率过程（如情感演变和行为扩散路径）的重建精度。随后出现了情境建模能力的理论局限性，因为现有研究经常使用社交媒体发布内容或互动频率作为社区韧性和信任水平的代理指标，但这些指标往往将复杂的社交过程静态化并量化，难以揭示灾害期间邻里互助、信息传播和意见形成的动态演变机制（R.-Q. Wang等人，2018）。对微观机制理解不足进一步暴露了分析深度的缺陷，尽管基于代理的建模和模拟系统用于分析个体响应路径，但“可信熟人信息”的传播逻辑和情感传导链仍缺乏微观机制的支持，无法准确评估信息干预的行为效应（Du等人，2017）。隐私和伦理是洪水研究的主要挑战。社交媒体数据非常精确，这使得隐藏个人身份变得困难，尤其是当数据包含疏散路线或家庭位置时，此类数据可能导致伦理问题或信息滥用（Visave和Aldrich，2025；Anam等人，2018）。除了基本的隐私保护之外，社交媒体洪水感知的伦理框架还涉及更深层次的数据主权和危机背景下的“脆弱性悖论”问题。在灾害响应的紧急情况下，用户生成的内容经常在未经明确知情同意的情况下被重新用于高风险的预测建模，这引发了关于受影响群体自主性的关键问题。这种基于提取的数据方法可能无意中将已经处于数字劣势的脆弱群体边缘化或污名化。因此，转向“数据正义”框架至关重要；这需要确保社区生成的情报由优先考虑幸存者安全和尊严的透明协议来管理，而不仅仅是出于技术数据的利用。

展望未来，社交媒体在洪水研究中的应用在六个关键维度上具有重大进展潜力：数据整合、方法论创新、尺度协调、公平保障、机构和治理转型以及伦理考量。除了技术整合之外，我们的多尺度分析揭示了根本的治理含义：当前的灾害管理机构在结构上与社交媒体数据的时间即时性和空间粒度不兼容，需要适应性共同治理框架而不仅仅是添加新的数据流。此外，所有尺度上数字边缘化人群的系统性代表性不足表明，除非在数据收集和政策响应系统中嵌入积极的公平机制，否则算法洪水管理可能会固化不公平的资源分配。首先，在数据整合方面，未来的研究应利用大型语言模型（LLMs）和基于云的地理空间平台等新兴技术来提升实时洪水监测能力（Ye等人，2026）。最近的进展展示了将雷达卫星数据与光学图像和水力模型结合的潜力，其中雷达后向散射强度可用于在多云和降雨条件下估计洪水深度（Pakati等人，2025）。此外，将物联网传感器与社交媒体流整合在一起为开发混合型早期预警系统提供了机会，这些系统可以在极端降雨事件中实现亚小时级的预测，解决了传统机械模型需要在16核CPU上运行数小时的计算限制，而AI模型则可以通过GPU加速实现实时处理（Li等人，2025）。具体而言，未来的框架应探索将社交媒体情感分析与高分辨率气候预测和社会经济指标相结合，以创建综合考虑洪水风险物理和社会维度的综合脆弱性评估。

洪水研究的一个重要方法论前沿是将社交媒体驱动的感知与物理水文和水动力模型系统地耦合。例如，使用带有地理标签的社交媒体数据通过Height Above Nearest Drainage (HAND)等模型来增强区域预测，以及应用集合卡尔曼滤波器将实时众包信息整合到城市模拟框架中。此外，从社交媒体视频中提取流速等动态参数现在使得在数据稀缺环境中校准城市模型成为可能，为基于物理过程的模型与机器学习的混合架构铺平了道路，以提高预测精度和可解释性。其次，关于方法论创新，生成式AI和可解释AI的整合对于提高模型透明度和利益相关者信任度至关重要（Ye等人，2025）。最近在基于提示的大型语言模型方面的发展以及从社交媒体反馈中自动报告的进展展示了实时危机沟通的巨大潜力（Cantini等人，2025）。未来的研究应专注于开发结合物理过程和机器学习算法的混合模型，特别是对于规划不善的城市区域，这些区域的传统建模方法面临数据质量限制，难以评估洪水事件后的土地利用变化（Pakati等人，2025）。此外，数字孪生城市系统与社交感知框架的结合为在建筑环境中断期间提供集成文本-视觉-地理分析提供了前所未有的机会，从而在实时灾害场景中实现更精确和响应迅速的政策干预（Fan等人，2021；Gong等人，2025）。此外，未来的研究应优先开发可解释AI模型，为紧急响应者提供透明的决策过程，满足生命关键应用中对可信AI系统的迫切需求。在尺度协调方面，未来的研究必须解决将高分辨率气候预测与洪水事件后的实时土地利用变化相结合的关键问题。当前的单尺度方法无法捕捉到现代城市洪水风险中的级联效应和复合基础设施故障场景，包括可能威胁关键基础设施系统的地质技术故障（Eskandarinejad等人，2025）。未来的研究应建立多尺度建模框架，纳入洪水的地质技术影响，包括土壤-水力相互作用、冲刷过程和渗透力，这些目前在建模框架中尚未得到充分代表。此外，开发结合社区知识和AI增强预测技术的参与式方法对于创建适应性和公平的洪水管理策略至关重要，特别是在灾害风险减少能力有限的地区（Souza和de Amorim Silva，2025）。从公平的角度来看，社交媒体数据的不平等可见性可能加剧灾难响应和资源分配中的算法偏见。脆弱群体，如老年人、低收入人群和偏远地区的居民，在社交媒体平台上的存在感或活动水平较低，这导致他们在数据驱动的情境感知和决策系统中被边缘化。这代表了一个关键的治理悖论：基于最大化预测准确性的人工智能增强型洪水管理系统无意中优化了已经受益于数字基础设施的人口，从而违背了灾害治理应优先考虑最脆弱群体的公平原则。我们的跨尺度分析显示，当在区域和国家层面部署基于城市规模数据训练的算法时，这种偏见会呈几何级放大，系统性地将应急资源转向数字可见的社区，同时使边缘化人口在基础设施上变得“不可见”（Erokhin和Komendantova，2024年；Zhang等人，2021年）。未来的研究应该开发差异化的采样策略和注重公平性的加权机制。例如，整合人口普查数据或基础设施可访问性指标可以帮助生成调整因素，以更好地考虑到数字沉默群体的声音，从而减少灾害治理中的数据和政策偏见。此外，还存在一个关键的研究空白，即如何开发能够有效将人工智能驱动的社交媒体分析整合到现有灾害风险管理周期中的制度框架。未来的研究必须通过具体的政策机制将适应性环境管理原则付诸实践：为实时公民数据在应急操作中心的纳入制定法律授权，创建具有标准化社交媒体数据共享协议的跨司法管辖区互助协议，并建立参与式治理结构，使社区生成的洪水情报直接用于流域管理决策和基础设施投资优先级的确定（Lopes等人，2025年）。这包括在紧急情况下制定社交媒体数据治理的标准协议，建立跨机构协调机制以实时共享信息，以及创建能够应对社交媒体平台和用户行为变化的自适应治理结构。此外，研究应优先开发考虑当地社会经济背景的区域特定建模方法，特别是在数据基础设施和制度能力可能受限的发展中国家，正如巴西南部和东南部地区洪水预测研究集中而其他地区严重缺失的情况所证明的那样（Souza和de Amorim Silva，2025年）。

我们的审查还揭示了一个亟需关注的再现性问题。普遍缺乏数据可用性声明（64.3%未提及，仅15.3%可根据图4(i)获取）反映了社交媒体洪水研究中的更广泛危机。鉴于平台依赖的数据访问限制——Twitter的API限制、Weibo的政策变化以及Facebook的隐私设置——这种情况尤为严重，这些因素会导致数据集永久性丢失。未来的研究应采用FAIR原则（可查找、可访问、可互操作、可重现）来管理社交媒体数据集，建立匿名且经过道德审查的洪水事件数据社区存储库。期刊应强制要求提供数据可用性声明，并鼓励开放数据实践，因为再现性是验证基于大语言模型的方法并在这一快速发展的领域积累知识的基础。最后，在伦理学方面，未来的工作必须在承认数据主权为公平洪水治理基础的环境正义框架内嵌入保护隐私的机制。这需要包括对紧急社交媒体监控的强制性伦理审查委员会在内的制度保障，社区控制的数据信托机构，使受影响人口能够共同管理他们的信息在水文建模和资源分配算法中的使用方式，以及通过公共审计确保人工智能驱动决策系统的算法问责性的监管机制。

尽管这项审查在方法论上有所创新且涵盖范围广泛，但仍需承认一些局限性以确保透明度并指导未来的改进。首先，我们的半自动化审查方法虽然在文献综合方面显著提高了效率，但仍存在技术限制。使用大语言模型进行结构化信息提取可能会导致与提示敏感性、文化框架和语言理解相关的潜在偏见。特别是，大语言模型可能难以处理微妙的学科细微差别、地区特定的术语或多语言学术文本的解释，从而限制了它们捕捉跨语言和跨文化洞察的能力。尽管我们实施了严格的验证协议，但我们认识到这些机制可能无法完全消除潜在的不准确性，尤其是在处理复杂或模糊的学术表达时。随着大语言模型的不断发展，对其决策过程和可解释性的深入研究对于提高人工智能辅助学术分析的透明度和可信度至关重要。我们的主题分类框架也可能存在局限性。虽然我们采用了自动关键词提取（通过KeyBERT）和人工编码来多维度分类研究，但仍有可能遗漏或过度简化某些研究，尤其是跨多个领域或使用非常规方法的研究。未来的工作可以探索更适应性或层次化的分类方案，以更好地捕捉这些多维度特征。此外，我们的审查范围受到有意设定的限制，这一点需要明确说明。我们仅关注Scopus索引的英语期刊文章，从而产生了三个特定的偏见：(1) 来自拉丁美洲、东南亚和非洲的社区层面治理创新在地区性出版物中的代表性不足；(2) 可能忽略了结构上不同于Twitter应用的基于Weibo的系统的中文见解；(3) 在自然语言处理和计算机视觉领域的方法论创新被低估了，因为初步研究结果通常先出现在会议论文集中，随后才发表在期刊上。然而，这种范围广度与方法论严谨性之间的权衡对于我们的目标（大语言模型验证）是必要的。如果扩展到多数据库、多语言的语料库，将会影响：(1) 由于元数据质量不一而导致KeyBERT提取的一致性；(2) 跨来源的去重可靠性；(3) 通过受控语料库设计实现的0%幻觉率。未来的研究应优先为代表性不足的地区提供针对性的多语言补充（图3），使用调整后的大语言模型协议，而不是追求牺牲分析深度的全面覆盖。

社交媒体平台上的错误信息和虚假信息问题也给洪水相关研究增加了复杂性。虽然我们的审查侧重于应用和方法论框架而非内容验证机制，但未来的研究必须优先开发强大的错误信息检测和过滤系统，以确保从社交媒体中获取的见解在灾害管理决策中的可靠性。

社交媒体已经超越了灾后叙事回音室的角色，成为了灾害监测和城市治理的关键感知基础。本研究提出了一个涵盖四个空间层面（全球、区域、城市和社区）的分析框架，系统地揭示了社交媒体在洪水研究中的空间敏感性和异质性。通过结合GPT-4o、PRISMA协议和KeyBERT的半自动化文献审查流程，这项工作提高了文献综合的准确性和效率，并提供了人工智能辅助知识提取的实证模型。从方法论路径到知识结构，这项研究填补了关于社交媒体空间尺度应用的系统研究中的关键空白，并为数据伦理、公众参与和空间智能在构建韧性城市方面的发展奠定了基础。主要发现从四个方面为洪水风险管理实践提供了信息：我们创建并测试了一个新的分析框架。该框架表明，当前的灾害管理方式与社交媒体数据不太匹配。官方系统往往反应迟缓，而社交媒体数据提供了高速度和详细的见解，使环境管理者能够从被动监控转向积极的、公民参与的生态管理，从而支持基于实时环境反馈的更可持续的城市水系统发展。其次，我们揭示了基于社交媒体的洪水监测如何在所有尺度上系统性地排除老年人、低收入人群和数字断开连接的人群，证明了人工智能驱动的灾害响应可能在数据收集和算法设计中缺乏主动的公平机制，从而导致不公平的资源分配。第三，我们指出了缺失的中间环节问题，即通过社交媒体捕捉到的微观层面社区脆弱性由于聚合偏见而在宏观层面政策响应中未被识别，为多尺度信息协调系统提供了理论基础。第四，我们引入了一个半自动化的文献审查流程，实现了跨学科的系统性整合，揭示了水文建模、社交网络分析和城市规划之间以前存在于不同学科孤岛中的隐藏联系。主要发现表明，在全球和国家层面，社交媒体能够实现跨平台的灾害识别和政策情绪监控。在区域层面，它揭示了风险感知的差异，并促进了多语言协调。在城市层面，它支持数据稀缺地区的实时洪水监测和韧性评估。在社区层面，它捕捉了个人疏散行为和邻里互助网络，推动了从技术中心向居民中心转变的灾害响应方式。我们的分析表明，跨语言建模、多源整合、数字包容性和伦理治理方面的技术挑战凸显了一个概念上的不匹配，即为集中式传感器网络设计的层次化框架与分布式、公民生成的社交媒体智能在结构上不兼容。解决这些挑战需要重新设计机构，采用适应性共同治理架构，将受影响社区视为合法的知识生产者，而不仅仅是被动的数据来源。

**作者贡献声明：**
Jin Rui：写作——审查与编辑、原始草稿撰写、可视化、方法论、形式分析、数据管理、概念化。
Wenjing Gong：写作——审查与编辑、原始草稿撰写、监督、项目管理、概念化。

热点排行