洪水是最具破坏性的自然灾害之一,对可持续发展构成重大威胁(Rentschler等人,2022年;Rogers等人,2025年)。到2030年,全球每年因洪水造成的平均经济损失将达到1360亿美元(世界银行集团,2022年),约1.32亿人将面临洪水灾害(Ward等人,2020年)。洪水风险不仅受物理灾害的影响,还受人口和基础设施等脆弱要素的暴露程度的影响(Tate等人,2021年)。传统评估主要利用遥感和静态社会经济数据(如人口统计数据和土地利用信息)来确定洪水淹没区域(Fang等人,2021年;Smith等人,2019年)。尽管这些基于物理的方法能有效绘制潜在风险地图,但它们无法捕捉公众在事件发生期间对洪水风险的真实感知(Rajput等人,2024年)。最近的研究表明,公众感知的洪水风险(PPFR),即个人体验和解读的洪水强度和影响,在推动个人应急响应、影响社会稳定以及最终决定灾害损失方面起着关键作用(Al Mamun等人,2025年;Brown等人,2018年)。因此,增强对PPFR的理解对于准确的洪水评估和有效的洪水管理至关重要。
传统上,PPFR是通过社会调查、问卷调查和访谈来评估的(Abass等人,2022年)。尽管这些方法提供了有价值的信息,但在快速变化的灾害情况下,它们往往具有有限的时间分辨率和空间覆盖范围(Zhao等人,2025a)。随着Web 2.0的到来,社交媒体数据为捕捉PPFR提供了新的途径(Peng和Zhang,2024年)。与传统数据相比,社交媒体数据具有较高的时空分辨率(Wang等人,2020年;Yan等人,2024年)。在洪水事件期间,人们经常在X(前身为Twitter)、Facebook和Weibo等社交媒体平台上发布求助信息或记录他们的经历(Huang等人,2022年)。这使得社交媒体成为捕捉PPFR的有效渠道。
社交媒体数据已广泛应用于洪水相关研究,包括洪水监测和预警(Shoyama等人,2021年)、灾害演变分析(Abedin等人,2024年)以及灾后损失评估(Hao和Wang,2020年)。然而,大多数研究仅关注单一灾害阶段,缺乏对多个阶段公众感知灾害风险的系统比较。新兴证据表明,此类风险在不同阶段存在显著差异,并表现出明显的时间动态(Q. Guo等人,2025年)。因此,对公众感知灾害风险的全面评估必须考虑阶段间差异及其时间演变。
然而,通过社交媒体数据分析公众感知的灾害风险的一个重大挑战是提取受影响地点(Kim和Hastak,2018年)。传统方法通常构建特定领域的词典并应用字符串匹配来识别地点实体(Smith等人,2017年)。但由于灾害场景的多样性和汉语的语言复杂性,这些基于规则的方法普遍适用性有限,语义理解能力较弱(Roy等人,2021年)。近年来,预训练模型(如双向编码器表示BERT)凭借深度语义表示和上下文理解能力,能够更准确地从社交媒体文本中提取与灾害相关的地点实体(Devlin等人,2019年)。例如,Yan等人(2024年)对BERT进行了微调,从微博帖子中提取与洪水相关的地点实体,实现了城市尺度上的精细情境感知和洪水演变跟踪。因此,本研究采用基于BERT的框架从社交媒体数据中识别与洪水相关的地点实体。
评估影响因素对PPFR的异质性效应是另一个挑战,因为这些知识支持差异化和精细化的洪水管理策略(Tellman等人,2021年)。传统的洪水影响评估通常依赖于线性假设(Guo等人,2026年),使用基于指数的评估方法(Gu和Liu,2024年)、广义线性回归(Zhang等人,2020年)、主成分分析(Abdrabo等人,2023年)和空间计量模型(H. Wang等人,2024a)。然而,影响因素与PPFR之间的关系往往是非线性的(Li等人,2025年;Zhao等人,2024年)。近年来,机器学习(ML)方法已广泛应用于洪水相关研究中的非线性建模。这些模型可以捕捉复杂的关系,而无需预先定义的功能形式,并能自动从大规模异构数据中提取特征(Zhu等人,2024年)。
尽管ML可以捕捉洪水建模中的非线性效应,但其“黑箱”特性限制了模型的可解释性(Kim和Kim,2022年)。最近在可解释人工智能(XAI)方面的进展提供了提高模型透明度的新方法(Jiang等人,2024年)。根据可解释性的范围,XAI方法通常分为全局可解释性和局部可解释性。前者评估预测因子对模型输出的总体影响,而后者解释每个因素对个别预测的贡献(Zhang等人,2022年)。在这些方法中,Shapley加性解释(SHAP)因其同时支持全局和局部可解释性而被广泛采用(Qiu等人,2026年;Shapley,2020年)。然而,SHAP在空间可解释性方面存在显著局限性(Li等人,2022年,Li等人,2024年,Li等人,2025年)。先前的研究表明,影响因素对洪水风险的影响在地理空间上存在差异(Li等人,2024b)。为了克服这一局限性,采用了GeoShapley方法,该方法在模型解释中明确纳入地理坐标作为联合空间特征,从而能够量化空间效应(Li,2024年)。在此基础上,通过将ML模型与GeoShapley结合,开发了地理空间可解释人工智能(GeoXAI)框架,以全面捕捉PPFR建模中的非线性效应和空间异质性。
本研究的目标有四个:(i) 使用社交媒体数据量化不同洪水阶段的PPFR并描述其时空模式;(ii) 基于微调的BERT开发一个两阶段深度学习框架,用于从社交媒体中提取与洪水相关的地点实体;(iii) 介绍一个GeoXAI框架,用于评估影响因素在不同阶段对PPFR的非线性效应和空间异质性;(iv) 确定每个阶段影响PPFR的关键因素。