情感景观：利用自然语言处理技术绘制城市公园的情感地图

《Urban Forestry & Urban Greening》：Emotional landscapes: Mapping urban park sentiments using natural language processing

【字体：大中小】 时间：2026年05月04日 来源：Urban Forestry & Urban Greening 6.7

编辑推荐：

　　下元山高|埃里克·德尔梅勒城市与区域规划，设计学院；宾夕法尼亚大学，费城，PA 19104，美国 **摘要** 城市公园在促进身体活动、心理健康和社区福祉方面发挥着关键作用。然而，了解公众如何看待这些空间仍然很困难，因为传统的调查成本高昂、更新缓慢且地理覆盖范围有

　　下元山高|埃里克·德尔梅勒
城市与区域规划，设计学院；宾夕法尼亚大学，费城，PA 19104，美国

**摘要**
城市公园在促进身体活动、心理健康和社区福祉方面发挥着关键作用。然而，了解公众如何看待这些空间仍然很困难，因为传统的调查成本高昂、更新缓慢且地理覆盖范围有限。本研究提出了一个新颖的分析框架，该框架结合了基于Transformer的情感分类、降维、聚类和空间自相关技术，以大规模监测公园的情绪和氛围。我们分析了费城93个公园的37,000多条谷歌评论。我们提取了28种细微的情感，然后通过主成分分析和聚类将其简化为六种不同的类别（例如，灵感、沮丧）。这些情感特征在空间和时间上进行了映射，揭示了显著的地理差异和季节性趋势。采用时间加权方法可以优先考虑最近的评论，使规划者能够识别与维护、安全或投资相关的感知变化。最后，我们将情感模式与公园设施和周围的社会经济条件联系起来，为公园规划提供了可操作的见解。我们的研究结果表明，自然语言处理和情感制图可以改善适应性公园管理、空间公平性和公众在景观规划中的实时参与度。

**1. 引言**
已有大量文献表明，城市地区的绿地（包括公园）鼓励居民进行身体活动（Bedimo-Rung等人，2005；Coombes等人，2010；De Vries等人，2003；Kondo等人，2018；Lopez和Hynes，2006；Maas等人，2006；Richardson等人，2013），降低压力、焦虑和抑郁水平（Berman等人，2012；Sun和Chen，2017；Sturm和Cohen，2014），并通过促进社会互动来提高整体福祉（Herzog和Strevey，2008；Kong等人，2022；Jennings和Bamkole，2019；Mullenbach等人，2019；Mullenbach等人，2022）。城市公园越来越多地提供文化生态系统服务（CES），如情感恢复、场所依恋和审美愉悦（Dai等人，2024；J. Li等人，2024；Knight等人，2022）。多项研究还强调了城市公园在减少极端高温、降低空气污染和噪音以及维持一定生物多样性方面的作用（Cohen等人，2014；Gunawardena等人，2017；Iungman等人，2023；Panagopoulos等人，2016；Solecki等人，2005；Dzhambov和Dimitrova，2015；Yang等人，2016；Dooling等人，2006）。绿地的存在、充足的访问便利性和维护是规划城市以促进居民公共健康的关键方面（Haase等人，2014；Andersson等人，2014）。

城市公园的心理益处基于环境心理学的两个互补框架。注意力恢复理论（ART）（Kaplan和Kaplan，1989；Kaplan，1995）认为，自然环境通过四个关键特性帮助人们从定向注意力疲劳中恢复：远离日常需求、足够的空间来激发思维、无需努力的关注以及人与环境的契合。提供这些特性的公园能够实现认知恢复和心理焕新。与此相辅相成的是压力减少理论（SRT）（Ulrich，1983；Ulrich等人，1991），该理论认为，接触自然环境会通过进化上的积极情感反应快速缓解生理和心理压力。这些理论解释了为什么公园不仅仅提供娱乐机会——它们还提供了对城市心理健康至关重要的恢复体验。

除了恢复功能外，城市公园还培养了人们对有意义场所的情感依恋（Scannell和Gifford，2010；Lewicka，2011）。场所依恋通过特定地点的反复积极体验、个人记忆和社会互动形成，从而产生场所感和身份认同（Relph，1976；Tuan，1977）。作为纪念、社交聚会或个人反思场所的公园会形成特别强烈的依恋（Kyle等人，2004）。这些情感联系影响公园的访问模式、保护倡议和社区参与管理（Halpenny，2010）。要理解公园体验的情感维度——从恢复和参与到沮丧和纪念性反思——需要超越二元情感分类，捕捉公园在城市生活中成为有意义场所的独特情感路径。

公园和娱乐设施的管理主要由市政当局负责，如规划或公园与娱乐部门。他们的职责之一是评估居民的需求，并评估这些空间是否得到了适当使用。具体来说，这些部门需要将资源用于运营改进，以提高用户满意度（Donahue等人，2018）。这些评估传统上通过公众满意度调查进行，但这种方法资源密集且耗时（Hausmann等人，2020）。正如Dony和Fekete（2020）所指出的，由于人口变化、迁移或需求变化，调查结果可能会迅速过时。此外，这些调查通常局限于较小的地理范围，如单个公园。

早期的参与式方法中，社区成员贡献了关于景观的数据，而不仅仅是依赖专家评估，包括基于照片的方法，如游客拍摄的照片，参与者通过自己的图片记录有意义的特征（Chenoweth，1984）。后来的旅游研究强调了这种基于照片的方法在引发非专家感知和偏好方面的持续价值（Steen Jacobsen，2007）。最近的工作探索了传统调查的替代方法论，包括结合访谈的心理地图技术，可以捕捉居民对休闲绿地的空间感知和场所感（Otto等人，2024）。这些方法建立在心理地图研究的悠久传统之上（Gould和White，2012），并扩展到结合用户生成数字内容的定性GIS方法。Schuurman及其同事展示了如何通过主题建模和社交媒体数据的可视化来呈现局部感知，为更具情感意识的地图绘制提供了基础（Martin和Schuurman，2017；Martin和Schuurman，2020）。比较研究也开始检验社交媒体数据与传统调查方法在公园评估之间的一致性（Huai等人，2023），而其他研究则探索了结合文本和图像分析的多模态方法，以更全面地理解休闲偏好（Chai-allah等人，2025；Zhao等人，2024）。

越来越多的研究关注社交媒体数据和志愿地理信息（VGI）在捕捉公众对城市绿地感知方面的作用（Cui等人，2021；Ghermandi等人，2023）。这些数字平台充当了公众情绪的实时传感器，揭示了传统数据来源往往无法捕捉到的复杂社会环境动态（Lopez等人，2019）。这一趋势与越来越多的学术研究一致，这些研究探讨了人工智能技术如何不断重塑景观设计和规划。我们的研究直接基于这一方向，应用基于Transformer的自然语言处理来捕捉人们对城市公园的细微情感反应。

基于地点的情感的数字映射在研究中越来越受到关注（Feng等人，2024；Brunn，2023），强调了情感意识方法在城市分析中的重要性。这一转变与绿色基础设施多功能性的规划理论相呼应，后者不仅强调生态性能，还强调景观的社会和情感价值（Korkou等人，2023）。在更大的空间尺度上，研究利用社交媒体情绪来量化景观价值，使规划者能够评估不同区域和大陆背景下的情感依恋和意义（Van Zanten等人，2016）。

**1.1. 社交媒体数据的重要性**
鉴于城市人口结构的动态性和演变性，传统的调查结果可能会随着社区需求和满意度的变化而过时。市政当局可以利用社交媒体平台作为定量和定性数据的额外来源。社交媒体定期更新用户反馈，提供了关于城市空间的公众偏好和情绪的动态见解。Twitter、Instagram和TripAdvisor等平台提供了庞大的数据集，其规模和速度是传统方法无法比拟的（Zhang和Zhou，2018）。有趣的是，COVID-19大流行凸显了城市公园在室内活动受限期间作为娱乐和心理健康避难所的重要作用。社交媒体记录了这一变化，记录了公园访问量的增加、用户情绪和不断变化的需求。研究人员利用这些见解发现了诸如热门地区过度拥挤和对绿地公平访问需求增加等趋势（Park等人，2022）。这些数据为适应性管理策略提供了信息，展示了社交媒体如何在公共卫生危机期间记录快速的行为变化。

社交媒体数据越来越多地用于测量公园访问量、分析访问多样性以及识别驱动使用模式的因素（Chen等人，2018；Zhang和Zhou，2018）。例如，像谷歌评论这样的平台提供了来自各种用户的直接且未经过滤的反馈，揭示了改进公园管理和弥合公众与当局之间沟通差距的机会（Zachlod等人，2022；Y. Huang等人，2022）。新兴技术，如计算机视觉，通过分析社交网络上的照片，使评估文化生态系统服务和景观特征成为可能（Huai和Van de Voorde，2022）。这些工具为城市公园研究提供了新的维度，提供了详细的视觉和文本数据进行分析。

尽管有这些进步，社交媒体数据也有明显的局限性。它倾向于偏向年轻且熟悉技术的用户，内容的自愿性质引入了偏见，往往只反映了声音较大的个体的观点（Huai和Van de Voorde，2022）。社交网络和调查数据之间的一致性也受到质疑，因为这两种来源在测量公园访问量和满意度时有时会产生不一致的结果（Donahue等人，2018）。最近的研究表明，社交媒体数据与官方调查数据在频繁访问的公园方面可以达到显著的一致性（Huai等人，2023）。

我们专注于谷歌评论的研究建立在越来越多的使用地理标记和用户生成内容来评估城市绿地体验的工作基础上（Chen等人，2022；Liu和Xiao，2021；Schwartz等人，2022）。这补充了来自Twitter或Flickr等其他平台的情感映射方法，这些方法已被用于绘制场所依恋、集体记忆或福祉（Zhu等人，2021；Ashkezari-Toussi等人，2019；Hauthal和Burghardt，2016）。然而，包括Hauthal对Flickr数据的映射在内的许多早期方法依赖于二元情感分类（正面 vs. 负面），限制了它们捕捉游客与城市公园相关联的完整情感范围的能力。

**1.2. 自然语言处理与大型语言模型**
自然语言处理（NLP）是计算机科学和人工智能的一个子领域，它使计算机能够处理文本形式的人类语言。NLP结合了计算语言学和机器学习来分析非结构化或半结构化文本（Eisenstein，2019）。常见的任务包括语音识别、文本分类、情感分析和机器翻译。在本研究中，我们专门使用NLP进行文本分类，使我们能够将大型、异构的文本数据集组织成类别，并提取仅通过手动编码难以捕捉的语义上有意义的模式。

在NLP领域，最近的进展是由大型语言模型（LLMs）推动的，这些模型在庞大的文本语料库上训练，以大规模捕获语言和上下文模式。基于Transformer的模型，如BERT（Bidirectional Encoder Representations from Transformers；Devlin等人，2019），引入了双向上下文，使单词在完整的句子中得到理解。RoBERTa（Liu等人，2019）通过在更大的数据集上训练并采用动态掩码，改进了BERT的架构，从而实现了更丰富的上下文表示。更紧凑的变体，如DistilBERT（Sanh等人，2019），在计算成本上有所降低，但牺牲了一些细微差别，这说明了效率与语言理解深度之间的权衡。这些创新使LLMs特别适用于情感分析、情感分类和强度预测等细致任务。

除了基于Transformer的LLMs之外，其他NLP技术，如潜在狄利克雷分配（LDA），仍然广泛用于主题建模。LDA是一种概率方法，通过将频繁共现的单词分组来识别大型文本语料库中的潜在主题，从而揭示用户生成内容中的隐藏结构，并补充了社交媒体研究中的情感分析（Guo等人，2017；Song等人，2021）。在城市背景下应用LLMs，研究人员能够超越简单的基于词汇的分析，捕捉情感表达的复杂性。由此，NLP结果可以成为情感地图和城市空间细致描述的基础。这些方法已被用于识别文化生态系统服务、评估公园特征和提升游客体验（Kling和Pozdnoukhov，2012；Pánek和Benediktsson，2017；Huai和Van de Voorde，2022）。最近的研究强调了基于变压器的模型（如RoBERTa）在分析城市设施的众包评论（L. Li等人，2024年）、剖析对城市环境的情感反应（Yang等人，2022年）以及整合文本和视觉数据以评估公园感知（Zhao等人，2024年；Chai-allah等人，2025年）方面的价值。这些方法提供了重要的深度，优于传统方法，并使得规划和政策决策更加明智。然而，自然语言处理（NLP）并非没有挑战。制定精确的研究问题、确保数据的完整性以及解决文本数据中的偏见仍然存在（Cai，2021年）。代表性仍然是一个关键问题，因为社交媒体用户可能无法反映更广泛的人群。此外，像DistilBERT这样的算法可能在情感或情境理解方面难以达到更先进模型的水平，这限制了它们在复杂分析中的应用。尽管存在这些挑战，但将NLP与额外的数据源（如美国的311报告、公共安全记录和带有地理标签的社交媒体照片）相结合，可以提供对城市绿地的更全面理解。适应性管理方法强调了需要这些尖端工具来可持续地管理公园，并满足多样化城市人口不断变化的需求。随着NLP和大型语言模型（LLM）的持续进步，城市规划者能够更好地应对现代数据生态系统的复杂性，并为未来绿地管理做出明智的决策。

1.3. 用于城市公园情感分析的NLP
在本文中，我们利用Google Reviews和情感分析来监测宾夕法尼亚州费城公共公园的感知情况。具体来说，我们利用NLP的最新进展来分析Google Reviews中的公园评论，并开发特定于公园访问的情感标签。通过这个具有广泛影响力的社交媒体平台，我们能够更深入地了解全市公园用户的情感和情绪模式，超越了现有研究中占主导地位的二元感知研究。这种方法为城市规划者和利益相关者提供了一个有效的工具，以理解和改善城市公园，从而可能带来公共福祉的益处。它超越了手动反馈收集的方式，允许对访客的感受有更全面和准确的理解。我们基于情感的方法扩展了最近在公园社交媒体分析（Zhao等人，2024年）和景观偏好评估（Chai-allah等人，2025年）方面的方法论进展，同时建立在将社交媒体洞察与传统调查方法进行验证的框架之上（Huai等人，2023年；Dai等人，2024年）。

1.4. 研究空白
尽管越来越多的人认识到社交媒体数据在公园评估中的价值，但仍存在一个关键的方法论空白：现有的方法主要依赖于二元情感分类（正面与负面），这无法捕捉城市公园提供文化生态系统服务的多维情感路径。虽然最近的研究已经开始探索城市环境中的情感检测（Yang等人，2022年），但在不同类型的公园、时间尺度和社会经济背景下系统地应用细致的情感框架仍然缺乏。本研究通过应用基于变压器的自然语言处理来大规模分析公园评论，超越了二元情感分类，揭示了特定公园特征如何产生不同的情感反应，这些模式如何在不同的社区和季节中变化，以及情感信号如何为有针对性的规划干预提供信息。

1.5. 研究目标
本研究的目标是描绘公园访问感知的地理空间模式，识别与不同公园体验独特相关的情感，并揭示所有情感反应中频繁出现的关键词和主题。具体来说，我们解决了以下研究问题：
1. 我们能否使用NLP工具检测和分类城市公园评论中的一系列特定情感？还能发现哪些额外的背景信息？
2. 城市公园中的情感情绪和访问模式在时间、功能和空间上有哪些趋势？
3. 在不同公园访问情感的评论中，哪些特征被频繁提及？

本文的其余部分结构如下：第2节详细介绍了数据来源和分析方法，包括情感分类框架；第3节展示了公园情感在空间、时间和功能上的模式；第4节讨论了对城市规划和文化生态系统服务的影响；第5节总结了研究的局限性和未来研究的方向。

2. 数据和方法
2.1. 研究区域：费城公园
在本文中，我们关注费城广泛的公园资源，从小型口袋公园到吸引全球关注的大型城市景观。费城公园规划的发展，如Crawford（1910年）所述，最终形成了一份关键文件——1902年的综合城市公园系统报告，由费城市政公园协会正式发布。受波士顿大都会公园系统等模型的启发，该报告为综合绿色基础设施奠定了基础，包括城市广场、三角形公园、以Fairmount Park为标志的公园、适应地形以及Wissahickon、Tacony和Cobb’s Creek等溪谷的规划。在其后期发展阶段，费城强调了历史保护（例如Stenton Park），并扩展了如Schuylkill Riverbank这样的滨水公园。该市丰富的规划遗产和多样化的公园类型不仅提供了关于城市绿地设计的信息，还使费城成为具有类似历史、工业和社会景观的类似市政区的 metodologically robust 的案例研究。如今，费城的公园系统反映了这种多层次的历史，并服务于多种功能。它包括为儿童和家庭提供基本空间的社区游乐场和娱乐中心、保护生态栖息地的自然保护区（如Wissahickon Valley Park）、保存市民记忆的纪念和纪念公园、作为社交聚会场所的广场和广场，以及保护水质和减轻洪水的流域公园。这种多样化的公园类型使系统能够满足多种需求——从娱乐和生态保护到文化表达和气候韧性——同时也塑造了访客表达的各种情感反应。

2.2. 研究设计
本研究采用了一种结构化的方法，通过顺序分析流程（图1）来探索公园环境与访客情感之间的相互作用。我们首先通过系统性地抓取Google Reviews来收集数据，并收集权威的公园信息。然后我们使用情感分析来量化情感反应，接着通过多维情感分类来捕捉二元情感无法揭示的细微情感体验。机器学习技术——包括k-means聚类和潜在狄利克雷分配（LDA）——使我们能够识别潜在的模式、连贯的情感特征和公园体验的主题驱动因素。空间相关性分析考察了这些情感模式如何随着社会经济背景的变化而变化，解决了公园提供的心理效益的环境正义维度。我们的方法论解决了三个分析目标，每个目标都建立在前一个目标的基础上：
1. 情感分析（第2.4节）：二元情感分析提供了公园感知的初步评估，识别出可能需要优先关注的持续负面反馈的位置。时间加权聚合确保分数反映当前情况，而不是可能不再适用的历史感知。
2. 情感分析（第2.5节）：超越二元价值，情感分类揭示了公园提供心理效益的不同情感路径——恢复、参与、沮丧、纪念——这些路径基于环境心理学框架（Kaplan，1995年；Ulrich等人，1991年）。
3. 聚类后分析（第2.6节）：主成分分析（PCA）和k-means聚类将28种情感空间简化为可解释的特征，从而能够系统地比较不同公园功能、社区和时间段的体验。主题建模（LDA）将这些情感特征与特定的公园特征和访客体验联系起来，而相关性分析则考察情感如何随着社会经济背景的变化而变化，解决了心理效益的环境正义维度。

2.3. 数据抓取：Google Reviews
通过网络抓取，可以实时收集地理定位数据，从而增强对动态过程的研究，这是传统公园调查方法无法实现的（Brenning和Henn，2023年）。在城市研究中，Twitter、Instagram和TripAdvisor等流行的社交媒体平台经常被用来收集数据（Zachlod等人，2022年）；然而，Google Reviews经常被忽视，主要是因为该平台缺乏用于批量收集的开放API，使得通过抓取获取数据在技术上更加复杂且不够标准化。最近的研究越来越认识到各种社交媒体平台在收集公园访问和感知数据方面的优势和局限性。Flickr、Instagram和Twitter等平台可能由于用户人口统计或技术因素而引入偏见（Rice和Pan，2021年）。例如，Flickr在公园访问研究中经常低估了老年群体的比例，导致样本不能反映更广泛的公园用户群体（Fisher等人，2018年）。Instagram和Twitter也存在方法论挑战——如无线连接不一致和地理标签准确性不足——这可能导致数据覆盖范围在不同公园和地点之间存在显著差异（Tenkanen等人，2017年）。相比之下，Google Reviews捕捉了更广泛的用户体验，近年来评论量大幅增加，在基于位置的反馈方面超过了Yelp、TripAdvisor和Facebook等平台（Koerniawan，2019年；BrightLocal，2018年）。在我们的分析中，Google Reviews被证明是一个更丰富的数据来源，其中包含的费城公园评论数量是其他平台的10到50倍——Google上有93,385条评论，而TripAdvisor上有7,324条。这一发现与最近比较不同社交媒体平台在公园评估中的代表性的研究一致（Huai等人，2023年；Li等人，2025年）。鉴于Google API的限制（每个地点ID只能检索五条评论），我们采用了Outscraper进行系统化的数据抓取方法来收集大量评论。尽管Google Reviews在全球范围内的采用率不断提高，但在城市公园研究中的利用仍然不足，因此我们的探索对于利用最广泛的公共反馈来指导公园规划具有重要意义。需要注意的是，Google Reviews代表了一种自愿贡献的用户生成内容。因此，所得数据集反映了人们对公园体验的表达，而不是所有公园用户的代表性样本。在这项研究中，评论被视为基于地点的情感表达的指标，而不是对整个群体情感的直接测量。我们数据集的准确性和精确性至关重要；因此，我们仔细审查并清理了数据集，例如整合了可能以不同名称多次注册的同一公园的条目，以确保数据集的稳健性和可靠性。我们的研究最初侧重于理解评论数据的基本特征。我们对评论数量进行了基本分析，以识别用户参与的趋势、公园访问的季节性变化以及用户参与的重大波动。

2.4. 情感分析
我们使用Hugging Face的distilbert-base-uncased-finetuned-sst-2-english模型和transformer库中的pipeline包来进行情感分析，以预测收集到的公园评论的情感分数。我们用0到1之间的正面或负面分数来量化评论的访客情感。例如，2021年对Mifflin Square Park的评论得分为0.97，表示非常负面的情感：“不幸的是，这个公园已经不再像以前那样了；这个地区已经成为一个众所周知的高流量毒品区域，但有警察在尽力工作，但他们还有很多工作要做。我们不建议带狗去那里。这里有很多孩子，草地上到处都是用过的注射器。”在确定了每条评论的情感分数后，我们将负面分数乘以-1（使它们作为负面值），同时保持正面分数不变，并将中性评论的分数设为0。然后我们通过平均与该公园相关的所有评论来计算每个公园的平均情感分数。接着我们探讨了这些平均情感分数的变化，考察了它们在月份、季节和公园功能之间的波动。我们创建了情感地图来地理上表示这些情感分数，阐明了全市对公园访问的情感模式。

2.3. 数据抓取：Google Reviews
通过网络抓取，可以实时收集地理定位数据，从而增强对动态过程的研究，这是传统公园调查方法无法实现的（Brenning和Henn，2023年）。在城市研究中，Twitter、Instagram和TripAdvisor等流行的社交媒体平台经常被用来收集数据（Zachlod等人，2022年）；然而，Google Reviews经常被忽视，主要是因为该平台缺乏用于批量收集的开放API，使得通过抓取获取数据在技术上更加复杂且不够标准化。最近的研究越来越认识到各种社交媒体平台在收集公园访问和感知数据方面的优势和局限性。Flickr、Instagram和Twitter等平台可能由于用户人口统计或技术因素而引入偏见（Rice和Pan，2021年）。例如，Flickr在公园访问研究中经常低估了老年群体的比例，导致样本不能反映更广泛的公园用户群体（Fisher等人，2018年）。Instagram和Twitter也面临方法论挑战——如无线连接不一致和地理标签准确性不足——这可能导致不同公园和地点之间的数据覆盖存在显著差异（Tenkanen等人，2017年）。相比之下，Google Reviews捕捉了更广泛的用户体验，近年来评论量大幅增加，在基于位置的反馈方面超过了Yelp、TripAdvisor和Facebook等平台（Koerniawan，2019年；BrightLocal，2018年）。在我们的分析中，Google Reviews被证明是一个更丰富的数据来源，其中包含的费城公园评论数量是其他平台的10到50倍——Google上有93,385条评论，而TripAdvisor上有7,324条。这一发现与最近比较不同社交媒体平台在公园评估中的代表性的研究一致（Huai等人，2023年；Li等人，2025年）。鉴于Google API的限制（每个地点ID只能检索五条评论），我们采用了Outscraper进行系统化的数据抓取方法来收集大量评论。尽管Google Reviews在全球范围内的采用率不断提高，但在城市公园研究中的利用仍然不足，因此我们的探索对于利用最广泛的公共反馈来指导公园规划具有重要的价值。需要注意的是，Google Reviews代表了一种自愿贡献的用户生成内容。因此，所得数据集反映了人们对公园体验的表达，而不是所有公园用户的代表性样本。在这项研究中，评论被视为基于地点的情感表达的指标，而不是整个群体情感的直接测量。我们数据集的准确性和精确性至关重要；因此，我们仔细审查并清理了数据集，例如整合了可能以不同名称多次注册的同一公园的条目，确保了数据集的稳健性和可靠性。我们的研究最初侧重于理解评论数据的基本特征。我们对评论数量进行了基本分析，以识别用户参与的趋势、公园访问的季节性变化以及用户参与的重大波动。

2.4. 情感分析
我们使用Hugging Face的distilbert-base-uncased-finetuned-sst-2-english模型和transformer库中的pipeline包来进行情感分析，以预测收集到的公园评论的情感分数。我们用0到1之间的正面或负面分数来量化评论的访客情感。例如，2021年对Mifflin Square Park的评论得分为0.97，表示非常负面的情感：“不幸的是，这个公园已经不再像以前那样了；这个地区已经成为一个众所周知的高流量毒品区域，但警察正在尽力工作，但他们还有很多工作要做。我们不建议带狗去那里。这里有很多孩子，草地上到处都是用过的注射器。”在确定了每条评论的情感分数后，我们将负面分数乘以-1（使它们作为负面值），同时保持正面分数不变，并将中性评论的分数设为0。然后我们通过平均与该公园相关的所有评论来计算每个公园的平均情感分数。接着我们探讨了这些平均情感分数的变化，考察了它们在月份、季节和公园功能之间的波动。我们创建了情感地图来地理上表示这些情感分数，阐明了全市对公园访问的情感模式。一个挑战是，由于公园条件和管理实践的变化，评论的相关性可能会随时间而变化。为了解释这一现象，我们在计算每个公园的情感评分时应用了时间加权平均方法。这种方法更重视较新的评论，因为它们更有可能反映当前的情况。具体来说，我们使用了一个指数衰减模型，其中每条评论的权重会随着时间的推移而减少，半衰期为365天，这意味着评论的影响每年减少一半。我们首先将每条评论的时间戳转换为日期时间对象，从而可以计算出它的年龄（以天为单位）。然后使用Python的datetime包，根据一个半衰期为365天的指数衰减函数为每条评论分配一个权重。具体来说，权重定义为w=0.5（天数/365），其中天数表示评论撰写以来的时间。每个情感评分都乘以其相应的权重，通过将这些加权评分的总和除以权重的总和来获得加权平均情感评分。这种方法提供了一种动态且具有时间相关性的公园情感度量方法，赋予较新评论更大的影响力，同时减轻了可能不再反映当前游客体验或公园状况的旧评论或异常评论的影响。

2.5. 情感分析
尽管情感分析被广泛使用，但它通常将文本简化为二元或标量形式的积极性和消极性（通常表示在0-1的范围内）。这种方法有助于衡量整体基调，但它忽略了游客体验中可能存在的多种情感。为了解决这一局限性，我们扩展了分析，以更直接地考察情感。在系统考虑了其他架构后，我们选择了RoBERTa（Robustly Optimized BERT Pretraining Approach）作为我们的情感分类模型。RoBERTa在原始BERT模型上实现了几项优化——预训练期间的动态掩码、更大的训练批量、更长的训练序列以及移除了下一句预测任务——这些优化共同提高了下游自然语言理解任务的性能（Liu等人，2019年；Rogers等人，2020年）。比较评估显示了RoBERTa在情感分类方面的实际优势。在ISEAR数据集上的多类情感检测实验中，RoBERTA的准确率为74.31%，而XLNet为72.99%，BERT为70.09%，DistilBERT为66.93%（Adoma等人，2020年）。RoBERTa在用户生成的社交媒体内容上也表现优异，特别是针对Twitter的RoBERTa模型在包括情感分析、情感识别和讽刺检测在内的多个分类任务中取得了最先进的结果（Barbieri等人，2020年）。鉴于Twitter数据和Google评论之间的相似性——两者都是简短的、非正式的用户生成内容，具有口语化的语言和多变的语法——这一点尤为重要。

最重要的是，我们选择了SamLowe/roberta-base-go_emotions模型——这是一种专门在GoEmotions数据集（Demszky等人，2020年）上微调的RoBERTa变体，该数据集包含了28种不同情感类别加上中性情感（例如，快乐、钦佩、愤怒、悲伤、娱乐、恐惧）的大量Reddit评论。这个通过Hugging Face公开的模型提供了三个关键优势：（1）在我们多维分析中至关重要的细粒度情感分类上的验证性能；（2）对类似Google评论的非正式用户生成内容的普遍适用性；（3）通过开放访问工具的可重复性，无需进行自定义微调。虽然像ELECTRA这样的替代模型在二元情感分类上表现强劲，但它们缺乏我们研究所需的细粒度多维情感检测能力。在标记的公园评论数据上对其他架构进行自定义微调会给其他研究人员带来可重复性挑战，并超出我们方法论对可访问、可复制方法的承诺。

当应用于公园评论时，该模型输出28种情感的概率分布，而不仅仅是一个单一的极性评分。例如，一条评论可以被主要归类为“快乐”（0.65），同时“钦佩”（0.18）或“惊讶”（0.12）的概率较低，揭示了二元情感分析所简化为“积极”的情感复杂性。将这个模型应用于前面讨论的评论示例，得到了图2中总结的情感分布。这种方法提供了对游客感知的更丰富理解，不仅捕捉到了体验是积极的还是消极的，还捕捉到了诸如快乐、敬畏、沮丧或悲伤等细微的情感状态，这些情感状态影响了个人与公园的互动，并为规划优先事项提供了信息。

2.6. 聚类后的分析
在从Hugging Face模型中得出情感评分后，使用scikit-learn库的PCA对RoBERTa模型产生的28种情感概率进行了标准化和降维，保留了共同解释了95%方差的成分。然后对PCA得分应用K-means聚类（同样通过scikit-learn），并选择了k的一系列候选值。对于每个k值，我们计算了簇内平方和并检查了肘部曲线，以确定一个收益递减的区域；这指导我们选择了最终聚类解决方案，平衡了简洁性与保留不同情感轮廓的需求。通过检查它们主导的情感和代表性评论来解释结果簇，并随后使用基于共识的标记程序将它们重新分组为更小的与公园相关的情感家族。为了补充这种情感聚类，我们转向了潜在的狄利克雷分配（LDA），这是一种广泛使用的概率主题建模技术（Guo等人，2017年）。LDA通过基于词共现模式推断主题分布来揭示大型文本集合中的潜在主题结构（Song等人，2021年）。对于每一种情感类别，我们使用gensim库为相关的评论文本拟合了一个单独的LDA模型。我们尝试了几种主题数量（k = 3-6）的候选值，并直观地检查了结果词分布和主题一致性得分。每个情感家族四个主题的解决方案在主题细节和可解释性之间取得了良好的平衡：较少的主题倾向于合并不同的主题（例如，维护与安全），而更多的主题则产生了冗余或嘈杂的分割。在报告中，我们展示了每个主题的前五个词，我们认为这些词足以描述主要主题，同时保持表格的可读性。LDA并未用于分类；相反，我们使用每个主题中最可能的词作为情感家族的定性交叉验证，评估与每个类别相关的语言是否与其预期含义一致。这一步还使我们能够将词簇与特定情感联系起来，揭示了游客体验的主题驱动因素。与之前关于情感映射的研究一致（Song等人，2021年；Wang等人，2021b年；Liu等人，2024年；Zhu等人，2021年），我们使用LDA展示了主题建模如何将文本特征与城市环境中的情感反应联系起来。通过检查不太受欢迎的公园评论中最常见的主题，我们识别出了负面情感的潜在来源，为有针对性的公园管理改进提供了指导。

最后，为了揭示公园周围的社会经济特征与游客情感反应之间的潜在关系，本研究采用了相关性测试和生态设计研究。相关性测试用于识别变量之间的初步关联，提供了可能存在的关系基础理解。然而，由于模型只有92个观测值，因此很难对结果有信心。在这种情况下，我们进行了生态设计研究以交叉验证结果。在这项生态设计研究中，我们将每种情感的百分比分为高组和低组，并计算了这两组中所有变量的平均值。我们还应用t检验来测试高组和低组之间的平均值差异。这些测试有助于辨别哪些社会经济因素与公园游客情感百分比的变化有关。

3. 结果
3.1. 数据描述
对从Google Reviews收集的费城公园评论数据的探索显示，这些公园的反馈量存在显著差异。为了确保分析的稳健性，只有收到超过25条评论的公园被纳入我们的研究。这一标准导致了93个公园的纳入，共收集了2016年至2024年4月18日期间的37,215条评论。这种选择策略使我们能够专注于那些有足够用户参与度的公园，从而为分析提供可靠的数据，确保我们的见解基于广泛且多样的用户体验和情感。图3展示了全市城市公园的参与情况。从数据来看，John F. Kennedy Plaza（LOVE Park）是最受评论的公园，共有6624条评论，凸显了它作为中心城市空间的地位。接下来是位于郊区的Wissahickon Valley Park，尽管位置较为偏远，但仍吸引了大量关注，有2950条评论，表明其吸引力。同样，Fairmount Park、Ritten-house Square和FDR Park也显示出高参与度，分别有2032条、2811条和2019条评论，突显了它们作为费城关键社区和娱乐中心的作用。

在分析2016年至2024年的Google公园评论时，我们还观察到用户参与度随时间的显著变化。从图4A可以看出，评论活动稳步增加，直到2019年达到峰值，随后在2020年急剧下降，这与COVID-19大流行的开始相吻合。尽管2021年评论数量有所回升，但总体趋势显示随后几年逐渐下降。

3.2. 情感分析
图5A显示了每月平均情感评分，揭示了公园游客感知的明显时间波动。3月份的情感评分最低，这可能是由于天气较冷或公园设施可用性减少导致的季节性不满。夏季月份（尤其是7月）和12月的情感评分较高，表明在休闲、假期或天气良好的时期，公园的体验更为积极。图5B展示了基于公园功能的情感差异。游乐场获得了最低的平均情感评分，可能反映了与维护、安全或拥挤相关的担忧。相比之下，自然保护区和水源保护区获得了最高的情感评分，表明公众非常欣赏提供宁静和风景价值的自然空间。纪念公园、广场和普通公园则介于这两个极端之间，反映了这些类别中更广泛的用户体验和期望。图6提供了费城公园平均情感评分的视觉表示。在A面板中，公园情感通过颜色渐变来映射，使用渐变符号表示评论数量。中心城区的主要公园（如John F. Kennedy Plaza）显示出较高的情感评分，表明公众的感知始终是积极的。相比之下，一些较小的社区公园，特别是像Frankford和Hissey游乐场这样的游乐场，显示出较低的情感评分，表明这些区域的游客满意度可能较低，需要优先进行改进。总体而言，费城市中心、西费城和西北费城的公园通常获得较高的评价，而南费城和东北费城的公园则往往评价较低。与A组相比，B组使用了一种时间加权的情感指标，该指标更重视最近的评论，突出了游客体验的变化。大多数高流量的市中心公园依然表现良好，但当强调评论的时效性时，公园的整体情感评分有所下降。东北费城和部分西北费城的公园评分下降更为明显，显示出负面趋势。南费城的公园持续表现出较低的情感评分，这凸显了需要针对性干预的必要性。为了说明时间加权情感指标的作用（该指标更重视新评论），我们比较了肯辛顿大道附近两个游乐场——弗兰克福德游乐场和希西游乐场的整体情感评分。在弗兰克福德游乐场，最近的评论（2023-2024年）变得更加积极，导致整体时间加权评分上升；而希西游乐场则呈现出相反的趋势，最近的评论降低了整体时间加权评分。这个例子展示了时间加权如何揭示静态平均值可能忽略的演变趋势，并有助于评估基础设施改进是否与游客情感的变化相关。

图5. (A) 2016-2024年谷歌公园评论的平均情感评分月度变化。3月情感评分下降（红色点），7月和12月达到峰值（蓝色点）。(B) 按公园功能划分的平均情感评分。水平条形图反映了每个类别内公园情感评分的波动。（关于图中颜色代码的解释，请参阅本文的网络版本。）

图6. 情感地图。(A) 每个公园的平均情感评分。(B) 平均时间加权情感评分。

3.3. 情感分析
由于情感集维度较高且部分线性相关，我们首先使用主成分分析（PCA）对缩放后的情感概率进行了降维处理。Scree图显示大约需要22个成分来解释95%的方差，证实情感空间非常复杂，无法仅用少数几个维度表示。在此基础上，我们应用了k-means聚类，并使用肘部法则（elbow method）评估了k=1-23的候选解（见附录中的图S2）。曲线显示WCSS（Within-Cluster Sum of Squares）逐渐下降而非急剧下降，表明没有非常小的k值能够充分概括数据。当k≈10时，解释方差的边际增益开始趋于平稳，因此我们选择k=10作为简洁性与保留多样化情感特征之间的折中。为了检验稳定性，我们在多次随机初始化（50次运行）下测试了k=10解的稳定性，发现聚类分配结果一致（平均调整后的随机指数=0.94），表明该解不依赖于初始化方式。我们还测试了其他k值（6、8、12、15），发现较小的k值过度简化了情感多样性，而较大的k值则产生了冗余或分布稀疏的聚类，未能显著提高可解释性。

为了进一步验证内部有效性，我们在PCA降维后的情感空间上计算了两个标准聚类指标。平均轮廓系数（Silhouette Score）在k=8到k=9之间急剧上升，然后在k=9到k=14之间趋于平稳，表明这一范围内的解具有相似的良好分离度。相比之下，Davies-Bouldin指数在k=10时显著下降，之后下降趋势较为平缓，表明k≈10提供了相对紧凑且分离良好的聚类。综合这些诊断结果，我们选择的k=10位于一个内部拟合良好的区域内，同时产生的情感特征数量适中，可以有意义地进行解释，并可归类为六个与公园相关的情绪家族（见附录中的图S4和图S5）。

然后，我们对PCA降维后的数据应用k-means聚类，识别出十个能够概括公园访问中反复出现的情感特征的组（见附录中的图S3）。括号中的百分比表示分配到该情绪的评论比例。获得这10个数据驱动的聚类后，我们检查了每个聚类中的主导情感和代表性评论，然后手动将它们重新划分为六个更广泛的、与公园相关的情感家族（例如，灵感、放松、沮丧与恼怒）。这种重新分类基于现有的多维情感理论，如罗素的情绪值和唤醒度模型（Park等人，2020年），我们利用这些理论作为结构和命名类别的指导，同时根据公园访问体验的具体情况进行调整。虽然正式的评分者间一致性测试可以提供额外的验证，但现有证据支持这些分类的合理性：(1) 数据驱动的k=10解在多次初始化中都显示出统计上的稳健性；(2) 这种分类基于成熟的情感理论而非随意判断；(3) 结果产生的情感家族与先前的城市公园体验研究一致（Wang等人，2021a）；(4) 如下一节所示，主题建模独立验证了评论的语言内容与基于情感的分类是一致的。这种多方法验证为六个情感家族的有效性提供了支持。

从十个聚类合并为六个情感家族的过程遵循了三个标准：(1) 主导概率特征，即具有明显主导情感的聚类被合并（例如，聚类0和1都以高价值情感为主——分别是钦佩：0.87和爱：0.82——合并为“灵感”；(2) 语义相似性，即不同聚类中的代表性评论具有共同的主题内容；(3) 与罗素的情绪值和唤醒度模型的理论一致性。最模糊的情况是“沮丧与恼怒”（聚类4、5和8），它们具有负价值情感，但在主导情感上有所不同（恐惧、厌恶和失望）；将它们合并是因为它们具有共同的负面特征，并且在实际应用中具有可解释性。

• 发现（聚类6和9）：聚类6以好奇（0.33）和困惑（0.33）为主，而聚类9则以惊讶（0.58）为主。这两个聚类共同体现了探索和遇到意外事件的情感。
• 灵感（聚类0和1）：聚类0以钦佩（0.87）为主，伴随着一些认可（0.09），表明了积极的评价。聚类1显示出强烈的爱（0.82），反映了人们对公园体验的满意和愉悦。
• 互动（聚类3）：该组包含钦佩（0.29）和认可（0.18）以及中性（0.13）情感，反映了总体上是积极的但强度较低的经历：常规访问带来的愉悦感，没有强烈的情感高潮或低谷。
• 放松（聚类7）：该聚类主要包含中性情感（0.81），与平静、低唤醒状态和沉思的空间使用相一致。
• 沮丧与恼怒（聚类4、5和8）：聚类4以恐惧（0.52）和恼怒（0.22）以及一些厌恶（0.06）为主，表明不适或感知到的安全问题。聚类5以厌恶（0.56）和一些恐惧（0.03）为主，表明强烈的负面反应。聚类8显示失望（0.26）、不认可（0.23）和悲伤（0.20），与未满足的期望相符。图2中描述一个以毒品交易闻名的公园的评论属于这一组。
• 悲伤（聚类2）：悲伤（0.63）和失望（0.18）反映了更为忧郁的经历和遗憾的情绪。

为了在地图上直观展示这些情感聚类，我们根据Kushkin等人（2023年）开发的认知一致性颜色-情感关联为每个聚类分配了颜色。这种颜色方案将特定色调与情感类别匹配起来，增强了直观解释性，使读者能够更容易理解每个地点的情感基调。这种按情感反应对公园的聚类方式类似于分析生态系统服务组合（Wang等人，2021a）或城市间情感相似性的框架（Ashkezari-Toussi等人，2019）。

图7展示了根据游客评论，不同费城公园之间的情感基调如何变化。Wissahickon Valley Park的评论体现了“发现”聚类，游客通过钦佩、惊讶和兴奋等情感描述他们的体验。典型的叙述强调了探索和与自然的互动：“这个地方太棒了。适合跑步、散步、慢跑、游泳，甚至有些人还会去钓鱼”，反映了活跃的互动和多样的娱乐机会，从而产生了“发现”情感。同样，表达“城市边缘适合远足和骑行的绝佳地点”的评论展示了靠近自然体验如何增强惊讶和愉悦感——这是“发现”情感特征的关键组成部分。

相比之下，费城越南退伍军人纪念堂的评论则表现出以“悲伤”为主的情感特征。游客的语言从娱乐热情转变为纪念和哀悼：“我的父亲是建造这座纪念堂的人之一，他一年前去世了，我每个月都会去那里，只是为了缅怀你，爸爸”。其他评论如“一个为在朝鲜战争中牺牲的士兵们设计的深思熟虑且温馨的纪念碑”或“一个非常感人的纪念空间，纪念那些服役和牺牲的人”展示了设计良好的纪念空间如何引发反思、悲伤和历史意识等独特的情感反应。

这些对比鲜明的情感特征表明，基于地点的特征——无论是自然步道还是象征性的纪念设计——如何从根本上塑造不同的情感体验。图7从地理上定位了这些例子，展示了费城公园系统中情感反应的差异，揭示了公共空间的娱乐和纪念双重维度。

为了进一步验证这六个情感家族是否在评论的语言中得到体现（超出了RoBERTa情感分类的范围），我们使用主题建模检查了与每个类别相关的文本内容。在下一节中，我们将探讨评论中的主导词汇和主题是否与情感聚类所暗示的特征一致，从而提供了独立于情感模型输出的验证方法。

图7. 费城公园评论的情感编码。Wissahickon Valley Park的“发现”评论（绿色，左侧）突出了钦佩和惊讶。越南退伍军人纪念堂的“悲伤”评论（灰色，右侧）反映了悲伤和纪念。每条评论都附有情感评分。

3.4. 按情感分类的评论内容分析
公园评论中的词频模式（图8）揭示了与特定体验相关的情感维度。在“灵感”类别（图8A）中，频繁出现的词汇如美丽、散步和儿童强调了公园的美学吸引力及其家庭使用情况。“发现”类别（图8B）围绕清洁、步道和玩耍，将探索与环境质量和积极娱乐联系起来。“放松”类别（图8C）包含放松、享受和白天等词汇，突出了低唤醒度、恢复性的访问体验。“互动”类别（图8E）突出了解、兴趣和步道等词汇，表明了在公园空间中的信息性和探索性参与。“沮丧与恼怒”类别（图8D）以狗、垃圾、脏乱和清洁等词汇为特征，反映了人们对卫生和宠物管理的担忧。“悲伤”类别（图8F）包括悲伤、无家可归（homel[ness]）和误用/不当行为（mis）等词汇片段，表明了反思、悲伤或对社会问题的认识。这些特征将情感基调映射到公园环境的具体方面，从美丽和家庭娱乐到维护、安全和社会脆弱性。

为了更好地理解之前分析中识别出的公园体验的情感维度，我们应用了潜在狄利克雷分配（LDA）主题建模来分析每个情感类别中的具体语言模式（见图9）。为了放松，主题1中的主导词汇如“美丽”、“家庭”以及更具体的休闲活动如“参观”和“圣诞村”表明，美学欣赏和家庭聚会为公园体验增添了放松的氛围。主题3关注“放松”、“坐着”、“享受”、“一天”和“食物”等词汇，强调了访问中的悠闲和放纵方面，其中简单的乐趣是核心。与参与相关的评论强调了积极的参与和记忆的创造。主题1突出了“河流”、“汽车”和“游乐场”等词汇，反映了吸引游客的各种活动。主题4增加了“知道”、“需要”、“美丽”、“景色”和“船只”等词汇，表明风景优美的景观和水上活动有助于与公园环境建立更深层次的联系。探索和欣赏自然及娱乐特征的情感在评论中得到了体现。主题1还包括“爱”、“最喜欢”、“来”、“享受”和“年”等词汇，反映了情感上的依恋和频繁的访问。主题4的词汇如“孩子”、“玩耍”、“公园”、“观看”和“自从”突出了儿童活动在促进发现和留下深刻印象方面的作用。

在沮丧和烦恼的情绪中，主题中的主导词汇如“狗”、“干净”、“一天”、“皮带”、“可怕”和“安全”，表明了对公园清洁度、宠物管理和安全性的担忧。频繁出现的“干净”和“垃圾”一词凸显了对维护条件不满意，这些条件影响了游客的体验。最后，“悲伤”与记忆和反思有关。主题2包含“父亲”、“越南”、“知道”、“墙”和“记忆”等词汇，可能指的是纪念公园等纪念性场所。主题3中的词汇如“抱歉”、“小径”、“志愿者”、“结束”和“黄色”暗示了生命转变和社区服务的主题，为公园体验增添了深刻和沉思的层面。

关于情绪的时间、功能和空间趋势，图10显示大多数评论属于“灵感”和“放松”两类，表明公园通常被视为能够提升情绪并提供宁静环境的空间。时间分析显示，这些积极情绪在2019年达到顶峰，并在2021年显著回升。这种积极情绪的增加，尤其是在2020年疫情这一挑战性时期之后，表明游客非常重视重返公园的机会，利用这些空间来恢复精力和情绪。

在更细致的层面上，情绪分析揭示了基于公园功能的不同模式。从图11A可以看出，游乐场有相当比例的评论表达了沮丧和烦恼，这表明这些以家庭为导向的空间有改进的潜力。此外，“悲伤”情绪主要与纪念公园相关，反映了访问这些地点时的沉闷氛围。费城各公园的情绪映射生动地描绘了游客所经历的情绪景观。通过计算每个公园对应于六种情绪标签的评论百分比，我们确定了公众表达的主要情绪。图11B中的地图显著显示大多数公园中的主要情绪是“灵感”和“放松”，表明游客在访问期间通常会感到积极。

更广泛的视角通过个别情绪地图得到体现，这些地图揭示了特定情绪在空间上的差异。“灵感”（图12E）和“放松”（图12C）在整个城市中相对均匀分布，没有明显的地理聚集，表明这些情绪可以在多种公园环境中被广泛激发。相比之下，图12D突出了局部的情感问题：如Edgely Ultimate Fields、Frankford Playground和Weinberg Park等公园显示出较高的沮丧和烦恼情绪，这些情绪占评论的10%以上。图12A强调了费城西北部公园中的“探索”情绪的强烈存在，特别是在Ned Wolf Park和Cloverly Park，表明这些空间激发了好奇心和探索欲。同时，图12F显示Center City East附近的公园中与“悲伤”相关的情绪反应集中，尤其是在Philadelphia Vietnam War Memorial Park，这表明了历史和纪念性地点的情感共鸣。

为了评估与公园相关的情感反应是否表现出空间聚集性，以及社区背景是否影响超出公园特定特征的情感特征，我们使用R语言中的spdep包计算了每个加权情绪变量的全局Moran’s I（Moran, 1950）。空间权重是通过距离带方法构建的，将邻居定义为给定阈值内的所有公园对；权重进行了行标准化，以便每个观察值的邻居权重之和为一。报告了1公里和2公里阈值的结果，以评估阈值选择的敏感性。在1公里阈值下，四种情绪表现出显著的正空间自相关性：参与、“沮丧与烦恼”、“灵感”和“放松”。特别是“放松”（I = 0.44, p <.01）和“灵感”（I = 0.30, p <.01）显示出强烈的聚集性，表明附近的公园往往作为共享的恢复性环境，用户一致报告了平静或鼓舞人心的体验。“参与”和“沮丧与烦恼”显示出较弱但显著的空间聚集性（分别为I = 0.13和0.14）。相比之下，“探索”和“悲伤”没有显著的空间自相关性，表明这些情绪在空间上更为分散或受公园特定属性驱动。在2公里阈值下，只有“放松”（I = 0.30, p <.01）和“沮丧与烦恼”（I = 0.16, p <.01）仍然显著，而“参与”显示出边缘显著性（p = 0.05）。“灵感”不显著（p = 0.46），“探索”和“悲伤”仍然不显著。这种距离衰减表明恢复性体验在更广泛的社区尺度上有空间结构，而鼓舞人心的体验则更局部聚集。

这些空间模式支持我们的概念框架中包含社区背景作为调节因素，并表明情感体验——特别是恢复性情绪——可能受到更广泛的社区规模过程的影响，而不仅仅是单个公园特征的影响。

本研究重点关注实时公共反馈的重要性，特别是在最近公园改进和政策干预的背景下。为了捕捉公园特征与游客情绪之间最新的关联，我们关注自2023年1月1日以来发布的评论。我们使用最近一年的评论重新计算了每个公园中的每种情绪的百分比。基于聚类和主题建模的结果，我们探讨了情绪表达模式与公园环境的更广泛社会经济特征之间的关系。大量研究已经探讨了城市公园的各种特征如何影响公众感知并促进社会福祉。根据Brown（2008）提出的城市公园价值理论，公园的大小及其与人口密集区的接近程度是影响公园价值的关键因素。研究还表明，植物多样性可以直接提高游客的幸福感（Muratet等人，2015年），而声学舒适度（Tse等人，2012年）和触觉感受（Zhang等人，2019年）显著塑造了公园体验。这些发现提出了关于游客情绪与公园环境的建成环境和社会经济特征之间关联的重要问题。尽管人们认识到植物丰富性和声景的好处，但关于城市规划者是否应优先考虑植树和保持公园宁静仍存在争议。此外，公园的感知质量通常与周边地区的房价上涨有关（Zhou等人，2021年）。然而，较不富裕社区的公园可能会获得更高的情感评分，因为它们经常作为社区疗愈的关键空间。其他研究还指出，游客的感知受到种族（Gómez和Malega，2007年）、年龄、收入和教育水平（Dinda和Ghosh，2021年）的影响，尽管这些关联通常以二元方式考察。这种复杂性突显了需要更深入地分析公园情绪与社会经济条件之间的关系。

为了扩展以往的研究，我们汇编了一套全面的社会经济、空间和设施相关特征，以更好地理解它们与基于公园的情绪之间的关联。社会经济变量来自2022年美国人口普查数据，包含每个公园的街区组级别信息，包括人口密度、非裔美国人居民的比例、18岁以下和65岁以上居民的比例、家庭收入中位数、拥有学士学位或更高学历的居民比例、空置住房的比例以及白人房屋所有权率。空间特征如公立学校、铁路线、拆除的住房以及公共艺术装置来自费城开放数据Philly门户（2024年5月访问），并在R中用于计算公园级别的变量，其中所有“距离……”度量表示每个公园到该类型最近特征的欧几里得距离。公园设施和设施数据（如游乐场、野餐区、游泳池、喷泉区、城市农业地块、网球场、补水站和船只下水处）来自费城公园与娱乐（PPR）数据集，这些数据在Open Data Philly ArcGIS Online平台上发布（2024年5月访问），并在公园级别编码为二进制指标。对于树木和报告的犯罪事件，我们使用Open data Philly门户的数据计算了每个公园半英里半径内的发生次数，数据截至2024年5月。最后，使用Python中的rasterio包从2018年的Landsat 8影像计算了归一化差异植被指数（NDVI），并总结了每个公园边界内的中位NDVI值。

图13展示了最近公园游客情绪与公园特征及周围社会经济背景之间的关联。几种值得注意的模式揭示了物理环境与情感体验之间的微妙互动。植被通过NDVI捕捉到，与灵感、探索和沮丧呈正相关，而与放松呈负相关。这表明更绿色的公园通常会激发好奇心和参与感，但可能不太有助于平静感。一个可能的解释是特定公园的特征：例如，Pleasant Hill Park拥有一个鱼类孵化场和几个游乐场，尽管其NDVI相对较低（0.3），但仍有超过50%的评论与放松相关。这种明显的矛盾可能源于某些设施的存在，这些设施降低了NDVI但仍促进了情绪的恢复。相比之下，半英里半径内的树木数量与放松呈正相关，强化了树冠覆盖和阴影的恢复作用。

公园的大小也起着重要作用。较大的公园更常与探索和惊奇感相关联。此外，设施具有针对性的情绪效应：成人健身器材与灵感相关，但与放松无关，可能是因为其激励性而非平静性。船只下水处与沮丧相关，可能反映了导航、拥挤或噪音等挑战。另一方面，艺术纪念碑与悲伤呈正相关，可能是因为它们的纪念功能以及引发反思的能力。围绕促进互动体验的公园特征出现了更广泛的模式。野餐区、喷泉区、游乐场和城市农业地块与探索呈正相关，表明这些元素鼓励探索和新奇感。游泳池和喷泉区尤其具有影响力，也与参与感呈正相关，突显了它们在促进积极参与中的作用。除了公园本身之外，周围社区的社会背景在塑造情感模式中也起着重要作用。在普查区域层面，较高的空置率与居民的参与度呈正相关，这乍看之下可能有些反直觉。这可能表明，在居民较少或活力较低的社区中，公园成为了社区生活的核心中心。同样，老年人比例较高的地区在评论中表现出更多的悲伤情绪，这可能反映了老年访客的反思性情感。空间可及性进一步复杂化了这一现象：距离铁路线较远的公园既被认为是探索的好地方，但同时也更难到达。公园内的公共艺术设施与更高的参与度相关，表明可见的艺术装置有助于吸引游客参与互动体验。距离学校较远的公园则显示出更高的参与度，这可能反映了它们对学龄前儿童以外更广泛人群的吸引力。此外，在最近拆除住房的地区，悲伤情绪的水平也更高，这表明失去和变化对这些社区的情感影响仍然存在。

这些发现与巴塞罗那（Yang等人，2022年）和武汉（Ma等人，2021年）的研究结果一致，这些研究表明城市情感模式与建筑环境指标（如密度、绿化程度和公共设施的可及性）密切相关。公园的情感价值不仅受设计影响，还与其社会历史背景紧密相连（S. Huang等人，2022年；Mitchell等人，2013年）。最后，从评论数量中观察到的模式引发了一些重要问题：评论较多的公园往往显示出更高的发现和启发程度，而较为罕见的情绪则不太明显。这表明在人流量较大的公园中，主导情绪主题可能被过度强调，大量的评论可能掩盖了更微妙的情感反应。

总的来说，这些发现说明了公园特征和社区环境如何多方面地塑造人们的情感体验。数据强调了不仅要解读绿地的物理设计，还要考虑它们所处的社会和历史背景的重要性。

4. 讨论
本研究展示了自然语言处理（NLP）在从城市公园评论中提取和分类广泛情感反应方面的潜力。通过使用基于Transformer的情感模型和无监督的主题建模，我们不仅识别出了一般的情感趋势，还发现了更细致的、特定于情感的模式，这些模式反映了个人对公共绿地的体验。情感地图的创建进一步提供了这些见解的空间视角，揭示了费城公园评论中情感基调的地理差异。我们暂时观察到情感表达具有明显的季节性节奏：夏季月份正面情绪（如发现和参与）的数量较多，而冬季评论则表现出较低的情感强度。这些模式表明，参观率和情感参与度都高度受季节性因素的影响，可能是由天气条件、公园活动安排以及全年用户人口结构的变化所驱动的。

公园在情感上的作用在不同空间中差异显著。一些公园主要作为反思和回忆的场所，而另一些则更侧重于娱乐或社交功能。与游乐场相关的公园经常产生高度积极的情绪反应，同时也显示出明显的挫败感，这突显了以儿童为导向的设施对感知质量和维护标准的敏感性。从空间上看，费城中心的公园通常收到更多的正面评价，而在西部和西北部社区，挫败感尤为明显。这种地理差异表明，情感体验受到投资不均、维护实践和当地环境条件的显著影响——这些发现与之前关于城市公园公平性和环境正义的研究结果一致。类似地，通过社交媒体分析景观体验的地理空间方法揭示了人们如何超越传统界限来评价景观，强调了城市环境中蓝色和绿色空间的相互关联性（Bibaud等人，2024年）。

情感关键词的分析进一步明确了公园的哪些具体特征最能引起游客的共鸣。清洁度、步道、对狗友好的设施以及与家庭相关的术语（如儿童、玩耍、野餐）经常与积极情绪相关联，而与忽视或不适相关的词汇（如垃圾或危险）则常见于表达挫败感或悲伤的评论中。这些文本模式证实了物理维护、安全感知以及放松和探索的机会对于积极的公园体验至关重要。

我们对2023年数据的探索性分析揭示了情感分布与选定公园特征（包括植被密度（NDVI）、公园规模和特定设施）之间的有意义关联。较高的NDVI得分与启发和发现情绪呈正相关，而游泳池和喷泉等设施则与参与度相关。社会经济和空间背景变量也显示出显著的关联。在空置率较高的地区，公园的参与度评论比例更高，这表明这些空间可能在面临投资不足的社区中发挥着补偿性社会功能。

这些发现强化了关于城市公园价值的现有理论，同时也揭示了一些反直觉的现象。较高的NDVI不仅与发现和启发相关，还与挫败感相关——这可能反映了某些高人流量的公园虽然具有水景或娱乐设施，但其情感体验却较为复杂（例如，既能带来欢乐又能引发拥挤压力的喷泉游乐场）。同样，步行距离内的树木密度与放松情绪呈正相关，突显了树冠覆盖的恢复性价值。公园规模与发现情绪呈正相关，而游泳池和城市农业项目等互动设施则与参与度和探索情绪相关。社会经济和空间背景进一步加剧了公园体验之间的情感差异。在空置率较高的地区，公园的参与度更高，表明它们在资源不足的社区中起到了重要的社会基础设施作用。距离学校、铁路线和拆除住房区域较远的公园分别表现出更高的参与度、发现情绪和悲伤情绪。这些背景关联突显了城市绿地在城市情感和社会历史结构中的深远作用。

4.1. 城市规划意义
从社交媒体平台获取的情感数据在应用城市规划（Huai等人，2023年；Dai等人，2024年）和方法学综述（Shukla和Pujara，2025年；Zhang等人，2024年）中都得到了验证。我们的发现与最近的情感制图研究（Griffin和McQuoid，2012年；Caquard和Griffin，2018年）一致，展示了NLP衍生的情感模型如何将传统的GIS方法与当代城市规划实践相结合。这种方法还补充了系统综述中的广泛国际证据，这些证据强调了社交媒体数据在理解不同文化背景下绿地对情感和身体活动影响方面的价值（Zhang等人，2024年）。与大多数仅限于基本情感极性分类的先前研究不同（例如Roberts等人，2018年），我们的多情感框架捕捉了更广泛的情感谱，为规划者提供了更细致的城市体验情感地图（Park和Storey，2023年）。

这些发现为将情感指标纳入绿地治理和基于证据的城市规划提供了支持。我们的结果强调了将情感意识分析工具整合到数字规划工具箱中的重要性，并将实时情感分析与长期空间公平目标联系起来（J. Li等人，2024年；Li等人，2025年）。最近的情感映射方法系统综述强调了需要结合多种数据来源和方法论框架的多模态方法，以更全面地理解城市环境中公民的情感（Shukla和Pujara，2025年）。通过将情感数据融入规划过程，从业者可以更好地理解城市绿地不仅作为物理基础设施，还作为具有深厚社区意义的情感资源的功能。

在实践中，这些见解可以为更具情感意识的公园设计和管理策略提供依据。例如，铁路线的视野可能引发探索和挫败感——这表明，通过景观缓冲区或视觉屏障等干预措施可以帮助减少负面情感反应，同时保持开放性和好奇心。为了促进发现和参与，特别是儿童参与，公园规划者可以纳入探索性元素，如自然游戏区、临时活动或小规模城市农业项目。改善娱乐设施（如野餐区、游泳池和社区花园）也可以增强绿地的情感联系和社会互动。此外，在老年人口较多的社区，较低的参与情绪表明需要更多面向老年人的公园设施。遮阳座椅区、无障碍步行道和低冲击力的健身设施有助于增强舒适感、归属感和幸福感。这些应用展示了如何将情感数据应用于指导更具响应性和公平性的公园设计。

有趣的是，挫败感和烦躁情绪与人口密度呈弱负相关，而与白人居民比例呈正相关。这一模式并不与关于公园质量不平等的环境正义研究相矛盾，而是反映了参与在线评论的人群特征以及期望的形成方式。居住在较白人化、人口密度较低的社区中的居民可能更倾向于使用Google Reviews，并对公园的清洁度、安全性和狗的管理有更高的期望；因此，即使是相对轻微的忽视也会引起强烈的不满，这与强调垃圾、混乱和“破窗效应”对社区感知影响的观点相符。同时，如果居民较少发表评论，较弱势社区的挫败感可能被低估，这反映了在数字数据集中情感体验的代表性不足。这些发现表明，社交媒体中的情感信号应同时被视为公园状况的指标和社会差异化的期望表达，并强调了需要通过更多针对性的干预来补充数字反馈。

4.2. 朝向感知导向的规划框架
我们的发现揭示了公园特征、情感反应和社会经济背景之间的系统关系，为城市规划提供了可操作的路径。图14将这些关系综合成一个综合框架。该框架通过三个相互关联的机制运作：首先，公园特征（自然元素、设施、维护质量）通过注意力恢复理论和压力减少理论描述的心理路径产生不同的情感反应（见引言）。我们的分析确定了六个情感集群——发现、启发、参与、放松、挫败和悲伤——这些集群对应于特定的公园属性和功能类型（第3.5节）。发现和参与反映了积极的娱乐和对新体验的迷恋；放松和启发与恢复性特质（远离喧嚣、与自然环境的兼容性）相符；挫败感则表明维护不足，这会削弱恢复感和安全性；而悲伤则出现在用于反思和纪念的空间中。

4.3. 推进文化生态系统服务研究
本文提出的方法在三个关键维度上推进了文化生态系统服务（CES）的评估。首先，它提供了时间维度；虽然传统的评估方法只能捕捉公园体验的快照，但我们的多年分析揭示了动态模式——季节性波动、疫情影响以及长期趋势——表明公园提供的服务（CES）随时间发生了显著变化。这种时间视角对于理解公园干预措施如何影响情感效益以及识别特定服务（例如恢复、娱乐）最需要的时期至关重要。其次，我们的多维情感框架将CES的概念化超越了简单的分类。六个情感群组对应于不同的CES维度：放松和启发反映了恢复性的健康效益，发现和参与与娱乐和社会凝聚力价值相一致，而悲伤则体现了纪念和遗产意义（Daniel等人，2012年；Peters等人，2010年）。这种细致的分类使我们能够识别出特定公园提供了哪些CES维度或缺乏哪些维度，从而超越了“娱乐价值”的一般性评估，揭示了公园通过情感途径提供生态系统服务的方式。第三，我们的研究发现揭示了传统方法难以发现的CES提供的空间不平等现象。位于社会经济压力较大的社区的公园表现出系统性的情感效益下降——挫败感增加，启发性减少——这表明CES并不是对所有人群都可及的。这扩展了环境正义的研究（Dai，2011年；Wolch等人，2014年；Rigolon，2016年），表明不仅存在公园访问或物理质量的差异，还存在公园为不同社区提供的情感和心理服务的差异。重要的是，这种方法是对参与式CES评估的补充而非替代。与通常具有横截面性质且地理覆盖范围有限的传统调查方法不同，持续监测能够捕捉情感效益的时间变化——包括对维护干预或安全变化的反应——这些变化是静态评估难以发现的。社区参与对于理解文化价值、场所意义和优先事项仍然至关重要，而这些是无法仅通过评论推断出来的。同时，基于评论的情感表达反映了自选且数字化活跃的公园用户群体，应将其视为感知体验的指标，而不是代表整个群体的CES交付指标。因此，持续的情绪监测提供了一个补充视角，可以识别时间模式、揭示空间不平等，并在密集的参与式评估之间跟踪干预效果。

4.4 研究优势
这项研究在城市规划和数字人文学科领域具有几个显著的优势和贡献。首先，它使用了完全开放获取的工具和流程，这些工具和流程可以在不同的城市环境中轻松复制。通过使用公开可用的数据和易于获取的自然语言处理（NLP）工具，这项研究支持可持续的城市规划实践，同时提高了方法论的透明度和各城市之间的可重复性。除了其各个组成部分外，该研究的一个关键贡献是将基于Transformer的情感分类、降维、无监督聚类和空间统计整合到一个统一的分析流程中，用于大规模研究城市公园的感知。尽管之前已有研究分别应用了基于RoBERTa的情感检测、基于PCA的降维、k-means聚类和空间自相关方法，但将它们系统地结合到一个端到端的框架中——从用户生成的原始文本到空间明确的情感地图——构成了方法论上的创新贡献。这一流程是可复制的，可以扩展到其他城市，并能够捕捉到单一方法无法揭示的多维情感变化。一个关键的方法论贡献是开发了一个针对特定城市环境定制的情感标签生成框架，使得对公园游客情感的细致理解超越了简单的二元分类。将情感检测模型与地理空间可视化工具相结合，可以创建详细的情感地图，从而在地理上表示城市景观中的情感反应。本研究开发的分析框架提供了一个可扩展的模型，用于从公园评论中提取和解释情感体验。它提供了可操作的见解，其他具有类似城市特征和自然资源的城市可以据此进行调整。这种方法确保了更广泛的应用性，帮助城市规划者和官员通过开源数据分析得出的经过验证且成本效益高的策略来提升公园的功能性和游客满意度。

4.5 局限性
在解释这些发现时，必须承认几个重要的局限性。首先，Google评论的可靠性和代表性存在固有的挑战。由于伦理考虑，我们没有收集关于评论者的详细人口统计信息，因此不清楚贡献者是当地居民还是游客。这一区别至关重要，因为当地用户可能提供更准确和全面的关于公园长期问题的见解，这对市政改进工作最为相关。我们假设大量评论来自熟悉这些空间的当地用户，反映了真实的游客反复出现的情感，而不仅仅是偶尔的游客印象。时间差异也是一个方法论挑战。Google用户可以在访问公园后的任何时间提交评论，这可能远远晚于他们的实际体验时间。尽管我们假设评论反映了游客在访问时的体验，但这些时间差距可能会影响反馈的即时性和相关性。本研究试图通过分析不同月份和季节的评论频率模式来减轻这种偏差。社交媒体数据的人口代表性是第三个局限性。在线评论平台可能无法完全捕捉所有公园游客的观点，可能会对某些特定人口群体产生偏见，同时低估其他群体，特别是老年人和技术使用有限的人群（Stephens，2013年；Sloan等人，2015年）。因此，基于评论的数据不应被解释为公园使用或情感的代表性指标。相反，它们反映了选择性地表达的场所感知。重要的是，这项研究的分析重点不是估计人群层面的情感普遍性，而是识别与公园相关的情感表达的相对空间和功能变化。先前的地理信息科学和城市分析研究表明，尽管存在人口统计和参与偏差，用户生成的内容在作为感知体验的指标时仍能可靠地捕捉到有意义的地方模式（Goodchild，2007年；Jiang等人，2016年）。虽然未来的研究可以探索人口统计加权或与补充数据源的三角验证，但这些方法需要访问用户级别的人口统计属性或平台元数据，而这些数据在Google评论中是不可用的，也会引入额外的假设。因此，这些策略超出了本研究的范围。第四，情感分类方法也有验证局限性。将十个数据驱动的情感群组手动合并为六个更广泛的情感类别时，没有进行正式的评分者间可靠性测试，这需要独立的编码者来验证分类方案。此外，我们没有将自动化的RoBERTa情感分类与人工编码的评论子集进行比较，以直接验证情感检测的准确性。然而，这些情感类别得到了多种形式的一致验证：底层的k-means聚类在随机初始化下具有统计上的稳健性（调整后的Rand指数=0.94），合并基于已建立的情感理论（Russell的环状模型），主题建模也独立确认了评论语言与基于情感的类别一致。未来的研究可以通过系统性的评分者间可靠性测试和与专家编码的情感标签进行比较来加强这种方法，特别是在将这种方法扩展到其他城市环境或情感表达模式可能不同的文化背景时。最后，我们仅依赖Google评论可能会错过Yelp或TripAdvisor等其他平台上存在的全部公众意见。然而，我们选择Google评论是因为Yelp主要针对餐厅评论，而TripAdvisor则更侧重于游客的观点。此外，由于用户隐私的伦理考虑，本分析没有特别考虑那些发布大量评论的超级贡献者的潜在影响。

5. 结论
本研究开发了一种使用自然语言处理（NLP）和聚类技术对公园相关情感进行标记和地理空间映射的新方法。通过从Google评论生成情感地图，我们提供了一种可复制且可扩展的方法，以了解游客如何体验城市绿地。这些工具为城市规划者、景观建筑师和公共卫生官员提供了可操作的见解，旨在使公园设计与社区的情感相一致。结果突显了城市公园的持久价值和持续存在的挑战。公园仍然是娱乐和家庭生活的重要场所，尤其是在夏季，但与卫生和安全相关的问题仍然存在。这些负面情感反应在位于经济劣势社区的公园中更为常见，这强调了在资源不足的地区需要有针对性的投资和管理策略。本研究揭示了情感反应与环境和社会空间变量之间的复杂关系。诸如NDVI、树木密度和靠近基础设施（如铁路线）等特征显示出与情感相关的特定关联，这些关联挑战了简化的假设。例如，虽然植被通常支持积极情感，但其对放松的影响可能取决于公园的设计和周边设施。同样，可见的基础设施可以通过提供独特的视野或改善可达性来提升参与感，这突显了在规划决策中考虑情境细微差别的必要性。这些发现为情感地理学的不断发展的文献做出了贡献，并为提高城市绿地规划的公平性和有效性提供了数据驱动的基础。随着城市的演变，通过数字平台持续监测情感反应可以支持适应性管理，确保公园保持包容性、响应性和情感共鸣的城市组成部分。未来的研究应继续探索多模态方法（Zhao等人，2024年；Chai-allah等人，2025年），并将社交媒体的见解与传统的评估方法进行验证（Huai等人，2023年），以进一步提高情感感知公园规划的可靠性和适用性。

作者贡献声明
高夏园山：撰写——审阅与编辑、撰写——初稿、可视化、验证、软件、方法论、正式分析、数据管理、概念化。
Eric Delmelle：撰写——审阅与编辑、撰写——初稿、可视化、验证、监督、资源管理、项目管理、方法论、调查、资金获取、正式分析、数据管理、概念化。

热点排行