在全球城市化加速的背景下,特定职业群体的空间聚集是塑造城市功能组合的基本驱动力(Blumen & Zamir, 2001; Jacobs-Crisioni et al., 2014; Glaeser, 2011)。不同行业作为“活跃主体”,定义了城市空间的功能特征,创造了就业活动与建成环境之间的复杂相互依赖关系(Cervero, 1989; Zhou et al., 2024; Z. Chen & Yeh, 2026)。因此,准确绘制这些职业模式不仅是一项人口统计工作,更是制定数据驱动规划策略的先决条件(Liu et al., 2024; C. Xu, Xiao et al., 2021)。具体而言,它为优化产业布局、缓解功能不兼容性以及合理分配公共服务提供了必要的空间信息(Duncan & Duncan, 1955; Stadin et al., 2021; Wilmot & Ones, 2021)。因此,生成高分辨率的职业分布数据对于解码这些复杂的功能互动和支持精准的城市治理具有科学必要性。
尽管如此,满足这些数据需求仍然具有挑战性。传统的普查和家庭调查等来源虽然权威,但通常空间分辨率较低、更新频率较低且收集成本较高(Stadin et al., 2021; De Alwis et al., 2022)。这些限制限制了它们在网格级别映射和及时诊断城市社会经济动态方面的实用性(Freire, 2010; Jia et al., 2014)。
为了从面积统计数据中推导出高分辨率的人口分布图,已经开发了一系列空间化方法,包括非均质映射(Eicher & Brewer, 2001; Mennis, 2003)以及地理统计和机器学习技术(Cheng et al., 2022; Hu et al., 2022; Oliver & Webster, 1990; Tobler, 1979)。同时,由于夜间灯光具有广泛的空间覆盖范围和易于获取的特点,遥感代理数据(特别是夜间灯光)也被广泛用于近似人口密度或一般活动强度(Bagan & Yamagata, 2015; X. Yang et al., 2019)。然而,夜间灯光数据仍然是间接的且不够具体的。在照明强烈的城市核心区域,这些数据可能会饱和,并且对城市内部的细微变化敏感度较低,从而降低了它们区分行业就业结构和职业群体差异的能力。
时空大数据的最新进展为在细空间尺度上表征人口分布和动态提供了另一种途径(Boo et al., 2022; Xu et al., 2021)。移动轨迹和基于位置的服务能够以高时空分辨率和广泛的人口覆盖范围记录人类存在和活动,从而比传统的静态数据集提供更真实的人口动态描绘(Chen et al., 2022; Gao et al., 2024; C. Zhang et al., 2023)。特别是基于位置的社会媒体和平台用户数据(如腾讯用户数据),提供了大量且持续更新的信息,显示人们何时何地处于活跃状态(L. Chen, Zhao et al., 2022; Jiao et al., 2023; F. Wang, He et al., 2024)。尽管这些数据不直接编码职业类别,但当与城市背景信息和可解释的建模框架结合时,它们为推断和比较特定行业的职业人口模式创造了新的机会(T. Li et al., 2023; Preo?iuc-Pietro et al., 2015; Wen et al., 2020)。
尽管取得了这些进展,职业人口映射仍面临两个挑战。首先,大多数研究仅对总人口或单一群体进行建模,未能在统一框架内充分比较不同行业的职业人口及其不同的环境驱动因素。其次,许多高性能模型的可解释性有限,难以解释潜在机制并将结果转化为可操作的规划指导。
为了解决这些挑战,本研究利用腾讯的位置大数据对长沙的职业人口进行了网格级别的空间模拟和分析,重点关注餐饮、教育、建筑和旅游四个主要行业的职业人口空间分布模式。研究整合了多源地理特征数据作为预测变量,包括建成环境指标(兴趣点密度、道路网络密度)、物理约束(海拔、坡度)、社会经济信号(夜间灯光强度)和生态条件(NDVI)。通过使用XGBoost模型,我们实现了高精度的职业人口分布预测。除了预测之外,我们还基于SHAP开发了一个可解释的分析框架,以量化变量贡献并揭示行业特定的非线性响应。本研究为职业人口映射提供了一种集成且可解释的方法。从理论上讲,它通过量化非线性环境驱动因素推动了以机制为导向的城市分析;从实践上讲,它为优化城市功能分区和资源分配提供了基于证据的支持。
本文的其余部分结构如下:第2节介绍研究区域和数据来源。第3节详细阐述方法论框架。第4节展示我们的实证发现。第5节全面讨论了职业人口分布的空间异质性及其驱动因素。最后,第6节总结了研究结论并指出了未来研究的潜在方向。