城市形态作为住房与基础设施不平等的代用指标：基于开放建筑足迹数据的机器学习方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月02日 来源：Computers, Environment and Urban Systems 8.3

编辑推荐：

　　本研究聚焦于快速城市化地区空间不平等制图的难题。针对传统普查数据时空粒度不足的问题，作者以巴西圣塞巴斯蒂昂为案例，评估了从开放数据集Google Open Buildings提取的城市形态指标，在多大程度上能作为城市居住与基础设施条件不稳定的代用指标。研究利用随机森林模型，以官方界定的贫民窟位置为训练数据，实现了对贫民区与非贫民区的高精度区分（AUC达0.89）。研究表明，被分类为更不稳定的城市区域，与更小的建筑、更窄且未铺砌的街道、耐久性更差的屋顶材料以及更差的基础设施（如自来水、污水和垃圾收集）可及性显著相关。这项工作为利用开放地理空间数据评估城市不平等提供了可扩展、可复制的方法，对城市风险分析和规划具有现实意义。

城市化是塑造当今世界的重要力量，然而，城市在快速扩张的同时，也伴随着深刻的不平等现象。在巴西沿海城市圣塞巴斯蒂昂，一场极端降雨事件直观地揭示了这种不平等的代价：2023年2月，超过500毫米的日降雨量引发了多重灾害，造成广泛破坏和65人丧生，而研究发现，非正规住区的建筑受损密度是其他城市区域的12倍。这并非孤例，在全球范围内，气候变化与城市发展进程（如空间隔离）的交互作用，正加剧对经济和社会边缘化城市居民的威胁。为了应对这些挑战，准确、及时地绘制城市不平等地图至关重要。然而，现实是骨感的：传统的普查数据往往存在显著的时间滞后，且多为聚合数据，难以捕捉快速演变的城市动态。在此背景下，能够提供空间细节、近全球覆盖和高时间分辨率的地球观测（EO）技术，成为了填补信息空白的有力工具。特别是城市物理形态，长期以来被视为理解建成环境的关键窗口，但它在多大程度上能作为衡量住房和基础设施等维度不平等（在本研究中被定义为“城市不稳定性”）的代用指标，仍是一个有待深入探索的课题。近期发表在《Computers, Environment and Urban Systems》上的一项研究，为回答这个问题提供了有力的证据。

这项研究主要采用了基于开放建筑足迹数据的形态指标提取与监督式机器学习相结合的方法。研究人员以巴西圣塞巴斯蒂昂为案例，首先获取了两个核心数据集：由深度学习生成的开放建筑足迹数据集Google Open Buildings（GOB），以及巴西2022年全国人口普查中官方界定的“贫民窟和城市社区”（FUCs）图层。他们采用50米分辨率的规则网格作为基本空间分析单元，将城市形态指标（如建筑平均面积、形状指数、邻近度、方向标准差、建筑总数、建筑密度等，总计12个指标）作为自变量（预测因子），将基于FUCs图层生成的二元贫民窟/非贫民窟分类图作为因变量。研究人员训练了一个随机森林（RF）模型来学习形态指标与贫民窟位置之间的关联。模型在独立的验证子集上表现出高判别能力（AUC为0.89），随后被应用于生成一个从0到1连续变化的“不稳定性”概率表面。该表面最终被重新分为“极低”到“极高”五个不稳定性等级。模型的验证采用了统计指标、野外实地观测数据（收集了超过1200栋建筑的屋顶材料、面积、街道状况等信息）以及人口普查数据（包括自来水、污水收集、垃圾处理等基础设施指标）三结合的综合评估方法。

4.1. 敏感性分析与形态指标的重要性

通过敏感性分析，研究发现加入邻域上下文信息（即计算每个网格周围一定范围内指标的平均值）可显著提升模型性能，最优的邻域窗口大小为7x7。向后特征消除（BFE）过程显示，与建筑方向变化相关的指标在预测不稳定性方面作用有限，其移除反而使AUC提升了0.09。这表明，在圣塞巴斯蒂昂，建筑布局的规则性与城市不稳定性关联不强，可能与当地山地地形有关。最终，建筑总数和建筑平均面积的邻域平均值被识别为最相关的预测指标。相关性矩阵还揭示了多个形态指标（如建筑总数、建筑密度、平均邻近度）之间存在中度到高度相关性，表明从二维建筑足迹数据中可提取的独立形态信息数量有限。

4.2. 基于形态的城市不稳定性制图的统计性能与实地验证

模型在区分贫民窟与非贫民窟方面表现出高准确性（AUC 0.89, Brier分数0.09）。超过90%的贫民窟网格被分类为“高”或“极高”不稳定性。更重要的是，实地观测和人口普查数据的验证揭示了令人信服的梯度模式。随着不稳定性等级从“极低”升至“极高”，观察到以下系统变化：建筑平均面积从185 m²降至86 m²；拥有铺砌道路的家庭比例从95%降至21%；拥有游泳池的家庭比例从69%降至5%；使用耐久性屋顶材料（陶瓷或混凝土）的家庭比例从95%降至43%（更多人使用廉价的纤维水泥）；街道平均宽度从7.3米降至5.3米。人口普查数据也呈现一致趋势：拥有自来水接入的家庭比例从68%降至11%；拥有污水收集的家庭比例从74%降至21%；拥有直接垃圾收集的家庭比例从83%降至58%；平均每户卫生间数从1.5个降至1.3个。此外，“空置房屋”（多为度假房产）的比例从“极高”不稳定区的30%大幅上升至“极低”不稳定区的81%，反映了该旅游城市特有的社会空间分异。

4.3. 关于城市形态与不稳定性关联的最终思考

综合结果表明，研究所提出的方法不仅能有效区分贫民窟与非贫民窟，更重要的是，它所划分的不稳定性等级与一系列独立的住房和基础设施指标呈现出连续、一致的梯度关联。这强有力地证明了，从Google Open Buildings这类开放数据集中提取的形态指标，能够作为城市不平等（特指住房与基础设施条件）的有效代用指标。研究强调了地方背景的重要性，圣塞巴斯蒂昂低层、相对均质且空间隔离明显的城市肌理，可能促进了这种强关联的发现。在形态更复杂、功能混合的城市环境中，该方法的适用性可能需要调整并结合本地知识进行批判性解读。尽管如此，该研究通过结合开放数据、监督分类与多源验证，为在城市数据分析领域开发更可复制、可扩展的不平等评估方法提供了重要范例。

该研究得出结论，利用从Google Open Buildings提取的形态指标，结合以贫民窟位置为训练数据的机器学习模型，能够高精度地映射城市不稳定性（聚焦于住房与基础设施条件）。模型的优越性能得到了统计指标、野外观察和人口普查数据三方验证的一致支持。这些发现证实，城市形态在很大程度上与住房和基础设施条件相关联，因此可以作为一种有价值的代用指标。这项工作的方法具有可扩展性和可复制性，特别是在数据稀缺的背景下，为利用开放地理空间数据评估城市不平等提供了可行路径。然而，作者也谨慎指出，形态指标更多是“不稳定性形态”的代理而非直接测量，其应用需考虑地方具体情境，如地形、经济活动和建筑类型等。该研究对更广泛的风险分析和城市规划领域具有实际意义，例如，通过识别在环境灾害中暴露度更高的脆弱社区，为针对性的干预措施和灾害风险评估提供数据基础。最终，它推进了我们对城市形态与社会空间不平等之间量化关系的理解，为在城市科学中发展更稳健的分析工具做出了贡献。

联系信箱：

粤ICP备09063491号

热点排行