可解释的多模态生成设计:用于构建具有弹性和可持续性的三维城市中心形态

《Sustainable Cities and Society》:Interpretable Multimodal Generative Design of Three-Dimensional Urban Hub Morphology for Resilient and Sustainable Planning

【字体: 时间:2026年05月11日 来源:Sustainable Cities and Society 12

编辑推荐:

  徐晓东|徐昊文|徐涵宇|陈泽音|赵京凯|吴涛|Frank Petzold|吴志强|周世琦 中国上海同济大学智能自主系统研究所,上海200093 摘要 快速的城市化加剧了高密度城市中心的规划挑战,这些地区中的交通需求、土地市场压力和人口动态以非线性的方式相互作用。本研究提出了一个

  徐晓东|徐昊文|徐涵宇|陈泽音|赵京凯|吴涛|Frank Petzold|吴志强|周世琦
中国上海同济大学智能自主系统研究所,上海200093

摘要
快速的城市化加剧了高密度城市中心的规划挑战,这些地区中的交通需求、土地市场压力和人口动态以非线性的方式相互作用。本研究提出了一个可解释的端到端生成框架,该框架融合了多种城市信号——交通可达性(ACC)、房价(HP)和人口热力(POPH)——以合成街区级别的三维(3D)中心形态,并支持未来的情景测试。以中国广州作为测试基地,研究了六种具有代表性的600×600米中心类型(创新中心、商务办公中心、旅游中心、金融中心、交通中心和工业中心)。对两种条件GAN替代模型(Pix2pix和CP-GAN)进行了基准测试,选择了CP-GAN,因为它在再现城市纹理、土地利用/土地覆盖模式和功能分布方面具有更高的保真度。为了超越“黑箱”生成,我们对ACC/HP/POPH进行了受控的单变量扰动(-30%至+30%),并量化了城市形态指标、土地利用/土地覆盖变化(LUCC)和兴趣点(POI)组成的类型特定响应,同时辅以2D到3D的质量重建。研究结果揭示了不同的发展模式:可达性在工业中心引起了近乎线性的集约化,但在成熟中心则呈现出饱和或U形轨迹;土地价值扰动表明,在一个中间范围内,重新开发更有利于多样化(例如,工业中心和商务办公中心),而超出这个范围时系统倾向于更加专业化(例如,金融中心和旅游中心);人口压力在工业/创新中心导致了持续的密集化,但在旅游中心则产生了阈值效应。该框架为生成、比较和解释具有弹性和可持续性的中心设计提供了可行的途径。

引言
全球城市化的加速——通常伴随着无序的空间扩张和人口迅速集中——正在将城市规划和基础设施的能力推向前所未有的极限。这些压力在城市中心区域尤为明显,在这些地区,不断增长的交通需求、加剧的土地稀缺性和快速变化的活动空间需求以高度动态的方式相互作用(X. Xu等人,2025年)。然而,由功能分区和静态规划假设塑造的现有形态不太适合这种非静态、高复杂性的条件,导致系统效率下降、生活质量下降以及长期可持续性和城市韧性面临的风险增加。先前的研究已经证明了城市流动与空间物理配置之间存在强烈的非线性耦合(X. Xu等人,2026年;Zhou等人,2025年)。由于交通和活动流具有内在的局部性和时间变化性,街区尺度提供了一个更可行的视角来解决资源分配的空间异质性问题,并揭示城市形态与社会经济活动之间的反馈。这些见解强调了开发智能的、动态响应的街区级中心布局策略的紧迫性,这些策略能够适应交通、土地和人口变化的耦合影响。为了量化城市形态的变化如何重塑城市流动,研究人员开发了一系列分析框架,将这些框架与人员、货物、信息和资本的流动联系起来。在这些相互作用中,交通流被广泛认为是空间重组的最基本驱动因素,因为它们决定了连通性并影响了日常流动和交换的可行性。正如Batty(2022年)在讨论复杂城市网络时所指出的,交通基础设施不仅仅是物理移动的通道;它还为城市中心性和可达性提供了结构基础。因此,可达性指标已成为解释形态演变的主要指标。最近的实证证据进一步表明,高度可达的区域通过降低通勤和交易成本,倾向于引导区域沿交通轴线的扩展和功能性集聚(Duranton & Guerra,2016年;R. Wu等人,2022年)。智能城市传感技术的进步提高了多模态数据融合作为在快速人口变化下监测城市流动和指导规划的核心方法(Bibri,2021年;Qu等人,2023年)。在这个更广泛的数据生态系统中,土地价格代表了交通优势的经济预测和土地稀缺性的市场表现,使其成为三维城市形态的关键决定因素。价格信号可以揭示市场机制如何通过资本化和选择性投资重塑街区级别的形态(Büchler & Lutz,2024年;Higgins等人,2024年)。然而,尽管可达性和土地价格指标捕捉了结构潜力和经济激励,但它们主要是缓慢变化的、准静态的指标,因此在代表物理发展和日常人类活动之间的动态耦合方面仍然有限(Bibri等人,2023年;Haraguchi等人,2022年)。为了解决这一差距,高分辨率的移动信号数据已被引入到城市形态研究中。通过提供关于人口密度和活动轨迹的细粒度时空信息,这些数据减少了静态代理中的滞后,使得能够更动态地理解行为模式与空间发展之间的非线性互动(W. Wu等人,2025年;F. Xu等人,2025年)。现有研究主要研究了城市形态如何塑造交通性能和土地价值。在移动性方面,Nachtigall等人(2025年)基于柏林超过30,000份旅行日记,确定目的地主作为汽车旅行的关键决定因素。Ding等人(2025年)进一步表明,适度增加开发强度、更大的土地利用混合度和改善的网络连通性可以减少拥堵并提高网络效率。Choi和Ewing(2021年)使用犹他州的比较街区样本,证明了类似网格的、连通性良好的街道网络与较低的拥堵和较少的事故相关,而以死胡同和高环路为主的网络则倾向于放大交通压力。在土地市场方面,Li和Huang(2020年)发现武汉TOD站周围的土地价格显著上升,更高的开发强度、混合用途和可步行环境放大了这种溢价。Arliani等人(2024年)将这一证据扩展到价值捕获,表明铁路中心内的更强开发强度对应于更大的土地价值增长,为以中心为导向的价值捕获政策提供了定量支持。尽管取得了这些进展,但三个限制仍然限制了空间异质性、动态城市系统的进展:(i)显示细粒度形态属性的高分辨率3D数据仍然难以获得;(ii)在时变背景下模拟形态驱动的对微观交通流和土地价值的影响在计算上代价高昂;(iii)许多文献仍然是回顾性的,强调实施后的诊断而非前瞻性干预。回顾性方法可以提供纠正行动的信息,但一旦路径依赖性建立,它们的作用往往有限。相比之下,前瞻性策略在设计阶段进行干预,使用算法模拟来评估不同形态场景的实施前的性能——从而通过早期引导实现更大的社会经济收益。解决这些差距需要多模态数据整合和方法论的进步,超越评估,转向以性能为导向的城市形态生成。

在同一时期,建筑和街区形态的自动化生成取得了快速进展,然而该领域仍然主要受规则驱动的方案和旨在提高形态性能的启发式优化的支配。典型的工作流程将基于规则的生成器与评估循环相结合——利用形状语法、自动化场地规划模型、非支配排序遗传算法(例如NSGAII)和元胞自动机(CA)等方法——在预先指定的约束范围内搜索设计空间,并迭代细化候选配置。例如,Kumalasari等人(2023年)提出了一种基于Grasshopper的参数生成-优化工作流程,在数字孪生框架内生成替代的街区形态,并比较它们的行人可达性,报告说改善了社区的步行性和日常便利性。Huang等人(2025年)将强化学习与NSGA-III相结合,搜索在密集城市环境中平衡开发效益和空间质量的布局,使空间利用率提高了31.58%。然而,基于规则和启发式方法面临持续的局限性:构建有效的规则和参数空间高度依赖于专家知识,并且经常难以结合复杂的数据驱动约束,如观察到的流动性、土地价格梯度和人口分布;在多目标权衡下,生成的解决方案往往无法同时满足形态质量、交通效率和社会公平;对参数设置的敏感性强,增加了计算成本并削弱了跨城市的泛化能力。随着深度生成方法在城市设计中的影响力日益增强,生成对抗网络(GANs)已成为城市形态生成的一个突出途径。与基于规则的模型不同,基于学习的方法可以直接从大规模城市数据中推断形态和功能之间的关系,从而在指定的交通和社会经济背景下合成不同的空间配置。例如,Jiang等人(2023年)引入了ESGAN并将站点条件嵌入GAN架构;在一个纽约案例研究中,该模型自动生成了不同设计情景下的建筑布局,并提高了对周围城市结构和土地使用约束的响应性。类似地,Ji等人(2025年)将GAN与遗传算法结合,首先模拟兴趣点(POI)网络模式,然后优化多个目标——包括覆盖范围、可达性和服务公平性——从而提高了整体城市吸引力。这些研究共同展示了深度生成模型适应复杂输入(如交通结构、人口分布和功能强度)的能力。同时,它们也暴露了一个核心缺口:仍然缺乏一个统一的框架,能够将形态生成与多维社会经济目标结合起来,特别是可达性、土地价值和人口需求的相互交织的动态。最近的努力大大提高了我们对城市形态如何与城市流动相互作用的了解,但由于三个原因,以中心为导向的形态生成在真实规划环境中仍然难以操作化:(1)多模态信号通常被孤立处理,而不是被整合成连贯的条件输入;(2)现有的3D生成通常受规则约束,而不是性能驱动;(3)工作流程通常都是回顾性的,专注于事后的评估,而不是在设计阶段就进行端到端的主动干预。为了解决这些限制,本研究提出了一种针对中心街区的增强型条件GAN,利用可达性、土地价格和人口密度作为核心驱动因素,自动生成3D城市形态替代方案,并将它们嵌入到前瞻性规划决策过程中。具体来说,本研究旨在(i)构建一个以中心为导向的多模态条件数据集,结合缓慢变化的结构性信号(例如道路/铁路可达性模式和土地价格或租金梯度)与具有时间信息但聚合的人口活动强度指标;(ii)开发一个 performance-driven的3D生成模型,在指定的“可达性-价格-人口”条件下生成可控的建筑强度、体积组成和空间组织;以及(iii)建立一个基于场景的展望性评估和比较框架,量化不同形态如何响应交通和社会经济压力的变化,并在实施前确定最佳策略和权衡边界。通过从事后调整转向前置生成和优化,所提出的框架旨在为高强度中心区域提供可行的和智能的布局路径,从而在持续的城市动态中增强其韧性和治理能力。

方法论和材料
本研究提出了一个自动化生成框架,旨在共同提高可达性和社会经济活力。如图1所示,工作流程包括三个协调的步骤。首先,本研究整合了卫星遥感观测和移动信号追踪,构建了一个描述交通可达性(ACC)、房价(HP)和人口密度(POPH)的多模态数据集。其次,本研究对Pix2pix和CP-GAN进行了基准测试。在本研究中,CP-GAN模型使用AdamW算法进行了优化,该算法具有解耦的权重衰减,这增强了训练稳定性并减轻了过拟合。优化器进一步与余弦退火学习率调度相结合,使得在整个训练过程中可以动态调整学习率。这种策略有助于在早期迭代中更广泛地探索参数空间,并通过逐渐降低学习率来减少收敛到次优最小值的风险。

未来研究
本研究开发了一个基于CP-GAN的框架,用于城市形态的生成和优化,展示了它在揭示可达性、土地价值和人口密度的变化如何影响不同类型城市中心的空间配置方面的能力。尽管如此,仍存在几个限制,并指出了未来研究的重要方向。首先,提高三维城市形态生成的精度、效率和平面细节水平仍然是必要的。

结论
本研究应用了两种生成对抗网络(GAN)替代模型——CP-GAN和Pix2pix——来整合一个包含可达性(ACC)、房价(HP)和人口热力(POPH)的多模态城市数据集。通过将异质静态驱动因素与人类活动强度的聚合代理相结合,该框架实现了高保真的城市动态模拟,生成了土地使用和土地覆盖变化(LUCC)、城市形态指标(UMI)的详细表示。

未引用的参考文献
Hu等人,2020年,Xu等人,2025年

CRedI作者贡献声明
徐晓东:撰写——原始草案,监督,软件,方法论,数据整理。
徐昊文:撰写——原始草案,可视化,方法论。
徐涵宇:撰写——原始草案,概念化。
陈泽音:软件,调查,数据整理。
赵京凯:可视化,调查。
吴涛:软件,数据整理。弗兰克·佩佐尔德(Frank Petzold):负责撰写初稿及整体监督工作。吴志强(Zhiqiang Wu):参与监督并负责概念构思。周世奇(Shiqi Zhou):负责可视化效果的制作、数据整理及监督工作。

**利益冲突声明**
作者声明,他们不存在任何可能影响本文研究结果的已知财务利益冲突或个人关系。

**致谢**
本研究得到了中国国家自然科学基金(项目编号:52508078)、国家重点研发计划(项目编号:2023YFC3807505)以及上海市自然科学基金项目(项目编号:25ZR1402513)的支持。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号