: 打造EMPIRE：一种基于数据驱动的分层代理模型，用于提升时空人-机交互建模的普适性与可解释性

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月02日 来源：Computers, Environment and Urban Systems 8.3

编辑推荐：

　　本文针对当前建筑环境设计中，传统基于代理的模型（ABM）过度简化人类行为的动态性和适应性，导致模型在跨场景泛化能力上的不足。作者提出EMPIRE框架，该框架集成了模仿学习（IL）、强化学习（RL）和图神经网络（GNN），构建了一个数据驱动、分层的时空行为预测模型。通过在公园场景下的案例研究，证明EMPIRE能够成功地将学习到的行为模式迁移到新的空间布局中，为设计以人为本的响应式环境提供了新工具。

我们花费了大约90%的时间生活在建筑环境中——我们的家、办公室、公园、交通系统。这些环境的设计，深刻地影响着从获取机会、公共健康到社会资本形成和应对突发中断的韧性等个体和社区的福祉。然而，尽管建筑、交通等基础设施越来越多地由数据和计算模型指导，但这些模型常常过度简化了它们旨在服务的主体——人类。它们通常赋予代理人以静态或假定的行为规则，无法捕捉现实世界行为的动态、适应性和情境敏感的本质。这个持续的建模差距，限制了我们设计真正能够支持有意义的人类和社区成果的空间的能力。

特别是在社会基础设施（如公园、图书馆、交通枢纽）中，其布局、可见性和可供性常常未能支持那些形成信任和互惠基础的、随意的、重复的互动。因此，即使物理基础设施存在，其社会功能也未能实现。这揭示了一个关键的设计缺陷。同样，在医疗保健环境的仿真模型中，人类运动常常被描绘为统一和可预测的，严格遵循预定时间表；在疏散和人群仿真中，基于细胞自动机的方法难以表示异构的决策策略和精细空间配置的影响。这类简化忽视了个人差异和动态互动，而这些因素恰恰会显著影响结果（如护理质量、疏散效率）。

为了突破这些限制，来自卡内基梅隆大学的Maral Doctorarastoo、Katherine A. Flanigan、Mario Bergés和Christopher McComb在《Computers, Environment and Urban Systems》期刊上发表了他们的研究成果，提出了一个名为EMPIRE（Empirical Modeling of People in Responsive Environments，响应式环境中的人的实证建模）的新框架。这个框架旨在构建一个数据驱动的、分层的模型，用于预测动态物理环境中的人类时空行为，其核心目标是实现基于场景的泛化能力。EMPIRE的灵感来源于认知科学、环境心理学和机器学习对人类决策认知特性的见解，其结构是分层的，顶部是战略规划，底部是执行规划。

为了开展这项研究，研究人员在EMPIRE框架中整合了多种关键技术。首先，他们采用了模仿学习来从现场数据中学习人类的高级战略活动（如下一步做什么活动，持续多久），避免使用手工制定的启发式规则。其次，他们利用强化学习来生成基于环境解释和偏好的适应性执行策略，使代理能够通过试错在与动态环境的交互中学习最优行动。最后，为了捕捉个体在执行同一活动时的独特偏好（例如，一个人可能喜欢阳光照射的座位，而另一个人则寻求阴凉处），他们引入了图神经网络。GNN能够对个体感知到的空间特征、环境条件、附近人员及其相互关系进行编码，从而为每个个体生成一个位置特异性的“合意性”表面，这个表面作为RL规划的奖励景观。这三层（IL, GNN, RL）共同构成了代理的“决策核心”，在训练阶段分别使用不同的数据流（粗粒度和细粒度数据）进行独立训练，在仿真阶段则紧密耦合，形成一个闭环决策循环。

框架概览与核心组件

本研究提出的EMPIRE框架包含两个主要阶段：训练阶段和仿真阶段。在训练阶段，传感器网络从仪器化环境中收集多模态观测数据，并将其处理为粗粒度和细粒度两种数据流，分别用于训练战略规划（IL）、偏好建模（GNN）和执行力规划（RL）模型。在仿真阶段，训练好的代理决策核心被部署到模拟环境中，代理根据当前观察，通过IL选择活动，GNN生成奖励图，RL决定具体行动，形成一个动态交互的闭环系统。该框架将环境抽象为物理空间、社会空间和环境空间三个相互关联的部分，并使用规则网格世界进行表示以实现计算可操作性。

案例研究：口袋公园中的行为模拟

为了验证EMPIRE的场景泛化能力，研究团队进行了一项案例研究，模拟人类在代表性社会基础设施（口袋公园）中的行为。研究中并未使用真实的人类观测数据，而是采用了受已有工作启发、基于详细规则生成的合成行为数据作为“真实轨迹”。他们设计了六个不同的公园布局，并采用“留一布局”交叉验证策略进行评估，即每次使用五个布局的数据训练模型，然后在第六个未见过的布局上进行测试。

模型评估与泛化性能

研究对EMPIRE在每个被保留的公园布局中的性能进行了系统评估，将模拟的代理行为与合成的真实轨迹数据进行比较。实验结果表明，EMPIRE成功地将学习到的行为模式迁移到了新的、未见过的空间场景中。这证明了其分层架构（战略目标稳定，执行策略自适应）和GNN对空间关系编码的有效性，共同赋予了模型强大的场景泛化能力。具体性能指标在论文相关部分给出。

研究结论与意义

本研究的核心贡献在于提出了EMPIRE这一创新的、数据驱动的人类时空行为建模框架。该框架通过分层集成模仿学习、图神经网络和强化学习，巧妙地模拟了人类“战略规划-偏好评估-执行调整”的决策过程。其关键优势在于：

1.
数据驱动与实证基础：通过IL和GNN直接从（合成）数据中学习行为模式和个体偏好，减少了对人工制定规则的依赖，提高了模型的真实性。
2.
强大的场景泛化能力：分层的模块化设计使得高级行为目标（由IL学习）能够相对稳定地跨场景迁移，而低级的执行策略（由RL学习）可以灵活适应新的空间布局和社会动态。GNN对图结构关系的捕捉进一步增强了模型对未知空间配置的适应力。这在“留一布局”测试中得到了验证。
3.
可解释性与模块性：决策过程被分解为战略、偏好、执行三个相对清晰的层次，增加了模型的可理解性。同时，每一层理论上都可以用更先进的算法替代，保持了框架的灵活性和未来扩展性。

这项工作表明，将人类重新定位为动态系统的驱动者和受益者，并利用先进的机器学习技术构建具有适应性和泛化能力的行为模型，是可能的。EMPIRE框架为建筑环境、城市规划、应急管理乃至虚拟现实等领域，提供了一个强大的新工具，用于模拟和预测复杂、动态的人类-环境互动，从而支持设计出更加人性化、高效和富有韧性的空间与系统。未来的工作可以探索在真实观测数据上训练和验证EMPIRE，并将其应用于更广泛的领域和更复杂的多智能体交互场景中。

联系信箱：

粤ICP备09063491号

热点排行