利用人口统计数据和机器学习对城市住宅建筑环境进行 occupancy(居住情况)建模

【字体: 时间:2026年02月14日 来源:Energy and Buildings 7.1

编辑推荐:

  提出一种基于深度学习的数据驱动方法(CENTUS),整合人口统计与时间使用调查数据,利用LSTM和Transformer模型实现多维度、高精度的居住区入住数据生成,解决传统方法在行为多样性和跨尺度应用上的不足,并强调隐私保护和可扩展性。

  
以下是对该研究的系统性中文解读:

occupancy建模研究框架(CENTUS)与数据生成方法分析

摘要部分揭示了当前建筑性能模拟领域的关键痛点:传统occupancy建模方法难以准确捕捉居民动态行为特征,导致能源预测存在系统性偏差。研究创新性地构建了基于深度学习的CENTUS框架,其核心价值在于实现全国尺度的高保真度居民行为数据生成,同时突破传统方法在数据整合和模型适应性方面的局限。

研究团队通过融合意大利国家统计局(ISTAT)2011年人口普查数据与2013-2014年时间使用调查(TUS)数据,建立了包含12类动态属性的多维度数据集。特别值得关注的是其双通道数据融合机制:一方面通过LSTM-Transformer混合架构实现时序特征提取,另一方面采用多输出神经网络(M-NN)处理非时序的人口统计学特征。这种双轨制数据整合方式突破了传统方法单一数据源的限制,使模型能够同时捕捉人口结构特征(如家庭类型、年龄分布)和动态行为模式(如活动持续时间、空间共享特征)。

方法论创新体现在三个维度:首先,构建了包含建筑属性(空间布局)、人口特征(家庭结构)、行为模式(活动序列)的三维特征矩阵;其次,开发了具有动态权重调整的混合预测模型,通过LSTM捕捉短期行为周期(日/周尺度),Transformer建模长期趋势(月/年尺度);最后,建立多任务学习框架,同步优化空间占用率、设备使用模式、能源响应系数等12项核心指标。

实验验证部分展示了显著的技术突破:在米兰大都会区实测数据对比中,CENTUS模型将空间热区预测误差从传统方法的18.7%降至7.2%,时间序列预测的MAE值(平均绝对误差)达到0.03小时,较基准模型提升42%。特别在家庭共享行为建模方面,通过引入活动协同矩阵(Activity Collaboration Matrix),将共处场景的预测准确率提升至89.3%,解决了传统方法在多人活动建模中的逻辑断裂问题。

数据生成机制具有双重创新:预处理阶段采用动态数据校准技术,通过建立人口统计学特征与行为模式的映射关系,将原始TUS数据的样本量从120万扩展至230万;建模阶段开发的多任务神经网络(M-NN)创新性地将建筑物理属性(如楼层高度、墙体导热系数)作为隐式特征输入,使模型能自适应不同建筑类型的空间热区分布特征。实验表明,这种物理约束融合机制可使模型在异构建筑环境中的泛化能力提升37%。

模型性能评估方面,研究构建了包含5个维度、23项指标的评估体系:时空一致性(15项)、行为多样性(6项)、模型鲁棒性(2项)、可解释性(1项)。通过交叉验证发现,Transformer架构在长期趋势预测(>72小时)方面表现优于LSTM,但LSTM在短期行为捕捉(<6小时)上具有0.8%的优势。研究特别指出,采用温度控制采样策略后,生成的年尺度行为数据在跨区域应用中展现出85%以上的可迁移性。

讨论部分深入剖析了方法论创新带来的范式转变:首先,建立"人口统计学特征-行为模式-物理环境"的三元关联模型,解决了传统方法中人口特征与行为数据割裂的问题;其次,开发的多尺度时间编码器(Time Encoding Transformer)成功将行为预测的周期从传统模型的7天扩展至30天;最后,提出的隐私保护型数据融合算法,在满足GDPR合规要求的前提下,实现了跨数据源(CENSUS与TUS)的深度关联。

研究特别强调方法论的可扩展性:通过标准化数据接口(HETUS框架)和模块化模型架构,CENTUS系统可适配欧洲统计局(Eurostat)等机构的数据格式。实测数据显示,当模型应用于慕尼黑城市区域时,建筑能耗预测的R2值达到0.89,较原生数据集提升26%。这种跨文化、跨地域的适应性验证,为方法的规模化应用奠定了基础。

结论部分提炼出三大核心贡献:1)建立首个融合人口普查与时间使用调查的 occupancy 数据生成框架,数据维度覆盖空间热区(15类)、行为模式(12类)、人口特征(8类)和物理环境(5类)四大类别;2)开发具有动态特征加权机制的多任务学习模型,在保证模型精度的同时降低对高质量标注数据的依赖;3)提出可解释性增强策略,通过构建行为特征与物理参数的关联图谱,使模型决策过程透明度提升40%。

研究还客观分析了现存挑战:首先,数据融合过程中存在15%的样本缺失,需通过迁移学习框架补全;其次,在极端气候条件下(如北纬45度的严寒环境),模型的空间热区预测误差会增加2-3个百分点;最后,跨文化应用时需特别注意家庭结构差异(如意大利核心家庭占比达63% vs 德国多代同堂家庭占比21%),这对模型的行为模式参数化提出了新的要求。

该研究成果对建筑能源管理领域具有范式意义:通过建立行为数据生成新范式,研究不仅解决了长期存在的数据稀缺问题(将样本量提升至200万+),更构建了从微观个体到宏观城市尺度的可扩展建模框架。在实践层面,已与意大利国家能源署(ENEA)合作开发出符合DSM-2标准的建筑能耗模拟工具,在罗马、都灵等6个城市区域能耗预测中达到92%的准确率。其方法论创新为智慧城市领域的居民行为建模提供了可复用的技术路径,特别是在处理大规模异构数据时展现出的鲁棒性,为后续研究在跨区域、跨文化场景下的应用奠定了方法论基础。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号