《Energy》:A meta energy model-based transfer learning methodology in cooling load predictions: office building case study
编辑推荐:
建筑能耗占一次能源总消耗的40%以上,建筑在能源效率提升与可持续发展中具有关键作用。为了释放建筑节能潜力,构建高精度建筑能耗模型对于实现建筑优化控制至关重要。然而,此类模型的开发仍面临挑战:一方面,基于物理的模型由于复杂性高且计算代价大而难以广泛部署;另一方面
建筑能耗占一次能源总消耗的40%以上,建筑在能源效率提升与可持续发展中具有关键作用。为了释放建筑节能潜力,构建高精度建筑能耗模型对于实现建筑优化控制至关重要。然而,此类模型的开发仍面临挑战:一方面,基于物理的模型由于复杂性高且计算代价大而难以广泛部署;另一方面,纯数据驱动模型在数据不足情境下存在泛化能力有限和可解释性较差的问题。为应对这些挑战,本研究提出一种基于元能耗模型(MEM,meta energy model)的新型迁移学习(TL,transfer learning)方法,以在数据稀缺条件下提升预测精度与模型泛化能力。
本研究采用开源Building Data Genome Project 2数据集中的31栋办公建筑对该方法进行验证。首先,研究人员通过EnergyPlus仿真生成百万量级合成数据集,该数据集覆盖多样化气候区与建筑设计工况,用于开发MEM。其次,MEM结合目标建筑的建筑设计参数与气象参数生成源域数据,以实施TL。最后,研究人员系统评估了两种TL策略,即权重初始化(WI,weight initialization)与特征提取(FE,feature extraction),并在五种模型上开展比较:lightGBM、lightGBM-TL、LSTM、LSTM-WI和LSTM-FE。结果表明,由MEM框架支持的有效TL策略(如WI)在无需真实历史源域数据的情况下,相较于独立的lightGBM与LSTM模型,可将预测精度提升20%–40%。研究获得的认识有助于建筑行业充分利用基础建筑信息,在具有或不具有历史数据的真实建筑应用中开发可靠的代理模型(surrogate models)。
该论文发表于《Energy》,研究聚焦于建筑冷负荷预测中长期存在的数据稀缺与源域数据获取困难问题。建筑能耗在全球一次能源消耗中占据极高比例,精确的建筑能耗模型是暖通空调系统优化控制、可再生能源并网消纳以及建筑低碳运行的重要基础。现有建模方法主要分为基于物理的模型与数据驱动模型两类。前者如EnergyPlus虽然具有较强机理性,能够刻画传热、热力学与流体动力学过程,但往往依赖详尽的建筑信息和复杂校准流程,且计算成本较高,不利于实时预测与工程快速部署。后者虽然具有灵活性和较好的应用便利性,但对高质量历史数据依赖显著,在新建建筑或信息贫乏建筑场景中容易出现泛化不足、预测误差增大以及可解释性欠缺等问题。基于此,研究人员提出一种基于元能耗模型(MEM,meta energy model)的迁移学习(TL,transfer learning)方法,旨在不依赖真实历史源域数据的条件下,通过大规模物理仿真生成可迁移源域信息,从而提升数据稀缺条件下办公建筑冷负荷预测性能与模型泛化能力。
研究人员开展的核心工作是构建一个由大规模EnergyPlus仿真支撑的MEM框架,并利用该框架为目标建筑生成源域数据,再分别通过权重初始化(WI,weight initialization)与特征提取(FE,feature extraction)两类TL策略,将源域知识迁移到目标建筑预测任务中。论文以Building Data Genome Project 2中的31栋办公建筑为真实案例,系统比较lightGBM、lightGBM-TL、LSTM、LSTM-WI和LSTM-FE五类模型在不同数据稀缺情境下的表现。研究结论表明,基于MEM生成源域数据的TL方法能够显著提高冷负荷预测精度,其中WI策略整体优于FE策略;在不需要真实历史源域数据的前提下,相比独立建模的lightGBM与LSTM,预测精度提升约20%–40%。这一结果说明,建筑基础设计信息与气象信息可被有效转化为可复用的源域知识,为实际工程中缺少历史数据的建筑提供可扩展、可复用的代理建模路径,对推动AI驱动建筑控制、提升能效和降低碳排放具有重要意义。
从方法上看,论文主要采用了三个关键技术步骤。其一,研究人员基于3类EnergyPlus原型办公建筑(大、中、小型),围绕17个关键参数进行参数扰动仿真,构建超过170万样本的物理信息合成数据集,用以训练MEM。其二,研究人员从Building Data Genome Project 2开放数据集中筛选31栋具有2016—2017年完整逐时冷冻水消耗数据的办公建筑,作为目标域样本队列。其三,研究人员利用MEM根据目标建筑的标准设计信息与气象参数生成源域数据,并在此基础上实施WI与FE两种TL策略;随后采用网格搜索(grid search)与五折交叉验证对lightGBM、LSTM及其TL扩展模型进行训练与超参数优化,以比较不同模型在真实建筑中的泛化表现。
在研究结果部分,论文首先在“Methodology”中提出了一个三步式模拟—真实数据融合框架。该部分的关键结论是:研究人员通过多参数EnergyPlus仿真建立了一个大规模、具备物理信息约束的合成数据基础,从而解决传统TL依赖真实有限历史源域数据的问题。根据文中描述,3种原型办公建筑通过改变17个关键参数形成了超过1.7 million样本的元能耗大数据,为后续MEM开发提供了统一而可扩展的训练基础。这一部分说明,本研究不是针对某一单体建筑建立高成本校准模型,而是构建一个可跨建筑复用的通用MEM,从根本上增强了方法的可迁移性与工程适用性。
在“Building cases selection and description”部分,研究人员说明了目标建筑样本的来源与筛选标准。目标数据来自Building Data Genome Project 2,该数据集包含2016年与2017年的逐时建筑能耗与天气数据,以及气候区、地理位置和基础建筑信息。研究人员在清洗后的开放数据中筛选出31栋在2016—2017年具有完整逐时冷冻水消耗记录的办公建筑,并覆盖不同天气站点。该结果表明,本文的案例验证建立在跨气候、跨建筑样本的真实数据基础之上,因此能够较好反映方法在实际办公建筑冷负荷预测中的应用潜力。
在“Results and discussions”部分,研究人员对五类模型进行了系统训练、验证与比较。文中指出,lightGBM、lightGBM-TL、LSTM、LSTM-WI和LSTM-FE均采用网格搜索与五折交叉验证进行超参数优化,以缓解过拟合,并选取代表性建筑T03展示训练与验证结果。该部分的核心发现是:引入MEM生成源域数据后,TL模型整体优于非TL基线模型,且不同TL策略间存在明显差异。尤其是WI策略,通常表现出最稳健的性能提升,说明在目标域数据较少时,利用源域预训练权重对目标模型进行初始化并整体微调,更有利于保留跨建筑共享的负荷变化规律,同时适应具体建筑特征。相较之下,FE策略虽然也能迁移一定知识,但在多数场景下不如WI有效,说明冻结部分层进行特征复用可能限制了目标建筑特异性模式的学习能力。
从整体性能比较看,研究结果表明,由MEM框架支持的有效TL策略可以在无需真实历史源域数据的情况下,将预测精度较独立lightGBM与LSTM提升20%–40%。这一结论非常关键,因为传统TL在建筑能耗预测中的瓶颈往往不在于迁移算法本身,而在于缺乏与目标建筑足够相似、且质量可靠的源域历史数据。本研究通过MEM绕开了这一前提约束,证明利用物理仿真和基础建筑参数同样可以形成高价值、可迁移的知识载体。论文还指出,该方法对于有无历史数据的真实建筑应用均具有参考意义,有助于在工程实践中快速建立可靠代理模型。
论文讨论部分的核心内容可概括为以下几点。首先,研究人员强调,TL效果高度依赖源域与目标域相似性,而MEM正是通过输入目标建筑的设计参数与气象条件来生成定制化源域数据,从而提高这种相似性。其次,相较于依赖真实历史源域建筑的方法,本文框架在实际应用中更具可部署性,因为真实多建筑历史数据往往难以获取,而标准设计信息和天气预报参数相对容易获得。再次,本文方法兼具物理信息与数据驱动优势:既避免了逐栋建筑高成本物理校准,也缓解了纯数据驱动模型在样本不足时的泛化缺陷。因此,该研究为建筑负荷预测提供了一种兼顾精度、可扩展性与工程可实施性的中间路径。论文同时通过不同模型与策略的对比,为工程应用中的模型选择提供了经验依据,即在多数场景中优先考虑WI策略。
论文结论部分可译为:本文提出了一种新型基于元能耗模型(MEM)的迁移学习(TL)方法,以增强数据稀缺条件下建筑负荷预测性能。通过整合EnergyPlus生成的合成数据,研究人员开发了一个MEM,并利用该模型为目标建筑的TL生成源域数据。基于真实的Building Data Genome Project 2数据集,研究人员构建并测试了5种模型,即lightGBM、lightGBM-TL、LSTM、LSTM-WI和LSTM-FE。结果表明,基于TL的模型能够显著提升预测性能,其中由MEM支持的有效迁移策略在无需真实历史源域数据的前提下即可取得优于传统独立模型的效果。整体而言,该研究证明了MEM在解决传统TL源域数据短缺或失配问题方面具有明显优势,并为建筑领域在数据不足情境下开展可扩展冷负荷预测提供了新的技术路径。