建筑能耗占全球总能耗的40%以上(Shi, Gao, Xu, Xu, & Jiang, 2024)。精确和实时的建筑能耗预测对于制定科学的能源生产和管理方案至关重要(Deb, Zhang, Yang, Lee, & Shah, 2017)。先进的计量基础设施(AMI)已在各种高能耗建筑中得到广泛应用。AMI收集了大量用于能源分析和预测的数据。因此,基于数据的方法,特别是利用神经网络的方法(Agga, Abbou, Labbadi, & Houm, 2021),已成为主流的预测模型。然而,这些方法严重依赖于可用数据的数量和质量。近年来,隐私保护法规的实施(如欧盟的通用数据保护条例(GDPR)(McKenna, Richardson, & Thomson, 2012)对数据利用提出了重大限制,给这些方法的实际应用带来了挑战。
数据加密(El-Latif, Abd-El-Atty, Mazurczyk, Fung, & Venegas-Andraca, 2020)技术可以缓解数据可用性问题,但它们需要在数据效用和隐私保护之间进行权衡(Chen, Li, Cheng, & Liu, 2023)。在建筑能耗预测的分布式多任务场景中,仅依赖数据加密可能不是明智的选择。为了解决这一挑战,联邦学习(FL)(Kone?ny et al., 2017)提供了一种有前景的解决方案。FL可以利用参与客户的本地模型信息来训练强大的模型,同时不侵犯隐私。在(Badr, Mahmoud, Fang, Abdulaal, Aljohani, Alasmary, Ibrahem, 2023b, Fernández, Menci, Lee, Rieger, Fridgen, 2022, Shi, Xu, 2022)的研究中,FL在建筑能耗预测领域展示了其成功。然而,FL在这一领域的应用面临一个主要挑战,即冷启动问题(如图1所示)。这个问题源于新建建筑的数据有限,导致这些建筑的预测性能下降。在FL框架内,这可以被视为少样本或零样本学习场景。具体来说,训练好的全局预测模型无法适应新建筑数据的分布变化。在数据受限的情况下,研究人员通常会采用迁移学习(TL)(Tang, Zhang, & Zhang, 2024; Tang, Xie, Wang, & Bie, 2023a),通过在FL框架中训练一个保护隐私的全局模型,然后对其进行微调以提高数据稀缺建筑的预测性能。然而,对于缺乏历史数据的新建建筑,TL的效果会减弱。因此,使用FL框架中的现有数据训练能够适应未知建筑数据分布变化的模型对于解决冷启动问题非常重要。这一努力需要提高模型的泛化性能,这就是所谓的领域泛化(DG)问题(Wang et al., 2021)。
然而,将现有的DG技术整合到FL框架中并不简单。例如,领域不变表示学习方法(Li, Gong, Tian, Liu, Tao, 2018, Nguyen, Tran, Gal, Baydin, 2021, Sun, Saenko, 2016)通常依赖于集中式训练环境,其中数据或其表示需要在各个领域之间共享。同样,基于元学习的方法(Balaji, Sankaranarayanan, & Chellappa, 2018)也需要访问来自多个源领域的数据,这些数据通常存储在中央服务器上(Nguyen, Torr, & Lim, 2022)。除了违反FL的分布式特性外,这些方法还存在隐私泄露的风险。已有研究尝试在FL环境中应用DG(Liu, Chen, Qin, Dou, & Heng, 2021)。在(Liu, Chen, Qin, Dou, & Heng, 2021)中,一种定制的医学图像分割方法从不同医院数据的共享连续频率空间中学习领域不变性。联邦领域泛化(FedADG)(Zhang, Lei, Shi, Huang, & Chen, 2021)通过对抗学习来提高泛化性能,该方法通过将每个分布与参考分布匹配来测量和对齐各个源领域的分布。尽管这种方法完全防止了隐私泄露,但它过于复杂,其在建筑能耗管理领域的适用性仍需验证。
在本文中,我们提出了一种与模型无关但有效的DG方法,用于FL环境中的建筑能耗预测,以解决冷启动问题。具体来说,我们提出了一种基于变分贝叶斯正则化(VBR)的表示学习方法,通过将生成的表示与参考分布对齐来学习领域不变表示,从而防止表示学习过多的领域特定知识而不泄露数据。需要强调的是,我们的工作是首次在FL环境中应用变分贝叶斯机制来实现DG,尽管这种机制在深度学习中并不罕见。为此,我们证明了VBR可以隐式地调整表示的条件分布,并建立了其与条件互信息的理论联系。这些理论基础确保了VBR的有效性。此外,我们提出了FedEM,这是一种用于FL环境中训练基于VBR的网络的交替优化方法。FedEM将优化过程分为期望步骤(专注于学习表示网络)和最大化步骤(用于优化预测网络),确保优化过程中的单调性并提高模型收敛速度。
我们工作的主要贡献如下:
•提出了一种基于VBR的表示学习方法,用于FL框架中的DG,以提高模型对未知建筑的预测性能,从而解决建筑能耗预测的冷启动问题。
•我们证明了VBR可以對表示分布进行对齐,并从DG理论的角度解释了VBR的有效性。
•我们提出了一种替代的优化算法(FedEM),用于FL环境中学习基于VBR的模型,提高了训练稳定性并加速了模型参数的收敛速度。
•在真实世界的建筑能耗数据集上验证了所提出方法(VBR-FedEM)的有效性。仿真结果表明,VBR-FedEM显著提高了对未知建筑的预测性能,有效缓解了冷启动问题。