《Journal of Building Engineering》:Co-LLM: A retrieval-augmented language model framework for chiller optimization control
编辑推荐:
针对大型建筑HVAC系统中 chillers高能耗问题,提出Co-LLM框架,结合RAG技术检索行业标准和历史数据,通过选择性重校准优化子策略,并设计RAG-tuned探索算法实现多轮优化。医院实测表明其节能1.9%,COP提升且抑制92.7%的舒适性骤降。
刘光宇|王云哲|卢悠|吴洪杰|刘凯|刘兰辉|陈建平|傅启明
中国江苏省苏州市苏州科技大学电子与信息工程学院,215009
摘要
在大型建筑的暖通空调(HVAC)系统中,特别是在气候炎热、冷却需求较大的地区,冷水机占据了大部分能源消耗。其运行受到多种因素的影响,包括室内条件和室外环境因素。因此,优化冷水机控制策略仍然是建筑节能的核心挑战,尤其是在冷却需求较高的环境中。迄今为止,很少有研究将大型语言模型(LLMs)与领域知识结合用于冷水机控制。本文提出了一种基于检索增强型合作LLM(Co-LLM)的控制框架。该框架根据行业标准、专家经验和运行日志构建了特定于冷水机的知识库。通过检索增强生成(RAG)机制检索高质量的先验策略,然后选择性地重新校准那些受外部干扰显著影响的子策略。最后,使用复合能量-舒适度指标进行多轮优化。在泰州市一家三级医院的中央HVAC系统上的实地研究表明,Co-LLM相比传统的专家策略节能1.9%,并且系统的COP(Coefficient of Performance)高于所有其他基准方法,表现优于主流控制方法。特别是,检索增强机制有效抑制了92.7%的舒适度下降,显著提高了控制系统的鲁棒性。
引言
建筑能耗约占全球能源使用的20%–40%,其中近一半来自供暖、通风和空调(HVAC)系统。在热带和亚热带地区的大型建筑中,人们对冷却的需求通常远超过对供暖的需求。在HVAC系统中,冷水机是主要的能源消耗部件。与冷冻水泵、风扇和冷却塔相比,冷水机占HVAC能耗的50%以上[1]。优化其运行对于实现显著的节能至关重要。虽然被动冷却方法(如风扇)可以在办公楼中达到与空调相同的冷却效果,从而降低能耗[2],但提高冷水机的运行效率对节能具有重要意义。然而,随着HVAC系统设备的老化,运行效率会下降。理论上升级设备是最佳解决方案,但也面临高成本的问题。尽管被动冷却方法(如风扇)可以有效替代冷水机的冷却效果[2],但在大型建筑中优化控制策略通常被认为是更具经济可行性和实际操作性的替代方案。
在实践中,控制策略优化在决定冷水机在不同负载和环境条件下的运行效率方面起着核心作用。在HVAC控制策略优化领域,通常采用三种代表性方法:基于规则的控制(RBC)、基于模型的控制(MBC)和强化学习(RL)。其中,由于简单性、低实施成本和与老旧HVAC基础设施的兼容性,RBC仍然是现有建筑中最广泛采用的策略。RBC依赖于手动设计的逻辑规则(如预定义的阈值和切换条件)来调节冷水机的运行。然而,RBC没有明确模拟HVAC系统的动态行为,难以适应变化的冷却负载和复杂的运行条件。这种限制可能导致冷水机运行不佳,例如频繁的启停循环或在高效区域外持续运行,进一步增加HVAC系统的能耗[3]。
此外,MBC方法在设备老化情况下缺乏适应性,并且受到计算开销和建模错误的影响,尤其是在大型和老旧的HVAC系统中。随着大数据技术和计算能力的不断发展,作为数据驱动方法的强化学习(RL)逐渐成为HVAC控制策略优化的主流方法[4]。它通过代理-环境交互学习最优控制策略,使RL具有很强的适应性,能够应对设备老化和环境变化等问题。尽管有这些优势,RL的一个不可避免的问题是样本效率低[5]。从头开始训练一个RL代理通常需要数百万次交互步骤,导致训练周期过长——特别是对于HVAC领域的策略优化任务,可能需要数月甚至数年,并且部署成本极高。因此,在实际问题中,构建高效且成本效益高的控制器至关重要,以在适应性和实际可行性之间取得平衡。
近年来,随着大型语言模型(LLMs)的发展,它们展示了非凡的逻辑、认知和智力能力[6][7]。同时,它们对许多复杂概念有深刻的理解,表现出极其详细的推理能力,并能够访问医疗、经济和社交媒体等各种方面的信息库。这种出色的信息整合能力和良好的推理能力使得LLMs成为HVAC领域的专业工具。2023年,微软亚洲团队开发了一种使用LLM管理HVAC系统的方法(上下文学习控制),其性能可与强化学习PPO方法相当或更好[8]。值得注意的是,这种方法不需要训练,完全依赖于LLM的固有推理能力,表明LLM可以通过提示有效学习调节HVAC设备。然而,这种方法仍存在一些局限性。特别是,它缺乏选择性学习能力,导致LLM无法准确区分劣质样本,从而做出不符合基本逻辑的决策[9]。虽然参数高效的微调方法可以解决这些问题,但对具有数十亿参数的LLM进行微调通常成本过高,如果使用基于API的LLM,则无法进行微调[10]。一种更用户友好的方法是应用带有检索增强生成(RAG)技术的LLM,该方法与微调后的LLM不同,因为它不需要对模型参数进行大规模调整。相反,它通过外部检索模块使LLM能够通过外部信息注入获得领域特定知识[11]。这种方法更具成本效益,且无需任何训练步骤,还具有可追溯的信息源优势,有助于缓解独立LLM中常见的幻觉问题。需要强调的是,检索增强生成(RAG)的优势只有在高质量和结构良好的领域知识库的支持下才能充分发挥。
因此,本研究专注于HVAC系统中冷水机运行方法的优化,并提出了一种名为基于合作LLM的控制框架(Co-LLM)的新框架。它结合了包含冷水机运行策略、ASHRAE标准和专家知识的领域知识库,并使用检索增强生成(RAG)来实现环境状态和控制策略之间的动态匹配。通过利用大型语言模型(LLMs)的上下文推理能力,Co-LLM无需显式物理建模即可对敏感子策略进行自适应校准。为了进一步改进策略优化,本文提出了RAG调优的探索算法,该算法利用动作空间离散化和选择性重新校准方法来优化敏感子策略。
本文的主要贡献可以总结如下:
部分摘录
传统控制方法
用于控制冷水机的传统方法包括基于规则的控制(RBC)和基于模型的控制(MBC)。RBC围绕手动设计的规则库展开,PID控制是一个典型的例子。它使用比例(P)、积分(I)和微分(D)三个组分的线性组合来控制冷水机的输出。Sanama等人应用了改进的PID来提高冷冻水风机盘管单元在控制温度、湿度和二氧化碳方面的性能
方法论
所提出的Co-LLM是一种创新的大型语言模型,它使用工程数据和专家知识优化控制策略,特别是用于优化HVAC系统中的冷水机控制策略。如图1所示,Co-LLM由三个部分组成:冷水机控制知识库、选择性重新校准和RAG调优的探索。在进入控制过程时,首先进行基于检索的初始化,以获取最
仿真环境的构建
在本节中,我们讨论了我们提出方法的评估,提供了实验设置的详细描述、进行的测试以及获得的结果。
实验设置
在本节中,我们将提出的Co-LLM与三种常用的冷水机控制方法进行比较:RBC控制、基于模型的控制和基于DQN的控制。为了全面评估所提出方法的有效性,我们关注三个不同的方面:整体性能、节能性能和运行性能。
结论与未来工作
本文研究了HVAC系统的方法优化,特别关注冷水机控制。为此,我们提出了一种基于检索增强型合作LLM的控制框架(Co-LLM)。Co-LLM首先构建了一个语义向量化知识库,将ASHRAE标准、历史运行策略和专家日志数据编码为高维、可搜索的向量,代表冷水机调度专业知识。在每个控制周期中,该框架使用基于检索的初始化
CRediT作者贡献声明
刘光宇:撰写——原始草稿、软件、方法论、调查、概念化。王云哲:撰写——审阅与编辑、验证、调查、概念化。卢悠:撰写——审阅与编辑、验证。吴洪杰:撰写——审阅与编辑、验证、监督。刘凯:撰写——审阅与编辑、验证。刘兰辉:撰写——审阅与编辑、验证、资源。陈建平:撰写——审阅与编辑、监督、方法论、概念化。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能会影响本文报告的工作。
致谢
本工作得到了江苏省建筑碳中和技术工程研究中心基金会(编号:JZTZH2023-0402)和国家自然科学基金(编号:62372318)的财政支持。