“人在回路”(Human-in-the-Loop):结合虚拟乘客行为模拟与语义决策机制提升建筑能源效率
《Energy and Buildings》:Human-in-the-Loop: Integrating Virtual occupant behavior simulation and semantic Decision-Making for building energy efficiency
【字体:
大
中
小
】
时间:2026年02月22日
来源:Energy and Buildings 7.1
编辑推荐:
个性化虚拟occupant建模与LLM增强型建筑能耗仿真研究
刘德丽|周晓萍|李宇
北京建筑大学,中国北京 100044
摘要
标准的建筑模拟通常依赖于确定的“标准人物”假设,未能捕捉到人类热偏好中的多样性,从而加剧了能源性能的差距。为了解决这个问题,本研究提出了一种“调查到模拟”的框架,该框架使用经过微调的大型语言模型(LLM)构建个性化的、基于意图的虚拟居住者。我们根据真实世界的调查数据将居住者分为“节能型”和“追求舒适型”两类,并在Gemma-1B模型上采用参数高效微调(PEFT)策略,并结合思维链(CoT)推理来显著提高对物理约束的遵守程度。在EnergyPlus中的联合模拟结果显示出不同的行为轨迹:节能型居住者优先选择被动适应服装,以最小的能源消耗(3.0–5.0千瓦时)维持热平衡,而追求舒适型的居住者则积极调节暖通空调(HVAC)设定点以确保中性温度,导致能源需求显著增加(>8.0千瓦时)。研究表明,语义LLM代理可以有效弥合静态行为模型与动态建筑性能之间的差距,为以人为中心的HVAC设计提供了一个可靠的测试平台。
引言
建筑环境是全球能源需求的主要驱动力[1],[2],其中供暖、通风和空调(HVAC)系统占据了相当大的能耗比例[3]。随着全球对碳中和的关注[4],[5],优化HVAC运行已成为一个关键的研究前沿。传统的控制策略,如基于规则的控制(RBC)[6],[7]和比例-积分-微分(PID)控制[8],[9],通常依赖于静态设定点(例如,在运行时间内保持固定温度)。尽管这些方法很稳健,但它们本质上是“以建筑为中心”的,而不是“以人为中心”的。它们将居住者简化为被动的热负荷,而没有认识到他们是有复杂热偏好和适应行为的主动主体。这种概念上的不一致经常导致“性能差距”——即模拟结果与实际运行之间的差异——从而导致运营效率低下和居住者舒适度受损。
(2)当前行为建模的局限性
为了弥合这一差距,研究人员尝试将居住者行为(OB)整合到建筑性能模拟(BPS)[10],[11],[12]中。然而,现有方法面临重大挑战:
1.“标准人物”谬误:大多数模拟依赖于基于平均数据的确定性时间表或随机模型[13],[14]。这种方法忽略了人类个性的丰富多样性。实际上,一个“节俭”的用户可能会容忍较大的温度范围以节省能源,而一个“敏感”的用户则可能要求严格的热控制。忽视这些“人物特征”会导致不现实的模拟结果。
2.缺乏语义理解:尽管基于数据的方法,如深度强化学习(DRL)在个性化控制方面显示出潜力[15],[16],[17],但它们通常作为“黑箱”运行。它们将数值状态映射到动作,而不理解背后的意图。例如,DRL代理可能会学习在天气炎热时降低温度,但它无法理解用户由于环保意识而更愿意先脱掉外套的细微差别。
3.可扩展性问题:训练个性化模型通常需要为每个特定用户提供大量的历史数据[18],这对于大规模部署来说是不切实际的。迫切需要一种能够从小规模调查推广到广泛人群行为的方法。
(3)大型语言模型(LLMs)在控制领域的崛起
大型语言模型(LLMs)的出现为建筑控制[19],[20],[21]提供了变革性的机会。最近的研究展示了LLMs在生成模拟脚本[22],[23]、解释建筑管理系统(BMS)的自然语言命令[24],[25]以及通过生成代理模拟居住者活动[26]方面的潜力。与数值模型不同,LLMs具有内在的“常识”推理能力,并能处理语义信息。然而,直接部署通用的、基于云的LLMs(如GPT-4)进行实时闭环HVAC控制仍然存在问题。大型模型的高推理延迟和计算成本阻碍了它们集成到需要快速响应的边缘控制循环中。依赖基于API的模型会引发关于居住者数据的重大隐私问题。因此,存在一个关键的研究空白:需要从依赖通用云智能转向适应小型语言模型(SLMs)[27]。这些SLMs必须经过微调,以作为专门的、基于物理的“数字居住者”,能够在本地运行,提供可解释的、基于意图的、物理上有效的控制决策。
为了更好地将我们的工作置于快速发展的基于大型语言模型(LLM)的自主代理领域中,我们与来自主要AI和HCI会议的几项最先进的研究进行了比较分析,总结在表1中。最近的研究已经成功展示了LLM代理在模拟人类社会和心理动态方面的高行为保真度。例如,Xie等人[28]验证了LLM代理可以在经济游戏中与人类的信任行为保持一致,而Newsham等人[29]和Sreedhar等人[30]探讨了人格特征和合作机制如何影响代理在抽象战略场景中的决策。此外,Wan等人[31]展示了LLMs在增强虚拟现实环境中的社交互动方面的潜力。
然而,仍存在一个重要的研究空白:虽然这些研究在模拟社会心理行为方面表现出色,但它们通常在虚拟或抽象的领域中运作,忽略了物理世界的约束。相比之下,我们的研究通过将基于LLM的意图驱动代理整合到网络物理建筑能源系统中来弥合这一差距。通过采用思维链(CoT)机制来强制执行热力学边界,我们的框架确保了基于个性的决策(例如,热舒适度调整)是物理上可行的,比现有的仅关注社会的模拟提供了更真实的人类-建筑互动表示。
在这项研究中,我们提出了一种新颖的“调查到模拟”框架,用于构建多样化的、基于意图的HVAC代理。我们不是依赖于合成假设,而是将代理基于从调查数据中得出的真实世界人类偏好。我们的方法论代表了从“预测数字”到“理解意图”的范式转变。
本文的主要贡献如下:
1.基于人物特征的行为聚类:我们引入了一种数据驱动的方法来根据居住者在服装调整和HVAC使用之间的权衡决策,将他们分类为不同的类型(例如,环保型、舒适型、被动型)。这为个性化建模提供了细致的基础。
2.基于意图的神经符号代理:我们微调了一个轻量级的LLM(Google Gemma-1B)作为代理的认知核心。至关重要的是,我们实现了一种思维链(CoT)[32]推理机制,在做出决策之前验证物理边界(例如,检查服装是否已经最小化)。这种架构有效地减少了小型模型中常见的幻觉现象,同时保留了它们的语义推理能力。
3.端到端评估:我们使用EnergyPlus在动态联合模拟环境中展示了这些代理的有效性。通过用我们的LLM驱动代理替换静态时间表,我们量化了不同行为特征的重大影响——揭示了节能型居住者的被动适应策略与追求舒适型居住者的高能耗需求之间的明显权衡——为以人为中心的HVAC设计提供了有力的见解。
方法的工作流程
该方法的工作流程
本研究建立了一个五步的“调查到模拟”框架,如图1所示,旨在将静态行为数据与动态建筑控制联系起来。工作流程从数据采集(步骤1)开始,使用基于场景的问卷和中国热舒适度数据集来捕捉真实的人类热偏好。这些数据驱动两个并行过程:虚拟传感器训练(步骤2),使用随机森林回归器将环境变量映射到PMV
实验设置
为了验证所提出框架的有效性和计算效率,所有实验都在一个旨在代表可访问的消费者级硬件约束的本地工作站上进行。具体来说,模型微调和推理过程在一个配备了8GB GDDR6视频内存的NVIDIA GeForce RTX 3060 Ti GPU上执行。软件开发和集成环境建立在Visual Studio Code(VS Code)平台上。
讨论
本研究整合了基于大型语言模型(LLM)的代理,以解决传统建筑性能模拟(BPS)中的一个关键缺陷:对“标准人物”假设或静态基于规则的控制的依赖。以前的方法经常忽略人类个性的多样性,导致预测和实际能源使用之间的“性能差距”。通过实施“调查到模拟”框架,
结论
本研究提出并验证了一种新颖的“调查到模拟”框架,该框架利用小型语言模型(SLMs)的参数高效微调来构建多样化的、基于意图的虚拟居住者。通过将经过微调的Gemma-1B代理与EnergyPlus模拟环境集成,我们成功弥合了静态调查数据与动态建筑性能模拟之间的差距,使得在物理约束下对复杂的人类决策过程进行建模成为可能。
CRediT作者贡献声明
刘德丽:写作 – 审稿与编辑,撰写原始草稿,方法论,概念化。周晓萍:写作 – 审稿与编辑,监督,方法论,概念化。李宇:方法论,概念化。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号