大型语言模型驱动的建筑能耗模型生成
《Energy and Buildings》:Large language model–driven building energy model generation
【字体:
大
中
小
】
时间:2026年03月06日
来源:Energy and Buildings 7.1
编辑推荐:
建筑能耗模型自动化生成研究:基于Gemma-3-4B-IT的双阶段微调方法有效提升EnergyPlus IDF文件几何精度与约束符合度,通过监督微调建立文本-模型映射,再利用群体相对偏好优化增强几何一致性,最终在300样本测试集上实现85%窗户几何准确率和78%端到端有效性,降低专业建模人员干预并加速绿色建筑方案迭代。
刘德丽|周晓萍|李宇
中国北京建筑大学,邮编100044
摘要
建筑能源建模(BEM)对于可持续设计至关重要,但传统上依赖于手动流程,这些流程耗时且容易出错。大型语言模型(LLMs)为从自然语言描述自动生成模型提供了可能性。本研究旨在开发一种基于LLM的方法,从自由格式的文本中生成可用于仿真的EnergyPlus IDF文件,从而提高建筑能源模拟的效率和准确性。我们在包含单层、双层和三层直线建筑的自然语言描述与IDF模型配对的数据集上对Gemma-3-4B-IT进行了微调。训练后的流程分为两个阶段:首先是基于2,100个样本的数据集进行监督式微调(SFT),以对齐模式和文本-IDF映射;其次是基于另外300个样本的数据集进行群体相对偏好优化(GRPO),进一步提高几何精度和约束遵守度,并使用低秩适应(LoRA)进行参数高效调整。在300个样本的测试集上,第一阶段的SFT达到了98.33%的解析通过率和96.00%的边界一致性,但窗口几何一致性仅为31.00%,端到端有效性为24.67%。第二阶段的GRPO将这些指标提升到了85.00%的窗口一致性和78.00%的端到端有效性。该方法简化了建筑能源模型的创建过程,减少了专家干预,并实现了节能建筑的快速原型设计。
引言
建筑物占全球能源消耗的很大比例[1],这强调了可持续设计和运营策略的必要性。建筑能源模型(BEM)是模拟能源使用[2]、室内热条件[3]和环境影响[4]的不可或缺的工具,有助于建筑改造[5]和脱碳计划[6]的应用。
然而,开发BEM的过程本质上是劳动密集型的,并需要模拟软件和建筑物理方面的专业知识[7]。建模人员必须仔细定义和迭代参数,包括几何形状、窗户设计、内部负荷、时间表和边界条件,经常遇到阻碍效率的错误,尤其是在城市建筑能源建模(UBEM)中复杂的或大规模的模型中。
传统的BEM创建方法已经从简化的经验方法发展到像EnergyPlus这样的复杂基于物理的引擎,这些引擎集成了详细的热平衡方程和动态模拟。虽然引入了图形用户界面和脚本库来简化输入,但这些方法仍然需要较高的技术熟练度和时间,限制了实际应用中的可访问性和可扩展性。
大型语言模型(LLMs)的迅速发展彻底改变了自然语言处理(NLP),通过在庞大的语料库上进行预训练,然后针对特定任务进行微调,实现了上下文理解和结构化输出的生成[8]、[9]。最近的研究开始探索使用LLMs来自动化BEM的生成,将自然语言描述转换为可用于仿真的文件。例如,有研究对T5模型进行了微调,以生成EnergyPlus IDF文件[10],实现了高解析率和对输入变化(如语气或拼写错误)的鲁棒性。其他工作将LLMs与强化学习结合,以增强能源系统中的决策[11],或用于智能建筑中的语义推荐[12]。
尽管取得了进展,但目前LLMs在BEM中的应用仍面临关键限制。仅依靠监督式微调往往会产生语法正确但数值不准确的IDF文件,尤其是在窗户设计和其他几何敏感参数方面。要实现可接受的鲁棒性,通常需要大量标记的文本-IDF数据集,这在建筑领域构建成本很高。实际上,许多方法还依赖于大参数的LLMs,进一步增加了实际设计工作流的计算和部署成本。
为了解决这些缺点,我们采用了一个两阶段的训练后方法,其中初始的监督式微调(SFT)建立模式对齐和基本参数映射,随后的群体相对偏好优化(GRPO)[13]通过奖励解析有效性、几何精度和约束遵守度来改进输出,从而缓解了基于概率的训练中固有的差距。
基于这一理念,我们开发了一个基于LLM的框架,用于从描述性自然语言生成EnergyPlus IDF模型。我们特别将这种输入方式与传统的自动化工具中使用的刚性“填空”模板或复杂的脚本语法区分开来。如图2中的数据集样本所示,我们的方法使用了“自然语言规范”格式。虽然这种格式保持了逻辑结构以确保工程精度,但在用户交互方面它本质上表现为自由格式文本——建模人员通过语义描述来定义几何形状和参数,而不是通过导航不同的GUI菜单或记忆IDF语法。通过利用LLMs的语义理解,这种基于文本的方式关注用户的设计意图,减少了与格式化相关的认知负担,并实现了更直接的文本到仿真的工作流程。通过使用低秩适应(LoRA)[14]进行参数高效调整,该方法旨在推进节能建筑的自动化、可靠模型创建。
方法部分
文献综述
建筑能源建模(BEM)传统上依赖于基于物理的模拟引擎,如EnergyPlus[15],这些引擎使用热平衡原理和详细的几何、材料和系统输入来预测能源消耗和室内条件。早期的自动化尝试包括图形用户界面(GUI),如DesignBuilder[16]和OpenStudio[17],以及脚本库如Eppy[18],旨在简化参数输入和模型修改。
方法
我们采用Gemma-3-4B-IT作为训练后的核心模型。Gemma-3-4B-IT是一个拥有约40亿参数的指令微调的解码器专用Transformer,在文本到IDF和几何解析任务中提供了强大的精度-效率平衡。我们选择它是因为:(i)其遵循指令的行为减少了监督负担并稳定了早期训练;(ii)其40亿参数的大小适合在单个A100 GPU上进行训练和推理;(iii)它具有长上下文能力。
硬件环境
实验在Google Colab上进行,使用Python 3.12.12和Linux(内核6.6)。运行时提供了一个NVIDIA A100-SXM4-40 GB GPU(40 GB VRAM),驱动程序为550.54.15,CUDA版本为12.x。
监督式微调的超参数设置
在全面训练之前,我们进行了小范围的学习率测试,测试了2 × 10-3、2 × 10-4和2 × 10-5,在相同的设置下(图4)。2e-3下降迅速,但过早地收敛到一个明显较高的平台期,表明更新过于激进,限制了最终拟合效果。2e-4表现出
结果解释和方法的有效性
基于这一新兴的研究方向,本研究的结果表明,一个相对紧凑的40亿参数模型,结合仅在2,400个样本上训练的两阶段训练后流程,可以显著提高几何一致性和约束遵守度。这些发现表明,可靠的建筑能源模型生成自动化并不一定需要非常大的数据集或模型规模,只要训练目标与实际需求正确对齐即可。
结论
本研究提出了一个基于LLM的框架,可以从自然语言描述自动生成建筑能源模型。我们在配对的文本-IDF数据上对Gemma-3-4B-IT进行了微调,采用了两阶段的训练后方案:首先进行监督式微调以对齐模式,然后进行GRPO以提高几何精度和约束遵守度。通过使用低秩适应(LoRA)进行高效调整,该框架生成了可靠、可用于仿真的EnergyPlus IDF文件。主要结论如下:
CRediT作者贡献声明
刘德丽:撰写——审阅与编辑,撰写——初稿,方法论,数据管理,概念化。周晓萍:撰写——审阅与编辑,监督,方法论,概念化。李宇:方法论,概念化。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
致谢
本工作得到了中国国家自然科学基金(项目编号62271035)和北京自然科学基金(项目编号L259085)的资助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号