AISS-VFL：一种高效的自适应重要性感知样本选择方法，用于基于分布式标签的垂直联邦学习

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月13日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　提出一种结合BERT语义对齐与GNN图学习的新型建筑合规检查系统，解决BIM与法规文档的异构数据对齐及空间关系建模难题。实验表明该系统在三种建筑类型中语义对齐F1达89.35%，合规准确率99.98%，有效降低人工干预。

陈妍|蒋慧娴

福建师范大学地理学院，中国福州350117

摘要

在建筑合规性检查中，一个挑战是将工业基础类（IFC）格式的建筑信息模型（BIM）与监管文件进行语义对齐。尽管深度学习和自然语言处理等技术提高了两者之间的对齐程度，但它们对不同法规的适应性有限，难以解释复杂的监管语言，并且依赖于手动标记的训练数据集。为了解决这些问题，提出了一种新的自动化合规性检查（ACC）系统，该系统结合了基于BERT的语义对齐和图神经网络（GNN）技术，以自动预测IFC建筑构件的合规性。首先，开发了两个异构本体，涵盖了IFC和监管实体概念及其相关的领域知识，包括空间关系和约束。接下来，为了自动对齐IFC和监管概念，开发了一种端到端的对齐模块，该模块结合了高召回率的词汇候选生成、多源本体感知特征和经过微调的跨注意力BERT。最后，为了对IFC元素进行合规性分类，通过融合边缘特征并集成图变换器编码器来增强图学习算法，并在知识对齐的图数据集上进行训练。实验结果表明，对于三种不同类型的建筑，该框架在语义对齐方面的F1分数达到了89.35%，合规性检查准确率为99.98%，优于其他基线方法，并且在训练数据有限的情况下表现出更好的性能。本研究的目的是通过减少人工干预，实现建筑合规性检查的自动化，从而支持智能、可靠的决策过程。

引言

建筑的自动化合规性检查（ACC）一直是建设项目中具有挑战性但又至关重要的方面（Amor和Dimyadi，2021；Zhang和El-Gohary，2015）。这一过程需要大量的专家知识，以确保建筑设计符合众多监管和安全标准（Kruiper等人，2024；Fuchs，2021），如图1所示。然而，监管语言的固有复杂性和建筑设计的多样性要求一种能够高效、准确地将对监管要求与建筑模型对齐的解决方案（Zheng等人，2022）。建筑信息模型（BIM），特别是通过工业基础类（IFC），已成为这一领域的基石，提供了建筑设计的标准化数字表示（Volk等人，2013；Isailovi?等人，2020）。虽然BIM提高了设计和施工过程的效率，但实现BIM与监管信息之间的对齐仍然是一个重大瓶颈，因为不同司法管辖区的监管语言往往含糊不清、复杂且不一致（Ismail等人，2023；Ataide等人，2023）。

为了提高建筑、工程和施工（AEC）行业的自动化水平，已经对ACC进行了广泛研究，并提出了许多智能系统（Zheng等人，2022；Beach等人，2020；Zhou等人，2022）。传统上，ACC方法依赖于基于规则的系统，其中监管文本被手动转换为可以针对BIM模型进行验证的计算规则。例如Solibri Model Checker（SMC）就是这样一种工具，它支持开放的IFC标准，被认为是建筑合规性审查的领先产品（Solibri，2017）。另一个值得注意的平台是FORNAX，它是第一个专门用于模型审查的软件（Solihin等人，2004）。尽管这些方法在特定环境中实现了高准确性，但它们需要高度手动化的方法来维护语义对齐，并且在应用于多样化和不断变化的法规时存在可扩展性、适应性和灵活性方面的问题（H?u?ler等人，2021）。此外，将模糊或基于性能的要求转化为严格的、机器可读的规则往往会导致错误或过度简化，使得基于规则的方法不适合更复杂的合规性检查任务（Alnuzha和Bloch，2025）。

相比之下，近年来出现了基于自然语言处理（NLP）的方法，引入了本体、机器学习和深度学习等技术（Xu和Cai，2021；Siddharth等人，2022），特别是BERT（双向编码器表示来自变换器）作为预训练的语言模型（PLMs）。BERT通过学习文本的上下文表示，提供了更灵活的解决方案，有助于提取监管术语与建筑设计之间的有意义关系，从而解决了与模糊语言相关的一些挑战（Devlin等人，2019）。最近的研究，包括Zhang和El-Gohary使用变换器结构验证的关于监管语言与BIM实体之间增强对齐的假设——未考虑空间关系——表明这种方法的平均准确率为84.3%（Zhang和El-Gohary，2023）。这种理解复杂、多层次监管语言并将其与构建模型对齐的能力，比传统的硬编码规则具有显著优势，为自动化合规性任务提供了灵活且可扩展的解决方案。一个限制是当所有概念都明确定义时无法进行测试。应用本体技术来总结和组织领域知识是一个有效的解决方案，有助于澄清概念之间的关系（Chen等人，2024）。

最近对文献的回顾（Alnuzha和Bloch，2025；Bloch等人，2023；Ren等人，2024）表明，仅靠BERT不足以完全解决BIM模型中空间关系的复杂性，这突显了Zhang和El-Gohary等人（Zhang和El-Gohary，2023；Amor等人，2024）指出的另一个限制。显然，虽然BERT在解释监管文本并将其与建筑设计信息对齐方面非常有效，但它本身无法完全捕捉BIM数据中嵌入的空间和关系复杂性。相反，基于图的学习技术，如图神经网络（GNNs），在管理BIM模型中固有的关系和拓扑数据方面显示出巨大潜力（Bloch等人，2024）。BIM结构表示建筑设计及其相互关系，本质上是图形的，节点代表房间、墙壁和窗户等实体，边代表它们的空间关系。GNNs是建模这些关系的强大工具，特别适合涉及建筑设计之间拓扑关系的任务。例如，Bloch等人展示了一个基于GNN的ACC工作流程，该流程在合成数据集上进行了训练，用于检查单户住宅的可达性要求。他们的工作强调了GNNs表示和推理房间、走廊和出口之间空间关系的能力。基于GNN的ACC方法近年来成为了一个新的研究方向，与传统ACC方法有显著不同（Bloch等人，2023）。尽管显示出潜力，但这些方法仍处于探索的早期阶段。这些方法不依赖于预定义的规则集，因此不如基于规则的方法可靠。此外，它们的灵活性受到依赖于手动标记的图数据集的限制，而不同BIM模型之间不同的图表示要求限制了这些数据集的多样性。此外，传统的GNN模型在训练过程中存在固有的限制，例如过度依赖图连接，这会导致性能问题，如暂停动画和过度平滑问题（Zhang等人，2020；Giraldo等人，2023）。

为了解决上述问题，一种有前景的方法是将NLP、PLM和GNN等先进技术集成到合规性检查框架中。这旨在利用每种技术的优势，同时减轻它们的局限性，最终提供更大的灵活性，减少合规性检查过程中所需的人工努力，并扩大可以自动检查的法规范围（Alnuzha和Bloch，2025）。本研究提出了一种新的ACC框架，将GNN与BERT（一种PLM）结合，结合了两者的优势来处理来自监管文件和BIM模型的异构数据。该框架包括：（1）通过基于本体的建模来形式化和对齐异构建筑知识，包括异构领域概念、约束和关系。这用于将监管和IFC概念分类为语义对齐或不对齐，使用高召回率的词汇候选词、本体感知的统计线索和跨注意力BERT嵌入来创新性地改进分类过程。根据对齐结果，它还促进了与BIM图数据相关的节点和边列表的半自动生成。（2）基于BERT的知识对齐图推理的集成，实现了可扩展的合规性推理，自动化了BIM中IFC建筑设计的检查。最后，通过在三种不同类型的建筑BIM模型和中国监管文件上测试，验证了所提出框架的有效性。

部分摘录

BIM中ACC的语义对齐方法

BIM数据和自然语言监管文件本质上是异构的，存在显著的语义差距。为了支持ACC过程，必须将IFC的语义表示和术语与自然语言监管文件的对齐（Nuyts等人，2024）。最近的研究探索了各种语义对齐策略来解决这一挑战。

研究空白、目标、问题和方法论

当前的ACC研究强调基于规则的系统及其与机器学习的集成。传统的基于规则的方法依赖于单一的手动定义。尽管机器学习取得了有希望的进展，但在将各种机器学习技术的优势完全整合到ACC中仍存在显著差距，特别是在GNN和PLMs方面。

ACC框架

我们提出的智能ACC框架（参考了Eastman的4个步骤（Eastman等人，2009），如图3所示（第1层和第2层包括Eastman的第1步：规则解释和第2步：BIM准备；第3层对应于第3步：规则执行；第4层和第5层包括第4步：报告和检查结果），在实验过程中遇到了一些挑战。首先，与IFC和监管数据获取及知识建模相关的复杂性

应用场景

下面详细介绍了验证所提出框架可行性的实验。第一步是验证语义对齐的准确性，包括一个高召回率的候选短语生成器，该生成器将所有文本跨度视为潜在的提及并计算相应的分数（实验1）。然后将这些跨度与最匹配上下文的概念关联起来，并选择链接跨度以完成异构本体之间的语义连接（

讨论

讨论分为三个部分：（1）所提出的ACC框架的实际意义，（2）局限性，以及（3）对知识体系的贡献。

结论和未来方向

我们提出了一个针对建筑行业的新型ACC框架，解决了自动将监管文件与BIM数据对齐的挑战。该框架通过利用先进的深度学习模型，自动弥合了监管文件和BIM数据之间的差距。它确保了高语义知识准确性和合规性预测性能，显著减少了合规性检查所需的时间和人工努力，同时提高了自动化程度

CRediT作者贡献声明

陈妍：撰写——原始草稿，监督，软件，方法论，数据管理。蒋慧娴：撰写——审阅与编辑，撰写——原始草稿，监督，数据管理，资金获取。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。

致谢

作者感谢福建省自然科学基金（2022J01621）和福建省科技厅的竞争性公益项目（2025R1040）提供的财政支持。

联系信箱：

粤ICP备09063491号

摘要

引言