AHD-Net:一种用于建筑遗产保护的损伤检测器及数据集

《Expert Systems with Applications》:AHD-Net: A damage detector and dataset for architectural heritage

【字体: 时间:2026年02月22日 来源:Expert Systems with Applications 7.5

编辑推荐:

  建筑遗产损伤检测框架AHD-Net通过整合数据集扩展与检测器结构优化,提出AHDD模块融合局部纹理感知与PCA全局注意力机制,并引入辅助分支抑制背景干扰,显著提升复杂场景下的检测精度与鲁棒性。

  
作者:龙林格、赵本云、甘振坤、张大宇、李青翔
北京服装技术学院艺术与设计学院,中国北京100029

摘要

建筑遗产的损坏为结构退化和潜在的安全隐患提供了关键证据。本文提出了AHD-Net(建筑遗产损伤网络),这是一个统一的建筑遗产损伤检测框架,它整合了检测器优化和数据集扩展功能。在该框架下,我们通过引入特征建模模块设计了建筑遗产损伤检测器(AHDD)。该模块结合了局部纹理感知和基于PCA的全局注意力机制来增强损伤表示能力。此外,还引入了一个辅助分支,将浅层结构信息注入到深层语义空间中。同时,我们构建并扩展了一个高分辨率的建筑遗产损伤数据集,丰富了多类型损伤样本在多场景、多尺度和复杂背景条件下的表现。在数据集和真实世界测试中的实验结果表明,AHDD在检测准确性和错误抑制方面均优于主流基线检测器。总体而言,AHD-Net为建筑遗产损伤的自动化检测提供了一条可行的技术路径。

引言

建筑遗产是历史信息、建筑智慧和地区文化记忆的重要载体(Long等人,2023年)。损伤的发生和演变与结构安全性、稳定性和美学完整性密切相关,它们直接影响后续保护决策的科学有效性。传统的损伤调查方法主要依赖于人工检查和专家经验(Cheng等人,2025a年)。由于建筑遗产分布广泛且损伤类型多样,人工检查往往劳动强度大、效率低且具有高度主观性,定量评估能力有限(Zhou和Tiong,2026年)。随着预防性保护概念的普及,遗产保护逐渐从被动干预转向主动监测。建筑遗产损伤的自动化和标准化检测已成为遗产保护和工程实践中的关键要求。
近年来,深度学习目标检测方法已被广泛应用于建筑遗产损伤的识别。例如YOLO系列(Vijayakumar和Vairavasundaram,2024年)和Faster R-CNN(Girshick,2015年)等检测模型已被用于识别典型的损伤,包括裂缝和风化(B. Zhao等人,2024年),取得了较高的准确率。然而,这些方法高度依赖于训练数据。现有的建筑遗产损伤数据集在规模、分辨率和场景多样性方面存在局限,通常只关注单一的遗产类型或损伤类别。因此,它们难以反映真实世界遗产环境的复杂性(Cheng等人,2025b年),这显著削弱了检测模型的泛化能力。为了解决这一局限,我们之前建立了MSD-Det数据集(Long等人,2025a年),以提高数据质量并为遗产损伤检测建立基础框架。尽管如此,随着监测要求的提高,进一步扩展数据集以增强场景多样性并改善多尺度和弱纹理损伤的覆盖范围仍然十分必要。
除了数据限制外,最近的研究提出了各种建筑遗产保护检测框架。然而,它们的优化策略通常侧重于一般结构改进(Qin等人,2026年),而没有明确考虑可见光条件下遗产表面损伤的视觉特征。现有方法通常遵循通用检测器优化路径,如引入全局注意力机制、多尺度上下文融合或特征金字塔结构,这些方法在特定场景下显示出性能提升(Qiu和Ni,2025年;Wen等人,2025年;Zhang等人,2018年)。然而,这些方法在建筑遗产损伤检测中的应用仍面临挑战。首先,许多方法依赖于通用形式的全局注意力或特征对齐,而对遗产视觉条件下的错误结构和鲁棒性要求关注不足。其次,遗产损伤通常具有弱纹理、模糊边界、重复背景图案和严重的尺度不平衡。即使整体检测准确率看似具有竞争力,背景干扰也经常导致误报或漏报。第三,全局注意力和对齐模块通常会增加额外的计算成本,并增加过拟合的风险,这限制了它们在大规模或高频遗产检测任务中的适用性。从更广泛的角度来看,数据集构建和检测器设计往往被视为相对独立的研究步骤,缺乏一个综合框架来共同解决建筑遗产损伤的独特视觉挑战。因此,在保持计算效率的同时提高损伤敏感性和背景抑制能力仍然是一个关键的研究方向。
为了解决这些挑战,本文提出了AHD-Net,这是一个建筑遗产损伤检测框架,它将数据集扩展与检测器结构优化紧密结合,以增强在真实世界遗产场景中的稳定性、鲁棒性和泛化能力。与传统的基于YOLO的检测器或通用的注意力驱动方法不同,AHD-Net不仅仅关注整体准确性的提高,而是明确针对建筑遗产损伤的典型视觉特征,包括弱纹理、重复背景和尺度不平衡。具体来说,通过两种紧密耦合的设计策略解决了这些问题。首先,在数据层面,构建了MSD-Det2025数据集,以扩展对弱纹理损伤和复杂检测场景的覆盖范围,从而加强模型的表示基础。其次,在检测器层面,引入了一种结合轻量级方向性全局信息建模和局部纹理增强的协作设计,该设计在错误结构分析的指导下进行,有效提高了区分稳定性并抑制了背景干扰,而不会显著增加模型复杂性。因此,AHD-Net在复杂遗产场景中表现出明显的性能优势。
本文的主要贡献总结如下:首先,我们通过扩展场景类型、纳入弱纹理和复杂环境样本以及统一注释标准,构建了MSD-Det2025数据集,得到了1933张高分辨率图像及其边界框级别的损伤注释。其次,我们提出了建筑遗产损伤检测器(AHDD),将AHDD Block集成到主干网络中。该模块将局部纹理分支与基于PCA的全局注意力机制相结合,并通过辅助分支进一步增强深度特征表示,提高了弱纹理损伤的识别能力,同时抑制了重复背景的干扰,保持了高推理效率。第三,基于MSD-Det2025构建了一个包含40多个检测模型的综合基准测试,其中包括四个特征提取网络(Liu等人,2023年;A. Wang等人,2024a年;J. Zhang等人,2023年;Y. Zhao等人,2024年)和五个YOLO系列(Jocher等人,2024a年,Jocher等人,2024b年,Tian等人,2025年;A. Wang等人,2024b年;C.-Y. Wang等人,2024年)。从模型复杂性、检测准确性和错误结构方面系统评估了AHDD的性能,而消融研究揭示了辅助分支和数据集扩展的独立贡献。最后,在不同遗产类型、空间尺度、材料系统和地理区域进行的真实世界实验证明了AHD-Net在遗产监测任务中的鲁棒性、跨尺度适应性和实际应用价值。本文的贡献如下:
  • 基于MSD-Det,我们通过添加多尺度、多场景和弱纹理损伤样本扩展了MSD-Det2025,并统一审查了所有样本的注释,使数据集更紧密地反映真实世界遗产监测需求。
  • 我们提出了AHDD,它结合了局部纹理分支和PCA全局注意力,通过辅助分支增强了弱纹理损伤的识别能力和背景干扰的抑制能力,同时保持了高推理效率。
  • 通过对40多个检测模型进行综合基准测试,从检测复杂性、准确性和错误结构方面验证了AHDD的优势,并通过消融研究揭示了辅助分支和数据扩展的独立贡献。
  • 在不同遗产类型、空间尺度、材料系统和地理区域进行的真实世界实验表明,AHD-Net具有鲁棒性、跨尺度和跨材料适应性以及实际应用价值。
  • 本文的其余部分组织如下:第2节回顾相关研究。第3节介绍MSD-Det2025数据集的构建过程和AHDD网络结构。第4节描述了AHDD与各种基线模型的比较结果、错误分析和消融研究。第5节展示了真实世界实验。第6节讨论了该方法的潜在研究方向。第7节总结了本文。

    小节片段

    数字方法在建筑遗产中的应用

    数字技术在建筑维护领域发展迅速,3D重建(Q. Li等人,2025a年)、虚拟现实(T. Li等人,2025c年)和目标检测(Zhao等人,2025年)等技术日益成熟。这些技术已成为建筑遗产保护和监测的重要工具,在遗产记录、结构诊断、保护规划和长期健康监测中发挥着关键作用。

    数据集

    本研究构建了建筑遗产损伤检测数据集MSD-Det2025(图2),它是基于MSD-Det(Long等人,2025a年)的扩展和增强版本,旨在更全面地展示建筑遗产的典型损伤特征。该数据集采用图像级采样方法,所有样本作为独立的检测单元参与模型训练和评估,使用单张高分辨率图像。数据集的规模已经得到扩展

    实验设置

    所有实验都在配备了Intel i9-13900K CPU和NVIDIA RTX 4090 GPU的系统上进行。MSD-Det2025中的1392张图像被分为1392张训练图像(72%)、154张验证图像(8%)和387张鲁棒性测试图像(20%)。训练和验证子集被随机划分,以避免数据划分过程中的偏差,确保不同损伤类别和场景类型的平衡分布。这种方法有助于提高

    案例1:大规模砖土城墙

    本研究选择了河北省的 Jimingyi 城作为真实世界实验地点。Jimingyi 城建于明朝永乐十八年(1420年),是 Xuanfu 城军事防御系统的重要组成部分。它是中国最大且保存最完好的古代驿站城镇(图10)。城墙总周长为1884.7米,高度约为11.7米。城墙由夯土和碎石构成,外部包裹着

    AHD-Net的优势和实际意义

    在研究框架方面,AHD-Net通过构建一个集成框架来解决建筑遗产损伤检测中普遍存在的视觉复杂性问题,其中数据集构建和模型设计是相互协作的。该框架不是将数据准备和检测器设计视为独立过程,而是从遗产场景的独特视觉条件出发。考虑了弱纹理、重复背景图案和尺度不平衡等因素

    结论

    本研究提出了一个用于建筑遗产损伤检测的AHD-Net框架。它将结构优化的检测器AHDD与扩展的高分辨率数据集MSD-Det2025相结合,以解决建筑遗产场景中的常见视觉挑战,包括重复纹理、弱纹理、多尺度分布和模糊边界。
    实验结果表明,AHDD系列在不同场景下实现了稳定且具有竞争力的检测性能

    未引用的参考文献

    Li等人,2025a年;Wang等人,2024c年;Zhang等人,2023a年;Zhang等人,2023b年;Zhao等人,2024年;Zhou等人,2025年。

    利益冲突声明

    作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

    致谢

    本研究得到了北京市属高校基本研究经费JBKY2025A-13和中国国家社会科学基金24VWB022的支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号