基于边缘筛选和跨层融合的伪装物体检测
《Pattern Recognition》:Camouflaged Object Detection based on Edge Screening and Cross-layer Fusion
【字体:
大
中
小
】
时间:2026年03月25日
来源:Pattern Recognition 7.6
编辑推荐:
目标语义理解与边缘特征协同的模糊物体检测方法,提出ECNet通过边界筛选与跨层融合解决边缘模糊和特征融合不一致问题,实验表明在COD基准数据集上优于12种SOTA方法,尤其在CAMO数据集上提升显著。
严亮戈|钟旭曦|任俊超|何敏|毕洪波|张桥
中国大庆市东北石油大学,163318
摘要
伪装物体检测(COD)旨在从复杂的背景中准确分割物体。然而,它面临两个主要挑战:
(1) 物体与背景之间的边缘模糊预测;
(2) 统一且渐进的融合过程忽略了浅层特征和深层特征之间的差异和不一致性。为了解决这些问题,我们提出了一个边缘筛选和跨层融合网络(ECNet)。具体来说,高级特征亲和模块(HFAM)通过融合初始特征来执行物体的位置感知。边界细化模块(BRM)利用多分支膨胀卷积来挖掘目标轮廓,而过滤门根据最优筛选系数
Lsc 选择清晰的边界,从而促进深层特征的聚合,从而减少边缘模糊对目标分割精度的影响。此外,边缘诱导融合模块(EFM)通过跨层融合机制将边界线索与结构信息结合起来,以解决特征交互不完整的问题。最后,在三个COD基准测试上的实验结果表明,ECNet的性能优于12种最先进的方法。特别是在CAMO数据集上,我们的模型相对于ZoomNeXt的总体性能提高了
M 24.58% 和
Sα 2.74%。我们方法的代码和结果将在
https://github.com/ZX123445/ECNet 上提供。
引言
伪装物体检测(COD)已成为一个重要的研究领域,因为它具有广泛的应用范围,包括工业缺陷检测[1]、害虫管理[2]和医学图像诊断[3]。最近,基于深度学习的方法可以大致分为三类:(1) 特征提取模块的针对性开发;(2) 联合多任务学习框架的实现;(3) 受生物学启发的启发式方法的应用。例如,CamoFormer[4] 使用不同的注意力头分别处理前景和背景区域。DCA-Net[5] 利用CF模块进行多层次连接和聚合,以有效捕获全局上下文和局部细节。此外,Liu等人[6] 提出了一种轻量级的双级循环细化网络—Bi-RRNet,逐步细化多层次上下文特征以实现精确的密集预测。MSFENet[7] 采用粗到细的方法来增强单层多尺度信息的表示能力,旨在保留更多的小尺度特征和更少的区域背景噪声。接下来,BBNet[8] 通过双分支架构研究和整合图像内部和多个图像之间的共同潜在线索,以实现精确的伪装物体检测。TPRNet[9] 结合了复杂的功能和全面的语义信息作为主要指导,这些信息被传输到RCU以实现特征区域的精确定位。此外,PRNet[10] 基于人类感知过程,通过融合模块实现了大致细化它们的边界和区域的双重目标。接下来,DSNet[11] 通过使用对称的联合解码器模块来模拟人类感知,从而促进通道交互,使得双分支特征的多层次组间交互成为可能。
几乎所有现有方法都经常表现出物体轮廓生成不完整的问题,主要是由于在多阶段特征集成过程中逐渐累积的边缘模糊伪影。这种退化表现为三个级联效应:(1) 浅层中的高频衰减;(2) 跨尺度语义不对齐;(3) 深层表示中的边界置信度侵蚀。受到这些挑战的启发,最近的边缘引导框架利用明确的边界监督来解决特征模糊问题。像[12]和[13]这样的开创性工作表明,边缘约束可以通过距离场同时强制拓扑一致性并保留关键的高频细节。如图1所示,ECNet通过两项创新推进了这一范式:首先,边界细化模块(BRM)从低层特征中协同提取边缘信息,同时整合高层语义以实现精确的轮廓分割,并在背景分离过程中直接对抗级联退化;其次,自适应边缘线索整合特别提高了多物体和小伪装物体场景下的性能。
在这项研究中,我们提出了一个基于边缘筛选和跨层融合的网络(ECNet)。具体来说,边界细化模块(BRM)通过多尺度膨胀卷积从编码器特征中提取边缘细节,同时在背景分离过程中保留关键轮廓信息。场扩展感知模块(FESM)用于利用深层和细粒度信息来减轻结构信息的损失。此外,边缘诱导融合模块(EFM)通过跨层交互协调,直接解决边界置信度侵蚀问题,通过抑制特征差异引起的背景噪声,同时确保通过边缘引导的特征交互完全捕获目标。值得注意的是,为了提高检测精度,ECNet中集成了一种筛选机制(过滤门),以产生更清晰的边缘预测。
总之,我们的主要贡献如下:
(1)ECNet有效促进了边界细节和目标特征之间的交互。过滤门使用 Lsc 动态修剪低置信度的边缘响应,从而在多阶段特征集成过程中减轻边缘模糊伪影的逐渐累积,同时提高伪装物体的分割精度。
(2)HFAM整合了高级特征以派生全面的结构信息,从而指导低层特征逐步提取目标语义。EFM通过跨层融合机制准确捕获完整物体,在边缘线索的引导下实现特征的完全交互。
(3)实验结果表明,ECNet在COD数据集上的性能优于12种现有的最先进方法。
部分摘录
伪装物体检测
伪装物体检测(COD)作为一种专门的计算机视觉任务,主要由于大规模标注数据集的普及而取得了显著进展。早期的方法主要依赖于手工制作的特征(例如,纹理描述符和显著性线索)来区分物体和复杂背景。随着深度学习的发展,研究人员提出了许多模型来提高COD的性能。例如,VSSNet[16] 捕获了视觉或语义
方法
本节描述了ECNet的设计架构,并随后提供了四个不同模块的全面描述。整体结构在第3.1节中介绍,然后是第3.2节的BRM,第3.3节的HFAM,第3.4节的FESM和第3.5节的EFM。最后,在第3.6节讨论了损失函数。
实验
在本节中,我们通过定量和定性分析评估ECNet的有效性,并验证了其性能。此外,一系列消融实验和比较分析证实了模型的可靠性和有效性。
下游应用
科学和技术最终为社会生产力做出贡献。为了验证ECNet的实际应用,我们使用了包含各种类型缺陷和背景的CDS2K数据集[50],以展示我们的模型在下游任务中识别不同缺陷物体的能力。此外,为了突出我们方法的优势特征,我们选择了3个代表性模型进行比较分析,它们的检测指标在表6中呈现。
失败案例
图11展示了ECNet的局限性。虽然ECNet在COD性能上具有竞争力,但在处理具有不规则形态的目标的精细结构细节时存在挑战。例如,在多物体场景中(第1行和第4行),ECNet能够准确定位目标,但由于特征表示能力的限制,难以详细描绘复杂的边界细节。尽管如此,ECNet仍然比DGNet、FEDER等模型具有相对优势。
结论
在本文中,我们提出了用于伪装物体检测的ECNet。具体来说,BRM熟练地研究了物体的边界特征。HFAM用于捕获全面的语义信息。随后,FESM从每个主要特征中提取多尺度和细粒度的特征。然后我们实施了一种筛选机制来选择不同的边缘,指导EFM采用跨层融合方法,以实现边缘信息的完全整合
CRediT作者贡献声明
严亮戈:写作 – 审稿与编辑、可视化、监督。钟旭曦:写作 – 原始草稿、验证、方法论。任俊超:写作 – 审稿与编辑、监督。何敏:验证、监督。毕洪波:写作 – 审稿与编辑、监督。张桥:写作 – 审稿与编辑、可视化、监督。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
致谢
本工作得到了国家自然科学基金(编号:62471124)、黑龙江省自然科学基金(编号:LH2022F005)和东北石油大学电气信息工程学院青年人才基金(编号:DYDQQB202204)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号