
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于短语锚定的风格迁移技术在单域泛化目标检测中的应用
《IEEE Transactions on Circuits and Systems for Video Technology》:Phrase Grounding-Based Style Transfer for Single-Domain Generalized Object Detection
【字体: 大 中 小 】 时间:2026年01月29日 来源:IEEE Transactions on Circuits and Systems for Video Technology 11.1
编辑推荐:
单域广义目标检测旨在通过训练时仅使用单一源域的数据提升模型对多个目标域的泛化能力。本文提出短语锚定风格迁移方法(PGST),利用GLIP模型捕捉目标域风格并迁移至源域,生成语义丰富的视觉特征以微调模型,实现单域训练下的跨域泛化。实验表明,该方法在五个天气驾驶基准测试中平均mAP提升8.8%,优于或等同于传统域适应方法。
随着深度学习[1]、[2]、[3]、[4]、[5]、[6]的发展,计算机视觉[7]、[8]、[9]领域中的目标检测任务取得了突破性进展。这些目标检测模型通常表现出优异的性能,但往往依赖于训练集和测试集遵循相同分布的假设以确保其有效性。然而,在开放环境中,由于环境、设备和人为干预等因素,测试数据集的分布存在变化,因此需要标注大量数据以适应可能出现的任何数据分布。这需要大量的手动和计算资源。为此,近年来域适应(DA)技术受到了广泛关注。其目标是提高在训练集(源域)上训练的模型对测试集(目标域)的泛化能力,尽管这两个域在某种程度上具有相关性,但它们的分布不同[10]、[11]。最近,域适应(DA)技术在计算机视觉任务(如图像分类[12]、[13]、[14]、[15]和目标检测[16]、[17])中得到了广泛应用,并取得了出色的性能。在图像分类中,DA侧重于跨域对齐全局图像特征。相比之下,目标检测更为复杂,因为它不仅要对对象进行分类,还要在图像中准确定位它们。因此,目标检测的域适应必须解决由域偏移引起的识别和定位差异问题,这使得它比图像分类更具挑战性[18]。