车道检测[1]、[2]对自动驾驶[3]、[4]、[5]、[6]、[7]至关重要,并在高级驾驶辅助系统(ADAS)[8]、[9]、[10]、[11]、[12]中发挥着关键作用。现有的车道检测方法通常分为四种类型:基于分割的[13]、[14]、[15]、[16]、基于关键点的[17]、[18]、[19]、基于曲线的[20]、[21]、[22]、[23]以及基于锚点的[8]、[9]、[24]、[25]、[26]、[27]、[28]、[29]、[30]、[31]。其中,基于锚点的方法逐渐成为主流。对于基于锚点的车道检测方法,锚点特征增强是加强锚点特征表示的核心步骤。例如,LaneATT[27]引入了一种基于锚点的注意力机制,利用其他锚点特征来增强目标锚点的特征表示;CLRNet[8]采用了跨层细化策略,通过不同网络层的特征图逐步增强锚点特征;GSENet[29]提出了一个全局特征提取模块,通过将全局特征与锚点特征连接起来来增强锚点特征表示。
总之,这些机制利用辅助特征(如其他锚点特征、不同网络层的特征和全局特征)来增强目标锚点的特征,从而显著提高了锚点特征优化的效果。然而,仍存在两个关键挑战需要解决。1) 视觉证据较弱或缺失。在某些具有严重遮挡(图1-a)和模糊(图1-b)[32]、[33]的挑战性场景中,车道线呈现出较弱或完全缺失的视觉证据。因此,辅助特征本身不包含足够的有用信息。在这种情况下,使用辅助特征来优化目标锚点特征是无效的。2) 锚点与车道真实标记的偏差。车道锚点在图像中的位置是预先定义的。由于交通场景的多样性和复杂性,存在一些锚点位置与车道真实标记显著偏离的情况(图1-c和图1-d)。因此,辅助特征(如其他锚点的特征)可能会提供不准确(甚至误导性的)信息,因为这些特征是从偏离车道真实标记的位置提取的,或者辅助特征(如不同网络层的特征和全局特征)只能提供泛化信息,无法提供与目标锚点位置相关的优先信息。
在上述内容中,我们解释了现有方法难以应对这些挑战的原因。接下来,我们将介绍我们解决这两个挑战的动机。对于第一个挑战,当图像中的车道视觉证据较弱或缺失时,任何辅助特征本身都难以捕获有用信息。因此,利用辅助特征来增强锚点特征是不合理的。为了解决这个问题,应该从整个数据集中学习辅助信息,而不是依赖于特定图像。一种直观的方法是从整个数据集中学习可能的车道位置先验知识,以辅助锚点特征增强。为了解决第二个挑战,重要的是定位与实际车道位置相邻的区域,从而可以从这些区域提取准确的特征来辅助锚点特征增强。
本文的核心研究目标是设计一种新的锚点特征增强机制,以共同应对上述挑战。基于这一动机,我们发现车道先验位置知识是同时解决这两个挑战的关键。因此,我们方法的核心思想是设计一种了解车道先验位置知识的锚点特征增强机制。我们提出了“实例级车道先验位置知识”(Instance-Level Lane Prior Position Knowledge)的概念,定义为车道实例可能位置的先验概率,反映了车道实例的全局空间分布和结构特征。
为了实现这一核心研究目标,本文提出了一种基于锚点的车道检测模型,该模型包含两个组成部分,即实例级车道知识引导编码器(Instance-Level Lane Knowledge Guided Encoder, IKGE)和锚点特征增强与解码器(Anchor Feature Enhancement and Decoder, AFED)。IKGE首先在车道真实标记的监督下学习先验位置概率图,然后利用这一知识融合全局上下文和局部细节来构建指导信息。AFED负责通过将锚点特征与IKGE编码的指导信息结合起来来增强锚点特征表示。利用增强的锚点特征,通过标准流程进行车道检测。车道先验位置知识被集成到IKGE和AFED中。因此,我们的方法旨在同时应对视觉证据较弱/缺失和锚点与车道真实标记偏差的挑战。
与现有方法相比,我们的方法具有以下优势。1) 良好的可解释性:现有方法使用辅助特征来增强锚点特征,但这些辅助特征并不提供明确可解释的信息。相比之下,我们的方法学习了实例级先验位置概率图,该图明确反映了车道实例的空间分布和结构特征。2) 强大的鲁棒性:在现有方法中,辅助特征与特定图像紧密相关。因此,当图像中没有明显的车道线视觉线索时,很难提取有效的辅助特征,甚至辅助特征中可能包含干扰信息,从而导致锚点特征增强机制的效果不佳。相比之下,我们的方法利用车道先验位置知识来增强锚点特征。先验知识是从整个数据集中学习的,因此具有更强的鲁棒性。当车道真实标记周围存在极弱或完全缺失的视觉线索时,我们的方法仍能推断出靠近车道真实标记的高概率位置,从而减少在严重遮挡等挑战性场景中的漏检。同时,车道先验位置知识有助于锚点特征增强,使其专注于靠近车道真实标记的区域,从而减少在意外图像区域中的误判。
为了评估我们的模型,我们在两个广泛使用的公共数据集TuSimple[34]和CULane[13]上进行了大量实验。实验结果表明,我们的模型在所有数据集上都达到了最先进的性能水平。同时,一系列消融和可视化实验分析了我们模型中关键模块的有效性。
本文的主要贡献如下。1)我们提出了一种知识引导的锚点特征增强机制,该机制通过车道真实标记的监督学习可能车道位置的实例级先验概率图。2)我们的方法在广泛使用的基准数据集上取得了最先进的性能,并具有良好的可解释性和强大的鲁棒性。
本文的结构如下:第1节介绍研究背景、关键挑战、动机、研究目标和贡献;第2节总结现有方法;第3节详细阐述所提出的模型;第4节测试模型的性能;第5节讨论所提出方法的局限性及未来研究的潜在方向;第6节总结本文。