自适应偏振成像技术在自动驾驶中的应用:一种基于物理原理的隧道环境鲁棒感知方法
《Optics and Lasers in Engineering》:Adaptive polarization imaging for autonomous driving: A physics-informed approach to robust perception in tunnels
【字体:
大
中
小
】
时间:2026年05月11日
来源:Optics and Lasers in Engineering 3.7
编辑推荐:
饶仁浩|崔长才|李冰|陈亮|欧阳志钊|陈双|根德莫帕|曹慧
华侨大学制造工程学院,中国厦门361021
摘要
本文提出了一种改进的自适应偏振增强(APE)算法,用于应对照明变化剧烈的交通场景,尤其是在隧道入口和出口处。APE利用线性偏振度(DOLP)作为物理先验:在
饶仁浩|崔长才|李冰|陈亮|欧阳志钊|陈双|根德莫帕|曹慧
华侨大学制造工程学院,中国厦门361021
摘要
本文提出了一种改进的自适应偏振增强(APE)算法,用于应对照明变化剧烈的交通场景,尤其是在隧道入口和出口处。APE利用线性偏振度(DOLP)作为物理先验:在明亮区域中,它作为眩光指示器;在暗区域中,它保留了纹理细节。与原始APE的主要改进之处在于引入了像素级别的自适应融合机制,该机制根据局部亮度和DOLP调整增强权重,取代了之前的全局场景级加权方法。我们在POLAR-GLV隧道数据集(1,487帧)上评估了APE的性能,采用基于序列的分阶段分割方法以避免时间数据泄露。与其他测试方法(包括Zero-DCE和SCI)相比,APE在暗区域增强和眩光控制之间取得了更好的平衡,并提高了下游YOLOv11n的检测性能(mAP50-95:未增强数据为0.967,增强数据为0.975)。在隧道出口处,APE将预训练的YOLOv11n F1分数从0.199提升到了0.647,且无需重新训练。九参数敏感性分析表明,主要超参数在选定设置附近相对稳定;通过30帧的分层自动校准方法,将三个依赖于场景的参数应用到未用于参数选择的隧道驾驶序列(video1)中:在内部光线较暗的场景中,熵值从3.70(原始数据)提升到5.38(自动校准后的APE);在曝光良好的开阔道路场景中,虽然原始图像已经趋于饱和,但熵值仍有小幅压缩。桌面参考实现可在NVIDIA RTX 3060 GPU上以约64 FPS的帧率运行,在单个CPU线程上以约0.9 FPS的帧率运行。根据每帧大约1.88 GFLOPs的计算成本,以及各平台发布的GPU FP32吞吐量的初步估算,结合内存密集型图像过滤通常的有效利用范围为5–15%,该方法在Jetson Xavier NX上可实现约23–68 FPS的帧率,在Jetson Orin Nano 8 GB上可实现34–102 FPS的帧率,在旧款Jetson Nano上可实现6–19 FPS的帧率。该方法无需训练数据。
引言
自动驾驶需要强大的视觉感知能力,然而隧道入口和出口处的剧烈照明变化给视觉系统带来了挑战。标准相机在这些环境中表现不佳,生成的图像中阴影部分曝光不足,眩光部分过度曝光,从而降低了物体检测等高级视觉任务的性能。
已有几种增强方法被提出,包括通过梯度分析[1]或感兴趣区域切换[2]实现的自适应曝光技术。高动态范围(HDR)成像能够捕捉更宽的亮度范围[3],但常受数据集可用性和计算成本的限制[4]。基于深度学习的方法如RetinexNet[5]、EnlightenGAN[6]和Zero-DCE[7]提升了低光环境下的图像质量,但在极端光照条件下可能引入颜色失真和细节丢失等问题[8]。
偏振成像通过捕捉光波振荡的方向为场景理解增添了物理维度。偏振技术能够通过反射[9]进行材料分类,并通过大气散射[10]去除雾气。在自动驾驶场景中,偏振成像已被证明对道路检测[11]、水险识别[12]和多模态传感器融合[13]有效。本文介绍的自适应偏振增强(APE)算法利用这些物理特性来处理隧道中的剧烈照明变化,在满足实时处理要求的同时提升图像质量。
章节概述
**偏振成像基础**
偏振成像通过测量特定角度的偏振特性来分析光场[15]。典型系统会在0°、45°、90°和135°三个角度采集图像,由此计算出Stokes参数(S0、S1、S2),进而得到线性偏振度(DOLP)和线性偏振角(AoLP)[16]等特征,这些特征能够反映表面材料和反射几何结构。
**偏振成像增强方法综述**
传统的图像增强方法在光照变化剧烈的场景中表现不佳。
**偏振成像原理**
偏振成像捕捉光的偏振状态,反映了光与表面的相互作用。我们的系统使用时分复用偏振相机采集四张图像(I0、I45、I90、I135),并从中计算出前三个Stokes参数:
$$S0 = \frac{I0 + I90}{2}, \quad S1 = \frac{I0 - I90}{2}, \quad S2 = \frac{I45 - I135}{2}$$
其中S0表示两个正交偏振通道的平均强度,S1和S2分别表示对水平/垂直以及±45°偏振的偏好。
**数据集构建**
实验使用了我们的POLAR-GLV(偏振用于眩光和低光视觉)数据集。该数据集包含1,487张多偏振图像,来自同一日隧道通行的驾驶序列(video0),涵盖隧道入口、内部暗区和明亮出口部分。当天使用相同成像设备采集的另一独立隧道驾驶序列(video1,5,483帧)仅用于第5.5节的跨序列转移评估。
**实验与结果**
为了验证APE算法,我们进行了视觉对比、图像质量定量评估、物体检测评估和消融研究。
**讨论与结论**
本文提出了一种改进的自适应偏振增强算法APE,用于隧道驾驶场景中的视觉感知。APE以DOLP作为物理先验,利用Fresnel反射原理:高DOLP与镜面反射相关联;在中等至明亮区域,只要DOLP超过第3.2.2节中描述的亮度依赖性强噪声阈值,它还能保留有用的结构对比度,因此非常适合隧道场景。
**作者贡献声明**
饶仁浩:负责撰写、审阅与编辑、原始草稿编写、软件开发、资源管理、方法论设计及数据整理;
崔长才:负责资金筹措;
李冰:负责资金筹措;
陈亮:负责资金筹措;
欧阳志钊:负责数据整理;
陈双:负责数据整理;
根德莫帕:负责监督;
曹慧:负责监督。
**利益冲突声明**
作者声明不存在任何可能影响本文研究的已知财务利益冲突或个人关系。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号