编辑推荐:
提出仅需少量语义标签(如1%)且无需人工实例标注的LiDAR点云全景分割框架,通过两阶段流程(生成与优化实例标签)结合几何引导对比原型学习提升分割性能,实验表明优于传统弱监督方法。
张伟健|宋海川|张志忠|谭鑫|马丽庄|谢远
华东师范大学计算机科学与技术学院,上海,200062,中国
摘要
激光雷达点云全景分割是一项快速发展的技术,它结合了对象检测、语义分割和实例分割的功能。然而,这项技术需要同时具备语义标注和实例标注,而这些标注的获取既成本高昂又耗费大量人力。在本文中,我们提出了一种新的激光雷达点云全景分割框架,该框架仅需极少量(例如1%或更少)的语义标签,并且完全不需要人工标注实例信息。具体来说,我们首先采用主动标注策略对一小部分语义标签进行标注;接着设计了一个两阶段流程来生成和优化实例标签。在实例生成阶段(IG-Phase),我们根据真实世界激光雷达场景的几何特征计算出具有类别意识的实例先验,并提出了一种启发式聚类算法来自动生成初始实例标签;在实例优化阶段(IR-Phase),这些标签会利用语义分割预测和类别意识先验进行进一步优化和修正。此外,我们还引入了一个基于几何结构的对比原型学习模块,通过强化局部语义一致性来提升空间特征聚合能力并改善对象区分度。在多个大规模激光雷达数据集上的广泛实验验证了该方法的有效性。在相同的标注预算下,我们的框架显著优于传统上用于语义分割和实例分割的弱监督标注方法。
章节摘录
引言
激光雷达点云对于3D场景理解至关重要,推动了自动驾驶(Lu等人,2025年)、机器人技术(Wang等人,2021年)等相关领域的发展(Pan等人,2025年;Ye等人,2025年)。激光雷达全景分割的目标是为每个前景(物体)和背景(杂物)点预测语义标签,并为物体点推断出实例ID。以往的研究方法大致可分为两类:
弱监督3D语义分割
由于存在大量冗余的标注数据,大多数弱监督3D感知方法都专注于语义分割(Zhang等人,2021a)。例如,Zhang等人(2021a)设计了一种点云着色预训练任务来提升弱监督点云分割的性能;Wang等人(2025)的SDSimPoint框架引入了一种浅层-深度相似性学习网络,用于学习不同点云之间的多种相似性,包括几何、颜色和语义方面的相似性。
方法论
在本节中,我们首先在第3.1节介绍高效标注全景分割的问题背景;第3.2节阐述用于获取少量语义标签的主动标注策略;第3.3节描述了基于少量语义标签生成粗略实例标签的流程;第3.4节则介绍了进一步优化实例标签的细节。
实验设置
对比用例的标注要求:在“随机点”(Random Point)设置中,我们按照给定比例随机标注部分点。对于被标注的点,杂物点被赋予语义标签,而物体点则同时被赋予语义标签和实例ID。这样每个前景实例至少有一个点被标注,这可以被视为一种强标注形式。在“随机框”(Random Box)设置中,杂物类的点同样以随机方式被标注。
结论
在本文中,我们提出了一种适用于激光雷达场景的高效标注全景分割框架。该框架首先通过主动标注策略获取少量语义标签,然后利用启发式聚类算法自动生成粗略的实例标签;此外,基于语义预测和具有类别意识的实例先验,实例标签传播模块能够更有效地识别前景点。此外,我们的几何引导对比学习机制进一步增强了空间特征的表达能力和对象区分能力。
CRediT作者贡献声明
张伟健:可视化、验证、方法论设计。宋海川:概念框架构建。张志忠:方法论实现。谭鑫:写作、审稿与编辑。马丽庄:项目监督。谢远:写作、审稿与编辑。
利益冲突声明
作者声明不存在任何可能影响本文研究的已知财务利益冲突或个人关系。
张伟健于2018年在中国吉林大学软件工程学院获得软件工程学士学位,目前正在华东师范大学攻读计算机科学与技术博士学位。他的研究兴趣包括3D视觉和视觉-语言模型,尤其关注点云全景分割、深度估计以及利用视觉-语言模型进行空间理解。