《Neurocomputing》:A Serialized Geometry-Guided Registration Method with Beltrami Diffusion for 2D Laser Scanning in Industrial Robotic Measurement Application
编辑推荐:
2D激光扫描器在机器人视觉系统中因非接触和高分辨率特性成为关键组件,但动态环境中的点云配准存在精度衰减和鲁棒性不足问题。本文提出基于序列化几何引导与贝特拉米扩散的SDGNet框架,通过空间填充曲线编码增强局部几何特征提取,结合扩散模块抑制高频噪声干扰,显著降低均方绝对误差15.15%和均方根误差44.15%。实验验证其在单源多视角和跨源CAD模型配准场景下的有效性。
郭晓宇|朱宝|池梦琪|胡一博|魏彦丁|方强
中国浙江省杭州市浙江大学机械工程学院流体动力与机电系统国家重点实验室,邮编310058
摘要
2D激光扫描仪因其非接触式操作和高分辨率轮廓感知能力,已成为机器人手眼测量系统中的关键组件。点云配准作为基础技术,在提高机器人视觉和控制的准确性和可靠性方面发挥着重要作用。为了解决动态环境下点云配准的准确性下降和鲁棒性受限的问题,特别是针对机器人2D激光扫描系统,本文提出了一种基于序列化几何引导的一致性网络,并结合了Beltrami扩散算法。该算法整合了序列化编码机制和Beltrami扩散模块,增强了空间特征提取和学习能力,从而显著提高了配准的准确性和鲁棒性。与基线方法相比,所提出的模型在噪声为0.005毫米的情况下,平均绝对误差降低了15.15%,均方根误差降低了44.15%。最后,在同源和异源配准场景中验证了该配准算法的准确性和鲁棒性,证明了其在动态环境中的适用性及其在工业机器人测量应用中的潜力。代码可在以下链接获取:
https://github.com/Venus121/SDGNet。
引言
2D激光扫描仪凭借其非接触式扫描能力和高分辨率轮廓捕捉能力,已成为机器人手眼测量的核心工具[1]、[2]。点云配准技术通过同源和异源配准范式,为机器人视觉测量和精确控制提供了重要支持。同源配准主要针对来自单个传感器的多视图数据生成的点云进行配准,常用于机器人手眼校准[3]、[4]。然而,在动态环境中,由于传感器噪声变化和视角或时间差异导致的数据异质性,其准确性可能会下降。相比之下,异源配准旨在实现真实世界点云与CAD模型之间的配准,广泛应用于点云恢复(例如,反射区域的数据补全)[5]、[6]和质量检测(例如,加工余量检测)[7]、[8]等任务。然而,由于真实世界点云和理想化模型在拓扑结构、表面纹理和噪声分布上存在显著差异,因此面临数据密度差异、几何表示与语义表示之间的差距以及算法鲁棒性限制等问题。这两种场景都对算法的全局优化能力和环境适应性提出了严格要求,需要开发兼具高精度和鲁棒性的配准方法来应对工业应用的复杂性。点云配准技术包括两种范式:传统方法和深度学习方法[9]、[10]、[11]。传统方法通常采用分阶段策略,首先使用PFH[12]、FPFH[13]和SHOT[14]等特征描述符估计对应点,然后通过RANSAC[15]进行粗略配准,最后通过ICP[16]进行迭代优化进行精细配准。然而,传统特征描述符的几何表示能力有限,难以捕捉复杂场景中的细粒度结构信息,因此主要用于粗略配准[17]、[18]。此外,尽管ICP及其变体[19]、[20]、[21]在特定场景中表现出可靠的性能,但它们的核心局限性在于对初始姿态的敏感性和易陷入局部最小值的倾向,常常导致收敛失败[22]。在集成机器人和2D激光扫描仪的测量系统中,点云配准受到环境动态特性和噪声干扰的显著影响。传统方法受特征匹配准确性和迭代优化稳定性的限制,难以满足工业应用对精度和鲁棒性的严格要求。
与传统方法相比,深度学习技术通过强大的特征表示能力显著提高了点云配准性能。早期研究如PointNetLK[23]首次结合了PointNet[24]的局部特征提取能力和李群优化框架实现端到端姿态估计。后续研究进一步发展了这一领域:ROPNet[25]通过识别重叠区域提高了精度,而CoFiNet[26]采用了从粗到细的配准策略。此外,GeoTransformer[27]引入了Transformer架构的全局自注意力机制,加强了跨尺度几何特征建模。RPMNet[28]利用软对应关系和退火技术实现了鲁棒的粗到细配准。最近,GCNet[29]整合了几何引导编码和一致性投票机制,通过提高正确对应点的比例实现了最先进(SOTA)的性能。
值得注意的是,现有的基于学习的配准方法主要依赖于室外LiDAR或室内3D相机生成的数据集,这些数据集的点云密度具有空间均匀分布,噪声模式主要是高斯白噪声[30]、[31]、[32]。然而,来自2D激光扫描仪和工业机器人集成系统的点云数据存在显著差异:一方面,机器人手臂运动过程中的振动和轨迹抖动会导致不同姿态下扫描点云的局部几何特征发生变化[33];另一方面,材料表面反射率的差异会导致高频锯齿状边缘噪声和局部数据缺失,使得测量点云与CAD模型之间的拓扑结构、表面纹理和噪声分布存在显著异质性[34]。这些特点表明,为机器人线激光测量系统定制的配准算法不仅需要平衡局部几何细节的保留与全局拓扑一致性约束,还需要解决由异质噪声引起的特征不匹配问题。
为了解决这些问题,提出了SDGNet,这是一种结合了保持局部性的序列化和光谱平滑的统一配准框架,以提高准确性和鲁棒性。该框架受到Point Transformer V3 (PTv3)[35]的启发,采用了基于空间填充曲线(SFC)的序列化方法将无序点云转换为有序序列,从而利用局部连续性和长距离上下文线索。同时,受扩散启发的语义正则化(例如PosDiffNet[36]及相关工作[37])的启发,在浅层集成Beltrami扩散(BD)模块,以抑制破坏SFC诱导的局部性和在序列化序列中引入不连续性(“虚假邻居”)的高频扰动。在同源多姿态扫描配准和异源扫描到CAD配准实验中,SDGNet在多种场景下均表现出更稳定和准确的转换结果。本研究的主要贡献如下:
(1) 提出了SDGNet点云配准模型,该模型引入了序列化编码机制以增强空间特征捕获,从而提高了配准精度。
(2) 引入了Beltrami扩散模块,进一步增强了模型的鲁棒性和适应性。
(3) 在同源和异源配准场景中验证了SDGNet配准算法的准确性和鲁棒性,证明了其在机器人测量应用中的潜力。
本文的其余部分结构如下:第二部分介绍了我们提出的实验设备和实验方法。第三部分展示了相关的实验结果和分析。最后,对本文进行了总结。
方法
实验工作流程如图1所示。首先,使用机器人线激光测量系统扫描目标表面以收集原始点云数据并构建数据集。然后,将数据集输入SDGNet模型进行迭代训练和参数优化。最后,进行了同源配准(单传感器多视图扫描点云配准)和异源配准(扫描点云与CAD点云配准)实验
实验结果与讨论
在本节中,进行了一系列实验以全面评估所提出模型的性能。所有算法均在Intel i7 14700KF处理器和NVIDIA GeForce RTX 4060Ti显卡(配备16GB内存)上进行调试。在训练和测试阶段,旋转角度限制在?10°到+10°之间,平移距离限制在?50毫米到+50毫米之间。此外,批量大小设置为16,训练周期数量也进行了设定
结论
本研究提出了SDGNet模型,以解决机器人手眼测量应用中常见的点云配准精度降低和鲁棒性不足的问题。主要结论如下:
(1) 本研究提出了一种基于序列化几何引导的配准网络(SDGNet),通过整合序列化编码机制和Beltrami扩散算法,显著提高了点云配准性能。
资助
作者感谢国家自然科学基金(项目编号51975517)对本工作的财务支持。
CRediT作者贡献声明
方强:资源管理、项目协调。魏彦丁:资金获取、概念构思。池梦琪:可视化、软件开发。胡一博:验证、监督。郭晓宇:撰写初稿、方法设计、概念构思。朱宝:撰写、审稿与编辑、数据整理。
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。
郭晓宇2022年在中国宁夏大学获得机械工程学士学位,目前在中国浙江大学机械工程学院攻读博士学位。他的研究兴趣包括计算机视觉和机器人运动规划。