
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一种用于叉车托盘姿态估计的超图计算与知识增强框架
《Annals of the New York Academy of Sciences》:A Hypergraph Computing and Knowledge-Enhanced Framework for Forklift Pallet Pose Estimation
【字体: 大 中 小 】 时间:2026年02月17日 来源:Annals of the New York Academy of Sciences 4.8
编辑推荐:
自主叉车操作中密集托盘堆叠、遮挡和光照变化导致定位精度与效率问题,本文提出融合超图计算与领域知识增强的框架,通过层次化注意力融合和几何感知关键点检测实现稳健姿态估计,模型压缩至20.2MB仍保持97.5%检测精度和97.3%关键点定位精度,采用Mahalanobis距离优化实现角误差1.6°内、定位误差18mm以下,在Jetson Orin Nano平台72.1FPS实时运行,验证数据集含16233张图像覆盖多场景。
现代仓库中的自主叉车操作面临着来自密集托盘堆叠、部分遮挡和变化光照条件等关键挑战,这些因素显著影响了定位精度和运营效率。本文提出了一种基于超图计算和知识增强的新框架,用于实现鲁棒的托盘姿态估计,以应对这些复杂的工业场景。该框架利用超图结构来建模托盘关键点之间的高阶空间关系,即使在严重遮挡和堆叠变形的情况下也能有效表示E形托盘配置的几何依赖性。通过将超图计算与领域知识相结合,我们开发了一种超姿态架构,该架构结合了层次注意力融合机制和几何感知的关键点检测模块,并将托盘结构先验编码为可微分约束。专门为超图结构设计的拓扑保持剪枝策略将模型大小缩减至20.2 MB,同时保持了97.5%的检测精度和97.3%的关键点定位精度。该框架采用马氏距离优化进行不确定性约束的姿态估计,实现了角度误差低于1.6°、距离误差低于18 mm的结果。该系统在NVIDIA Jetson Orin Nano边缘计算平台上实现了72.1 FPS的实时性能。使用16,233张仓库图像进行的广泛验证证实了其在各种挑战性条件下的鲁棒性能。超图计算与知识增强的结合为工业视觉系统树立了新的范式,显著提高了自动化物料处理的可靠性。
本研究提出了一种基于几何感知的关键点检测和不确定性约束姿态估计的托盘定位方法。主要贡献包括层次注意力融合、利用E形托盘先验的增强型几何感知检测、实现44%压缩率的拓扑感知剪枝以及不确定性感知优化。实验结果显示,检测精度为97.5%,关键点定位精度为97.3%,角度误差低于1.6°,距离误差低于18 mm。20.2 MB的模型在NVIDIA Jetson设备上可实现72.1 FPS的性能,满足工业自动化需求。
代表所有作者,通讯作者声明不存在利益冲突。
本研究中使用的托盘检测数据集目前尚未完全公开,主要是因为部分图像包含来自工业合作伙伴的生产场景信息,需要匿名处理。为了促进研究的可重复性和学术交流,我们承诺在论文正式发表后,通过GitHub仓库公开发布该数据集的核心子集,其中至少包含3000张标注图像,涵盖所有场景类别,包括室内、室外、遮挡、堆叠、不同光照条件和各种视角。对于有进一步研究需求的研究人员,可以通过向通讯作者提出合理请求来获取完整数据集。