欢迎光临散文网 会员登陆 & 注册

论文解读 | IROS 2022:对称性感知形状先验变形用于直接类别级的物体位姿估计

2023-05-26 10:31 作者:BFT白芙堂机器人  | 我要投稿

原创 | 文 BFT机器人

图片


01 研究内容


图片


本篇论文主要研究的是如何准确地估计物体的姿态。


在计算机视觉领域中,姿态估计是一个很重要的问题,因为它可以应用到很多领域,比如机器人操作、增强现实和自动驾驶等。以前的方法通常需要分两步来完成,第一步是提取物体的特征,第二步是根据这些特征来估计物体的姿态。


但这种方法存在一些问题,比如特征提取和姿态估计之间不太一致、形状先验模型不够准确等。因此,本文提出了一种新的方法SSP-Pose来解决这些问题,并在公共基准测试中取得了最先进的性能。


本文所遇到的难点是如何在没有CAD模型的情况下,对来自已知类别的新实例进行姿态估计。这是一个更具挑战性的问题,因为不同实例之间存在形状差异和姿态变化。此外,传统的物体姿态估计方法通常需要两个步骤,即特征提取和姿态回归,这两个步骤之间可能存在不一致性。


02  该篇论文的创新点


1. 提出了一种新的端到端可训练网络SSP-Pose,用于解决物体姿态估计中存在的问题,包括形状先验模型不够准确、特征提取和姿态回归之间存在不一致性等。


2. 利用对称先验知识来指导形状先验变形,并提出了一种对称性感知匹配损失来缓解形状先验匹配步骤中的歧义性,从而稳定和促进类别级别姿态敏感特征的学习。


3. 在公共基准测试中取得了最先进的性能,并且实现了实时推理速度,约为25 FPS。


图片

图1是本篇论文中的一个示意图,用于说明SSP-Pose算法的整体流程。


整体流程:


首先,使用一个现成的物体检测器(例如MaskRCNN)对感兴趣的物体进行分割(b),并从深度图生成反投影点云(a)。


然后,采用3DGCN作为编码器来提取观察到点云F_obs的特征。接下来,使用形状先验模型对点云进行形状变形,并利用对称性先验知识来指导形状先验变形,并使用对称性感知匹配损失来缓解形状先验匹配步骤中的歧义性。


最后,将变形后的形状先验与直接回归的姿态进行一致性检查,并输出物体的姿态估计结果。整个算法是端到端可训练的,并且可以在公共基准测试中取得最先进的性能。


03  实验结果


本篇论文的实验部分主要使用NOCS-REAL275和NOCS-CAMERA25数据集来评估SSP-Pose算法的性能。


其中,NOCS-REAL275是一个真实世界的数据集,包含了6个已知类别的物体(瓶子、碗、相机、罐头、笔记本电脑和杯子)的4.3k张训练图像和6个场景的2.75k张测试图像。


而NOCS-CAMERA25是一个合成数据集,通过在真实背景上渲染虚拟物体来生成,与NOCS-REAL275具有相同的类别。它提供了275k张训练图像和25k张测试图像。在这些数据集上进行了大量实验,并与其他最先进的方法进行了比较,证明了SSP-Pose算法在物体姿态估计方面具有很高的准确性和鲁棒性。


图片


图2 SSP-Pose与DualPoseNet的定量比较。演示了NOCS-REAL275在不同误差阈值下的精度,包括3D IoU,旋转和平移。


图片

图3是对SSP-Pose算法在NOCS-REAL275数据集上与DualPoseNet算法进行比较的结果。


图中显示了不同物体类别的姿态估计结果,包括瓶子、碗、相机、罐头、笔记本电脑和杯子。从图中可以看出,SSP-Pose算法在所有物体类别上都取得了更好的性能表现,特别是在相机这一类别上表现最为突出。


05  总结


该论文提出了一种新的姿态估计算法SSP-Pose,该算法利用形状先验和类别先验来提高姿态估计的准确性和鲁棒性。


实验结果表明,SSP-Pose算法在多个数据集上都取得了比其他最先进的方法更好的性能表现,并且具有25Hz的实时推理速度。此外,作者还计划将该算法扩展到更复杂的场景中。


图片


标题

SSP-Pose: Symmetry-Aware Shape Prior Deformation for Direct

Category-Level Object Pose Estimation


更多精彩内容请关注公众号:BFT机器人

本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。

论文解读 | IROS 2022:对称性感知形状先验变形用于直接类别级的物体位姿估计的评论 (共 条)

分享到微博请遵守国家法律