中科院自动化所和图森联合开源FSD V2:通过虚拟体素改进的全稀疏三维物体检测
#论文##开源# arxiv 2023|中科院自动化所和图森联合开源FSD V2:通过虚拟体素改进的全稀疏三维物体检测 【FSD V2: Improving Fully Sparse 3D Object Detection with Virtual Voxels】 文章链接:[2308.03755] FSD V2: Improving Fully Sparse 3D Obj... 开源代码:GitHub - tusen-ai/SST: Codes for “Fully Sparse 3D ... 基于LiDAR的全稀疏架构引起了越来越多的关注。FSDv1作为代表性的工作在效能和效率方面表现出色,尽管具有复杂的结构和手工设计。在本文中,我们介绍了FSDv2,这是FSDv1的升级版本,旨在简化以前的FSDv1,同时消除其手工设计的实例级表示引入的归纳偏差,从而提高更好的通用适用性。为此,我们引入了虚拟体素的概念,取代了FSDv1中基于聚类的实例分割。虚拟体素不仅解决了全稀疏检测器中臭名昭著的中心特征缺失问题,还赋予了框架更加优雅和简化的方法。 因此,我们开发了一系列补充虚拟体素概念的组件,包括虚拟体素编码器、虚拟体素混合器和虚拟体素分配策略。通过经验验证,我们证明虚拟体素机制在功能上类似于FSDv1中的手工聚类,同时更具通用性。我们在三个大规模数据集上进行了实验证明:Waymo开放数据集、Argoverse 2数据集和nuScenes数据集。我们的结果展示了在这三个数据集上的SOTA,突显了FSDv2在长距离场景中的优越性,并且其通用适用性可以在各种场景中实现具有竞争力的性能。此外,我们提供了全面的实验分析,以阐明FSDv2的工作原理。