欢迎光临散文网 会员登陆 & 注册

自动驾驶国内首个BEV感知全栈系列学习教程

2023-08-02 15:26 作者:bili_93891819972  | 我要投稿


如下图是BEV的表示例子结果:

这项工作是基于弱双目真值对单目语义度量占用网格映射(semantic-metric occupancy grid mapping )做端到端学习。该网络学会预测四个类别(road/terrain/sidewalk/non-free space),以及一个摄像机到鸟瞰图的映射。它的核心是利用变分编码器/解码器网络(variational encoder-decoder network,VED),该网络对驾驶场景的前视视觉信息进行编码,然后解码为2D顶视直角坐标系。其采用的嵌入矢量较小的变化采样具有对车辆动态扰动的鲁棒性,以及针对未见KITTI数据的泛化性。

如下图是可变编码器-解码器方法的说明: 从单个前视图RGB图像中,系统可以预测2-D顶视图语义度量占用网格图。

如下图是一些不同方法在测试集得到的映射图例子:


自动驾驶国内首个BEV感知全栈系列学习教程的评论 (共 条)

分享到微博请遵守国家法律