视觉SLAM2
2023-03-30 12:29 作者:璐璐20211128 | 我要投稿
在视觉 SLAM 中,基于深度学习的特征提取对于建图和定位都至关重要。 从图像中提取特征后,它们将用于估计设备的姿势并重建环境。
建图: 建图涉及使用从图像中提取的特征来创建环境的表示。
在基于特征的视觉 SLAM 中,映射过程通常涉及估计环境中特征的 3D 位置。 当相机捕获连续图像时,图像之间的特征匹配。 基于匹配的特征,可以使用 Perspective-n-Point (PnP) 或 Bundle Adjustment 等技术来估计相机位置(姿势)之间的相对运动。
这个过程被称为“运动估计”。 随着相机的移动,新特征会被检测到,与现有特征匹配,并进行三角测量以计算它们在环境中的 3D 位置。 要素的 3D 位置及其相关描述符的组合创建了表示环境的地图。 随着相机的移动和观察更多的特征,这张地图会逐渐更新。
定位: 定位是估计设备在地图内的姿态(位置和方向)的过程。 在基于特征的 Visual SLAM 中,定位依赖于将从当前图像中提取的特征与地图中存储的特征进行匹配。 当捕获新图像时,应用基于深度学习的特征提取方法来获取特征及其描述符。 然后使用 k-最近邻 (kNN) 搜索或其他匹配策略等技术将描述符与现有地图中的特征描述符进行匹配。 一旦建立了当前图像特征和地图特征之间的对应关系,就可以使用 PnP 算法估计相机的姿态,该算法在给定 2D-3D 对应关系的情况下求解相机的位置和方向。 这个过程被称为“姿势估计”。
总之,基于深度学习的特征提取对于视觉 SLAM 中的建图和定位都至关重要。 这些特征用于估计相机的运动,重建环境的 3D 结构,并确定设备在地图中的姿势。