布里斯托大学等发布:基于Ground-To-2.5D地图匹配的图像地理定位
#论文# arxiv|布里斯托大学联合华为河图与上海人工智能实验室发布基于Ground-To-2.5D地图匹配的图像地理定位 【Image-based Geolocalization by Ground-to-2.5D Map Matching】 文章链接:[2308.05993] Image-based Geolocalization by Ground... 我们研究基于图像的地理定位问题,旨在将地面视角的查询图像定位在地图上。先前的方法通常利用跨视角定位技术将地面视角的查询图像与2D地图进行匹配。然而,由于显著的跨视角外观差异,这些方法的性能经常不令人满意。在本文中,我们将跨视角匹配扩展到2.5D空间,在这个空间中,结构物(如树木、建筑物和其他物体)的高度可以提供额外的信息来引导跨视角匹配。我们提出了一种新的方法,从多模态数据中学习代表性的嵌入。 具体而言,我们首先通过极坐标变换将2D地图与地面全景图像对齐,以减小全景图像和地图之间的差距。然后,我们利用全局融合来融合来自2D和2.5D地图的多模态特征,以增加位置嵌入的独特性。我们构建了第一个大规模的地面到2.5D地图地理定位数据集,以验证我们的方法并促进研究。我们在两种流行的定位方法上测试了我们学习到的嵌入,即基于单个图像的定位和基于路径的定位。大量实验证明,我们提出的方法比先前的基于2D地图的方法实现了更高的定位精度和更快的收敛速度。