首页 > AR设备单目视觉惯导SLAM算法综述与评价

AR设备单目视觉惯导SLAM算法综述与评价

点云PCL免费知识星球,点云论文速读。

标题:Survey and evaluation of monocular visual-inertial SLAM algorithms for augmented reality

作者:Jinyu LI, Bangbang YANG, Danpeng CHEN, Nan WANG, Guofeng ZHANG1

编译:particle

欢迎各位加入免费知识星球,获取PDF论文,欢迎转发朋友圈分享快乐。

摘要

尽管VSLAM/VI-SLAM已经取得了巨大的成功,但是由于缺乏合适的标准的基准,从增强现实的角度定量评估各种SLAM系统的定位结果仍然困难。实际中的AR应用,由于用户可能不小心移动了AR设备,并且实际环境可能相当复杂,因此很容易遇到各种具有挑战性的场景(例如快速运动、强旋转、严重的运动模糊、动态干扰等)。此外,AR应用应尽量减少图像跟踪丢失的频率,并能够从故障的丢失状态中快速准确地恢复,以获得良好的AR体验。现有的SLAM数据集通常只提供姿态精度的评估,而且它们的相机运动很简单,不适合常见的移动AR应用场景。基于上述情况,我们建立了一个新的视觉惯性数据集和一系列AR的评价标准,并对现有的单目VSLAM/VI-SLAM方法进行了详细的分析和比较。特别是选择了8种具有代表性的单目VSLAM/VI-SLAM方法/系统,并在我们的基准上对它们进行了定量评价。我们的数据集、样本代码和相应的评估工具可以在网站找到: http://www.zjucvg.net/eval-vislam/.

在这里插入图片描述

主要内容

文章开始介绍了视觉SLAM以及VI-SLAM的基本理论,并且最终将两种的SLAM都归结为优化方程,比如视觉SLAM总结为优化相机位姿以及三维特征点的函数

在这里插入图片描述

这种优化称为捆集调整(BA)[1],即SfM和VSLAM的核心模块。

对于单目惯性SLAM,通过IMU的数据来恢复和优化单目SLAM中的绝对尺度问题,所以VI-SLAM结合了视觉测量和惯性测量的方式,可视为是VSLAM的扩展方法。所以VISLAM中的BA函数定义为:

在这里插入图片描述

接下来文章将着重介绍AR应用中的各种SLAM方案,并进行对比与评价。众所周知,SLAM系统可以通过滤波或优化来求解状态。基于此的SLAM方法可以分为基于滤波的方法和基于优化的方法。并且用于图像跟踪的前端部分也不尽相同。一些方法利用关键点匹配来优化重投影误差。也有一些方法直接使用图像像素最小化光度误差。这里将介绍一些有代表性的单目VSLAM/VI-SLAM方法。

基于滤波的SLAM

MonoSLAM是最早的单目VSLAM系统之一。由于它使用扩展卡尔曼滤波器来解决相机姿态问题,所以它是一个基于滤波的SLAM系统。对于Kalman更新步骤,所使用的观测值是标准针孔模型的重投影

基于优化的SLAM

基于滤波的SLAM系统不可避免地存在累积误差。据调查,基于优化的SLAM方法比基于滤波的方法具有更高的精度[2],首先介绍基于关键帧优化方法的PTAM,然后介绍了在PTAM之后的ORB-SLAM,它将图像跟踪、局部地图维护和回环检测放在三个线程中,在整个系统中使用ORB特征来提高系统的健壮性。ORB-SLAM使用了两种初始化的方式:单应矩阵模型和极线约束模型,并选择最佳模型初始化前两个关键帧。所以当有足够的运动时,系统会自动初始化。ORB-SLAM的开源激发了许多新的作品,包括基于惯性的ORB-SLAM.

OKVIS是设计用于融合惯性测量VI-SLAM系统,OKVIS的核心优化问题是一个既有重投影误差又有IMU运动误差的滑动窗口优化问题。而VINS Mono是一个强大的视觉惯性SLAM系统。与ORB-SLAM相比,它有许多新的亮点,拥有稳健的初始化与尺度估计。

基于直接法的SLAM

以上介绍的SLAM前端需要提取特征点,可以概括为特征点法的SLAM,直接法一般是求解最小化图像的光度误差作为SLAM的前端。直接法和间接法各有利弊。在大多数情况下,特征点法对几何噪声(如镜头畸变或卷帘效应)更为稳健,而直接法对几何噪声可能敏感。另一方面,直接方法对光度噪声更为鲁棒,因为使用了具有强度梯度的所有图像区域(边缘、无特征的墙等)。具有代表性的是DSO(Direct Sparse Odometry)

接下来主要就是介绍基于视觉与惯导的数据的采集以及对采集硬件的介绍,并且与常见的开源数据及进行了对比,同时也介绍了一些相机与IMU对齐和标定的工作。

在这里插入图片描述

并且文章介绍到使用了安卓和IOS设备采集各种场景的数据。并将数据集应用到以上的8中SLAM方案中,从跟踪精度,包括绝对误差、相对误差等进行比对,初始化的质量与快慢,以及跟踪的鲁棒性,重定位的耗时等方面进行评价和对比

实验结果

在这里插入图片描述

采集场景的介绍

在这里插入图片描述

VI-SLAM的跟踪精度的对比

在这里插入图片描述

初始化的时间对比

在这里插入图片描述

重定位的耗时对比

总结

现有的单目VSLAM和VI-SLAM方法,选择了8个有代表性的系统对我们的基准进行定量评估。虽然我们的视觉惯性数据是由手机采集的,但是评估仍然是在PC机上进行的,由于PC机的计算能力远远大于手机,所以SLAM结果不能真实反映手机上的实际SLAM效果。实际上,许多SLAM系统不能在手机上实时运行。PTAM和VINS Mono的移动版本已经上市。SenseSLAM是专门为移动AR开发的,能够在移动手机上实时跟踪。

由于文章的篇幅限制,有兴趣可以查看文章主页http://www.zjucvg.net/eval-vislam/,查看论文《Survey and evaluation of monocular visual-inertial SLAM algorithms for augmented reality》

参考文献

【1】Triggs B, McLauchlan P F, Hartley R I, Fitzgibbon A W. Bundle Adjustment—A Modern Synthesis. Vision Algorithms: Theory and Practice. Berlin, Heidelberg: Springer Berlin Heidelberg, 2000: 298-372

【2】Strasdat H, Montiel J M M, Davison A J. Visual SLAM: why filter? Image and Vision Computing, 2012, 30(2): 65–77

如果你对本文感兴趣,请点击“原文阅读”获取知识星球二维码,务必按照“姓名+学校/公司+研究方向”备注加入免费知识星球,免费下载pdf文档,和更多热爱分享的小伙伴一起交流吧!

在这里插入图片描述

更多相关:

  • 公众号致力于分享点云处理,SLAM,三维视觉,高精地图相关的文章与技术,欢迎各位加入我们,一起每交流一起进步,有兴趣的可联系微信:920177957。本文来自点云PCL博主的分享,未经作者允许请勿转载,欢迎各位同学积极分享和交流。资源三维点云论文及相关应用分享【点云论文速读】基于激光雷达的里程计及3D点云地图中的定位方法3D目标检测...

  • Thanks to LOAM, A-LOAM, and LIO-SAM code authors. The major codes in this repository are borrowed from their efforts.代码:https://github.com/gisbi-kim/SC-A-LOAM编译:点云PCL本...

  • 文章:Inertial-Only Optimization for Visual-Inertial Initialization作者:Carlos Campos, Jose M.M. Montiel and Juan D. Tard ´ os´代码:https://github.com/bxh1/VIDO-SLAM.git编译:点云...

  • 点云PCL免费知识星球,点云论文速读。文章:Monocular Object and Plane SLAM in Structured Environments作者:Shichao Yang, Sebastian Scherer翻译:particle本文仅做学术分享,如有侵权,请联系删除。欢迎各位加入免费知识星球,获取PDF论文,欢...

  • 点云PCL免费知识星球,点云论文速读。文章:Persistent Map Saving for Visual Localization for Autonomous Vehicles: An ORB-SLAM 2 Extension作者:Felix Nobis∗, Odysseas Papanikolaou, Johannes Be...

  • 来源:公众号|计算机视觉工坊(系投稿)作者:仲夏夜之星「3D视觉工坊」技术交流群已经成立,目前大约有12000人,方向主要涉及3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、...

  • 点云PCL免费知识星球,点云论文速读。文章:Real-Time LIDAR-Based Urban Road and Sidewalk Detection for Autonomous Vehicles作者:Ern˝o Horváth  , Claudiu Pozna ,and Miklós Unger编译:点云PCL代码:http...

  • 文章:Semantic Histogram Based Graph Matching for Real-Time Multi-Robot Global Localization in Large Scale Environment作者:Xiyue Guo, Junjie Hu, Junfeng Chen, Fuqin Deng, T...

  • 点云PCL免费知识星球,点云论文速读。文章:Robust Place Recognition using an Imaging Lidar作者:Tixiao Shan, Brendan Englot, Fabio Duarte, Carlo Ratti, and Daniela Rus编译:点云PCL(ICRA 2021)开源代码:...

  • 文章:A Survey of Calibration Methods for Optical See-Through Head-Mounted Displays作者:Jens Grubert , Yuta Itoh, Kenneth Moser编译:点云PCL本文仅做学术分享,如有侵权,请联系删除。欢迎各位加入免费知识星球,获取PD...

  • 文章:GVINS: Tightly Coupled GNSS-Visual-Inertial Fusion for Smooth and Consistent State Estimation作者:Shaozu Cao, Xiuyuan Lu, and Shaojie Shen代码:https://github.com/HKUST-...

  • 数据存储系统的经典书籍: 从数据系统的特性开始,先讲单机存储引擎 再到 分布式存储系统,最后到一些数据流的处理方式,作者深入浅出,译者更是精雕细琢,本书需要细品。 将持续阅读整理,先从理论走一轮,再找一些系统做一做实验。...

  • 常见的linux进程状态如下: 关于源文件xmid,可以从Mind-Mapping获取 这里借助进程状态来描述一下linux系统中的平均负载的概念 当我们感觉到系统变慢时,通常通过top和uptime命令来了解系统的负载情况 [root@pub-ncpu-ndb0 ~]# uptime21:06:13 up 8 days, 7:...

  • 围绕分布式存储(ceph)绘制的技能图谱可参考分布式存储ceph 技能图谱 相关的原始编辑文件可以从github-mindMapping下载 如有缺失、不足之处欢迎指正 CEPH架构 关于系统架构,这里主要是将CEPH融入操作系统架构之中 且是根据L版本进行绘制的 关于文件系统 :因为bluestore跳过了本地文件系统,同时封...

  • linux 系统崩溃完全没有操作空间的系统修复 1、通过U盘系统启动 2、修复文件系统 https://editor.csdn.net/md/?articleId=106213788 此时硬盘会被挂在到U盘系统下作为一个目录, 例如/dev/sda2 修复它: fsck -y /dev/sda2 很多时候都有效 3、修复g...