从零开始一起学习SLAM | 学习SLAM到底需要学什么?

2023-05-16

SLAM涉及的知识面很广,我简单总结了 “SLAM知识树” 如下所示:

这里写图片描述
(公众号菜单栏回复 “树” 可获得清晰版)

可以看到涉及的知识面还是比较广的。这里放出一张SLAM圈子里喜闻乐见的表达悲喜交加心情的漫画图,大家可以感受一下:
这里写图片描述

每个学SLAM的小伙伴可以说都是冒着“头顶凉凉”的巨大风险,勇气可嘉。下面结合SLAM知识树展开具体说说。

编程环境

首先先说电脑环境和编程。

1、电脑环境:Linux环境,推荐Ubuntu16.04。

有人问Windows行不行?这么说吧,如果你是一位SLAM领域的大牛,并且具有超强的解决bug能力,你可以用Windows,否则,非常不建议在Windows下编译,因为你早晚会被各种依赖库,各种bug搞崩溃的。而且大部分的SLAM开源代码都在Linux环境下编译,很多第三方依赖库在Linux下可以非常方便的安装。

如果之前没有接触过Ubuntu的,也不用担心。刚开始用命令行界面可能不太习惯,慢慢习惯后就会发现Linux的内在美。所以要学SLAM就先装一个Ubuntu系统吧,如果电脑本身是Windows系统,建议装双系统,不要装虚拟机。学习Linux的话,就看那本经典的书:《鸟哥的Linux私房菜》吧,书的内容比较多,建议先学习一下基本的文档操作指令。可以快速浏览一遍,不需要死记,以后用到了再去查就行。这书的作者鸟哥有个网站也可以查命令,挺方便的:

http://cn.linux.vbird.org/linux_basic/1010index.php

2、编程相关

编程语言:

主要是C++。推荐红宝书《C++ Primer》。内容非常多而全。如果是初学者没那么多时间学一遍,就重点选择前几章基础看看,动手敲一敲代码。然后了解后面几章常用的数据结构和C++的一些特性(重载、多态、继承)等。有时候也需要会一些python,网上资料很多,不多说。

集成开发环境:

CLion(用edu结尾邮箱可以申请免费使用一年)、kdevelop(免费),个人觉得前者好用一点。

编译工具:

cmake。统一使用cmake编译,好处很多,比如代码可以很方便的跨平台使用等。使用起来也很方便。有个小册子《CMake practice》照着学一下。

文档编辑:

有很多,比如gedit、Nano、vim等。

第三方函数库:

使用到的第三方库主要包括:OpenCV(计算机视觉),OpenGL(计算机图形学),Eigen(几何变换),Sophus(李代数),Ceres(非线性优化),G2o(图优化)等。

数学

这里写图片描述

主要是大学里学的:线性代数、概率论和微积分。虽然很多人大学里学的早都还给老师了,不过也不用太担心,SLAM里也不需要非常难的数学问题。主要包括:

矩阵的性质。比如矩阵乘法、求逆、矩阵分解(SVD,QR,Cholesky)、反对称矩阵等。

李群李代数。这个可能很多人以前没接触过,也是挺重要的,不过高翔的十四讲里也讲的比较详细了,仔细推一下公式。

非线性优化问题。比如梯度下降、牛顿法、高斯-牛顿法、LM算法、bundle adjustment等。

此外,还有泰勒展开,求(偏)导,积分等。

计算机视觉相关

SLAM里涉及很多图像处理、计算机视觉知识,总结一下主要有:

相机相关:单目、双目、RGB-D等相机的物理参数意义、相机成像模型、相机的标定、去畸变等。双目的话还涉及到视差计算,RGB-D的话涉及到RGB和depth图像的对齐等。

图像处理相关。比如和特征点相关的有:特征点描述子、特征点提取、特征点匹配。图像梯度计算、边缘检测、直线检测等。

多视角几何相关。比如对极约束、本质矩阵、单应矩阵、光流估计、三角化等。
这里写图片描述

英语

学习SLAM必须具备一定的英语阅读能力。因为SLAM相关的大部分资料(论文、书籍、技术文档等)都是英文的。不过即使英文不好也不用太担心,利用好查单词软件,遇到不认识的 就去查,时间长了也就都混的“脸熟”了,英语阅读速度和理解能力也会逐渐提升。

开源代码

虽然SLAM比较难,但是令人欣慰的是,SLAM领域有很多优秀的开源代码可以学习。列举几个主流的如下:

稀疏法:

ORB-SLAM2:支持单目,双目,RGB-D相机

https://github.com/raulmur/ORB_SLAM2

半稠密法:

LSD-SLAM:支持单目,双目,RGB-D相机

https://vision.in.tum.de/research/vslam/lsdslam

DSO:单目

https://vision.in.tum.de/research/vslam/dso

稠密法

Elastic Fusion:RGB-D相机

https://github.com/mp3guy/ElasticFusion

BundleFusion:RGB-D相机

https://github.com/niessner/BundleFusion

RGB-D SLAM V2:RGB-D相机

https://github.com/felixendres/rgbdslam_v2

多传感器融合:

VINS:单目 + IMU(惯性测量单元)

https://github.com/HKUST-Aerial-Robotics/VINS-Mono

OKVIS:(单目、双目、四目)+ IMU

https://wp.doc.ic.ac.uk/sleutene/2016/02/04/release-of-okvis-open-keyframe-based-visual-inertial-slam/

数据集

主要列举几个主流的数据集

1、TUM RGB-D SLAM Dataset and Benchmark

这里写图片描述
德国慕尼黑理工大学计算机视觉组制作的数据集,使用Kinect相机采集的数据集,包括IMU数据,并且用高精度运动采集系统提供了groundtruth(真值)。提供测试脚本,可以方便的实现量化评估。

https://vision.in.tum.de/data/datasets/rgbd-dataset

2、KITTI Vision Benchmark Suite

这里写图片描述
德国卡尔斯鲁厄理工学院和丰田工业大学芝加哥分校一起合作制作的用于自动驾驶的数据集。

使用一辆改装的汽车采集,该车配备了两台高分辨率彩色和灰度摄像机,还有Velodyne激光扫描仪和GPS定位系统,用来提供精确的groundtruth。主要采集区域是卡尔斯鲁厄市区、农村地区和高速公路。提供测试脚本可以方便的实现量化评估。

http://www.cvlibs.net/datasets/kitti/

3、EuRoC MAV Dataset

这里写图片描述
苏黎世联邦理工大学制作的数据集,采用装备了双目相机和IMU的四旋翼无人机采集数据,使用高精度运动采集系统提供了groundtruth。提供测试脚本,可以方便的实现量化评估。

https://projects.asl.ethz.ch/datasets/doku.php?id=kmavvisualinertialdatasets

作业

题目1

我们知道SLAM是处理序列图像的,有时候需要格式化的图像名字用作输入。前面提到的TUM的RGB-D数据集中图像是根据时间命名的,请从下面链接下载数据集fr1/desk

https://vision.in.tum.de/data/datasets/rgbd-dataset/download#

并解压。请编程实现将文件夹/rgb下以时间命名的序列图片重新命名为0000-9999的格式。

本程序学习目的:

熟悉cmake的使用、OpenCV读写操作、C++的string操作

题目2

已知相机的位姿用四元数表示为q=[0.35,0.2,0.3,0.1],顺序为x,y,z,w,请编程实现:

输出四元数对应的旋转矩阵、旋转矩阵的转置,旋转矩阵的逆矩阵,旋转矩阵乘以自身的转置,验证旋转矩阵的正交性。

本程序学习目的:

熟悉cmake的使用、学习eigen的基本操作;根据实践验证旋转矩阵的约束

下图是用于参考的代码框架:

这里写图片描述
参考输出如下,用于验证结果。
这里写图片描述

欢迎留言讨论,或者在公众号:计算机视觉life菜单栏进入知识星球「从零开始学习SLAM」一起学习交流(有参考答案)~

相关阅读

从零开始一起学习SLAM | 为什么要学SLAM?

零基础小白,如何入门计算机视觉?

原文链接更精彩:从零开始一起学习SLAM | 学习SLAM到底需要学什么?

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从零开始一起学习SLAM | 学习SLAM到底需要学什么? 的相关文章

  • PX4开发(2):QGroundControl的使用及电调校准——准备起飞

    1 介绍 上一节把固件烧写好了 xff0c 接下来进行传感器的校准了 xff0c 传感器校准要使用官方的地面站 xff0c 也就是QGC QGroundControl xff0c 官网下载点击这里 安装好QGC后打开 xff0c 然后将pi
  • Linux驱动开发04:块设备驱动和网络设备驱动

    介绍 因为块设备驱动和网络设备驱动实际中用得较少 xff0c 所以只给出驱动模板 xff0c 我也没有具体测试 xff0c 等到实际用到是再研究吧 xff0c 溜了溜了 块设备驱动模板 span class hljs keyword str
  • 支撑程序员的三种精神

    我注意到有三种精神指引着软件开发人员的灵魂 伟大的艺术家精神 xff0c 可信赖的员工精神和自私的实用主义精神 伟大的艺术家精神 如果你听到一种声音说 你不能这样画 xff0c 然后 xff0c 你继续这样画 xff0c 这种反对的声音就会
  • docker数据迁移

    docker数据迁移 前言 开发服务器随着docker运行服务的变多 xff0c docker目录占用磁盘空间也在逐渐变大 xff0c 终于在最近磁盘彻底占满导致容器启动不起来并提示 34 no device space left 34 为
  • 超好看的个人主页官网源码+带动态特效

    正文 这款个人主页源码感觉是我有史以来见过最好看的 xff0c 功能和页面也比较多 xff0c 简约又不失格调 官网带动态特效视频源码 xff0c 修改主页文件即可 程序 wwvwd lanzouw com i6RWe0ag8gde 图片
  • A2W、W2A、A2T、T2A的使用方法

    1 A2W和W2A 在 Window核心编程 xff0c 多字节和宽字节之间转换比较麻烦的 xff0c MultiByteToWideChar函数和WideCharToMultiByte函数有足够多的参数的意义让我们去理解 那么使用ATL的
  • C语言中int到float的强制类型转换

    最近在看一本名为的书 由于我所看过的计算机理论方面的书较少 xff0c 加上自己大学期间一直也不用功 xff0c 所以对于计算机的工作原理以及程序的工作方式我始终只知甚少 xff0c 印象也十分模糊 不过 xff0c 应该说我碰到了一本好书
  • MFC中如何将焦点设置到指定控件上

    MFC中如何将焦点设置到指定控件上 需求 xff1a 窗口打开的时候就将焦点 xff08 光标 xff09 设置到某个指定的控件上去 实现方法 xff1a 设置焦点需要用到setFocus这个方法 xff08 几乎任何编程环境都这样VC x
  • _tcschr、_tcsrchr

    tcschr tcsrchr 好处 xff1a 是可以不管是用unicode 编码还是其他 代码都不用改 C 43 43 标准库函数提供了字符和字符串的操作函数 xff0c 并提供了其UNICODE版本 xff0c 如 xff1a 1 tc
  • vc++ 6.0编译后生成的文件

    vc 43 43 6 0编译后生成的文件 程序在编译后 在目标路径下会生成多个文件 Debug文件夹 exe ilk obj pch pdb idb pdb cpp dsp ncb plg exe 是生成的可执行文件 ilk 当选定渐增型编
  • 除了pid还有什么控制算法,类似pid算法还有哪些

    什么是专家PID xff1f 他和传统的PID有什么区别 xff1f PID是智能控制啊 比如要控制一个水管的水流量 通过流量计 开关阀 让PID来控制开关阀的开关大小使水流量正确 专家PID记得是PID的高级设置 某些个场合一般的PID无
  • c++编译错误:invalid new-expression of abstract class type

    error invalid new expression of abstract class type UserdataActionI 原因 xff1a 出现这个错误原因是new 了一个抽象类出错 xff0c 说明父类 xff08 接口 x
  • Servlet jsp跳转到Servlet 出现404错误的路径设置方法

    jsp跳转到Servlet 出现404错误的路径设置方法 解决一 xff1a 最近又遇到了这种问题 xff0c 百度了好久 xff0c 发现有人说要在action的路径里面写Servlet文件的绝对路径 xff0c 比如说 xff0c 单独
  • 产品经理做APP从头到尾的所有工作流程详解!

    xff08 一 xff09 项目启动前 从事产品的工作一年多 xff0c 但自己一直苦于这样或者那样的困惑 xff0c 很多人想要从事产品 xff0c 或者老板自己创业要亲自承担产品一职 xff0c 但他们对产品这个岗位的认识却不明晰 xf
  • 使用阿里云搭建自己的原型发布站点

    最近在做项目时 xff0c 使用了Axure团队协同工具 AxureShare 时 xff0c 发现了一个问题 xff1a 由于AxureShare服务器在国外 xff0c Axure共享生成的链接访问时非常慢 xff0c 网上找了很多解决
  • 【FTP工具linux错误】Job for vsftpd.service failed because the control process exited with error code

    环境 xff1a 阿里云centos7 2搭建ftp 问题 xff1a 启动vsftpd服务 xff0c 报错 xff1a Job for vsftpd service failed because the control process
  • 【FileZilla错误】500 OOPS: could not read chroot() list file:/etc/vsftpd/chroot_list

    环境 xff1a ECS里 Centos 7 2 安装了vsftpd Windows安装了FileZilla 问题 xff1a 当链接时报错 xff1a 500 OOPS could not read chroot list file et
  • VirtualBox通过恢复备份快照VDI文件恢复至备份状态

    昨天很贱 xff0c 看到服务器的VB的快照 xff08 SnapShot xff09 是放在C盘的 xff0c 然后C盘的35G空间被这个快照用掉了14G xff0c 加上系统的18G xff0c 还剩3G的空间 关闭VB xff0c 然
  • 关于机器人操作系统(ROS)学习前须知二三

    ROS基础资料 1 什么是ROS xff1f ROS xff08 机器人操作系统 xff0c Robot Operating System xff09 xff0c 是专为机器人软体开发所设计出来的一套电脑作业系统架构 它是一个开源的元级操作
  • SLAM/VIO学习总结

    作者 xff1a 游振兴 链接 xff1a https zhuanlan zhihu com p 34995102 来源 xff1a 知乎 著作权归作者所有 商业转载请联系作者获得授权 xff0c 非商业转载请注明出处

随机推荐