三维重建：SLAM的尺度和方法论问题

2023-05-16

百度百科的定义。此文引用了其他博客的一些图像，如有侵权，邮件联系删除。作为算法的SLAM，被称为同步相机位姿确定和地图构建。作为一个工程的SLAM，有众多的算法。

在计算机视觉中, 三维重建是指根据单视图或者多视图的图像重建三维信息的过程. 由于单视频的信息不完全,因此三维重建需要利用经验知识.。而多视图的三维重建(类似人的双目定位)相对比较容易, 其方法是先对摄像机进行标定, 即计算出摄像机的图象坐标系与世界坐标系的关系.然后利用多个二维图象中的信息重建出三维信息。

预读：三维重建：SLAM的粒度和工程化问题。三维重建根据时间和场景的尺度不同需要引入不同的框架和优化方法：

1. 对于小型物体建模

小型物体建模可使用相机固定的包围设备，直接得到整个三维CAD模型（甚至可以使用类似于硬件级别的光线分析的方法）。

此外，使用KinectFusion的经典深度图像获取设备，也可使用此类通用双目相机完成物体重建的方法，同时此方法也适用于小型场景重建。

框架1 = 几帧单幅深度图像 /+ 简单图像拼接（ICP算法族或者简单三角/极线测量/视差算法）；

百科：三维扫描仪

框架2 = 多帧单幅深度图像 + 相机位姿刚性变换（VO视觉里程算法族）+多个深度图像拼接（ICP+TSDF（Truncated Signed Distance Function）的方法族或者Surfel方法）；

关键元素：VO算法族、ICP算法族、TSDF方法或者Surfel方法。

Change：序列图像计算VO、使用ICP方法或者Surfel方法。Kinect方法使用TSDF网格方法，而ElasticFusion使用surfel表面方法。Kinect方法使用ICP获取VO，ElasticFusion可以在VO中断时使用surfel表面重新计算VO。

2. 相机移动的小型场景

2.1. 像素级别：使用KinectFusion的经典方法，也可使用通用双目相机，完成小型场景像素级别重建。使用框架2.

2.2. 特征点级别：特征点级别重建，三维重建问题转化为经典的SLAM问题。引入经典的SLAM的方法——滤波方法 和对应的地图表示的另一种方式拓扑地图。

单目相机：

框架3 = 多帧二维图像 + 特征点检测算法+ 特征点深度计算/相机位姿刚性变换（ICP/PNP算法）+ 滤波方法（EKF等框架（运动模型+观测模型））+ ANN/RANSAC/ICP/......；

关键元素：特征点检测、特征点匹配（ANN近邻方法）、PNP算法（三维位姿计算）、滤波方法族、RANSAC算法。

Change：（1）基于特征点引入特征提取和特征点模式识别方法，分别为特征点检测算法族和近邻搜索方法族。

（2）基于特征点的三维位姿计算，引入PNP算法族。

（3）基于滤波框架，线性滤波方法族，用于同时优化相机和特征点刚性变换的误差和协方差方程。

双目相机：

使用双目相机的优势在于可获得标准的相机基线，得到空间的绝对尺度，并同时可根据固有视差算法得到特征点的深度信息。可以使用三维稀疏重建的方法。

框架4= 多帧成对三维图像 + 特征点检测算法/视差计算算法（特征点深度计算）+ 相机位姿刚性变换（ICP算法）+ RANSAC/ICP/......；

关键元素：视差方法（深度计算）、稀疏匹配（RANSAC、ICP方法族）。

Change：（1）深度计算：使用视差算法 Vs. PNP算法。

（2）位姿刚性变换变换到ICP算法族。

注意：深度计算之后，整体框架类似于KinectFusion方法，区别在于点集变得稀疏，因此稠密点匹配算法替换为稀疏点匹配算法（ANN方法族）。

3. 相机移动的中型场景

3.1. 像素级别：正如上一篇所说的，是一个大型工程问题，不是一个算法和框架可以描述的，需要更多设备和人的配合。大型场景重建一般使用表面模型，再次不再对其进行多加描述。

3.2. 特征点级别：

特征点级别重建，在可得到序列结构的VO之后，经典的SLAM的方法为滤波方法，为基于最大似然框架。而添加闭环检测之后，借鉴SFM思想的平差方法--捆集优化BA（Bundle Adjustment）引入到SLAM中来，因此形成了另一种框架。

框架5= 多帧二维/三维图像 +特征点检测算法+ 特征点深度计算/相机位姿刚性变换（PNP算法）+BA方法（关键帧平差方法）+ ANN/RANSAC/ICP/......+ 闭环检测（场景匹配/识别方法族）；

关键元素：BA方法（图优化方法等）、闭环检测（点集组合场景检测）。

Change：（1）类似于框架3，位姿和场景同时优化的方法从滤波框架转换到BA框架，引入关键帧平差方法。

（2）基于BA方法，使用关键帧，形式化为无向图，一般使用图优化方法。常用的基础库为G2O。

（3）引入闭环检测，需要使用场景匹配方法（基于特征点），经典方法为使用BOW模型。

4. 相机长期移动的大中型场景

特征点和目标级别：大型场景需要构建大型地图，应对长期误差累计而发展的方法闭环检测重要性增加。对此，闭环检测引入目标识别，进而引入基于目标检测的场景识别，更名为语义SLAM。

语义SLAM：大型场景重建，已走过重复地标记-闭环检测占据更多的分量，场景识别更关注语义分析。

框架6= 多帧二维/三维图像 + 特征点检测算法+ 特征点深度计算/相机位姿刚性变换（PNP算法）+目标检测（目标检测方法族）+目标识别（目标识别方法族） + BA方法（关键帧平差方法）+ ANN/RANSAC/ICP/......+ 闭环检测（基于特征点的闭环检测+基于目标的闭环检测+场景检测）；

关键元素：目标检测（目标特征提取与目标识别）、场景检测标记（基于目标）。

Change：（1）基于框架5或者进行改进，引入基于目标的特征提取方法（目标提取）族和模式识别方法（目标识别）族。由此根据不同的场景需要使用不同的目标检测的通用方法。由此一大批模式识别方法融入SLAM过程，从简单的ANN，到MSVM，到DNN方法。

（2）闭环检测之中增加基于目标的闭环检测，和场景识别。场景检测从BOG模型到基于图的场景识别模型，也可以使用DNN方法中CNN方法。

（3）......................................。

参考文章：场景图像的稀疏表示总结

总结：

三维重建是一个工程问题，发展到三维场景重建，SLAM问题及应对方法相应而生。经典可用的SLAM方法为把SLAM问题转化为滤波方法，是一个真正可用的解决SLAM问题的方法。而后BA方法出现，并随着计算机计算能力的提高，BA方法逐渐应用于SLAM过程。更宽范围的SLAM方法引入目标识别，模式识别的方法（从ANN到MSVM到CNN）引入SLAM，成为语义SLAM，把SLAM发展为“一切问题都可以用模式识别方法来解决”的巨坑。

后记：红酒塔问题

三维重建里面有一个红酒塔问题，即是怎样使用重建算法重建出波光闪闪的透明玻璃杯红酒塔。

其实，红酒塔问题不应该是一个重建问题，从人的感知角度分析，红酒塔也是不能只是靠双目重建的，而其本质是目标识别。识别红酒塔，然后使用模型匹配进行模型补完，重建整个红酒塔，是一个识别之后alignment的过程。

参考：

1. 双目相机-ElasticFusion是三维重建领域效果比较显著的开源库，其作者为Facebook Reality Labs的Thomas Whelan博士。ElasticFusion的github源码主页：https://github.com/mp3guy/ElasticFusion.git。小品文：ElasticFusion解释；

2.双目相机-KinectFusion是微软亚研院开源的一个室内深度场景重建算法，ICRA2011论文：https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/kinectfusion-uist-comp.pdf；小品文：深度相机方案对比-KinectFusion的基本原理（尺度）。

3.单目相机-EKF-SLAM方法是经典的稀疏场景重建方法，小品文：SLAM: Inverse Depth Parametrization for Monocular SALM。EKF在GitHub下载。

4.OrbSLAM工程化良好，成为一个流行的稀疏重建框架，并应用到不同的场景中。小品文：ROS：ubuntuKylin17.04-Ros使用OrbSLAM2。GitHub下载OrbSLAM2。

5.SemanticFusion，结合了CNN方法的重建方法，在数据关联时使用CNN方法。ICRA2017论文，SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural Networks。论文解析：ElasticFusion解析。SemanticFusion开源代码依赖ElasticFusion和Caffe-CNN，使用方法：Ubuntu16使用SemanticFusion

6.VINS-Fusion，视觉惯性单目系统，香港中文大学的开源代码：https://github.com/HKUST-Aerial-Robotics/VINS-Fusion。不依赖ROS的VINS代码：安装使用VINS。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

三维重建：SLAM的尺度和方法论问题的相关文章

Python3+PyQT5+Pyserial 实现简单的串口工具

练手项目 xff0c 先上图先实现一个简单的串口工具 xff0c 为之后的上位机做准备代码如下 xff1a 代码 github 地址 xff1a https github com ColinFred Pyserial Demo pyse
1.定义一个TestList类要求如下（1）利用List接口和泛型新建一个ArrayList对象list，要求为String类型；（2）list添加“China”，“Usa”，“India”，“J

1 定义一个TestList类要求如下 xff08 1 xff09 利用List接口和泛型新建一个ArrayList对象list xff0c 要求为String类型 xff1b xff08 2 xff09 list添加 China xff0
项目篇：移动平台机械臂视觉定位抓取实施（基于ROS架构）

ROS包内容 xff1a 代码暂不公开这篇日志的目的是快速项目实施 xff0c 所以详细的部分会不断补充举例如下 xff1a 项目包1 xff1a 项目地址 Pylon Camera Aruco ros AUBO Robot 大寰机械手
查看rospackage包的依赖

rospack libs only l my package
转载：Snorkel - 可编程的数据标注神器

我知道你已经用上了最先进的深度学习模型 xff0c 不过 xff0c 还在人工标注数据吗 xff1f 这有点过时了 xff01 快来了解下Snorkel 最新的基于弱监督学习的大规模训练数据标注神器现在的机器学习尤其是深度学习模型很强大
ubuntu16.04使用阿路比-LPMS-IG1进行ros数据发布

官方资料下载 https www alubi cn support download 这个是ros包下载地址 https bitbucket org lpresearch openzenros src master 这个包比较坑 xff0c
C++总结1-vector的指针

在使用vector的时候犯了一个导致编译错误 xff0c 在这里记录一下 vector是非常常见也非常好用的容器 xff0c 但是vector的指针有一些特殊如果想要获得vector的数组的指针 xff0c 我找到了两种方法 amp ve
Unity项目关闭Debug.Log没有Log

接手的项目打包后没有记录自定义Log 卧槽 xff0c 这我怎么debug 搜索了一堆都只有说怎么关闭 xff0c 没什么怎么打开的以至于我明明加了Andrid关键词还有说设置Use Player Log的换了个关键词搜索怎么关闭 xf
发行商提供证书打包iOS时遇到的若干问题

No signing certificate ios Development found No ios Development signing certificate matching 开发和发布总共收到了2个 p12文件 xff0c 另外
RPGMakerMV接入Greenworks，以支持steamworks API

RPGMaker MV的基本原理在查看Greenworks的github页面时有提到NW JS xff0c 实际上RPGMakerMV部署好的工程就是基于NW JS运行的在根目录下的Game exe实际上可以用网上下载的NW exe替代
MBP合上盖子后仍反复自动唤醒

现象每天早上起来电脑都有点温度 xff0c 明明一直合着盖子但总是隔了几天就没电了在办公室的时候开着steam就看到提示家里的笔记本可以远程流传输通过休眠命令查看 xff0c 几乎每10分钟就有一条唤醒记录大部分唤醒理由是 xff0
MAC 关闭office软件自动更新提示 (Microsoft AutoUpdate)

参考 xff1a https blog csdn net weixin 42873928 article details 115936349 sudo chmod 000 Microsoft AutoUpdate app 执行的功能是设置文
git 出现 “fatal: The remote end hung up unexpectedly“

情况 xff1a 有台两年没开的电脑长期没有更新git等工具版本 xff0c clone跟checkout的时候都有报这个问题实际上没注意到git lfs filter process git lfs command not found这
VSCode智能补全代码片段技巧

小技巧 foreach的代码片段中没有快速建议智能建议不优先推荐代码片段 xff08 试过也不大行 xff09 foreach的代码片段中没有快速建议通过快速建议输入一个foreach之类的代码片段 xff0c 保持tab键可以切换输入位
Windows下搭建局域网内简易git服务器

这里写自定义目录标题概述配置步骤1 任意位置创建git 仓库2 启动Git Daemon3 其他电脑克隆工程4 开机自动启动5 其他配置注意事项概述由于和朋友小规模制作项目 xff0c 又使用了UE5这样的庞然大物 xff0c 准备整
如果OpenStack给虚机自动分配的ip和其他静态配置的ip重复了怎么办

1 查找你要修改ip地址的网卡id root 64 node 1 neutron port list 2 允许ip地址为10 10 1 56通过 root 64 node 1 neutron port update 4e79200f ac5
Lisp笔记

变量动态变量 defvar defparameter span class token punctuation span span class token car dafvar span paraname default value sp
MSDK接入中的各种问题

检查顺序包名注意一下 Unity报 Found plugins with same names Found plugins with same names Assets Msdk BuglyPlugins Android libs bug
C++ Windows 窗体程序入门 - 1.你的第亿个窗体程序

前言 43 学Windows窗体已经有一段时日了 xff0c 奈何没有什么浅显易懂 amp 便宜 xff01 xff01 的书籍就想来算是记笔记吧顺便还能给你们总结一些经验注有许多内容源于我看过的一些视频比如Chili和Cher
CSS替换元素和非替换元素

根据是否可以通过修改某个属性值更改元素呈现的内容 xff0c 可以分为替换元素和非替换元素替换元素以下元素都是可替换元素 xff0c 以及在各种浏览器下的默认display值 xff08 图片来源 CSS世界张鑫旭 xff09 针对

随机推荐

SD-WAN加速保障跨国公司数据传输质量

很多企业开启国际化业务 xff0c 跨国文件传输越来越频繁 xff0c 而且随着业务的开展 xff0c 公司规模的扩张 xff0c 很多企业都在海外设置了分支机构不得不说 xff0c 随着经济一体化的进程不断加快 xff0c 企业跨国经营
零基础视觉SLAM（一）

文章目录 SLAM简介什么是SLAM xff1f 传感器VSLAM架构视觉里程计后端优化 SLAM应用自学参考书预备知识 SLAM简介什么是SLAM xff1f SLAM从本质上来说它要实现的就是通过传感器去实时地估计自身位置及经过的轨迹
关于Proxmox 5.x的国内有效镜像源

官网的 http download proxmox com 有多慢我就不提了 xff0c 否则大家也不会看到这篇小文首先需要分清楚Proxmox VE的镜像构成 1 xff09 Debian自身这个用国内哪个镜像都可以 xff0c al
多线程是否真的有必要?

一点疑问相比大家在投简历面试等等过程中 xff0c 或多或少会遇到这么一个问题 xff1a 熟悉掌握多线程开发 xff1b 谈谈你对多线程的认识其实 xff0c 我有这么一个疑问 xff0c 那就是多线程真的有必要么 xff1f 根据
stm32无法烧录问题分析

1 开始能烧录 xff0c 烧录程序后就不能烧录了原因 xff1a 升级接口IO被代码修改应用 xff0c 导致无法烧录 xff0c 解决办法 xff1a 可以让MCU进入升级模式 xff08 拉高boot0 xff0c 然后复位MCU
【Git】msysgit + TortoiseGit：在 windows 上安装配置版本控制工具 Git 图形化使用

msysgit 43 TortoiseGit xff1a 在 windows 上安装配置版本控制工具 Git 图形化使用一安装说明 Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控
Slickedit使用记录

Slickedit使用记录一快捷键二问题和解决方法一快捷键已经习惯了android studio 中的快捷键 xff0c 在slickedit上也做下修改Tools gt options gt Keyboard and mous
查看.Net源代码vs版本号

方法 xff1a 用记事本打开vs项目的 sln文件第2行就是这个源代码包的开发软件vs版本号了 Microsoft Visual Studio Solution File Format Version 9 00 Visual Studi
Docker: GUI 应用，Ubuntu 上如何运行呢？

操作系统 Ubuntu 18 04运行镜像 continuumio anaconda3 based on debian Step 1 安装 Docker span class token comment update the apt pac
网络爬虫详细设计方案

目录网络爬虫设计方案 1 网络爬虫简介 2 Java爬虫的开发和使用流程 2 1 下载 2 2 分析 3 单点登陆与Jsoup解析 3 1 单点登陆简介 3 1 1 登陆 3 1 2 注销 3 2 Jsoup网页解析 4 网络爬虫详细设计
安装 python-dev 的时候，缺少依赖关系

sudo aptitude install python dev报错 xff1a 下列软件包有未满足的依赖关系 xff1a python dev 依赖 libpython dev 61 2 7 5 5ubuntu3 但是它将不会被安装依赖
maven-replacer-plugin 静态资源打包方案js css

解决问题 xff1a 防止浏览器缓存 xff0c 修改js css后无效 xff0c 需要强刷两种解决方案 xff1a 1 不依赖插件 xff0c 纯代码实现 1 1 实现拦截处理器 xff1a ModelAndViewIntercept
简单FTP构建及访问

使用2台RHEL6虚拟机 xff0c 其中一台作为vsftpd服务器 xff08 192 168 4 5 xff09 另外一台作为测试用的Linux客户机 xff08 192 168 4 205 xff09 在RHEL6系统中 xff0c
freertos程序死机原因

一开机死机原因 1 一般是某任务栈溢出所致栈溢出一般有两个原因 xff1a 1 此任务函数的代码量太大或调用了某个比较大的函数 2 此任务的函数内有比较大的局部变量的数组调试方法 xff1a 1 先关闭所有任务再逐个打开 xff0c
安装在win10环境下的Jenkins添加本地虚拟机centos7作为从机遇到的问题，报错：SSH Connection failed with IOException: "Key exchange

首先声明我的Jenkins版本是 xff1a 2 31版因为不同版本页面有所不一样安装在win10环境下的Jenkins添加本地虚拟机centos7作为从机遇到的问题 xff0c 报错情况如下 xff1a Searching for 1
Linux du命令和df命令区别

1 xff0c 两者区别 du xff0c disk usage 是通过搜索文件来计算每个文件的大小然后累加 xff0c du能看到的文件只是一些当前存在的 xff0c 没有被删除的他计算的大小就是当前他认为存在的所有文件大小的累加和 d
ML大杂烩:**常见机器学习算法公式梳理

机器学习方法有一个进阶的过程 xff0c 不同的方法族 xff0c 都有其基础和逐渐进化的模型每一个更新的模型一般是对上一个简单模型的改进 xff0c 比如SVM就直接改进了近邻方法 xff0c 降低了保留的实例个数本文有大量修改 xf
libuv笔记（一）Threads

Threads 线程在现代程序开发中会很常见 xff0c 当然Libuv也不能缺席这一块 xff0c 记得你在使用过程中要非常认真的处理各种原始的同步问题线程会在内部使用 xff0c 用来在执行系统调用时伪造异步的假象 libuv通过线
SLAM: SLAM基本流程—VSLAM扫盲之旅

在很多机器人的论文和书籍里面 xff0c 劈头第一页即是 xff0c 经典的SLAM视觉框架是过去十几年前已经成熟的研究结果 xff0c 这个框架和算法本身已经没有太多理论可以操作的空间封杀了很多人的SLAM科研之路 xff0c 把SLA
三维重建：SLAM的尺度和方法论问题

百度百科的定义此文引用了其他博客的一些图像 xff0c 如有侵权 xff0c 邮件联系删除作为算法的SLAM xff0c 被称为同步相机位姿确定和地图构建作为一个工程的SLAM xff0c 有众多的算法在计算机视觉中三维重建是指根

三维重建：SLAM的尺度和方法论问题

参考：

三维重建：SLAM的尺度和方法论问题 的相关文章

随机推荐

热门标签

三维重建：SLAM的尺度和方法论问题的相关文章