DOT:视觉SLAM的动态目标物跟踪

2023-10-31

点云PCL免费知识星球,点云论文速读。

文章:DOT: Dynamic Object Tracking for Visual SLAM

作者:Irene Ballester, Alejandro Fontan, Javier Civera

翻译:分享者

本文仅做学术分享,如有侵权,请联系删除。欢迎各位加入免费知识星球,获取PDF论文,欢迎转发朋友圈分享快乐。

论文阅读模块将分享点云处理,SLAM,三维视觉,高精地图相关的文章。公众号致力于理解三维视觉领域相关内容的干货分享,欢迎各位加入我,我们一起每天一篇文章阅读,开启分享之旅,有兴趣的可联系微信dianyunpcl@163.com。

论文摘要

在本文中,我们提出了DOT(dynamic object tracking,动态目标跟踪)系统,它是在现有SLAM系统的基础上增加的一个前端,可以显著提高SLAM系统在高动态环境下的鲁棒性和准确性。DOT系统结合了实例分割和多视图几何生成动态对象的mask,使基于刚性场景模型的SLAM系统在优化时避免此类mask图像区域。

为了确定哪些目标实际在移动,首先是对潜在的移动对象进行对象的实例分割,然后根据估计的相机运动,通过最小化光度重投影误差来跟踪这些对象。与其他方法相比,这种短期跟踪的方法提高了分割的准确性。最终,根据结果只生成实际的动态对象的mask。我们在三个公共数据集中用ORB-SLAM 2对DOT进行了评估。实验结果表明,该方法显著提高了ORB-SLAM 2的精度和鲁棒性,特别是在高动态场景下。

内容精华

DOT系统概述

下图显示了DOT系统的概述。DOT的输入是一定视频速率下的RGB-D或立体图像,其输出是对场景的静态和动态元素进行编码的mask,可直接用于SLAM或里程计系统。第一个模块(实例分割)对应于CNN,该CNN以像素方式分割出所有潜在的动态对象。在我们的实验中,使用自动驾驶数据集,只有汽车被分割成潜在的运动。由于DOT是从一帧到另一帧跟踪mask图像,因此不需要在每一帧都执行此操作。图像处理模块提取并分割属于图像静态区域的点和动态对象中的点。仅使用场景的静态部分用来跟踪相机位姿。

判断物体在运动吗?使用几何标准确定网络标记为潜在动态的对象是否确实在移动。此信息用于更新编码每个帧的静态和动态区域的mask,并为里程计/SLAM视觉系统提供信息。

最后,DOT动态物体的跟踪不需要对每一帧的运动进行估计(因此不需要对每一帧图像进行新的运动估计)。考虑到实例分割的巨大计算量,这可能是DOT与其他最新方法相比的一个优势所在。

实例分割

使用deep network Detectron2分割图像中所有可能移动的实例。对网络的输出进行了修改,以在一幅图像中获得所有的分割mask。未被划分为潜在移动类别的图像区域被赋予一个“背景”标签,并且在随后的块中被认为是静态的。

相机和目标跟踪

在前一步的实例分割中,我们的目标是估计摄像机和动态物体的运动。由于摄像机的运动和物体的运动在图像中是耦合的,所以我们在两步过程中进行估计。首先将摄像机的姿态作为一个相对变换,然后减去相机的运动来估计目标物的运动

跟踪的质量处理

遮挡、光照条件的变化和分割误差对目标和相机姿态的准确性有重要影响。如算法1所示,在目标跟踪步骤之后开发了几种策略,以减少它们的影响。

判断对象是否运动

这个模块主要根据相机的运动和对象的位移来判断真实的对象是否有移动。

上图为计算流程的一个部分的示例。第一排显示点估计的跟踪相机和对象。请注意,并非所有帧都需要来自网络的分割mask(黄色帧)。下面一行显示由DOT生成的分割mask,这些掩码对运动分类进行编码:运动中(彩色)、静态(黑色)和未观察到(灰色)。

mask传播

DOT系统利用每帧中可用的两个分割mask:一个由神经网络产生,另一个由前一帧传播。将两个mask进行图像映射,可以将不同帧中发现的实例对象可靠地关联到同一个3D对象中。状态传播。将新的语义实例与预先存在的对象关联起来,可以预测它们的运动(这对于快速移动的对象至关重要)。此外,在物体移动到运动不可见的位置时,可以保持运动的分类。独立分割。我们的方案允许语义分割掩码从初始种子在时间和空间上传播,消除了分割每一帧的需要。在低端平台上,以较低的频率运行神经网络使实时目标跟踪更容易。作为进一步的好处,DOT能够填补网络在连续图像之间暂时丢失对象实例化的空白。

● 实验

虽然DOT的潜在应用范围很广,从目标检测到增强现实或自动驾驶,本文中我们提供了一个深入的评估,以证明“了解物体的运动”能在多大程度上提高SLAM系统的精度。

场景内容。所研究的三种构型的样本结果。左:没有mask。中心:圆点mask。右图:所有mask。

● 总结

DOT是一种新颖的SLAM系统前端算法,它结合实例分割和多视图几何方程,对运动目标进行鲁棒检测和跟踪。用ORB-SLAM2对三个用于自主驾驶研究的公共数据集进行了评估表明,DOT生成的物体运动信息允许我们分割动态内容,显著提高了其鲁棒性和准确性。DOT与SLAM的独立性使得它成为一个多功能的前端,只需最小的集成工作就可以适应任何最先进的视觉里程计或SLAM系统。与其他系统不同,点云的mask跟踪降低了应进行分割(通常涉及高计算成本)的速率,降低了相对于现有技术的计算需求。

资源

三维点云论文及相关应用分享

【点云论文速读】基于激光雷达的里程计及3D点云地图中的定位方法

3D目标检测:MV3D-Net

三维点云分割综述(上)

3D-MiniNet: 从点云中学习2D表示以实现快速有效的3D LIDAR语义分割(2020)

win下使用QT添加VTK插件实现点云可视化GUI

JSNet:3D点云的联合实例和语义分割

大场景三维点云的语义分割综述

PCL中outofcore模块---基于核外八叉树的大规模点云的显示

基于局部凹凸性进行目标分割

基于三维卷积神经网络的点云标记

点云的超体素(SuperVoxel)

基于超点图的大规模点云分割

更多文章可查看:点云学习历史文章大汇总

SLAM及AR相关分享

【开源方案共享】ORB-SLAM3开源啦!

【论文速读】AVP-SLAM:自动泊车系统中的语义SLAM

【点云论文速读】StructSLAM:结构化线特征SLAM

SLAM和AR综述

常用的3D深度相机

AR设备单目视觉惯导SLAM算法综述与评价

SLAM综述(4)激光与视觉融合SLAM

Kimera实时重建的语义SLAM系统

SLAM综述(3)-视觉与惯导,视觉与深度学习SLAM

易扩展的SLAM框架-OpenVSLAM

高翔:非结构化道路激光SLAM中的挑战

SLAM综述之Lidar SLAM

基于鱼眼相机的SLAM方法介绍

往期线上分享录播汇总

第一期B站录播之三维模型检索技术

第二期B站录播之深度学习在3D场景中的应用

第三期B站录播之CMake进阶学习

第四期B站录播之点云物体及六自由度姿态估计

第五期B站录播之点云深度学习语义分割拓展

第六期B站录播之Pointnetlk解读

[线上分享录播]点云配准概述及其在激光SLAM中的应用

[线上分享录播]cloudcompare插件开发

[线上分享录播]基于点云数据的 Mesh重建与处理

[线上分享录播]机器人力反馈遥操作技术及机器人视觉分享

[线上分享录播]地面点云配准与机载点云航带平差

点云PCL更多活动请查看:点云PCL活动之应届生校招群

扫描下方微信视频号二维码可查看最新研究成果及相关开源方案的演示:

如果你对本文感兴趣,请点击“原文阅读”获取知识星球二维码,务必按照“姓名+学校/公司+研究方向”备注加入免费知识星球,免费下载pdf文档,和更多热爱分享的小伙伴一起交流吧!

扫描二维码

                   关注我们

让我们一起分享一起学习吧!期待有想法,乐于分享的小伙伴加入免费星球注入爱分享的新鲜活力。分享的主题包含但不限于三维视觉,点云,高精地图,自动驾驶,以及机器人等相关的领域。

分享及合作:微信“920177957”(需要按要求备注)联系邮箱:dianyunpcl@163.com,欢迎企业来联系公众号展开合作。

点一下“在看”你会更好看耶

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

DOT:视觉SLAM的动态目标物跟踪 的相关文章

随机推荐

  • AUTOSEMO“恒以致远,共创共赢”主题研讨会圆满落幕

    2023年8月31日 中国汽车工业协会软件分会中国汽车基础软件生态标委会 简称 AUTOSEMO 与天津市西青区人民政府联合主办 北京经纬恒润科技股份有限公司承办的 恒以致远 共创共赢 主题研讨会在天津隆重召开 本次研讨会是AUTOSEMO
  • vue2.0使用less 创建全局的颜色变量,配置主题色

    1 使用场景 项目中需要统一配置前端的主题样式 我们可以使用less创建 theme colors rgba 54 174 149 1 变量 供全局调用 2 安装依赖 cnpm install less less loader save 安
  • 【Android】WebView控件最全使用解析

    WebView控件最全使用解析 一 WebView 概述 二 WebView使用基础篇 2 1添加方式 2 2 加载远程网页 2 3 加载本地网页 2 4 加载HTML片段 2 5 WebView 常用方法 三 WebView 进阶篇 3
  • Android--Recovery模块之恢复出厂设置

    一 在进行详细流程分析之前 先看一下几个重要概念 一 Recovery的工作需要整个软件平台的配合 从架构角度看 有三个部分 1 Main system 用boot img启动的Linux系统 Android的正常工作模式 2 Recove
  • 【MyBatis】自定义resultMap三种映射关系

    目录 一 一对一映射 One to One 1 1 表关系 1 2 resultMap设置自定义映射 二 一对多映射 One to Many 2 1 创建实体 2 2 级联方式处理映射关系 2 3 定义SQL 2 4 OrderMapper
  • jquery 购物车飞入特效--全网最简单

    有个插件 jquery fly js 可以搞定 好象特点之一是有抛物线效果 如果要求不高 可以看看我这个 其实也是在网上看到的 作了些改进 三个元素 被点击的div 飞翔的小红点 装小红点的div 购物车 div 被点击的 div div
  • (一)@Input属性讨论

    Input Declares a data bound input property Angular automatically updates data bound properties during change detection 大
  • PAT C入门题目-7-111 输出学生成绩 (20 分)(动态内存分配)

    7 111 输出学生成绩 20 分 本题要求编写程序 根据输入学生的成绩 统计并输出学生的平均成绩 最高成绩和最低成绩 建议使用动态内存分配来实现 输入格式 输入第一行首先给出一个正整数N 表示学生的个数 接下来一行给出N个学生的成绩 数字
  • vue3+uniapp+TS+Vite+uView-plus(uniapp-nutui)微信小程序模板搭建

    官网下载目录结构 DCloud uni preset vue 码云 开源中国 gitee com 下载zip压缩包即可 目录 一 依赖下载 二 运行 三 vite config json文件修改 四 uView plus组件库加载 1 安装
  • Android Studio之BuildConfig类

    转自 http blog csdn net lvxiangan article details 71601451 Android Studio开发中 把一个module输出打包为jar文件 我们会发现里面多了一个BuildConfig类 但
  • vue中慎用style的scoped属性

    在vue组件中 在style标签上添加scoped属性 以表示它的样式作用于当下的模块 很好的实现了样式私有化的目的 这是一个非常好的机制 但是为什么要慎用呢 在实际业务中我们往往会对公共组件样式做细微的调整 如果添加了scoped属性 那
  • 前后端通过局域网对接

    因为前后端分离写项目 后端同学在隔壁宿舍 我们通过连他的热点来进行前后端的对接 第一步 关闭防火墙 第二部 找到自己ip地址 无线局域网Ipv4地址 然后前后端在 cmd中 通过 ping 加上地址可以连接成功 然后就可以访问后端的接口了
  • Linux与Windows:操作系统之争及个人体验比较

    在当今数码化的世界中 操作系统扮演着关键的角色 Linux和Windows作为最受欢迎和广泛使用的操作系统之一 具有不同的特点和优势 作为一个AI模型 我虽然没有真正的使用经验 但我可以就这两个操作系统进行比较 并提供一些观点供您参考 Li
  • 利用注册表修改3389端口

    步骤 打开 开始 运行 输入 regedit 打开注册表 进入以下路径 HKEY LOCAL MACHINE SYSTEM CurrentControlSet Control Terminal Server Wds rdpwd Tds tc
  • 1060- 礼物的最大价值

    题目如下 在一个 m n 的棋盘的每一格都放有一个礼物 每个礼物都有一定的价值 价值大于 0 你可以从棋盘的左上角开始拿格子里的礼物 并每次向右或者向下移动一格 直到到达棋盘的右下角 给定一个棋盘及其上面的礼物的价值 请计算你最多能拿到多少
  • VMware 搭建私有云

    我们的目的是在VMware workstation 上安装Centos 7系统 并配置用远程桌面访问虚拟机 在虚拟机上安装Centos 7 首先按照老师给出的博客 VirtualBox 安装 Centos 7 笔记 进行安装 博主使用的是v
  • MPU6050 加速度计和陀螺仪传感器与 Arduino 连接

    MPU6050 加速度计和陀螺仪传感器与 Arduino 连接 前言 MPU6050 模块引脚 MPU6050 模块组成 MPU6050陀螺仪传感器模块电路图 MPU6050模块如何工作 MEMS加速度计如何工作 MEMS陀螺仪如何工作 常
  • 刷题day67:零钱兑换II(完全背包开始)

    题意描述 给你一个整数数组 coins 表示不同面额的硬币 另给一个整数 amount 表示总金额 请你计算并返回可以凑成总金额的硬币组合数 如果任何硬币组合都无法凑出总金额 返回 0 假设每一种面额的硬币有无限个 题目数据保证结果符合 3
  • 杭电OJ——1007 Quoit Design(最近点对问题)

    Quoit Design Problem Description Have you ever played quoit in a playground Quoit is a game in which flat rings are pitc
  • DOT:视觉SLAM的动态目标物跟踪

    点云PCL免费知识星球 点云论文速读 文章 DOT Dynamic Object Tracking for Visual SLAM 作者 Irene Ballester Alejandro Fontan Javier Civera 翻译 分