最新SOTA!NGEL-SLAM:精度最高、速度超快的SLAM系统

2023-12-05

作者 | Deep蓝同学  编辑 | 深蓝AI

原文链接:https://arxiv.org/abs/2311.09525

点击下方 卡片 ,关注“ 自动驾驶之心 ”公众号

ADAS巨卷干货,即可获取

点击进入→ 自动驾驶之心【SLAM】技术交流群

本文只做学术分享,如有侵权,联系删文

导语:

本文提出了一种基于神经隐式表示的全局一致的低延迟的SLAM系统,名为NGEL-SLAM。该系统能够实现高精度的定位和高保真的场景重建,同时保证全局一致性和低延迟。这个系统使用了多个神经隐式场来表示场景,每个神经隐式场对应一个局部区域,利用了闭环检测来调整闭环,使用了神经辐射场的渲染方法来生成RGB-D图像和表面网格。这个系统在合成和真实世界的数据集上,与其他最先进的SLAM系统进行了比较,表现出了更好的性能。

6325b7eef5c5325ed7dd5fd2fa3e7729.png

▲图1|渲染和定位结果。与NICE-SLAM相比,我们的方法渲染了更高保真的图像,提供了更精确的相机定位结果。此外,我们的方法实现了快速收敛,并在环路闭合后启用低延迟地图更新,使其比NICE-SLAM快10倍。真实相机轨迹以黑色显示,估计的轨迹以红色显示。


0812d6e44aaf83f282e1b44d242798e3.png

SLAM是计算机视觉中一个基础而又具有挑战性的问题,它涉及在更新一个未知环境的地图的同时,定位一个智能体的位置。在交互式应用中,如增强现实/虚拟现实(AR/VR)和机器人,SLAM系统不仅需要具有精确的定位和地图构建能力,还需要全局一致性和低延迟。传统的SLAM系统,如ORB-SLAM3,具有低延迟、高精度的定位,并利用闭环检测来保证全局一致性。但是,这些系统只能构建稀疏的点云地图,缺乏密集的几何和纹理信息。近年来,神经隐式表示的进展使得能够进行精确和密集的三维表面重建。因此,一些基于神经隐式表示的SLAM系统被提出。作为这一方向的先驱工作,iMAP和NICE-SLAM基于神经表示实现了定位和地图构建,从而实现了高保真的场景重建。然而,基于神经表示的定位缺乏闭环检测的支持,导致在大场景中由于缺乏全局一致性而表现不佳。即使将闭环检测集成到他们的系统中,也很难快速地调整神经表示以适应闭环,从而导致较高的延迟。

230549ecd0d22fe410f0c8e3b0a4c7ee.png

为了解决上述问题,本文提出NGEL-SLAM。为保证全局一致性,我们的系统利用传统基于特征的定位模块结合环路闭合。另外,我们通过表示场景为多个神经隐式子图,实现对环路闭合的快速调整。此外,我们的系统通过使用基于八叉树的隐式表示实现快速收敛。环路闭合响应快速和收敛快的结合使我们的系统成为真正低延迟的系统,同时保证全局一致性。我们的系统实现高保真RGB-D图像渲染,以及提取稠密完整表面。在各种合成和真实环境数据集上的实验表明,与基准方法相比,我们的系统在定位与制图精度上处于领先地位,同时保持低延迟。

1d191cb1df0282d326bca58a87f0ce26.png

66d96decb91e03e0cc6469fecaa3bf9d.png

▲图2|NGEL-SLAM系统流程图。

本文提出的系统包含两个主要模块:定位模块和制图模块。它们可以进一步分为三个过程:定位、动态局部制图和环路闭合。这三个过程协同工作以确保我们系统中的全局一致性和低延迟。定位过程以RGB-D流为输入,实时定位相机姿态。如果一帧被选为关键帧,则被传递到动态局部制图过程。在这个过程中,定位模块执行局部BA,而制图模块训练相应的局部地图。检测到环路时,环路闭合过程优化相机姿态使用全局BA,并更新场景表示。所有过程并行执行。三个过程具体展开如下:

定位过程使用了ORB-SLAM3的定位方法,利用RGB-D图像中的特征点进行相机位姿的估计。定位模块还负责进行闭环检测,通过比较当前帧和历史帧的特征点,找出可能的闭环候选帧,并通过全局姿态图优化来消除累积误差。

动态局部制图过程使用了多个神经隐式场来表示场景,每个神经隐式场对应一个局部区域。神经隐式场是一个基于八叉树的隐式表示,它使用一个多层感知机(MLP)来预测给定空间位置的几何和纹理信息。地图构建模块根据当前帧的位姿和深度,更新对应的神经隐式场的参数,从而实现实时的场景重建。

e7e8259896c5df5c27566d647839df99.png

▲图3|制图网络。制图网络采用稀疏的八叉树结构存储多级特征,以及两个单独的MLP。

环路闭合过程在指检测到闭环时,会触发一个闭环调整的过程,即将闭环帧对应的神经隐式场与当前帧对应的神经隐式场进行融合,从而保证全局一致性。闭环调整的过程是快速的,因为只需要调整少量的神经隐式场的参数,而不需要重新优化整个场景的表示。

866a4dda9c6b5b066b7fdd80fb7ef616.png

本文的实验方法包括了在合成和真实世界的数据集上,对定位和地图构建的精度和效率进行评估,并与其他最先进的SLAM系统进行比较。实验数据集包括了ICL-NUIM,TUM-RGBD,ScanNet,SUN3D和7-Scenes。实验结果表明,NGEL-SLAM在保持低延迟的同时,实现了最先进的定位和地图构建的精度。

46507f2e7b440a27a59863e66fa33d0a.png

▲表1|在Replica数据集上制图的定量比较。数据来自8个场景的平均值。GT pose和Est pose分别表示使用真实姿态和估计姿态渲染

96ff28c896a3ce0fb5f6a9a5ec5f74e0.png

▲表2|在TUM RGB-D上定位的定量比较。使用指标ATE-RMSE [cm]

31c15df39bf060f8290a6167d19a5e72.png

▲表3|在ScanNet上的定位定量比较。使用指标ATE-RMSE [cm]

234a830f837e4261d7f9ff8c80de38bd.png

▲图4|在Replica数据集上的渲染结果

543c1fd692ea828cde18b424f142af8f.png

▲图5|在ScanNet数据集上的渲染结果

743694326fac56f79f41f9345b469a52.png

NGEL-SLAM结合了传统SLAM系统ORB-SLAM3的定位精度高,以及神经隐式表示提取密集网格和生成高保真图像的能力。为了保证全局一致性,我们的系统利用了一个传统的基于特征的定位模块,其中包含了闭环检测。我们通过使用多个神经隐式场来表示场景,维护了一个全局一致的地图,从而能够快速地调整闭环。此外,我们的系统通过使用基于八叉树的隐式表示,实现了快速的收敛。闭环检测的快速响应和快速的收敛的结合,使得我们的系统成为一个真正的低延迟的系统,实现了全局一致性。我们的系统能够渲染高保真的RGB-D图像,以及提取密集和完整的表面。在合成和真实世界的数据集上的实验表明,我们的系统在保持低延迟的同时,实现了最先进的定位和地图构建的精度。

① 全网独家视频课程

BEV感知 、毫米波雷达视觉融合 多传感器标定 多传感器融合 多模态3D目标检测 点云3D目标检测 目标跟踪 Occupancy、 cuda与TensorRT模型部署 协同感知 语义分割、 自动驾驶仿真、 传感器部署、 决策规划、轨迹预测 等多个方向学习视频( 扫码即可学习

e7d0b9866e0de880ee1e9b7fda94215a.png 视频官网:www.zdjszx.com

② 国内首个自动驾驶学习社区

近2000人的交流社区,涉及30+自动驾驶技术栈学习路线,想要了解更多自动驾驶感知(2D检测、分割、2D/3D车道线、BEV感知、3D目标检测、Occupancy、多传感器融合、多传感器标定、目标跟踪、光流估计)、自动驾驶定位建图(SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案、AI模型部署落地实战、行业动态、岗位发布,欢迎扫描下方二维码,加入自动驾驶之心知识星球, 这是一个真正有干货的地方,与领域大佬交流入门、学习、工作、跳槽上的各类难题,日常分享论文+代码+视频 ,期待交流!

e3eb4eb19ffb4f6ac9cdf6d7d29fec36.png

③【自动驾驶之心】技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦 目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多模态感知、Occupancy、多传感器融合、transformer、大模型、点云处理、端到端自动驾驶、SLAM、光流估计、深度估计、轨迹预测、高精地图、NeRF、规划控制、模型部署落地、自动驾驶仿真测试、产品经理、硬件配置、AI求职交流 等方向。扫码添加汽车人助理微信邀请入群,备注:学校/公司+方向+昵称(快速入群方式)

0b551e76df3d36c8a525e04dad8eaeff.jpeg

④【自动驾驶之心】平台矩阵, 欢迎联系我们!

01efcb14d4d5fb63fd60e4ddf1512e19.jpeg

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

最新SOTA!NGEL-SLAM:精度最高、速度超快的SLAM系统 的相关文章

  • 【24校招】京东——「采销方向」大扩招,另有众多岗位等你投递

    个人简历制作分享 秋招 大家在求职的时候 肯定会遇到简历应该如何做 怎么做的问题 在这里我分享一下我的个人简历制作方法 我用这个方法制作的简历已经帮我拿到了心仪的offer简历的原则不 题解 走迷宫 package 搜索 BFS 走迷宫 i
  • C++学习之路(十七)C++ 用Qt5实现一个工具箱(增加托盘图标并且增加显示和退出菜单)- 示例代码拆分讲解

    上篇文章 我们用 Qt5 实现了在小工具箱中添加了 为屏幕颜色提取功能增加一个点击复制的功能 功能 今天我们增加一个比较正式点的功能 就是增加托盘图标并且增加显示和退出菜单 越来越像回事了吧 下面我们就来看看如何来规划开发这样的小功能并且添
  • 腾讯音乐后台开发(面试官太狗了) 一面 二面

    双非二本 互联网大厂游戏校招入职体验 转眼已经入职我手工作快六个月啦 加上提前入职实习了六个月 已经算是一年工作经验了hhh 但任然有一种自己还是学生的错觉 加上前几天看完周杰伦上海演唱会散场之后去 题解 快速求和反应训练 新思路 先给佬磕
  • @6666666666666轩闻

    6666666666666轩闻 看到请回复 无聊 牛客425068585号 425068585 秋招选offer 坐标辽a 工商和农行哪个好 求建议 选择哪一个offer PK offer选一下 offer 客户经理岗位这两个怎么选 除了洛
  • PyCharm添加Anaconda虚拟环境

    使用pycharm添加anaconda虚拟环境时 找到anaconda的安装目录 选择文件condabin里面的conda bat 然后点击ok继续操作即可
  • 基于Go语言实现简易Web应用

    目录 前言 Go语言特点 写在使用Go语言实现Web应用前面 创建Web服务器 声明一个结构体操作 加入中间件的使用 使用静态文件服务器 最后 前言 在编程语言中 近几年问世的几个新语言都是非常不错的 比如Go Python Rust等等
  • 反馈:打造优质产品的必备利器

    在当今快速发展的科技时代 我们越来越强调创新和快速迭代 然而 在这样的环境下 许多公司在开发新产品或功能时 却忽略了其中最重要的一步 充分了解和满足用户的需求 而要做到这一点 就需要我们利用一种强大的工具 反馈 反馈是一种用来获取或提供一个
  • 冤哥y佬和他的happy茶(2023年四川大学腾讯杯新生赛E题の吐槽)

    第一次发帖 希望大佬们能解答 小弟是今年大二的双非计算机专业学生 在前面一年多里面有效的学习时间学的基本上都是前后端开发 现在是把重心放在了后端的开发上面 最近学校和腾讯云有个校企合作的小项 题解 X形图案 include
  • 基于腾讯云手把手教你搭建网站

    目录 前言 前期准备工作 具体搭建网站 番外篇 网站开发及优化 结束语 前言 在当今数字化时代浪潮之下 作为开发者拥有一个属于自己的网站是非常有必要的 也是展示个人形象 打造影响力和给别人提供服务的重要途径 网站不仅可以作为打造自己影响力的
  • Python从入门到项目实践!神仙级python入门教程(非常详细),从零基础入门到精通,从看这篇开始!

    内容简介 Python 从入门到项目实践 一书从入门学习者的角度出发 通过简洁有趣的语言 丰富多彩的实例 挑战大脑的任务 贴近开发实战的项目 循序渐进地让读者在实践中学习 在实践中提升实际开发能力 全书共分7 篇 基础篇 进阶篇 高级篇 框
  • CnosDB有主复制演进历程

    分布式存储系统的复杂性涉及数据容灾备份 一致性 高并发请求和大容量存储等问题 本文结合CnosDB在分布式环境下的演化历程 分享如何将分布式理论应用于实际生产 以及不同实现方式的优缺点和应用场景 分布式系统架构模式 分布式存储系统下按照数据
  • Python教程:从零基础到编程高手

    Python 一门简洁而强大的编程语言 吸引着越来越多的初学者 本文将为你提供一份Python教程 带领你从零基础开始 逐步掌握这门语言 最终成为一名Python编程高手 第一部分 Python入门指南 首先 我们将介绍Python的基础知
  • 中移物联网山东地区有收到offer的朋友嘛

    题解 计算用户的平均次日留存率 SELECT COUNT DISTINCT q2 device id q2 date COUNT DISTINCT q1 device id q1 date 题解 小乐乐找最大数 include
  • 超越其它所有SOTA!Drive-WM:与现有端到端规划兼容的第一个自动驾驶世界模型!...

    点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 gt gt 点击进入 自动驾驶之心 世界模型 技术交流群 论文作者 汽车人 编辑 自动驾驶之心 最近世界模型的工作好多 今天分享一个与现有端到端规划模型兼容的驾驶世界模
  • 【vue3】elementplus日期组件英文转中文

    vue3 elementplus日期组件英文转中文 1 在main js或者main ts中加入 即可解决 import ElementPlus from element plus import element plus dist inde
  • 自定义软件APP定制开发的优势|企业网站小程序搭建

    自定义软件APP定制开发的优势 企业网站小程序搭建 随着科技的不断进步和智能手机的普及 移动应用程序 APP 成为了人们生活中必不可少的一部分 对于企业来说 拥有一个自定义的APP可以带来很多优势 本文将介绍自定义软件APP定制开发的一些优
  • CnosDB FDW:打通一扇通往PostgreSQL世界的大门

    本文档提供了下载 安装和使用 CnosDB FDW 的简要说明 请根据您的实际需求和环境对文档进行调整 概述 CnosDB FDW 是一个用于在 PostgreSQL 数据库中访问 CnosDB 数据库的外部数据包装器 Foreign Da
  • 艾瑞:央国企数字化升级,低代码首选得帆云!

    中国权威咨询机构艾瑞咨询最新发布了 2023年央国企数字化升级研究报告 THE NEW RESEARCH 报告认为 央国企作为中国特色社会主义的重要物质基础和政治基础 肩负着推动经济发展和增强社会价值的重要责任 必须在数字化升级中发挥引领作
  • 事件代理如何使用?

    事件代理是一种机制 用于处理动态添加的元素或大量元素的事件绑定 通过将事件绑定到它们的父元素上 可以统一处理子元素的事件 以提高性能和代码简洁度 在jQuery中 可以使用on 方法来实现事件代理 on 方法接受两个参数 事件类型和处理函数
  • 巧借C++算法实现冒泡排序算法

    目录 引言 冒泡排序原理 具体实现步骤 示例代码 时间复杂度和稳定性 优化可能性 结束语 引言 作为计算机专业出身的开发者 以及从事软件开发相关的小伙伴 想必对C 语言并不陌生 它是一门非常厉害的编程语言 不仅是基于程序底层的语言 而且是一

随机推荐

  • 命令行客户端MySQL如何使用

    MySQL是一种常用的关系型数据库管理系统 它提供了命令行客户端来与数据库进行交互 以下是使用命令行客户端MySQL的基本步骤 打开命令行终端 如Windows的命令提示符或Mac的终端 输入以下命令来连接到MySQL服务器 mysql u
  • 自动驾驶轨迹/行为/运动/交通预测综述论文总结

    作者 eyesighting 编辑 汽车人 原文链接 https zhuanlan zhihu com p 664213622 点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 点击进入 自动驾驶之心 轨迹预测 技术交
  • Java入门:二.安装Apache Tomcat(非必须)

    前言 如果不需要使用Web服务器功能 只使用Java开发 那则不需要安装Tomcat 在安装Tomcat前 需完成java环境搭建 参见 Java入门 一 开发环境搭建 安装java jdk CSDN博客 一 下载Tomcat 下载地址 A
  • 容器与集群——通过deployment 创建pod以及Java Web应用的容器化发布

    一 通过deployment 创建pod 1 1 编写yaml文件 1 2 安装pod 创建 kubectl create f dp nginx yaml 查看Deployment信息 1 3 查看相关信息 查看pod信息 kubecel
  • 头歌—Hive的安装与配置

    第1关 Hive的安装与配置 在修改 conf 下面的 hive site xml 文件这里 题目给的信息是错误的 正确的内容如下
  • 【已解决】为什么Word文档里有部分内容无法编辑?

    小伙伴们是否遇到过这样的情况 打开Word文档进行编辑 发现部分内容可正常编辑 另外一部分内容却无法编辑 这是怎么回事 又要如何解决呢 出现以上情况 一般是Word文档被设置了 限制保护 使其部分内容被锁定 无法进行修改编辑 我们可以在文档
  • Python入门实战 | 第二期(input输入语句和if判断语句)

    本期继续给大家推荐Python的语法讲解 Python作为深度学习的必备工具 也是PHM初学者的必备技能 之前发表了初学者必看 Python入门语法讲解与实战 一 这期主要是介绍Python的input输入语句和判断语句 目录 一 inpu
  • SMT贴片加工组装工艺的可靠性

    随着电子产品的广泛应用 电子产品的可靠性已成为一个重中之重的问题 大多应用场合都要求电子产品的性能必须稳定 可靠并且能够安全的运行 在航空航天 军事 通信 金融 监控等领域 如果电子系统发生故障会对其造成很大的损失 电子产品种类复杂 由材料
  • 油气罐防雷和化工防雷综合解决方案

    油气罐防雷和化工防雷是化工企业安全生产的重要内容 涉及到化工装置 储罐 管道 电气设施等多个方面 地凯科技 将介绍油气罐防雷和化工防雷的方案和应用方案 以期为化工企业提供一些参考 油气罐防雷 油气罐是储存可燃易爆物质的设施 一旦遭受雷击 可
  • JavaScript对象的创建方式有几种?

    在JavaScript中 有多种方式可以创建对象 包括以下几种 对象字面量 Object Literals 这是创建对象最简单的方式 使用花括号 来定义对象 通过键值对的方式来定义对象的属性和方法 let person name John
  • 拼图软件合成照片有推荐吗?探索热门拼图软件

    嘿伙计 你知道吗 最近我发现了一个超级好玩的拼图软件 简直就是我网上冲浪的新宠啊 我得给你分享一下我在这个软件上的使用体验感 简直是让我笑翻了 拼图的时候 你可以像变魔术一样通过手指滑动 缩放 旋转 将碎片们拼接起来 就像魔法一样 一块块碎
  • linux下安装nginx

    第一步 压缩包 准备压缩包 最好准备一个稳定的版本 下载地址 我这边选用的是1 24 0双版本号 第二步 解压 在相对应的目录下 执行命令 tar zxvf nginx 1 18 0 tar gz 第三步 配置 编译 推荐使用 config
  • [原创][4]探究C#多线程开发细节-“初步体验ManualResetEvent类带来的同步效果“

    简介 常用网名 猪头三 出生日期 1981 XX XX 个人网站 80x86汇编小站 https www x86asm org 编程生涯 2001年 至今 共22年 职业生涯 20年 开发语言 C C 80x86ASM PHP Perl O
  • 得帆云助力容百科技构建CRM系统,实现LTC全流程管理

    宁波容百新能源科技股份有限公司 宁波容百新能源科技股份有限公司 以下简称 容百科技 于2014年9月建立 是高科技新能源材料行业的 跨国型集团公司 专业从事锂电池正极材料的研发 生产和销售 于2019年登陆 上交所科创板 成为科创板 首批
  • Visual C++(VC)6.0-可视化软件编程开发工具 最新安装教程

    今天大成给大家分享的是 Visual C VC 6 0 可视化软件编程开发工具 安全无毒 无广告捆绑 运行稳定 快来下载体验吧 资源介绍 支持 Windows系统 Visual C 6 0是一个功能强大具有集成开发环境的可视化软件编程开发工
  • 如何做好小红书?9条小红书运营起号心得(必读)

    关于小红书运营细节和方法 总结了以下9条起号心得 希望给近期新手们一些经验借鉴 一 出现一条爆文后的策略 当账号新发的一篇笔记流量起飞了 不要急于发布新内容 先让爆文的流量消耗殆尽 等流量开始减少时再发布新笔记 同时 将新笔记置顶 这样访问
  • Linux下Redis安装及配置

    首先下载redis安装包 地址 这里我使用的是7 0版本的 将文件上传至linux上 此处不再多叙述 不会操作的 建议使用ftp 第一步 解压压缩包 tar zxvf redis 7 0 14 tar gz 第二步 移动redis存放目录
  • 测试基础知识

    常见测试分类 按测试阶段划分 单元测试 针对程序源码进行测试 国内是开发自测 集成测试 又称接口测试 针对模块间的访问地址进行测试 系统测试 对整个系统进行测试 包括功能 兼容性 文档等 验收测试 分为内测和公测 按代码可见度划分 黑盒测试
  • 智能联动第三方告警中心,完美实现故障响应全闭环

    前言 我们曾讨论完善的告警策略是整个数据监控系统的重要组成部分 参见 机智的告警策略 完善监控系统的重要一环 介绍了如何配置告警通知以及场景示例 帮助用户及时更多潜在的故障和问题 有效地保障系统稳定运行和持续优化 为了实现故障发现 告警 处
  • 最新SOTA!NGEL-SLAM:精度最高、速度超快的SLAM系统

    作者 Deep蓝同学 编辑 深蓝AI 原文链接 https arxiv org abs 2311 09525 点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 点击进入 自动驾驶之心 SLAM 技术交流群 本文只做学术