论文汇总！物体级SLAM（定位/建图/重定位/回环检测）

2023-05-16

作者 | 黑桃K 编辑 | 汽车人

原文链接：https://zhuanlan.zhihu.com/p/570562248

点击下方卡片，关注“自动驾驶之心”公众号

ADAS巨卷干货，即可获取

点击进入→自动驾驶之心【SLAM】技术交流群

后台回复【SLAM综述】获取视觉SLAM、激光SLAM、RGBD-SLAM等多篇综述！

一. 综述

Semantic Visual Simultaneous Localization and Mapping: A Survey：https://arxiv.org/abs/2209.06428

最新的一篇关于物体级SLAM的综述，比较简短，回顾了最近的一些工作。
有公众号发布了中文版。

Advances in Inference and Representation for Simultaneous Localization and Mapping：https://arxiv.org/abs/2103.05041

这篇综述重点关注SLAM中场景的表示和推理，篇幅适中。

Semantics for Robotic Mapping, Perception and Interaction: A Survey：https://arxiv.org/abs/2101.00443

非常全面的关于语义SLAM的综述，包括定位、建图、导航、感知、交互等，篇幅较长。

二. 物体级SLAM（偏向于定位和物体估计）

1. 对偶二次曲面作为地标的面向对象SLAM

QuadricSLAM: Dual Quadrics from Object Detections as Landmarks in Object-oriented SLAM [RAL 2018]：https://arxiv.org/abs/1804.04011

最早以二次曲面作为物体表示的物体级SLAM，启发了后续很多以二次曲面作为地标的物体级SLAM工作。
使用有约束的对偶二次曲面作为物体地标的表示方式，将二次曲面约束为椭球，结合旋转和平移共9个自由度表示。对于地标的初始化选择使用2D检测框与椭球相切的约束计算，通过多帧多个检测框的反投影平面与椭球相切，构造一个线性方程通过SVD解得，然后将通用结果转换为约束形式。实验中有时会将地标初始化在相机平面背面，因为二次曲面可以从图像任意侧投影。
使用yolo作为目标检测器。构建地标与相机位姿的优化问题，其中有约束对偶二次曲面与相机的观测误差为重投影误差，即将椭球地标投影到图像，从椭圆生成方框，然后与检测框作差表示观测误差。构建最小二乘问题通过非线性优化求解。但文章没有考虑不同帧间数据关联的问题，通过手动标记进行关联。

2. 用于高速自主导航的鲁棒物体级SLAM

Robust Object-based SLAM for High-speed Autonomous Navigation [ICRA 2019]

提出了一种基于椭球体表示的物体级SLAM，使用2D边界框以及纹理平面和物体先验来估计物体参数。与先前的椭球体SLAM不同的是，该工作没有将多帧2D检测框的线段反投影成平面去直接约束求解物体，而是首先提出使用单帧检测框初始化物体参数。提出了三个假设，即椭球位置在检测框中心的反投影直线上和对应深度为场景的平均深度（固定了t）、初始化方向为定值（固定R）以及形状为语义先验（尺寸）。
在初始化后根据观测构建约束求解优化问题。误差项包括三部分，一是将椭球体投影到图像平面生成椭圆，椭圆与2D检测框的误差，二是在物体上三角化特征点，由特征点生成与相机平面平行的平面与物体相切构成误差，三是物体的尺寸先验误差。实验部分表明由于引入先验的单帧初始化方法，在视点不充分的情况下估计也还不错。

3. 单目三维物体级SLAM

CubeSLAM: Monocular 3D Object SLAM [TR-O 2019]：https://arxiv.org/abs/1806.00557

基于立方体物体表示的物体级SLAM经典工作，启发了后续许多物体级SLAM研究。
使用单目图像估计物体立方体姿态。3D 立方体有三个正交轴，根据旋转 R 和相机参数 K，通过透视投影生成三个消失点，在立方体的上边缘采样一个角，然后结合三个消失点分析计算其他 7 个角。通过这些3D角点可以得到立方体位姿。
可以通过物体的R得到消失点，问题是如何先得到R。论文只考虑在地面上的物体，通过对偏航角进行采样得到一些R，然后再在2D检测框的上边缘进行采样得到一些角点，对采样的R和角点生成提案计算评分，选择最优的提案生成立方体位姿。评分函数包括3部分，距离误差就是生成的3D检测框的边在图像上与物体边缘的偏差，即倒角距离。角度对齐误差就是检测线段与消失点的对齐程度。形状误差就是惩罚具有较大长宽比的立方体。三种误差有不一样的权重。
基于ORBSLAM2构建系统，联合优化物体和相机的位姿。构建最小二乘非线性优化问题，包括相机-点测量、相机-物体测量和物体-点测量。
- 3D测量是将世界坐标系的物体变换到当前帧相机坐标系，与当前帧测量作差。
- 2D测量就是重投影误差，将3D检测框投影到图像与2D检测框作差。
- 相机-物体测量包括2部分：
- 物体-点测量：点与物体对象相互约束，如果点所属于物体，则它应位于3D长方体内，故可以先将点转换到物体的立方体坐标系，然后再与立方体尺寸进行比较。
- 相机-点测量：标准的3D点重投影误差。
提出了一种基于特征点匹配的对象关联方法，首先将属于2D边界框且其对应地图点与物体中心距离小于1m的特征点关联到物体，然后通过帧间匹配共享地图点数量最多且大于阈值（10）的对象进行物体关联。
动态SLAM部分请具体看论文，主要是一些假设条件约束下的优化问题。
代码分析：开源代码包括两部分，一个面向单个物体特定数据集的例子，一个结合ORBSLAM的完整算法。前者主要是通过消失点生成立方体的算法，没有数据关联、没有完整的SLAM流程。后者将论文中大部分内容结合ORBSLAM作了实现，但提供的输入为离线检测的立方体，算是额外的测量。
单目尺度恢复的问题，结合ORBSLAM的算法中主要有三个部分，开源代码中可将以下几点结合使用。
- 一是初始化时可以利用双目初始化，可以利用第一帧提供的真实的立方体检测约束特征点恢复尺度（会飘）。
- 二是恒定地面高度假设，每隔一段时间采样图像中下方的地图点拟合平面，然后通过先验高度约束尺度。
- 三是使用每个立方体检测约束地图点尺度（不稳定）。

4. 基于集成数据关联的单目半稠密SLAM

EAO-SLAM: Monocular Semi-Dense Object SLAM Based on Ensemble Data Association [IROS 2020]：https://arxiv.org/abs/2004.12730

吴艳敏大佬的工作，开源且效果很不错。主要提出了一种集成参数和非参数统计检验的数据关联策略，以及一种鲁棒的物体质心和尺度估计算法。基于ORBSLAM2构建了完整的物体级SLAM系统（开源代码中无在线目标检测和旋转优化部分的代码）。
首先系统中物体的质心、尺度由属于物体的地图点确定。提出的集成数据关联策略包括两部分：
- 非参数检验：由于构造物体的地图点不属于高斯分布，所以使用非参数Wilcoxon秩和检验来判断两个物体是否是同一物体。将两个物体对应的地图点按三个维度排序，计算秩和判断。
- 单样本和双样本t检验：物体及其历史帧中的观测的质心服从高斯分布，可以通过单样本t检验来进行数据关联。双样本t检验通过检验两个物体的历史质心来合并物体（合并很有用）。
提出一种基于孤立森林（isolate forest）的离群点剔除算法。由于物体关联的地图点由图像检测框中特征点关联得到，所以存在很多不属于物体的外点。使用iForest算法按照3个维度构建t颗孤立树，属于物体的点体通常更聚合，对应深度更深，外点更稀疏，对应深度更浅，通过阈值剔除相应的外点。然后计算质心和尺度。旋转使用采样的方法，通过将三维检测框投影到图像与线段计算角度误差选择最优的旋转角度。然后进一步优化。
代码分析：主要改动在两个部分，一是前端位姿跟踪那里，每一帧将对应地图点与物体关联后进行数据关联，然后离群点剔除。在后端中进行物体的合并，因为后端优化后地图点位置变动了，更准。相机位姿与物体无关，还是原来基于点的估计。单目算法取了第一帧的真实位姿，因为需要与地平面对齐，算法仍然在单目的场景下，不具备真实尺度。

5. 基于物体级SLAM的主动建图与机器人抓取

Object SLAM-Based Active Mapping and Robotic Grasping [3DV 2021：https://arxiv.org/abs/2012.01788

上面EAO-SLAM的后续工作，将物体级SLAM应用于机器人抓取任务。除了EAO-SLAM部分外，额外引入了新的优化误差项。包括物体3D中心在图像的重投影误差、物体关联的地图点与物体表面距离误差（物体尺寸由最大地图点距离得到，怎么在物体外面会有地图点）以及用于约束旋转的物体坐标轴与平面法向量间的约束误差。
提出一种自主感知的主动建图策略。在物体表面构建网格，将地图点投影到物体表面，通过网格是否被占用来定量物体观测程度。通过信息增益和一系列效用函数来判断下一个最佳的观测视角，自动的感知建图。实验效果还不错，很有实用意义的工作。但代码未开源，有些问题文章中没有说明，如单目的尺度问题、平面估计问题、圆柱体如何建模等。

6. 室外环境下基于二次曲面地标重建的精确鲁棒的物体级SLAM

Accurate and Robust Object SLAM with 3D Quadric Landmark Reconstruction in Outdoor Environment [东北大学张云洲组] [RAL 2022]

提出了一种基于二次参数分离（SQP）的二次曲面初始化方法。参数分离的二次曲面初始化方法，将旋转、大小与位置解耦计算（因为Q里面t的数值大，若t估计偏差大Q就大），先算位置，再用检测框反投影与椭圆相切解旋转（yaw）和大小，其中旋转只考虑偏航角，通过解耦t和R计算提高精度和鲁棒性。
局部帧联合优化二次曲面地标与位姿，包括对象地标的重投影误差（投影框与检测框的差），先验大小误差（汽车），纹理平面误差（没看懂）。
在数据关联方面，提出了一种结合匈牙利分配算法的多线索算法。主要包括三种，用光流跟踪特征点在分割掩模的多少，地标的重投影与检测框的交并比，以及基于卡尔曼滤波的运动预测运动预测检测状态（和重投影交并比好像没啥区别）。

7. 紧耦合的多目标跟踪和SLAM

DynaSLAM II: Tightly-Coupled Multi-Object Tracking and SLAM [RAL 2021]：https://arxiv.org/abs/2010.07820

输入双目图像计算ORB和像素实例分割，若实例区域附近包含大量新特征点，则创建一个对象，与实例进行绑定。将静态特征点与前一帧做匹配关联。动态对象的特征点关联包括匀速运动假设下的重投影匹配和2D连续图像实例最大重叠。以对象的地图点的重心为中心，进行对象位姿的初始化。后续位姿优化主要是通过关联的地图点。
BA优化相机位姿，静态地图点，对象位姿，对象关联的地图点，误差来自于重投影误差、对象的线速度和角速度估计下的对象位姿与地图点和观测的误差。优化的Hessian矩阵不是特别稀疏，求解速度取决于对象、对象地图点的数量。
将对象的BBox估计与位姿估计解耦，通过搜索两个垂直平面来初始化对象边界框，在只找到一个平面的情况下，我们在与对象类相关的不可观测方向的粗略维度上添加先验知识。为了优化边界框尺寸及其相对于目标跟踪参考的姿态，在时间窗口内执行基于图像的优化。该优化旨在最小化3D边界框图像投影和2D边界框预测之间的距离。将初始边界框姿势设置为先验，以便优化解保持接近。

8. 基于尺度比例和对称纹理约束的语义物体级SLAM

SO-SLAM: Semantic Object SLAM with Scale Proportional and Symmetrical Texture Constraints [RAL 2022]：https://arxiv.org/abs/2109.04884

文章探讨了在室内结构环境下物体级SLAM中对象可以引入的约束，包括尺度比例约束、对称纹理约束和平面支撑约束。基于这些语义约束，提出了两种新的方法——更健壮的对象初始化方法和方向精细优化方法。
提出了一种从单帧观测中获取9自由度约束来初始化完整椭球体的方法，包括目标检测框、平面支撑约束、尺度比例约束。具体就是检测框反投影与椭球相切4个约束，支撑平面与物体相切1个约束，物体旋转的X和Y方向与支撑平面的法向量垂直2个约束，物体三个轴长度的比例2个约束共9个约束可以单帧初始化一个椭球地标。
基于对称纹理约束的精细优化，通过物体的对称性进一步限制物体的方向。通过使用像素到图像中边缘的最近距离值将其变为距离变换图。定义了对称性描述符来量化物体的对称特征，优化使物体位姿有更好的对称性。算法比较复杂，没有详细研究。

9. 基于椭球模型和三维感知椭圆预测的基于对象的摄像机姿态估计

Object-Based Visual Camera Pose Estimation From Ellipsoidal Model and 3D-Aware Ellipse Prediction [IJCV 2022]：https://arxiv.org/abs/2203.04613

单张图像通过观测地图中的椭球体地标恢复相机位姿的方法（SLAM中可用于重定位）。
通过改进目标检测算法，直接生成地标的椭圆检测框。方法是在传统目标检测的基础上，通过重建场景额外训练网络，在方框检测框的基础上生成椭圆检测框。
图像检测框与地标椭球体通过RANSAC算法进行数据关联。然后通过椭圆中心点的P3P算法恢复相机位姿。若观测少于3个对象，引入额外约束。
算法前提是要有完整的椭球表示物体的三维场景，要求很高，而且用于重定位的方法还是只使用椭圆的中心点，就是P3P套了个椭球物体的皮。尤其是实验表明地标物体的椭球方向、大小对算法没啥影响（只使用中心点肯定没啥影响）。实验很多，虽然是篇IJCV，感觉很水。

10. 语义建图中三维物体地标推理的鲁棒性改进

Robust Improvement in 3D Object Landmark Inference for Semantic Mapping [ICRA 2021]

引入水平支撑假设来约束二次曲面，即物体只有偏转角（yaw），减少了参数量。无约束的二次曲面有9个自由度，10个参数（尺度），而投影图像中的椭圆可提供5个约束，两幅图像时，由于极线约束，对应于同一椭球的两个椭圆轮廓反向投影的圆锥共享两个公共切面，所以两视图只能提供8个约束，一般需要三视图才能无约束恢复椭球，通过引入平面支撑约束，减少两个自由度，则两视图也可以求解椭球。

三. 平面-物体结合SLAM

1. 使用二次曲面和平面的结构感知SLAM

Structure Aware SLAM using Quadrics and Planes [ACCV 2018]：https://arxiv.org/abs/1804.09111

提出了结合点、物体与平面的语义SLAM方法。将通用对象表示为二次曲面实体，将平面建模为无限平面，在点、物体和平面间构建约束进行图优化求解。具体实现基于ORB-SLAM2的RGB-D模式，平面由RGB-D信息得到，物体检测由CNN检测器得到。
在点、物体和平面间构建空间约束：
- 点-平面约束：对于生成平面的内点，认为点在平面上，构造约束。
- 平面-平面约束：基于曼哈顿假设，对平行和垂直的平面间通过法向量构造约束。
- 平面-物体约束：若平面与物体相交或距离小于20cm，则认为是支撑平面，构造相切约束。
点、物体的测量误差均为重投影误差，物体的椭球体投影到图像与检测框内接椭圆计算误差，平面地标转换到当前帧坐标系与平面观测计算误差。物体通过语义标签和在检测器生成的特征空间中使用最近邻来进行数据关联，平面采用法线差异和最近邻来进行数据关联。

2. 单目对象级感知稀疏SLAM

Real-Time Monocular Object-Model Aware Sparse SLAM [ICRA 2019]:https://arxiv.org/abs/1809.09149

该工作是上面1号文章的单目版本。在RGB-D版本中，平面检测由深度信息得到，而在该文章中使用CNN网络来提取平面信息。平面间的数据关联主要通过共享关键点、法向量和距离关系得到。此外还额外添加了一个物体点云生成网络，将特定的物体检测框放入一个CNN网络，生成一个点云来表示对象的3D形状，然后计算归一化外接椭球后与SLAM中的对象椭球对齐估计参数。生成的对象点云可以用于提供物体形状先验，在优化中引入额外的约束（意义不大，要对特定物体训练网络）。其他内容与RGB-D版本差不多。

3. 结构化环境中单目物体与平面SLAM

Monocular Object and Plane SLAM in Structured Environments [RAL 2019]:https://arxiv.org/abs/1809.03415

提出了首个结合点、平面和物体的单目SLAM算法（1为RGB-D）。主要包括单视图检测和SLAM后端中的优化。对于单视图检测部分，主要包括平面和物体，首先通过语义分割得到地墙边缘，然后在图像中提取线段，筛选接近地墙边缘的线段，在线段上采样2点后反投影到地面生成2个交点构造墙平面（这里和CubeSLAM一样，第一帧真实位姿用于初始化，地平面是已知的，另外通过初始高度恢复单目尺度）。对于物体检测遵从CubeSLAM的方法，通过消影点生成15个提案。
生成的物体和平面提案构造一个势能函数，通过条件随机场（CRF）求解。包括平面自身势能、物体提案自身旋转误差势能和物体平面成对势能。成对势能包括物体-平面和平面-平面，前者为平面对物体的遮挡程度，后者为平面间的角度重叠比。通过条件随机场求解得到每个实体最优的提案，然后进行数据关联，主要根据物体和平面关联的地图点以及平面法线的角度、位置等信息。
在SLAM后端中进行统一的优化，各个元素间根据约束关系构造误差。包括地图点-特征点的重投影误差、物体重投影框与检测框的误差、地标平面与当前帧坐标系观测平面的误差、平面和物体遮挡误差（物体角点放入平面公式计算，若为正则在平面正侧）以及平面和点误差（属于平面的点放入平面方程值越小越好）。为提高鲁棒性，对物体和平面有严格的异常值剔除机制。

四. 物体级SLAM（偏向于建图）

面向对象的语义建图

1. Meaningful Maps With Object-Oriented Semantic Mapping [IROS 2017]:https://arxiv.org/abs/1609.07849

基于RGBD的稠密语义建图，结合了ORB-SLAM2和SSD对象检测和3D点云无监督分割。
使用ORB-SLAM2进行跟踪定位，通过深度图生成点云构建环境地图。使用SSD目标检测网络进行对象检测，然后将检测框中的3D点云进行无监督分割，得到对象的点云模型，将其与对象绑定。
通过地图中对象点云与当前帧检测到的对象点云各自的质心进行粗匹配，然后考虑每个点，若一半的点云距离小于2cm，则进行关联，否则创建新地标。
通过存储每个关键帧观测的点云以及每个对象的分段点云，可以在SLAM系统更新轨迹时（闭环）重新构建对象模型。
对象的表示方式是点云集合，并不具备空间刚性结构。

2. 从SLAM到3D动态场景图的空间感知

Kimera: from SLAM to Spatial Perception with 3D Dynamic Scene Graphs [IJRR 2021]:https://arxiv.org/abs/2101.06894

从定位、语义分割、语义建图、拓扑场景图、导航全流程打通的系统，来自MIT的工作，是作者之前几篇文章的集合。通过此文可以感受到目前机器人（视觉）空间感知技术的方方面面。分别来说包括如下两点。
Kimera，一个空间感知引擎。包括用于视觉惯性VIO、度量语义3D重建（网格）、对象定位、人体姿势和形状估计以及回环检测（同时优化位姿图和3D网格）的精确算法。
3D动态场景图DSG，DSG是一种分层有向图，其中节点表示空间概念（例如对象、房间、代理），边表示成对的时空关系。DSG中选择的节点和边还捕获了位置及其连接性，并使DSG成为导航和规划的可操作表示。
对象表示分为两种，有CAD模型的进行点云拟合，没模型的通过质心和点云生成位置，较为基础。但是在场景图中有其拓扑表示，可为高级任务提供信息。

3. 扩展和增强视觉SLAM的在线语义建图系统

An Online Semantic Mapping System for Extending and Enhancing Visual SLAM [SCI 3区 2022]：https://arxiv.org/abs/2203.03944

通过yolo目标检测生成2D检测框，然后引入IOU跟踪器将连续帧中属于同一目标的检测框关联起来（目标跟踪的思路），若连续关联超过5帧，则生成检测提案。在2D图像上进行预关联可以提高检测的鲁棒性。
对生成的提案进行点云生成，分别计算点云的质心，然后计算质心与多帧的2D检测框的偏移误差，若误差较大则考虑为动态对象或遮挡严重情形，缺乏足够的定位信息。（这里相机定位是考虑了运动物体的特征点，即点云受到了运动物体的影响，再反过来排除运动物体，处理的不是很好）。
通过多帧点云生成最大后验的质心，生成地标提案，通过使用一个验证门来进行数据关联，若存在的地标距离在门内，且类别符合，则进行数据关联。若门内有多个地标，则通过点云距离判断关联哪个。若没有找到合适的地标，则生成新的地标。地标以椭球表示，通过点云确定大小，不考虑方向。

五. 物体级SLAM（偏向重定位与闭环检测）

Semantic loop closure detection based on graph matching in multi-objects scenes [JVCIR]
OA-SLAM: Leveraging Objects for Camera Relocalization in Visual SLAM：https://arxiv.org/abs/2209.08338
Closing the Loop: Graph Networks to Unify Semantic Objects and Visual Features for Multi-object Scenes [IROS 2022]：https://arxiv.org/abs/2209.11894
Towards Accurate Loop Closure Detection in Semantic SLAM with 3D Semantic Covisibility Graphs [RAL 2022]

六. 数据关联（语义SLAM中另一个重点关注的问题）

1. 语义SLAM的概率数据关联

Probabilistic Data Association for Semantic SLAM [ICRA 2017 best paper] [引用:334]

首次提出语义SLAM数学模型，第一个将惯性观测、几何观测和语义观测紧耦合到一个统一的优化框架中的方法。提出一种鲁棒的语义数据关联方法，将语义信息和度量信息混合为一个优化问题。
提出了一种用于数据关联的期望最大化（EM）算法，不是将对象间的关联视为一对一的硬关联，而是建模为软关联，即观测对象与所有地标间都有关联，使用概率表达，然后通过将这些关联及其期望（这种关联下的误差概率）求最大化来得到最优的相机位姿和地标位置。先从上一帧相机位姿和地标计算当前观测的关联权重，然后在SLAM后端优化中根据关联权重引入语义信息约束。
搭建了一个结合语义、视觉、IMU的语义SLAM系统，包括语义关联的误差、特征点重投影误差、IMU预积分误差，结合起来优化SLAM问题。

2. 基于混合模型的鲁棒语义SLAM概率数据关联

Probabilistic Data Association via Mixture Models for Robust Semantic SLAM [ICRA 2020]：https://arxiv.org/abs/1909.11213

提出了用于语义SLAM数据关联的近似最大边缘化过程，核心就是将上篇论文中的平均的关联权重替换为最大边缘化的关联权重。但是计算所有时间中最大边缘化概率的计算量较大，文章提出不考虑新增观测对过去数据关联的影响（有点马尔可夫的意思），在之前先验的基础上通过当前观测最大边缘化计算概率。
在具体计算数据关联概率时同时考虑语义和度量数据，将其混合计算。同时，还引入了零假设数据关联，将其与候选关联并起来然后归一化。然后优化位姿和地标时选择概率和误差最优的数据关联，是硬关联。

3. 具有自动对象级数据关联的语义SLAM

Semantic SLAM with Autonomous Object-Level Data Association [ICRA 2021]：https://arxiv.org/abs/2011.10625

一种利用对象的几何和外观信息的对象级数据关联算法，首先通过yolo进行目标检测，然后在每个检测框中提取ORB特征，然后计算这些特征的词袋向量（BOW）。帧间进行数据关联时首先通过每个检测对象的类别进行过滤，然后同一类别考虑重投影误差，即上一帧关联的地标对象的中心在当前帧的重投影点在检测框内，若还未建立地标对象，则上一帧检测框的中心在当前帧的极线经过当前检测框。然后满足以上条件的候选对象进行BOW匹配，通过一个整数规划算法确定数据关联。
结合多帧的二次曲面初始化方法。当新建立地标对象时由于观测太少不进行实体初始化，在连续匹配几帧后通过二次曲面与检测框反投影平面相切的约束进行初始化，还额外引入了二次曲面在相机前、相机平面与二次曲面无接触、中心点在每个观测帧的投影点都在检测框内等3个约束。通过解这个线性约束的二次规划问题求得初始化结果。

Localization of Classified Objects in SLAM using Nonparametric Statistics and Clustering [IROS 2018]
Not Only Look But Infer: Multiple Hypothesis Clustering of Data Association Inference for Semantic SLAM [SCI期刊]
Bayesian Nonparametric Object Association for Semantic SLAM [RAL 2021] [引用: 3]

七. 大杂烩

用于宽视差重定位的对象增强RGB-D SLAM：Object-Augmented RGB-D SLAM for Wide-Disparity Relocalisation [IROS 2021]
模糊感知对象SLAM的混合共识优化（机翻）：Consensus-Informed Optimization Over Mixtures for Ambiguity-Aware Object SLAM [IROS 2021]
用于对象SLAM中位姿模糊的多假设方法：A Multi-Hypothesis Approach to Pose Ambiguity in Object-Based SLAM [IROS 2021]
合成可缩放物体级SLAM（机翻）：Compositional Scalable Object SLAM [ICRA 2021]
具有深度形状先验的面向对象SLAM：DSP-SLAM: Object Oriented SLAM with Deep Shape Priors [3DV 2021]
动态环境中的受限SLAM：TwistSLAM: Constrained SLAM in Dynamic Environment [RAL 2022]
单目物体级SLAM的对偶二次曲面的尺度估计：Scale Estimation with Dual Quadrics for Monocular Object SLAM
受益于铰接式对象的动态SLAM：AirDOS: Dynamic SLAM benefits from Articulated Objects [ICRA 2022]
具有对象级重定标的可视惯性多实例动态SLAM：Visual-Inertial Multi-Instance Dynamic SLAM with Object-level Relocalisation
用于基于图的语义单目定位与建图的对象结构点表示：Object Structural Points Representation for Graph-based Semantic Monocular Localization and Mapping [arXiv:2206.10263]

往期回顾

2022最新！视觉SLAM综述（多传感器/姿态估计/动态环境/视觉里程计）

【自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区，聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多传感器融合、SLAM、光流估计、深度估计、轨迹预测、高精地图、规划控制、模型部署落地、自动驾驶仿真测试、硬件配置、AI求职交流等方向；

加入我们：自动驾驶之心技术交流群汇总！

自动驾驶之心【知识星球】

想要了解更多自动驾驶感知（分类、检测、分割、关键点、车道线、3D目标检测、多传感器融合、目标跟踪、光流估计、轨迹预测）、自动驾驶定位建图（SLAM、高精地图）、自动驾驶规划控制、领域技术方案、AI模型部署落地实战、行业动态、岗位发布，欢迎扫描下方二维码，加入自动驾驶之心知识星球（三天内无条件退款），日常分享论文+代码，这里汇聚行业和学术界大佬，前沿技术方向尽在掌握中，期待交流！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)