多传感器融合 | 详解PointPainting和MVP

2023-05-16

作者 | 谷溢编辑 | 深蓝AI

点击下方卡片，关注“自动驾驶之心”公众号

ADAS巨卷干货，即可获取

点击进入→自动驾驶之心技术交流群

后台回复【多传感器融合综述】获取图像/激光雷达/毫米波雷达融合综述等干货资料！

一提到多传感器融合的工作，就不得不帮深蓝学院打一波广告了，多传感器融合的定位课程是我心目中top3的存在，最近又开设了多传感器融合的感知课程。

多传感器融合相关的理论真的可以非常复杂，而在感知方面，由于可以和深度学习做结合，所以很多工作可以变得简单有效，有时候一个简单的特征融合都会有很好的效果。

本文结合 3D 物体检测，为大家带来两篇工作，一篇是 PointPainting，一篇是Multimodal Virtual Point 3D Detection (后称MVP).

PointPainting

这篇文章并不算久远，但是很适合作为多传感器的入门读物。在当时 3D 物体检测还是以 Lidar-Only 的方式为主，因为融合的算法并不能体现明显的优势，但是很显然，Lidar 的信息有限、检测精度有限。如下图可以看到，在25m远的地方，人和杆子仅根据点云已经很难区分了，但是图像上却很容易区分。

针对Lidar信息有限的问题，解决思路有两个，一个是挖掘更多的信息，但是这条路很难走；另一个思路就是加信息，那么怎么加信息就是我们要关注的点了。

PointPainting的解决思路是为每个点赋上一个语义，这个语义从图像中可以获取，结合论文的流程图加以理解：

在有了带语义的点云之后，再输入到一个现有的点云检测网络当中即可。这是 CVPR 2020 的工作。

工作虽然很简单，但是效果提升很明显。不过我们还是需要有一些思考，虽然这样的方式可以提升性能，但是图像分割不是绝对准确的，如果赋错了怎么办？而且点云依旧是稀疏的，是不是可以像PseudoLidar这类单目3D物体检测的方法，去补一些点呢？我们来看一看 MVP 是怎么思考这些问题的。

MVP

我们首先看一下 3D 物体检测常见的failure case (图像来自MVP github):

在远处的物体往往会出现误检、漏检以及检测不准确的问题。这是由于雷达过于稀疏：

那么按照 PointPainting 的做法我们会为这些稀疏的点赋上语义，如下图：

但是稀疏的问题仍然存在，所以MVP提出的观点是，应当补充适当的点，使得远处的点稠密，又不至于整理计算开销太大：

方法也很简单，其实深度估计都不需要，我们根据图像得到的 Mask，可以先计算一些 Mask 内有多少 Lidar 点，如果满足一定阈值，比如20个点，我们就不做额外操作，如果不满足，我们就在mask内随机选若干个像素，深度依据最近邻原则补上，然后再投影到3D空间，这样做不仅不会增加很大的开销，而且可以大幅提升性能：

可以看到 MVP 的 performance 是远超 PointPainting 的。

我们在选取一帧补充后的点云做可视化：

总结

所以有些时候思想往往更重要，最近很火的 MAE 其实也十分易懂，但是效果却很惊艳，简洁到不知道怎么修改，当然这是开玩笑了。这两篇工作都是非常简单，但是实验都做得非常充分，MVP 还结合了最新的 MaskFormer 做了一些实验。这也给了我们很大启发，有时候分析清楚问题往往比设计一个复杂又不通用的算法要有意义多。

往期回顾

一文尽览 | 基于点云、多模态的3D目标检测算法综述！（Point/Voxel/Point-Voxel）

【自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区，聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多传感器融合、SLAM、光流估计、深度估计、轨迹预测、高精地图、规划控制、模型部署落地、自动驾驶仿真测试、硬件配置、AI求职交流等方向；

加入我们：自动驾驶之心技术交流群汇总！

自动驾驶之心【知识星球】

想要了解更多自动驾驶感知（分类、检测、分割、关键点、车道线、3D目标检测、多传感器融合、目标跟踪、光流估计、轨迹预测）、自动驾驶定位建图（SLAM、高精地图）、自动驾驶规划控制、领域技术方案、AI模型部署落地实战、行业动态、岗位发布，欢迎扫描下方二维码，加入自动驾驶之心知识星球（三天内无条件退款），日常分享论文+代码，这里汇聚行业和学术界大佬，前沿技术方向尽在掌握中，期待交流！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

多传感器融合 | 详解PointPainting和MVP 的相关文章

人工智能革命（下）：永生还是毁灭

导读 xff1a 本系列文章讲述了人工智能革命的爆发以及人类未来的出路 xff0c 由于篇幅较长分为上下两篇 xff0c 原英文载于神奇的网站 WaitButWhy com xff0c 作者Tim Urban还写过一篇有关脑机接口的文章 N
rust vs java_为什么我喜欢以Java程序员的身份学习Rust

rust vs java 自从我正确地学习了计算机或人类这门新语言以来 xff0c 已经很长时间了也许25年那是Java语言 xff0c 尽管与此同时我不得不写一点点C xff08 很少 xff09 和JavaScript xff0c
git-cola使用教程_使用Git Cola轻松实现Git

git cola使用教程 Git是一个Linux命令 xff0c 可帮助您管理工作的版本它已被移植到BSD xff0c macOS xff0c Windows等它是流行的代码托管服务的基础 xff0c 包括GitLab和NotABug等
.net 开发使用什么语言_如何开始使用.NET开发

net 开发使用什么语言 NET框架由Microsoft在2000年发布该平台的开源实现Mono在2000年代初一直是争议的中心 xff0c 因为Microsoft拥有 NET技术的多项专利 xff0c 并且可以使用这些专利终止Mono的
linux重启命令_3条命令重启Linux（另外4种安全方式）

linux重启命令 Linux完全有能力运行 xff0c 而不需要数周 xff0c 而是数年 xff0c 而无需重新启动在某些行业中 xff0c 这正是Linux的功能 xff0c 这要归功于kpatch和kgraph之类的进步但是 x
crazy pony_Pony编程语言简介

crazy pony 在Wallaroo Labs xff08 我是工程副总裁 xff09 xff0c 我们正在构建以Pony编程语言编写的高性能 xff0c 分布式流处理器大多数人都没有听说过Pony xff0c 但是对于Wallaro
html标记语言图像标记_为什么我喜欢这些标记语言

html标记语言图像标记去年大约这个时候 xff0c 我为本专栏文章简要介绍了各种标记语言语言选择的话题最近出现了好几次 xff0c 所以我认为现在该是时候以我的偏见来重新讨论这个话题了我在这里解释为什么我更喜欢我的语言 xff0c
无人机开源项目_8个开源无人机项目

无人机开源项目编者注 xff1a 本文最初发表于2016年12月 xff0c 现已更新以包含其他信息在过去的几年中 xff0c 对民用 xff0c 军事和商用无人机的兴趣Swift增长 xff0c 这也带动了制造商社区对开源无人机项目的
开源协议自主发展_开源推动科学发展的9个故事

开源协议自主发展如今 xff0c 科学可能看起来更像开源世界各地的研究人员和科学家都在呼吁获得免费许可的数据集开放获取发布条件 xff1b 以及协作 xff0c 透明的同行评审他们正在寻找开放源代码原则可以增强数字时代知识生产实践
开源 word 替代_5种Google文档的开源替代品

开源 word 替代每天处理大量文档时 xff0c 无论您写什么 xff08 白皮书 xff0c 手册 xff0c 演示文稿 xff0c 不同的市场营销材料 xff0c 合同等 xff09 xff0c 都必须在某个时候 xff08 最常见
vscode快捷键 & java/c++环境

vscode快捷键 amp java c 43 43 环境 vscode快捷键环境配置javac 43 43 个人习惯设置参考 vscode快捷键快捷键功能Ctrl 43 Shift 43 P 或 F1显示所有命令Ctrl 43 空格触发
IIC通信协议（简单易理解版）

IIC通信协议简介 xff1a IIC xff08 也记为I2C xff0c 读作I 2C xff0c inter integrated Circuit集成电路总线 xff0c 最早是飞利浦在1982年开发设计并用于自己的芯片上 xff0c
linux防病毒软件_十大Linux最佳防病毒软件-Linux防病毒软件列表！

linux防病毒软件 Today s article is all about the best Antivirus for Linux But if Linux is so secure why do we need to have an
Python isinstance（）

Python isinstance function is used to check if an object is an instance of the specified class or not Python的isinstance
使用git下载仓库_使用Git仓库

使用git下载仓库 Whenever we start a project we will need to store all files in a repository So let 39 s start by first creatin
在Raspberry Pi（ARM32）上的Docker中构建，运行和测试.NET Core和ASP.NET Core 2.1

I love me some Raspberry Pi They are great little learning machines and are super fun for kids to play with Even if thos
什么是Ubuntu LTS？与常规Ubuntu版本有何不同？

Ubuntu distributions are released at given time intervals Every release has a code name that is related to an animal nam
定义一个protobuf消息并生成Go代码

大家好 xff01 让我们开始gRPC课程的动手部分整个部分的目标是构建个人计算机 Web服务 xff0c 该服务将使我们能够管理和搜索笔记本电脑配置 Here 39 s the link to the full gRPC course
学科起源（漫画版）

发几张收藏的图 xff0c 让大家对学科起源有点了解 xff0c 避免因学科纷争而引起不和 xff0c 生命科学也罢 xff0c 神经网络也罢都摆脱不了从物理和数学的角度去解释 xff0c 因为机器学习中很大的一部分 xff0c 尤其是神经
【沧海拾昧】WiFi串口通信ESP8266模块基本介绍（附野火WiFi透传实例）

C0104 沧海茫茫千钟粟 xff0c 且拾吾昧一微尘沧海拾昧集 64 CuPhoenix 阅前敬告沧海拾昧集仅做个人学习笔记之用 xff0c 所述内容不专业不严谨不成体系如有问题必是本集记录有谬 xff0c 切勿深究目录前言一

随机推荐

linux shell

转自 xff1a http blog csdn net fly sky520 article details 8853537 最近在linux下面编写shell脚本 xff0c 差不多是边学边写在此记录一些学习心得一 xff09 she
软件开发遇到的难题_软件开发团队如何处理管理难题

软件开发遇到的难题通常是这样的项目经理或产品负责人传达了来自公司食品链上层人士的消息 xff0c 即必须在给定日期之前交付软件日期背后的原因可能是已知的 xff0c 但可能不是反过来 xff0c 项目经理通知软件开发团队必须在该日期
Ubuntu20.04由于分辨率问题安装界面显示不完整

使用vmware安装ubuntu的时候 xff0c 由于分辨率的问题 xff0c 导致安装界面显示不完整 xff0c button被隐藏 xff0c 无法进行下一步鼠标操作同学遇到的问题 xff0c 迟迟不能解决 xff0c 参考别人的解
数据结构排序算法及代码整理

排序 xff1b 1 插入排序 xff08 直接插入排序和希尔排序 xff09 2 选择排序 xff08 直接选择排序和堆排序 xff09 3 交换排序 xff08 冒泡排序和快速排序 xff09 4 归并排序 5 基数排序 xff0d x
排序算法性能比较

各种排序方法的综合比较结论排序方法平均时间最坏时间辅助存储简单排序 O n2 O n2 O 1 快速排序 O nlogn O n2 O logn 堆排序 O nlogn O nlogn O 1 归并排序 O nlogn O nl
c++标准容器类（表格介绍）

1 STL有6种序列容器类型 xff08 1 xff09 vector 它提供对元素的随即访问 xff0c 在尾部添加和删除元素的时间是固定的 xff0c 在头部或中部插入和删除元素的复杂度为线性时间 xff08 2 xff09 deque
各大公司薪水一览表

转自 http blog sina com cn s blog 4997a23a0100b2xc html 最近终于把自己给卖了 xff0c 这几个月来自己陆陆续续的面试的有30多家公司 xff0c 主要是IT公司 xff0c 准备把今年我
strtol

转自 xff1a http hi baidu com qwpsmile blog item 9bc44efa4f41018a9f514637 html 今天 xff0c 在review 一些代码的时候 xff0c 看到了strtol 这个函
学会做自己的朋友

转自 http www 5xue com modules article view article php a2233 你是否经历过 xff1a 我们常会怪罪自己 xff0c 给自己很低的评价 xff0c 也习惯对结果做最坏的打算 xff1
二值信号量和互斥信号量的区别

互斥信号量和二进制信号量的区别互斥型信号量必须是同一个任务申请 xff0c 同一个任务释放 xff0c 其他任务释放无效同一个任务可以递归申请二进制信号量 xff0c 一个任务申请成功后 xff0c 可以由另一个任务释放二进制信号量
敏捷开发

这两个圆圈表示不同的视角上的敏捷实践 xff0c 包括开发者视角和项目管理的视角接下来从里向外进行介绍 xff0c 因为有些实践我了解得不清楚 xff0c 如果下面有哪些说得不对的地方也请大家指出 Test Driven Developm
c++结构体的二进制文件，python如何解析

c 43 43 结构体的二进制文件 xff0c python如何解析场景分析现有如下场景 xff1a 有一个二进制文件需要解析成可读数据已知条件 xff1a 该文件符合c 43 43 结构体对应的结构体数据 xff0c 因此我们可以通过
LeetCode刷题记录（Python3）——线性表

LeetCode27 移除元素简单问题描述 xff1a 给定一个数组nums和一个值val xff0c 你需要原地移除所有数值等于val的元素 xff0c 并返回移除后数组的新长度不要使用额外的数组空间 xff0c 必须仅使用 O
使用百度网盘上传大文件到云服务器

因为需要把几个7G大小左右的数据上传至服务器 xff0c 但无奈使用的是共享服务器 xff0c 上传速度非常慢管理员建议可以用奶牛快传 xff08 目前收费 xff09 中转 xff0c 百度搜了一下 xff0c 百度网盘有相同作用 xf
ubuntu操作系统中TCP客户端和服务器端的开发

网络编程在Python中的应用 xff0c 三次握手和四次挥手的理解 TCP客户端和服务器端流程图 xff1a TCP客户端开发流程 xff1a 1 创建客户端套接字 2 和服务端套接字建立连接 3 发送数据 4 接收数据 5 关闭客户端套
sphinx 文档_Sphinx轻松漂亮的文档

sphinx 文档 Sphinx是允许开发人员以纯文本格式编写文档的工具 xff0c 可轻松生成满足各种需求的格式的输出使用版本控制系统跟踪更改时 xff0c 这将很有帮助纯文本文档对于跨不同系统的协作者也很有用纯文本是当前可用的最可
经典激光雷达SLAM系统：LeGO-LOAM

作者密斯特李编辑汽车人原文链接 xff1a https zhuanlan zhihu com p 511968459 点击下方卡片 xff0c 关注自动驾驶之心公众号 ADAS巨卷干货 xff0c 即可获取点击进入自动驾驶之
经典激光雷达SLAM系统：LOAM-Livox

作者密斯特李编辑汽车人原文链接 xff1a https zhuanlan zhihu com p 515732721 点击下方卡片 xff0c 关注自动驾驶之心公众号 ADAS巨卷干货 xff0c 即可获取点击进入自动驾驶之
SLAM中姿态估计的图优化方法比较（g2o/Ceres/GTSAM/SE-Sync）

编辑深蓝AI 点击下方卡片 xff0c 关注自动驾驶之心公众号 ADAS巨卷干货 xff0c 即可获取后台回复 SLAM综述获取视觉SLAM 激光SLAM RGBD SLAM等多篇综述 xff01 本文是对论文 A Compari
多传感器融合 | 详解PointPainting和MVP

作者谷溢编辑深蓝AI 点击下方卡片 xff0c 关注自动驾驶之心公众号 ADAS巨卷干货 xff0c 即可获取点击进入自动驾驶之心技术交流群后台回复多传感器融合综述获取图像激光雷达毫米波雷达融合综述等干货资料 xff

多传感器融合 | 详解PointPainting和MVP

多传感器融合 | 详解PointPainting和MVP 的相关文章

随机推荐

热门标签