《FlowNet3D》(CVPR2019)--直接从点云中估计场景流

2023-05-16

暴走兔学习了CVPR 2019的论文:《FlowNet3D: Learning Scene Flow in 3D Point Clouds》,为了更好的理解该论文(年纪大了容易忘),在此做个总结性的阅读笔记,争取言简意赅、简单粗暴地描述出论文作者们所作的工作,如果能对相关研究方向的小伙伴有借鉴意义,那就更好了。不喜勿喷,直接移步就好了~


项目地址:https://github.com/xingyul/flownet3d

一句话介绍:

FlowNet3D----是一种点云的端到端的场景流估计网络,能够直接从点云中估计场景流。

  输入:连续两帧的原始点云;

  输出:第一帧中所有点所对应的密集的场景流。

  如图所示:

  flownet3d网络为第一帧中的每个点估计一个平移流向量,以表示它在两帧之间的运动。

FlowNet3D架构

如图所示(图是从论文截的,试了几次也不知道怎么去掉博客水印,抱歉啊),该模型具有三个关键模块,分别为:

(1)点特征学习(point feature learning)-- 作用:分层点云特征学习。

(2)点混合(point mixture)--作用:混合两个点云。

(3)流细化(flow refinement)--作用: 将与中间点关联的流嵌入上采样到原始点,并在最后一层预测所有原始点的流。

向上采样的步骤是通过一个可学习的新层--set upconv层来实现的。

点云处理层

在这些模块下是三个可训练的点云处理层:

4个set conv层--作用: 学习深度点云功能;

1个flow embedded层--作用: 流嵌入层,学习两个点云之间的几何关系,推断运动;

4个set upconv层(对应于四个set conv层)--作用: 以一种可学习的方式向上采样和传播点特性。

每个可学习层对函数h采用多层感知器,用几个线性层宽来参数化Linear-BatchNorm-ReLU层。详细的层参数如表1所示。

(这个表格也是论文中的,同不知道怎么去博客水印,抱歉)

因为点云自身的不规则性和无序性,传统的用于2d图像的卷积并不适合对其进行直接处理。在2017年,学术界提出了pointnet以及后来改进的pointnet++,是可以直接处理3d点云的神经网络,所以这篇论文是延用了pointnet++的网络结构。

<具体公式这里就不贴了,请移步论文看公式>

数据集

FlyingThings3D及kitti

额,FlyingThings3D的这些数据集中,有一个100G的,一个80多G的,我下了半个月还没下完,下载链接为:

https://lmb.informatik.uni-freiburg.de/resources/datasets/SceneFlowDatasets.en.html

数据集由stereo和从ShapeNet中采样的具有多个随机移动对象的场景中呈现的RGB-D图像。

有大约32k的立体图像与地面真视差和光流图。作者们随机选取2万个作为训练集,2000个作为测试集。不使用RGB图像,而是通过视差图到3D点云和光流到场景流来预处理数据。

测试结果

在flying things3d数据集的测试结果

度量指标为

端点误差(End-point-error, EPE)

流量估计精度(Acc)(<0.05或5%,<0.1或10%)。

<补充说明:EPE(endpoint error):评价光流法的一种方法。
指所有像素点的gound truth和预测出来的光流之间差别距离(欧氏距离)的平均值,越低越好。>

在KITTI场景流数据集上的场景流估计。

度量指标为:

EPE,ACC.

使用KITTI sceneflow数据集进行场景流估计。(前100帧用于调整我们的模型。所有方法都在剩下的50帧上求值。)

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

《FlowNet3D》(CVPR2019)--直接从点云中估计场景流 的相关文章

随机推荐

  • 报错{“msg“:“invalid token“,“code“:401}问题的解决

    报错 msg invalid token code 401 问题的解决 xff1a 解决办法 xff1a 将精确的路由放在最上面 xff0c 模糊的路由放在最下面 xff0c 防止精确的路由被覆盖
  • Android 电池管理系统

    https blog csdn net bhj1119 article details 52947344 Android电池服务的源码结构 Framework base services java com android server Sy
  • eBPF技术介绍

    前言 eBPF起源于linux内核 xff0c 它可以以砂箱程序运行在操作系统内核的特权上下文 xff0c 高效 xff0c 安全 xff0c 易于扩展而不需要修改内核源码或者加载内核模块 操作系统一直是实现观测 xff0c 安全和网络功能
  • eBPF开发工具链

    有几个开发工具链可以帮助开发和管理eBPF程序 它们都满足了用户的不同需求 xff1a bcc BCC是一个框架 xff0c 使用户能够编写嵌入其中的eBPF程序的python程序 该框架主要针对涉及应用程序和系统分析 跟踪的用例 xff0
  • Off-CPU分析

    前言 性能问题可以分为两种类型 xff1a On CPU xff1a 线程花时间在CPU上运行的地方 xff1b Off CPU xff1a 在I O xff0c 锁 xff0c 计数器 xff0c 分页 交换上阻塞等待的时间 Off CP
  • uint8_t / uint16_t / uint32_t /uint64_t数据类型详解

    https blog csdn net bruce 0712 article details 72805903
  • 什么是系统调用?为什么要用系统调用?

    什么是系统调用 Linux内核中设置了一组用于实现各种系统功能的子程序 xff0c 称为系统调用 用户可以通过系统调用命令在自己的应用程序中调用它们 从某种角度来看 xff0c 系统调用和普通的函数调用非常相似 区别仅仅在于 xff0c 系
  • android的surfaceflinger原理学习

    概念 SurfaceFlinger是一个系统服务 xff0c 如 xff1a audioflinger xff0c audiopolicyservice等等 xff0c 系统的主要服务通过这个文章进行了解 xff0c Android的系统服
  • labview界面分隔和自定义窗口大小

    gt gt gt gt gt gt 我的博客目录导航 转自 statemic LabVIEW程序界面的布局 控件的显示效果与监视器是密切相关的 xff0c 因此在程序设计时需要考虑目标监视器的颜色 分辨率等因素 xff0c 并明确运行该应用
  • CAN通信矩阵的理解(CAN报文信号的属性)

    CAN通信矩阵 1 CAN通信矩阵是什么 CAN通信矩阵 xff08 CAN Communication Matrix xff09 通常由整车厂完成定义 xff0c 车辆网络中的各个节点需要遵循该通讯矩阵才能完成信息的交互和共享 我们知道C
  • Android OMX介绍(总括)

    一 OpenMax简介 xff08 缩写为 xff1a OMX xff09 OpenMAX是一个多媒体应用程序的标准 由NVIDIA公司和Khronos 在2006年推出 它是无授权费的 跨平台的C语言程序接口序列 xff0c 这些接口对音
  • 从此以后谁也别说我不懂LDO了

    LDO是个很简单的器件 xff0c 但是我跟客户沟通的过程中 xff0c 发现客户工程师的技术水平参差不齐 xff0c 有的工程师只是follow 别人以前的设计 xff0c 任何原理和设计方法都不懂 xff0c 希望大家看完这篇文章都能成
  • 屏下指纹技术实现方案与原理

    1月24日 xff0c 全球第一台量产的屏幕指纹手机vivo X20 Plus屏幕指纹版正式在北京亮相 据悉 xff0c 该手机屏幕指纹版已经支持支付宝和微信的指纹支付 vivo X20 Plus屏下指纹 xff0c 其原理是利用光电反射技
  • linux系统的休眠与唤醒简介

    系统挂起 xff08 Suspend xff09 是电源管理 xff08 APM amp ACPI xff09 的一个特性 xff0c 给用户带来了很大的方便 Linux在2 6系列核心中对电源管理有了较好的支持 xff0c 下面就谈谈Li
  • 奇偶校验的概念

    奇偶校验 Parity Check 是一种校验代码传输正确性的方法 根据被传输的一组二进制代码的数位中 34 1 34 的个数是奇数或偶数来进行校验 采用奇数的称为奇校验 xff0c 反之 xff0c 称为偶校验 采用何种校验是事先规定好的
  • HTTP Basic, Session, Token 三种认证方法简介

    1 概述 本文简介 HTTP Basic xff0c Session xff0c Token 三种认证方法 Basic 认证 xff1a 户籍部门已给你签发了一张身份证 你每次去办事 xff0c 都要带上身份证证 xff0c 后台要拿你的身
  • 车路协同、智能网联方面的英文专业词汇

    车路协同系统 Cooperative Vehicle Infrastructure System xff08 CVIS xff09 车辆对基础设施 Vehicle to Infrastructure V2N 车辆对网络 Vehicle to
  • 国内外知名激光雷达企业盘点

    https mp weixin qq com s KBOZfM qP9y oCAB6FxZxQ 国外知名产品 品牌 图示 所属国家 核心产品 Velodyne 美国 机械式激光雷达 HDL 64E HDL 32E VLP 16 车规级 激光
  • 激光雷达的性能指标-以大疆livox-Mid40激光雷达为例

    xff08 看了一下 xff0c 有网上列表的探测范围数据与本文截图不太一致 xff0c 本文截图来自livox官网手册 xff09 有人问我 这个参数是什么意思 xff0c 在此解释一下 xff1a 激光打到不同的射物上 xff0c 能反
  • 《FlowNet3D》(CVPR2019)--直接从点云中估计场景流

    暴走兔学习了CVPR 2019的论文 xff1a FlowNet3D Learning Scene Flow in 3D Point Clouds xff0c 为了更好的理解该论文 xff08 年纪大了容易忘 xff09 xff0c 在此做