WoodScape: A multi-task, multi-camera fisheye dataset for autonomous driving

2023-05-16

Paper name

Paper Reading Note

URL: https://openaccess.thecvf.com/content_ICCV_2019/papers/Yogamani_WoodScape_A_Multi-Task_Multi-Camera_Fisheye_Dataset_for_Autonomous_Driving_ICCV_2019_paper.pdf
GITHUB_URL: https://github.com/valeoai/WoodScape
数据集官网： https://woodscape.valeo.com

TL;DR

2019 年 ICCV 文章，出自于德国 Valeo 自动驾驶公司，提出了首个基于鱼眼相机采集的自动驾驶数据集 woodscape（取名致敬鱼眼镜头发明者 Robert_W._Wood）
适用于多个视觉任务：分割、深度估计、3D 包围框检测、镜头污渍检测等。分割标注在 instance level 有40类标注，提供了 10000 张图片，其他任务提供了 100000 张图片（其实并没有完全开源，比如雷达数据没有开源，总数据集数目大概是 10000 张左右）
鼓励在进行畸变校正的情况下进行视觉处理

Introduction

鱼眼相机和传统使用透视投影的针孔相机不一样，是使用非线性的投影来得到一个非常大的 FOV
该数据集适用于多个视觉任务：分割、深度估计、3D 包围框检测、镜头污渍检测等。分割标注在 instance level 有40类标注，提供了 10000 张图片，其他任务提供了 100000 张图片（其实并没有完全开源，比如雷达数据一点都没有开源，总数据集数目大概是 10000 张左右）
主要贡献有：
- 提出首个 10000 数量级的鱼眼图像分割数据集
- 4 个鱼眼相机、9个视觉任务，鼓励多任务、多相机方面的研究
- 提出了一种新颖的镜头表面污渍检测任务，并提出了该任务的首个数据集
- 提出了一种训练速率提升 95x 的 3D 框检测方法

Dataset/Algorithm/Model/Experiment Detail

实现方式

采集车传感器配置

前后左右分别安装一个鱼眼相机

鱼眼相机投影

鱼眼图像虽然 FOV 大，但成像模型较为复杂
鱼眼畸变由径向映射函数 r ( θ ) r(\theta) r(θ) 建模， r ( θ ) r(\theta) r(θ) 是图像上距畸变中心（光轴与图像平面的交点）的距离，是入射光线与相机光轴夹角 θ \theta θ 的函数
鱼眼相机投影方法
- 一般的鱼眼投影方法有：Stereographic projection、Unified Camera Model (UCM)、eUCM (Enhanced UCM)，这些方法由于使用了特定的 geometry 所以并不完美适配鱼眼
- WoodScape 使用了 4阶多项式的映射函数，将入射角映射到图像像素
不同鱼眼相机投影的对比，其他投影模型参数都是优化到与 4 阶多项式投影对齐（入射角：0°与120°范围内，即 FOV 最大 240°）。

畸变校正 vs 模型适配畸变图像

a 图是 rectilinear image 的简单畸变校正，缺点是降低了 FOV，且大于 180°的区域无法被正常校正，另外对于小区域 warp 到大区域的情况下有 resampling distortion
b 图的 Piecewise linear correction 能解决 FOV 缺失问题，但是从一个平面到另一个平面的过度区域存在一些问题，可以看成是对鱼眼透镜模型的分段线性近似
c 图展示了基于圆柱形视点进行的拟线性校正，在垂直方向是线性的，所以在垂直方向的竖直物体被较好保留，但是水平方向存在一些 distortion

在这里插入图片描述

由于畸变校正方法的本质缺陷，使用 CNN 来适配这种畸变也是一种思路，但是 CNN 的平移不变性在鱼眼这里不能被满足，因为鱼眼存在 spatially variant distortion，隐式学习这种畸变较为困难，最近的球形模型是一种解决思路但远远不够，这个方向还是 open problem

数据采集

大部分数据采集于： USA, Europe, and China（由于隐私问题不能开源）
虽然大部分数据来自轿车，但运动型多用途车的数据量很大，确保了传感器机械配置的充分性
采集设备
语义分割类别分布

数据集对比

在这里插入图片描述

实验结果

分割检测任务
镜头表面污渍检测
slam

Thoughts

非常全面的鱼眼数据集，支持多个任务，可惜开源工作不彻底，只开源了小部分数据（并且开源时间与承诺时间相比推迟了一年）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

WoodScape

Multi

task

Camera

Fisheye

WoodScape: A multi-task, multi-camera fisheye dataset for autonomous driving 的相关文章

访问 iOS 6 新 API 以获取相机曝光和快门速度

在苹果的iOS 6 0 功能页面 https developer apple com technologies ios6 过去常说利用内置摄像头的高级功能新的 API 可让您控制焦点曝光和感兴趣区域您还可以使用人脸检测 API 访问
Gradle 额外属性在子项目中定义的自定义任务中不可见

我正在尝试在多个 Gradle 任务之间重用通用逻辑类似于中建议的内容这个答案 https stackoverflow com a 13072481 但我遇到了额外项目属性不可见的问题归根结底问题就在这里假设我有一个根 Gradle
关闭 Android 中的自动对焦

这是在我的应用程序代码中关闭相机自动对焦的任何方法我想检查如果手机没有自动对焦功能我的扫描仪如何工作但我的手机有该功能 Use FOCUS MODE INFINITY http developer android com refer
在 TPL 中返回空静态任务是一种不好的做法吗？

在某些情况下我想有条件地运行任务我使用某种扩展方法如下所示 public static class MyTaskExtension private static Task theEmptyTask Task Factory Start
以编程方式截取屏幕截图不会捕获 surfaceVIew 的内容

我有一个应用程序我希望能够捕获屏幕截图布局的背景是一个 SurfaceView 显示来自后置摄像头的视频下面的代码可以截图但是surfaceView的内容保存为黑色这是代码 btn setOnClickListener new O
如何检测位图中的红色像素

android中的getPixels 是上下左右读取像素还是左右上下读取像素基本上是按行或列读取如果我想知道图片中的红色值较高的位置我可以这样做吗我假设它是按列读取的 Bitmap thumbnail Bitmap data ge
Android相机无法从后台服务拍照

我已经实现了一项从后台线程拍照的服务但照片永远不会在我的任何设备上拍摄这是代码下面记录输出 public class PhotoCaptureService extends Service private static final S
如何使用 UIImagePickerController CropRect

我刚刚找到了一种方法来更改裁剪框的矩形该裁剪框在捕获图像后出现UIImagePickerViewController 这可以在以下帮助下完成UIImagePickerControllerCropRect 但我不知道如何使用它最初的裁剪框
iPhone 相机访问权限？

我想知道如何访问 iPhone 相机并实时使用它例如仅在相机视图上绘图另一个相关问题可以显示吗同时 4 个摄像机视图就像 Mac 上的 Photo Booth 一样您可以使用 AVFoundation 来做到这一点 void in
如何在 AVCaptureDevice 上准确设置快速快门速度（曝光时间）？

我正在开发适用于 IOS 13 的相机应用程序为此我将 AVCaptureSession 与 AVCaptureVideoPreviewLayer 结合使用到目前为止一切正常现在我想让用户从给定的典型快门速度值数组以 1 3 曝光
线程/进程/任务之间有什么区别？

线程进程任务之间有什么区别 Process 进程是正在执行的计算机程序的实例它包含程序代码及其当前活动根据操作系统 OS 进程可能由同时执行指令的多个执行线程组成基于进程的多任务处理使您能够在使用文本编辑器的同时运行 Java 编
在无头模式下独立运行 Unity，同时捕获屏幕截图

我需要创建一个在无头模式下运行的统一项目使用 batchmode 命令但它必须捕获屏幕截图例如每一秒并将它们写到一个文件中我知道在无头模式下您需要强制调用 Camera Render 才能渲染任何内容在捕获第一个屏幕截图后时间
Task.Run 如何受 CPU 内核限制？

为什么下面的程序只会运行有限数量的阻塞任务限制数量似乎是机器上的核心数量最初当我写这篇文章时我希望看到以下内容作业 1 24 的作业完成输出 2秒的间隙工作产出 25 48 然而输出是作业 1 4 的作业完成输出然后每隔
Task.Delay 是否真的像 I/O 操作一样异步，即它依赖于硬件和中断而不是线程？

我发现了大量相关内容但这些内容都是拐弯抹角的但我始终无法找到答案我几乎 100 确定Task Delay int 不使用线程因为我可以在只有 16 个逻辑处理器的机器上运行此代码 var tasks new List
Three.js 设置并读取相机外观向量

而不是使用camera rotation或lookAt 函数旋转相机我想将外观矢量直接传递给相机是否可以直接设置相机外观矢量以及是否可以从相机读取外观矢量相机没有外观矢量因此无法设置它但是您可以构造一个point通过将您的外观
异步任务、视频缓冲

我正在尝试理解 C 中的任务但仍然遇到一些问题我正在尝试创建一个包含视频的应用程序主要目的是从文件中读取视频我使用 Emgu CV 并通过 TCP IP 发送它以在板上进行处理然后以流实时方式返回首先我是连续做的所以读
将图片添加到图库 - Android

我有一个活动用相机拍照然后将其添加到正确的文件夹在本例中为 DCIM Camera 但是当你退出应用程序并加载 Android 图库时它不在那里我正在玩一些游戏发现它只在重新启动手机后才出现我不确定这背后的原因也许它必须创建
相机预览的有效模糊

到目前为止我尝试过的将每一帧转换为位图然后用library https github com wasabeef Blurry并将其放入ImageView这是在相机预览前显然太慢了就像1 fps 然后我开始使用渲染脚本这会模糊每一帧
如何将相机中的图像保存到 iPhone 图库中的特定文件夹？

嘿我是 iPhone 新手最近我一直在尝试制作一个应用程序基本上我想要做的是如果用户将从相机捕获任何图像那么它应该保存在设备库中我知道如何将照片保存在图库中它对我有用但我无法将所有捕获的图像保存到设备图库中的特定文件夹例
如何以编程方式创建和暂停 Google App Engine 任务队列

我正在使用 Google App Engine 并且一直在使用命名推送队列来处理一些任务队列是使用queue xml 定义和配置的没关系现在我正在尝试做更多的事情 1 有没有办法动态创建和配置Java 中的新队列动态 2 另外一旦

随机推荐

路由器重温——PPPoE配置管理-2

四配置设备作为PPPoE服务器路由器的PPPoE服务器功能可以配置在物理以太网接口或 PON 接口上 xff0c 也可配置在由 ADSL 接口生成的虚拟以太网接口上 1 配置虚拟模板接口虚拟模板接口VT和以太网接口或PON接口绑定后
Python入门自学进阶——1--装饰器

理解装饰器 xff0c 先要理解函数和高阶函数首先要明白 xff0c 函数名就是一个变量 xff0c 如下图 xff0c 定义一个变量名和定义一个函数 xff0c 函数名与变量名是等价的既然函数名就是一个变量名 xff0c 那么在定义函
Python入门自学进阶-Web框架——21、DjangoAdmin项目应用

客户关系管理以admin项目为基础 xff0c 扩展自己的项目一创建项目二配置数据库 xff0c 使用mysql数据库 xff1a 需要安全mysqlclient模块 xff1a pip install mysqlclient D
Python入门自学进阶-Web框架——33、瀑布流布局与组合查询

一瀑布流 xff0c 是指页面布局中 xff0c 在显示很多图片时 xff0c 图片及文字大小不相同 xff0c 导致页面排版不美观如上图 xff0c 右边的布局 xff0c 因为第一行第一张图片过长 xff0c 第二行的第一张被挤到第
Python入门自学进阶-Web框架——34、富文本编辑器KindEditor、爬虫初步

KindEditor 是一个轻量级的富文本编辑器 xff0c 应用于浏览器客户端一首先是下载 xff1a http kindeditor net down php xff0c 如下图下载后是解压缩后 xff1a 红框选中的都可以删除
Python入门自学进阶-Web框架——35、网络爬虫使用

自动从网上抓取信息 xff0c 就是获取相应的网页 xff0c 对网页内容进行抽取整理 xff0c 获取有用的信息 xff0c 保存下来要实现网上爬取信息 xff0c 关键是模拟浏览器动作 xff0c 实现自动向网址发送请求 xff0c
6、spring的五种类型通知

spring共提供了五种类型的通知 xff1a 通知类型接口描述Around 环绕通知org aopalliance intercept MethodInterceptor拦截对目标方法调用Before 前置通知org springfram
路由器接口配置与管理——1

路由器的接口相对于交换机来说最大的特点就是接口类型和配置更为复杂 xff0c 一般吧路由器上的接口分为三大类 xff1a 一类用于局域网的LAN接口 xff0c 一类用于广域网接入互联的WAN接口 xff0c 最后一类可以应用于LAN组网
路由配置与管理——静态路由配置与管理

静态路由是一种最简单的路由 xff0c 需手工配置 xff0c 用一条指令指定静态路由的目的IP地址子网掩码下一跳IP地址 xff0c 或者出接口优先级等主要参数值就可以了还可根据实际需要配置静态路由与BFD或者NQA的联动一路
TCP实现局域网通信

TCP实现局域网通信 TCP客户端通信步骤 xff1a 1 xff1a 创建套接字 sockfd 61 socket AF INET SOCK STREAM 0 2 xff1a 填写服务器结构体信息 span class token key
路由策略和策略路由配置与管理-1

路由策略和策略路由配置与管理路由策略与策略路由之间的区别就在于它们的主体 xff08 或者说作用对象 xff09 不同 xff0c 前者的主体是路由 xff0c 是对符合条件的路由 xff08 主要 xff09 通过修改路由属性
IP组播基础及工作原理——1

IP组播在一些多用户定向发送的网络应用中使用非常普遍 xff0c 如远程多媒体会议远程教学视频点播定向电子商务 xff0c 以及ISP的IPTV xff08 网络电视 xff09 等学好IP组播基础知识及配置与管理方法 xff0c
IP组播配置与管理实战——1

IGMP 配置与管理 IGMP xff08 InternetGroup Management Protocol xff0c 因特网组管理协议 xff09 是TCP IP 协议族中负责IPv4组播成员管理的协议 xff0c 需要在组播组成
Linux:利用返回值传出参数，地址传递，值传递,使用回调函数赋值几个例程。

利用返回值传出参数 xff0c 地址传递 xff0c 值传递使用回调函数赋值几个例程代码 xff1a include lt stdlib h gt include lt stdio h gt include lt unistd h gt
一步一步实现多尺度多角度的形状匹配算法(C++版本)

前言用过halcon形状匹配的都知道 xff0c 这个算子贼好用 xff0c 随便截一个ROI做模板就可以在搜索图像中匹配到相似的区域 xff0c 并且能输出搜索图像的位置 xff0c 匹配尺度 xff0c 匹配角度现在我们就要利用op
查看麒麟操作系统版本

root 64 tbase01 nkvers Kylin Linux Version Release Kylin Linux Advanced Server release V10 Tercel Kernel 4 19 90 23 8 v2
Parallax-tolerant Image Stitching - 解决大视差图片拼接的方法

Paper name Parallax tolerant Image Stitching Paper Reading Note URL http web cecs pdx edu fliu papers cvpr2014 stitching
Consistent Video Depth Estimation - 时序一致的视频深度估计算法

Paper name Consistent Video Depth Estimation Paper Reading Note URL xff1a https arxiv org pdf 2004 15021 pdf 代码 URL xff1
Monocular Fisheye Camera Depth Estimation Using Sparse LiDAR Supervision

Paper name Monocular Fisheye Camera Depth Estimation Using Sparse LiDAR Supervision Paper Reading Note URL https arxiv o
WoodScape: A multi-task, multi-camera fisheye dataset for autonomous driving

Paper name WoodScape A multi task multi camera fisheye dataset for autonomous driving Paper Reading Note URL https opena

WoodScape: A multi-task, multi-camera fisheye dataset for autonomous driving

TL;DR

Introduction

Dataset/Algorithm/Model/Experiment Detail

实现方式

采集车传感器配置

鱼眼相机投影

畸变校正 vs 模型适配畸变图像

数据采集

数据集对比

实验结果

Thoughts

WoodScape: A multi-task, multi-camera fisheye dataset for autonomous driving 的相关文章

随机推荐

热门标签