Monocular Fisheye Camera Depth Estimation Using Sparse LiDAR Supervision

2023-05-16

Paper name

Paper Reading Note

URL: https://arxiv.org/pdf/1803.06192.pdf

TL;DR

2018 年 ITSC 文章，出自于德国 Valeo 自动驾驶公司，提出了单目鱼眼深度估计的有监督训练方案，并针对雷达与鱼眼相机安装位置不一样造成的遮挡问题提出了一种基于形态学滤波的过滤方法

Introduction

自动驾驶汽车周围的近景深度估计是十分重要的功能，一般是通过四个鱼眼相机（FOV>=180°）来做汽车周围的图片采集
有监督训练的难度：
- 基于雷达获取稠密深度数据较为困难
- 合成场景的深度数据被广泛应用，但是存在着在真实场景中遇到泛化性较差的问题，需要处理 domain shift
本文提出一种基于稀疏雷达数据（64线）训练单目鱼眼深度估计模型的方法，主要贡献有：
- 展示了基于稀疏雷达的训练犯法
- 展示了在鱼眼相机使用 CNN 做深度估计
- 根据摄像机和V激光雷达视点的差异调整训练数据以处理遮挡
- 修改损失函数和训练算法以处理稀疏深度数据

Dataset/Algorithm/Model/Experiment Detail

实现方式

网络结构

使用 AlexNet 作为以下网络结构的 Scale1，参考 2014Nips(Eigen) 文章的网络结构设计，能够在 Nvidia TX2 上实时运行

稀疏雷达深度图

使用 HDL-64ES2 雷达，64线，垂直可见的视场角为 26.8°；另外因为雷达的传感器旋转和汽车的运动，较远的点的反射率较差，所以雷达采集的图相对来说比较稀疏

训练损失（Scale-Invariant Error）

l2 的 scale-invarian 损失，与 2014Nips(Eigen) 一样，这里网络直出的是深度，与 gt 深度计算损失
对于没有深度的区域就是简单的不计算损失而已

模型训练

AlexNet 的模型 load pretrain 参数；使用 Adam 优化器，Relu 替换为 Swish（原因是替换了 SELU、ELU、leaky ReLU 的效果都没有 Swish 好）
数据集
- 作者公司的内部数据集（类似于后来开源的 woodscape），60000 图片的数据集，其中 5000 图片作为测试集
- 主要在法国巴黎和德国巴伐利亚，场景主要是城市、住宅和郊区
- 基于 tstamp 将 10Hz 的激光雷达数据和 30 Hz 的鱼眼图像数据进行对齐，对于每个 RGB 采集图像选取最近的 depth 采集图
输入尺寸： w：576 px，h：172 px

遮挡校正

部分雷达可以观察到的点鱼眼相机不一定能看到
使用分割和形态学滤波方法，根据深度进行分层，雷达点被映射到对应的层上，并经过膨胀形态学滤波，如果某个点被前一层的点膨胀后的 mask 遮挡则移除该点
去除遮挡的激光雷达真值可视化对比

实验结果

KITTI 和 Valeo 鱼眼数据集上的定量对比实验结果

在这里插入图片描述

定性分析，gt 深度及预测深度可视化，天空区域因为没有足够的雷达监督信息基本都挂了

Thoughts

这篇工作创新性和参考性一般，主要是参考了 2014Nips(Eigen) 的网络设计和训练 loss，对比实验也不是很充分（对比不同方法在不同数据集上的精度）
由于雷达和鱼眼相机安装高度和位置不同产生的遮挡导致雷达采集的 gt 深度部分无法映射到鱼眼图像平面上的情况，提出了一种基于深度分层过滤的方案，值得参考，但文章中对于这部分工作连消融实验都没有
数据集和代码均没有开源，无法复现

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Monocular

Fisheye

Camera

Depth

Estimation

Monocular Fisheye Camera Depth Estimation Using Sparse LiDAR Supervision 的相关文章

如何将图像保存到相机胶卷？

我是 Xcode 新手使用 4 3 不确定如何将图像保存到设备的相机胶卷中到目前为止我所做的就是为按钮设置一个 IBAction 来保存图像我可以使用什么库方法或函数将图像保存到用户的相机胶卷中您使用UIImageWriteToSa
解释来自 Android 相机 onPictureTaken(byte[] data) 的原始图像数据

我正在使用 Camera 类来拍照并希望对 onPictureTaken 中的图像进行一些处理如何解释字节数组是RGB格式还是其他格式参考文献说这取决于 Camera Parameters 相机参数 http developer a
将预览帧转换为位图

我知道这个主题已经在黑板上出现过很多次了但无论如何我都无法让它发挥作用我想将预览中的视图帧保存为 jpeg 文件它看起来或多或少代码被简化没有额外的逻辑异常等像这样 public void onPreviewFrame byt
使用 Android 相机进行图像处理

我想使用 onPreviewFrame 在将图像显示给用户之前对其进行后处理即应用色调棕褐色等据我了解返回给回调的 byte 数据以 YUV420sp 编码人们是否已经在 J ava 中或使用 NDK 本机代码将其解码为 RGB
Zxing扫描仪相机变焦

我已经尝试解决这个问题3天了但仍然没有找到答案我想在通过 Zxing 扫描仪扫描二维码时向相机添加 ZOOM 构建 gradle implementation me dm7 barcodescanner zxing 1 9 8 Xml
检测所有摄像头android

我有一个使用 Camera2 API 来获取相机预览的应用程序我想在手机的镜头之间进行选择在我的代码中我使用以下代码 CameraManager manager CameraManager activity getSystemServ
OpenCV：断言失败（（img.深度（）== CV_8U || img.深度（）== CV_32F）&& img.type（）== templ.type（））

我从上面得到这个错误不知道如何避免它我的目的是获取屏幕截图然后对其进行模板匹配看看此时屏幕上是否显示图标到目前为止这只是图标的位置我的代码 include opencv2 highgui highgui hpp include
调整生成的相机流的大小

我试图让用户捕获图像并使用图像将其添加到屏幕上然而由于内存限制我还需要将此图像的大小调整为大约一半大小 12x 5MP 图像在手机上永远不会很好我正在正常启动相机任务它调用 Completed 事件但是当我尝试使用 Decod
动态设置布局参数

我正在使用 CameraPreview 示例 API 演示我需要添加一些覆盖 SurfaceView 的视图按钮等为此我尝试设置它们的参数但它们始终出现在屏幕的左上角这是onCreate方法的代码 Override protec
还有其他访问相机的替代方法吗？

除了使用 ActionScript 3 之外还有其他方法来访问相机吗 import flash media Camera videoInstance attachCamera cameraInstance 或者我应该使用任何 API 吗
Android 致命信号 11 (SIGSEGV) at 0x00000040 (code=1) 错误

我正在开发一个 Android 应用程序我正在其中获取用户照片图像 5张图像使用opencv2 4 2具有面部检测功能的相机并使用 Web 服务保存到服务器中的数据库中为此我使用 Opencv2 4 2 人脸检测示例 Ksoap2
iOS：同时使用 WiFi 和移动数据

Setup 我的项目涉及一个 WiFi 相机它创建一个 WiFi 热点为了在相机上流式传输视频预览浏览媒体用户需要连接到相机的热点 Problem 用户无法同时使用 3G 4G 上的蜂窝数据因为 iOS 设备已通过 WiFi 连接
如何在SceneKit中实现逼真的景深效果？

我正在尝试渲染具有真实景深效果的帧我已经尝试过景深属性camera节点但它不会产生可用的结果是否可以切换到景深效果的最大渲染质量性能不是一个因素我只需要渲染一帧用户可以等待它 SceneKit 中逼真的景深效果在SceneKi
iPhone 相机访问权限？

我想知道如何访问 iPhone 相机并实时使用它例如仅在相机视图上绘图另一个相关问题可以显示吗同时 4 个摄像机视图就像 Mac 上的 Photo Booth 一样您可以使用 AVFoundation 来做到这一点 void in
如何在 AVCaptureDevice 上准确设置快速快门速度（曝光时间）？

我正在开发适用于 IOS 13 的相机应用程序为此我将 AVCaptureSession 与 AVCaptureVideoPreviewLayer 结合使用到目前为止一切正常现在我想让用户从给定的典型快门速度值数组以 1 3 曝光
在无头模式下独立运行 Unity，同时捕获屏幕截图

我需要创建一个在无头模式下运行的统一项目使用 batchmode 命令但它必须捕获屏幕截图例如每一秒并将它们写到一个文件中我知道在无头模式下您需要强制调用 Camera Render 才能渲染任何内容在捕获第一个屏幕截图后时间
如何打开相机然后切换到图像模式（反之亦然）

就我而言我想拍照或捕捉视频实际上如果我创建单独的意图我可以做到这些我的意思是我可以将相机打开为图像模式或视频模式但无法在它们之间切换这与我使用的意图过滤器有关吗我应该怎么办我如何在它们之间切换我有同样的问题在我想放置一
DirectShow 虚拟摄像机不会出现在某些配置的列表中

我使用 DirectShow 过滤器作为虚拟相机 CLSID VideoInputDeviceCategory 它运行良好但某些应用程序配置不将此提要显示为源例如在 win 8 1 上我可以通过 webrtc 在 Chrome F
PWA 可以访问联系人、GPS 或使用手机摄像头吗？

PWA 可以访问联系人 GPS 或使用手机摄像头吗这在任何系统 ios android 中都可能吗是否有任何开发计划来实现这些功能 PWA 无法克服一些限制 you cannot访问电话上的联系人列表另一方面你can拍照并使用 GP
相机预览的有效模糊

到目前为止我尝试过的将每一帧转换为位图然后用library https github com wasabeef Blurry并将其放入ImageView这是在相机预览前显然太慢了就像1 fps 然后我开始使用渲染脚本这会模糊每一帧

随机推荐

路由器重温——串行链路链路层协议积累

对于广域网接口来说 xff0c 主要的不同或者说主要的复杂性在于理解不同接口的物理特性以及链路层协议 xff0c 再上层基本都是 IP 协议 xff0c 基本上都是相同的 WAN口中的serial接口主要使用点对点的链路层协议有 xff0c
路由器重温——PPPoE配置管理-2

四配置设备作为PPPoE服务器路由器的PPPoE服务器功能可以配置在物理以太网接口或 PON 接口上 xff0c 也可配置在由 ADSL 接口生成的虚拟以太网接口上 1 配置虚拟模板接口虚拟模板接口VT和以太网接口或PON接口绑定后
Python入门自学进阶——1--装饰器

理解装饰器 xff0c 先要理解函数和高阶函数首先要明白 xff0c 函数名就是一个变量 xff0c 如下图 xff0c 定义一个变量名和定义一个函数 xff0c 函数名与变量名是等价的既然函数名就是一个变量名 xff0c 那么在定义函
Python入门自学进阶-Web框架——21、DjangoAdmin项目应用

客户关系管理以admin项目为基础 xff0c 扩展自己的项目一创建项目二配置数据库 xff0c 使用mysql数据库 xff1a 需要安全mysqlclient模块 xff1a pip install mysqlclient D
Python入门自学进阶-Web框架——33、瀑布流布局与组合查询

一瀑布流 xff0c 是指页面布局中 xff0c 在显示很多图片时 xff0c 图片及文字大小不相同 xff0c 导致页面排版不美观如上图 xff0c 右边的布局 xff0c 因为第一行第一张图片过长 xff0c 第二行的第一张被挤到第
Python入门自学进阶-Web框架——34、富文本编辑器KindEditor、爬虫初步

KindEditor 是一个轻量级的富文本编辑器 xff0c 应用于浏览器客户端一首先是下载 xff1a http kindeditor net down php xff0c 如下图下载后是解压缩后 xff1a 红框选中的都可以删除
Python入门自学进阶-Web框架——35、网络爬虫使用

自动从网上抓取信息 xff0c 就是获取相应的网页 xff0c 对网页内容进行抽取整理 xff0c 获取有用的信息 xff0c 保存下来要实现网上爬取信息 xff0c 关键是模拟浏览器动作 xff0c 实现自动向网址发送请求 xff0c
6、spring的五种类型通知

spring共提供了五种类型的通知 xff1a 通知类型接口描述Around 环绕通知org aopalliance intercept MethodInterceptor拦截对目标方法调用Before 前置通知org springfram
路由器接口配置与管理——1

路由器的接口相对于交换机来说最大的特点就是接口类型和配置更为复杂 xff0c 一般吧路由器上的接口分为三大类 xff1a 一类用于局域网的LAN接口 xff0c 一类用于广域网接入互联的WAN接口 xff0c 最后一类可以应用于LAN组网
路由配置与管理——静态路由配置与管理

静态路由是一种最简单的路由 xff0c 需手工配置 xff0c 用一条指令指定静态路由的目的IP地址子网掩码下一跳IP地址 xff0c 或者出接口优先级等主要参数值就可以了还可根据实际需要配置静态路由与BFD或者NQA的联动一路
TCP实现局域网通信

TCP实现局域网通信 TCP客户端通信步骤 xff1a 1 xff1a 创建套接字 sockfd 61 socket AF INET SOCK STREAM 0 2 xff1a 填写服务器结构体信息 span class token key
路由策略和策略路由配置与管理-1

路由策略和策略路由配置与管理路由策略与策略路由之间的区别就在于它们的主体 xff08 或者说作用对象 xff09 不同 xff0c 前者的主体是路由 xff0c 是对符合条件的路由 xff08 主要 xff09 通过修改路由属性
IP组播基础及工作原理——1

IP组播在一些多用户定向发送的网络应用中使用非常普遍 xff0c 如远程多媒体会议远程教学视频点播定向电子商务 xff0c 以及ISP的IPTV xff08 网络电视 xff09 等学好IP组播基础知识及配置与管理方法 xff0c
IP组播配置与管理实战——1

IGMP 配置与管理 IGMP xff08 InternetGroup Management Protocol xff0c 因特网组管理协议 xff09 是TCP IP 协议族中负责IPv4组播成员管理的协议 xff0c 需要在组播组成
Linux:利用返回值传出参数，地址传递，值传递,使用回调函数赋值几个例程。

利用返回值传出参数 xff0c 地址传递 xff0c 值传递使用回调函数赋值几个例程代码 xff1a include lt stdlib h gt include lt stdio h gt include lt unistd h gt
一步一步实现多尺度多角度的形状匹配算法(C++版本)

前言用过halcon形状匹配的都知道 xff0c 这个算子贼好用 xff0c 随便截一个ROI做模板就可以在搜索图像中匹配到相似的区域 xff0c 并且能输出搜索图像的位置 xff0c 匹配尺度 xff0c 匹配角度现在我们就要利用op
查看麒麟操作系统版本

root 64 tbase01 nkvers Kylin Linux Version Release Kylin Linux Advanced Server release V10 Tercel Kernel 4 19 90 23 8 v2
Parallax-tolerant Image Stitching - 解决大视差图片拼接的方法

Paper name Parallax tolerant Image Stitching Paper Reading Note URL http web cecs pdx edu fliu papers cvpr2014 stitching
Consistent Video Depth Estimation - 时序一致的视频深度估计算法

Paper name Consistent Video Depth Estimation Paper Reading Note URL xff1a https arxiv org pdf 2004 15021 pdf 代码 URL xff1
Monocular Fisheye Camera Depth Estimation Using Sparse LiDAR Supervision

Paper name Monocular Fisheye Camera Depth Estimation Using Sparse LiDAR Supervision Paper Reading Note URL https arxiv o

Monocular Fisheye Camera Depth Estimation Using Sparse LiDAR Supervision

TL;DR

Introduction

Dataset/Algorithm/Model/Experiment Detail

实现方式

网络结构

稀疏雷达深度图

训练损失（Scale-Invariant Error）

模型训练

遮挡校正

实验结果

Thoughts

Monocular Fisheye Camera Depth Estimation Using Sparse LiDAR Supervision 的相关文章

随机推荐

热门标签