3D车道线单目检测方法ONCE-3DLanes

2023-10-29

3D车道线检测论文”ONCE-3DLanes: Building Monocular 3D Lane Detection“，上传arXiv于2022年5月，是华为诺亚和复旦大学的工作。

由于道路不平，传统的单目图像2D车道线检测在自动驾驶的跟踪规划和控制任务中性能较差。因此，预测3D车道线布局是必要的，可以实现有效和安全的驾驶。然而，现有的3D车道线检测数据集不多，一些还是模拟环境合成，严重阻碍了该领域的发展。

该文提出一个真实世界的自动驾驶数据集，ONCE-3DLanes，具有3-D空间的车道线布局标注。通过点云和图像像素之间的显式关系，文章设计了该数据集标注流水线，从211K个道路场景的2D车道线标注，自动生成高质量的3D车道线位置。此外，作者还提出一种无外参、无锚点的方法，称为SALAD，在图像视图中回归车道线的3D坐标，而无需将特征地图转换为BEV。为了促进未来对3D车道线检测的研究，文章对数据集提供基准测试，并提供一种新的评估指标，对现有方法和提出的方法进行了广泛的实验分析。

网站地址在https://once-3dlanes.github.io。

大多数现有的基于图像的车道线检测方法都专注于对车道检测问题描述为2D任务，其中典型的流水线首先基于语义分割或坐标回归在图像平面中检测车道线，然后通过假设地面平坦在俯视图中投影检测车道线。利用标定良好的摄像头外参，逆透视映射（IPM）能够在平坦的地平面上获得可接受的3-D车道线近似值。然而，在真实的驾驶环境中，道路并不总是平坦的，并且由于车速变化或道路崎岖不平，摄像头外参对车身运动非常敏感，这将导致对3D道路结构的错误感知，从而可能会在自动驾驶车辆上发生意外行为。

为了克服与地平面假设相关的上述缺点，3D LaneNet以端到端方式直接预测3D车道线坐标，其中有监督的方式预测摄像头外参，以便获得图像视图到俯视图的投影。此外，提出一种基于锚点的车道线预测头，用于从虚拟俯视图生成最终的3D车道线坐标。尽管结果显示了这项任务的可行性，但如果没有难获得的外参信息，虚拟IPM投影很难学习，并且模型是在摄像头对地平面零度夹角的假设下训练的。一旦假设受到质疑，或者外参的需求得不到满足，这种方法几乎无法工作。

Gen LaneNet在虚拟顶视图中提出一种几何引导的新车道线锚点。通过图像分割学习与3D车道线预测的解耦，该算法实现了更高性能，并且更适用于未观察到场景。3D LaneNet+提出了一种无锚点半局部表征方法来表示车道线，而不是将每条车道线与预定义的锚点关联起来。虽然检测更多车道线拓扑结构的能力显示了无锚点（anchor- free）方法的威力，然而这些方法都需要以有监督方式学习投影矩阵，以便将图像视图特征与俯视特征对齐，这可能会导致高度信息丢失。

目前3-D车道线的数据集比较如表：

3D空间中的车道线L_k由一系列点{x_ki，y_ik，z_ik）}表示，这些点记录在3D摄像头坐标系中。摄像头坐标系位于摄像头的光学中心，X轴向右正，Y轴向下，Z轴向前。

正视图到俯视图的投影误差主要发生在斜坡地面的情况下，因此重点分析ONCE- 3DLanes数据集的坡度统计。每个场景中车道线的平均坡度用于表示该场景的坡度。向前方向被认为最重要的特定车道线坡度计算如下：

如图是坡度场景的坡度和高度统计：

车道线是地面上的一系列点，在点云中很难识别。因此，获得3D车道线的高质量标注非常昂贵，而在2D图像中对车道线进行注释则便宜得多。对激光雷达点云和图像像素进行深入研究，用于构建3-D车道线数据集。数据集构建流水线的概述如图所示：该流水线包括五个步骤，即地面分割、点云投影、人为标注/自动标注、自适应车道线调和（blending）和点云恢复。

SALAD，一种空间感知的单目车道线检测方法，可直接在单目图像上执行3D车道线检测。与之前的3D车道线检测算法相比，该算法将图像投影到顶视图，并采用一组预定义的锚点回归3D坐标，不需要人工制作锚点和外参的监督。受SMOKE（单目3D检测）方法的启发，SALAD由两个分支组成：语义-觉察分支和空间上下文分支。

SALAD的模型总体结构如图所示：主干将输入图像编码为深度特征，两个分支即语义-觉察分支和空间上下文分支对特征进行解码，以获得车道线的空间信息和分割掩码；然后整合这些信息进行3D重建，最终获得真实场景的3D车道线位置；此外，一种改进的联合3D车道线扩展策略可提高泛化能力。

由于下采样和缺乏全局信息，预测车道点的位置不够准确。空间上下文分支，接受特征F并输出像素级偏移图，该偏移图预测图像平面上沿u轴和v轴的车道线点空间位置偏移δu和δv。通过像素位置偏移δu和δv的预测，车道线点的位置粗略估计将根据全球空间上下文进行修改：

为了恢复3D车道线信息，空间上下文分支还生成一个密集的深度图，以回归车道线每个像素的深度偏移δz。考虑到图像平面的地面深度沿行增加，为深度图的每行指定一个预定义的偏移αr和比例βr，以残差方式进行回归。标准深度值z恢复如下：

在稀疏深度图上应用深度补全，得到密集深度图Dgt，为空间上下文分支提供足够的训练信号。

具体而言，给定相机内参矩阵K3×3，相机坐标系的3D点（x、y、z）可以投影到2D图像像素（u、v），如下所示：

因此，给定图像像素坐标（u，v）及其深度信息d的2D车道线点，注意深度表示到摄像头平面的距离，因此深度d与相机坐标系中的z相同。因此，摄像机坐标系（x、y、z）中的3D车道线点可以恢复如下：

损失函数定义如下：

如图所示是单边Chamfer距离：给定路面真车道线上的一个点，在预测车道上找到最近的点以计算Chamfer距离。

实验结果如下：

本文仅做学术分享，如有侵权，请联系删文。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

3D车道线单目检测方法ONCE-3DLanes 的相关文章

比尔盖茨与萨姆.奥尔特曼的对话及感想

谈话内容比尔盖茨嘿萨姆萨姆奥尔特曼嘿比尔比尔盖茨你好吗萨姆奥尔特曼哦天哪这真的太疯狂了我还好这是一个非常激动人心的时期比尔盖茨团队情况怎么样萨姆奥尔特曼我想你知道很多人都注意到了这样一个事实
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【卡尔曼滤波】粗略模型和过滤技术在模型不确定情况下的应用研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文献
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
机器学习：基于python微博舆情分析系统+可视化+Django框架 K-means聚类算法（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
喜报|华测导航荣获“张江之星”领军型企业称号

近日 2023年度张江之星企业培育名单发布上海华测导航荣获2023年度张江之星领军型企业称号据悉张江之星企业培育是上海科创办为落实关于推进张江高新区改革创新发展建设世界领先科技园区的若干意见张江高新区加快世界领先科技园区
用CHAT分析高校体育智慧教学体系构建与探索研究现状

CHAT回复现阶段高校体育智慧教学体系的构建与探索研究还处于初级阶段但全球数字化转型大潮的推动下一些较为前沿的研究和实践已经开始出现 1 教学平台的建设很多高校已经开始尝试使用在线教育平台进行体育教学把传统的面对面授课模式转变为
活动日程&直播预约｜智谱AI技术开放日 Zhipu DevDay

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入直播预约通道关于AI TIME AI TIME源起于2019年旨在发扬科学思辨精神邀请各界人士对人工智能理论算法和场景应用的本质问题进行探索加强思想碰撞链接全球AI学
多模态、长文本、智能体，智谱AI推出GLM-4模型全家桶，发布即上线！

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入 2024年01月16日智谱AI首届技术开放日 Zhipu DevDay 在北京中关村国家自主创新示范区展示中心成功举办现场智谱AI团队全面展示了其投身于大模型事业三年多来所
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
毕业设计：基于深度学习的微博谣言检测系统人工智能

目录前言设计思路一课题背景与意义二算法理论原理三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有
性能大减80%，英伟达芯片在华“遇冷”，我方霸气回应：不强求

中国这么大一块市场谁看了不眼馋在科技实力大于一切的今天高端芯片的重要性不言而喻作为半导体产业发展过程中不可或缺的一环芯片技术也一直是我国技术发展的一大心病在美西方等国的联手压制下我国芯片技术发展处处受阻至今也未能在高端芯片
强烈推荐收藏！LlamaIndex 官方发布高清大图，纵览高级 RAG技术

近日 Llamaindex 官方博客重磅发布了一篇博文 A Cheat Sheet and Some Recipes For Building Advanced RAG 通过一张图给开发者总结了当下主流的高级RAG技术帮助应对复杂的生产场
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！

AI 大模型技术经过2023年的狂飙 2024年必将迎来应用的落地对 IT 同学来讲这里蕴含着大量的技术机会越来越多的企业开始招聘 AI 大模型岗位本文梳理了 AI 大模型开发技术的面试之道从 AI 大模型基础面 AI 大模型进阶
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

详情点击链接 GPT4 Python近红外光谱数据分析及机器学习与深度学习建模第一 GPT4 入门基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初体验注册与
实力认证！鼎捷软件荣膺“领军企业”和“创新产品”两大奖项

近日由中国科学院软件研究所中科软科技股份有限公司联合主办的 2023中国软件技术大会于北京成功举办本届大会以大模型驱动下的软件变革为主题数十位来自知名互联网公司和软件巨头企业的技术大咖不同领域行业专家畅销书作者等分享嘉宾
AI 赋能绿色制冷，香港岭南大学开发 DEMMFL 模型进行建筑冷负荷预测

近年来城市化进程加速所带来的碳排放量骤增已经严重威胁到了全球环境多个国家均已给出了碳达峰碳中和的明确时间点一场覆盖全球全行业的绿色革命已经拉开序幕在一众行业中建筑是当之无愧的能耗大户其中又以暖通空调 Heating

随机推荐

使用jiraRestClient报错java.lang.ClassNotFoundException: com.google.common.base.MoreObjects

问题是swagger需要guava依赖导入依赖解决
【工欲善其事必先利其器】论文编辑及文献管理（Endnote,Latex,JabRef ,overleaf)资源下载及使用指南

EndnoteX9 百度网盘下载及安装 Download 百度网盘链接 https pan baidu com s 1 WWYVkwF0uAUVvv73XZM6Q 提取码 mnd9 参考链接 EndNote X9 3 3 Build 13
字节跳动面试题 —— 水壶问题

原题给你一个装满水的 8 升满壶和两个分别是 5 升 3 升的空壶请想个优雅的办法使得其中一个水壶恰好装 4 升水每一步的操作只能是倒空或倒满图片理解了这个题目的意思之后我们的第一个方法肯定就是使用强大的脑力来进行暴力破解法
关于常量指针的用法

一指向常量的指针例1 int main int num 5 const int fun 100 int pi const int pci pi num pci fun printf num addr p value d n num nu
LocalDateTime、LocalDate、Date的相互转换

目录使用背景转换方法 LocalDateTime 转 LocalDate LocalDate 转 LocalDateTime LocalDate 转 Date Date转LocalDate LocalDateTime转Date Date
跑一跑NeuralAnnot

GitHub 传送阵一运行这东西标注器代码西八兄弟没开源我搞完之后才发现是标注结果展示 1 环境西八兄弟好像没给环境配置和环境有关的就这句话 1 python 3 8或以上不然会报错 2 pycocotools 3 libgl
Vue3 引入Element Plus

Element Plus 是为适配 Vue3 而对 Element UI 进行重构后产生的前端组件库包含丰富的基础组件下面先贴出官方文档里面的介绍已经十分全面和详细大家遇到的很多问题都可以在上面找到答案假设现在我们已经用 vue
社区发现算法（二）

GN算法本算法的具体内容请参考Finding and evaluating community structure in networks Newman and Girvan 重要概念边介数 betweenness 网络中任意两个节点通
linux与centos的区别与联系

linux与centos的区别与联系 1 centos是基于linux建立的操作系统 2 linux属于内核系统只有终端命令界面无图形界面 3 centos同时拥有终端命令界面和图形界面 4 linux和centos都是属于开源系统一
计算机视觉与图像处理学习笔记之人脸识别的三种方法

人脸检测是指在图像中完成人脸定位的过程而人脸识别是在人脸检测的基础上进一步判断人的身份 OpenCV提供了三种人脸识别的方法 EigenFaces 特征脸 FisherFaces 人鱼脸 Local Binary Patterns His
Linux-安装命令01：apt-get命令详解（超详细）【apt-get是Ubuntu默认的包管理工具】

简介 apt get 是一条linux命令适用于deb包管理式的操作系统例如Ubuntu系统主要用于自动从互联网的软件仓库中搜索安装升级卸载软件或操作系统 sudo apt get y update sudo apt get y
JSP九大作用域

jsp的九大作用域 request 请求对象类型 javax servlet ServletRequest 作用域 Request response 响应对象类型 javax servlet SrvletResponse 作用域 Pag
增长黑盒

大家好我是Alan 增长黑盒增长黑盒是一家专注研究企业增长的公司近两年来我们输出了数十篇企业增长策略和案例的深度研究报告并建立了国内最大的增长黑客社区今天的这篇文章将结合自己从零搭建了一整套增长工程的案例谈一谈增长驱动力的研究
Java 网络编程（大全）

前言必读读者手册必读云边的快乐猫的博客 CSDN博客一 1网络通信的基本模式分为两种 1 CS模式 Client 客户端 Server 服务端客户端是需要程序员去开发的例如日常使用的各种的APP 服务端就是服务器例子端游依
fedora 8 声音问题解决方案

症状 1 通过system config soundcard测试可以正确识别声卡 2 普通用户无法调节音量无法播放声音文件解决方法 lax liulantao sudo less etc security console perms
unity 3D打飞碟游戏，虚拟现实大作业

unity 3D打飞碟游戏下载链接在文末包含游戏菜单按钮分数记载等等点我下载资源 https download csdn net download weixin 43474701 34839915
信捷总线Xnet-速度模式使用总结

XDC类型的PLC的串口配置主要是串口1与串口4 串口1 X Net RS232 32768 2 OMMS 57600 串口4 X Net RS485 32768 2 OMMS 3000000 周期通讯 PLC配置 N为站号可参考Xne
Neo4j 环境配置及问题解决

问题目录 1 环境配置 Jdk环境配置 Neo4j下载地址环境变量 2 遇到的问题 jdk版本不匹配在配置neo4j install service时失败 1 环境配置 Jdk环境配置 jdk配置这里就不说啦 Neo4j下载地址官网下
Rxjs的flatMap使用

Rxjs的flatMap使用 flatMap是Rxjs比较绕的一个概念这里我们只是讲解如何使用在Rxjs 4 0版本时叫flatMap 在Rxjs 5 0时被更名为margeMap 现在flatMap作为margeMap的别名使用这是
3D车道线单目检测方法ONCE-3DLanes

3D车道线检测论文 ONCE 3DLanes Building Monocular 3D Lane Detection 上传arXiv于2022年5月是华为诺亚和复旦大学的工作由于道路不平传统的单目图像2D车道线检测在自动驾驶的跟踪规

3D车道线单目检测方法ONCE-3DLanes

3D车道线单目检测方法ONCE-3DLanes 的相关文章

随机推荐

热门标签