【CVPR2023 Best Paper】Planning-oriented Autonomous Driving 阅读笔记

2023-11-16

Paper: https://openaccess.thecvf.com/content/CVPR2023/papers/Hu_Planning-Oriented_Autonomous_Driving_CVPR_2023_paper.pdf
Github: https://github.com/OpenDriveLab/UniAD#high
Youtube: https://www.youtube.com/watch?v=R4iuq3zDBL4
一篇写的比较详细的解读(文中部分参考): https://zhuanlan.zhihu.com/p/632275644

CVPR2023的best paper,虽然不是第一个提出了end-to-end的网络框架。但是,已有的方法可能会遭受累积误差或任务间协同不足的困扰。 与之相反,作者认为应该设计和优化一个合适的框架来追求终极目标,即自动驾驶的planning任务。 针对这一点,作者从性能和safe planning安全性出发,确定要达到安全自动驾驶需要以下几部分,即detection+tracking、online Mapping、Motion Forecasting、Occupancy Prediction 和 Planning。并确定了任务的前后优先级,新框架称为UniAD。
在这里插入图片描述

网络设计

在这里插入图片描述

1、Backbone

在这里插入图片描述
文中用了BEVFormer来做环境感知信息的编码,作者也提出了这个结构设计方便替换出更先进的BEV encoders。

2、Perception

1)TrackFormer
在这里插入图片描述
TrackFormer的主要作用是实现对参与交通的实体目标进行跟随(如行人、骑行人员、车辆等)。
Tracking用的是MORT来做,将BEV的feature作为一种proposal信息输入到网络中,与历史的tracklets一起编码,这个思路有点像MOTR v2。

2)MapFormer
在这里插入图片描述

MapFormer采用了语义分割的方式(Panoptic Segformer)来实现对场景中其他元素的识别,如车道、分隔线和交叉路口。
MapFormer将可行驶的道路区域设置为stuff,监督了每一层的输出,并将最后一层中的结果送入下一个网络中。

3、Prediction

1)MotionFormer
在这里插入图片描述
MotionFormer的作用是预测参与交通的实例物体运动轨迹。
文中对场景和实例的信息进行编码(PE为正弦位置编码,之后用MLP网络进行编码),获得当前的query位置信息。之后这些信息与前置网络的输出一起进行inference,获得目标的运动预测。
在这里插入图片描述
此外,考虑到预测不确定性会带来的一些不符合物理学的突变情况,文中用了非线性平滑的方式进行了运动约束,防止对下游任务造成较大影响。

2)OccFormer
在这里插入图片描述
OccFormer的作用是预测BEV特征下所划分的单元格是否被占用,以及其未来的变化情况。

OccFormer,在两个方面合并了场景级和agent级的语义:(1)在展开到未来范围时,通过精心设计的注意力模块,稠密场景特征获取agent级特征信息;(2)通过agent级特征和稠密场景特征之间的矩阵乘法轻松生成逐实例occupancy,而无需进行繁重的后期处理。
在这里插入图片描述在这里插入图片描述

4、Planning

在这里插入图片描述
在这里插入图片描述
UniAD 的训练分为两个阶段。首先联合训练感知部分,即tracking和mapping模块,训练若干个epochs(在作者的实验中是 6 个),然后使用所有的perception、prediction和planning模块一起端到端地训练20个epochs。从经验上来说,两个阶段的训练会更加稳定。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【CVPR2023 Best Paper】Planning-oriented Autonomous Driving 阅读笔记 的相关文章

  • 安装pygame

    在学习了一个学期的python之后 我决定对pygame下手了 首先要安装pygame 对于一个计算机小白 安装的过程就比较的痛苦 但是怎么说 查阅了各方资料 好歹是安装完毕 预备条件 win10 python3 9 7 打开cmd win
  • 【vue2】按需引入多个组件的写法

    可以使用component标签 is 组件名 dialogTitle dialogTitle 和 rowInfo offlineRow 就是父给子传值的写法

随机推荐

  • 汽车雷达-综述

    目录 1 简介 2 发展史 3 技术参数 4 采用SIGe毫米波T R组件 5 汽车雷达中主要的信号处理单元 5 1 远程雷达 5 1 1 总体框图 5 1 2 FFT 5 1 3 DOA估计 5 1 3 1 和差测角 5 1 3 2 顺序
  • 多种排序算法(插入、二分法【查找、排序】、选择、冒泡、快速、希尔)

    多种排序算法 插入 二分法 查找 排序 选择 冒泡 快速 希尔 插入排序 function insertSort arr var len arr length for var i 1 i lt len i var key arr i var
  • 用户行为预测论文summay

    用户行为预测论文summary 1 论文名称 Modelingand Predicting Behavioral Dynamics on the Web 2 论文作者 KiraRadinskyz Krysta Svorey 3 主要内容 本
  • 论文阅读--Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

    多人姿态估计的挑战 1 人数 位置和尺寸的大小未知 2 人体之间的相互接触 遮挡造成干扰 3 复杂度随着实时人数的增加而提升 姿态估计方法 1 top down approaches 自顶向下 借助现有的用于单人姿势判断的技术 先检测人 然
  • 趣味算法:探索栈和队列的神秘之旅

    文章目录 前言 一 栈和队列 从历史到理论 二 栈和队列 实际例子和代码 1 栈在后缀表达式求解中的应用 2 队列在打印任务调度中的应用 三 栈和队列 更多的应用场景 四 栈和队列 如何选择 五 栈和队列的变体 六 性能分析 结语 前言 编
  • spring boot 统一JSON格式的接口返回结果

    前后端分离的项目开发前 会提前规定好数据返回格式 本文以JSON为例 第一步 定义好JavaBean package com yclouds myhelper web response import com fasterxml jackso
  • 输入商品数量和单价,计算商品总额。(C语言)

    代码 define CRT SECURE NO WARNINGS 1 include
  • 【PyTorch】使用 Mac GPUs (Apple silicon GPUs) 训练模型

    根据 PyTorch 官网的文章 Introducing Accelerated PyTorch Training on Mac1 从 PyTorch v1 12 release 开始支持使用 Apple silicon GPUs 加速训练
  • ML-熵、条件熵、信息增益

    通俗理解条件熵 特征选择之信息增益法 必看 系统介绍了熵 条件熵 信息增益的概念及推导 条件熵的计算 必看 知乎前三个回答都看一下 有关于熵 条件熵 信息增益的实践 我通过例子一步一步讲解这个概念 在决策树算法的学习过程中 信息增益是特征选
  • stm32实现网页服务器,STM32实现Web服务器

    实例简介 有例程及详细的讲解 适用于初学嵌入式WebServer的同学下载 实例截图 核心代码 ourdev 682501O2PDF8 10M以太网 WEB服务器 源码 PDF教程 以太网ENC28J60 pdf 以太网ENC28J60源码
  • KNN分类——matlab(转载)

    KNN分类 matlab 时间 2016 09 06 标签 matlab knn算法 算法 栏目 MATLAB 原文 http blog csdn net lwwangfang article details 52452429 adsbyg
  • elasticSearch 设置用户名密码 && 查询

    一 设置密码 1 需要在配置文件中开启x pack验证 修改config目录下面的elasticsearch yml文件 在里面添加如下内容 并重启 xpack security enabled true xpack license sel
  • SpringBoot集成RabbitMQ生产消费消息(简单实用版)

    概要 要使用RabbitMQ消息队列主要有两个步骤 一个是搭建RabbitMQ服务 需下载安装 二是代码添加依赖开始编码 一 安装RabbitMQ服务 以docker安装为例 其他安装方式自行百度 下载镜像 docker pull rabb
  • Java中的链表——LinkedList解析

    LinkedList类结构 LinkedList
  • TCP思维导图总结

    TCP 可靠性 为什么网络中会存在不可靠 根本原因就是距离太远 不可控因素太多 TCP因此就应运而生 是一种保证可靠性的协议 TCP协议格式 源 目的端口 表示数据从那个进程来 要到对端的那个进程去 32位序号 32位确认序号 分别代表TC
  • Authing 入选长城战略咨询《2023 中国潜在独角兽企业》报告

    2023 年 6 月 20 日 长城战略咨询 GEI 发布 2023 中国潜在独角兽企业研究 报告 Authing 作为国内首家身份云 IDaaS 厂商入选中国潜在独角兽企业榜单 独角兽企业指具有发展速度快 数量稀少 备受投资者青睐等属性的
  • 面试必备的红黑树,这可能是最容易理解的一篇了!

    点击上方 Java之间 选择 置顶或者星标 你关注的就是我关心的 来源 linux内核 红黑树是一个平衡的二叉树 但不是一个完美的平衡二叉树 虽然我们希望一个所有查找都能在 lgN次比较内结束 但是这样在动态插入中保持树的完美平衡代价太高
  • luffy前传

    目录 企业的web项目类型 商城 门户网站 企业站和门户站 企业项目开发流程 pip永久换源 虚拟环境搭建 使用虚拟环境 新建项目 luffy后台创建目录调整 企业的web项目类型 商城 B2C 直销商城 商家与会员直接交易 Busines
  • 2020国内十大API接口服务平台

    API的概念早在上世纪60年代就已经出现 其代表的是应用程序的编程接口 是一些预先定义的函数 或指软件系统不同组成部分衔接的约定 换句话说 API是一个信使 它将用户的请求交付给用户所请求的提供者 然后将响应交付给用户 打个简单的比喻 日常
  • 【CVPR2023 Best Paper】Planning-oriented Autonomous Driving 阅读笔记

    Paper https openaccess thecvf com content CVPR2023 papers Hu Planning Oriented Autonomous Driving CVPR 2023 paper pdf Gi