停车位检测新数据集、新方法，精准又快速（含视频解读）

2023-05-16

点击上方“AI算法修炼营”，选择“星标”公众号

精选作品，第一时间送达

本文是一篇关于停车位检测的文章，文章的视频有详细解读，文章的创新点就是在圆形描述器来回归定点坐标。地址：

https://www.bilibili.com/video/BV1CA411v74F?t=32。

希望各位看官们，多多支持，一键三连。

论文地址：https://arxiv.org/pdf/2005.05528.pdf

数据集地址：https://github.com/wuzzh/Parking-slot-dataset

已获得原UP主授权，转载请联系。地址：https://www.bilibili.com/video/BV1CA411v74F?t=32。超专业，超良心，各位看官记得去B站一键三连。

实时停车位检测在泊车系统中起着至关重要的作用，现有的方法主要有两个原因导致性能不理想：1、目前有关停车位检测的可用数据集多样性有限，这导致训练出来的模型泛化能力较低。2、停车位检测的专业性通常是被低估了的。因此，本文为了更好地训练停车位检测模型，对大规模的benchmark进行了标注，并在社区中共享。

本文提出了一个圆形描述符来回归停车位顶点的坐标，从而准确地定位停车位。为了进一步提高性能，开发了一个两阶段的深度体系结构，以从粗略到精细的方式定位顶点。在benchmark和其他数据集的测试中，本文设计的方法可以在实践中达到实时性的同时保持最先进的准确性。

简介

基于标记点的深度方法在停车位检测中占据了主导地位。已经提出了包括DeepPS 和DMPR-PS 等典型工作来识别用于停车位检测的标记点。这两种方法的主要区别在于标记点的描述方式。DeepPs 利用矩形描述符提取停车位顶点的矩形邻域内的图案。然而，矩形描述符对方向变化敏感。因此，具有T / L模板的方向性的描述符来描述顶点的方法已在DMPR-PS中应用。尽管此描述符对方向变化更鲁棒，但它只能提取T / L形等垂直的停车位，不适用于描述复杂的非T / L形场景，例如倾斜和梯形停车位。

同时，各种停车位顶点没有固定的模式，这使得很难找到一种通用的方式来描述不同的停车位顶点。为解决这一问题，在本文中提出了一种可变形的圆描述符，以学习不同类型的停车位顶点的特征模式。对于不同类型的停车位顶点，使用相应的特征模式作为停车位顶点的描述子。因此，该描述符可以与不同类型的停车位检测任务兼容并且具有更好的归纳能力。

表I列出了不同的停车位检测方法的比较。

此外，网络的计算开销严重限制了深度学习算法在实际工程应用中的应用。例如，DeepPS 和DMPR-PS 需要强大的GPU来运行深度学习算法。但是，批量生产的嵌入式环境仅具有CPU或功能较弱的GPU。尽管DMPR-PS是为嵌入式系统的任务而设计的，但是在没有强大的GPU的情况下仍然难以进行实时检测。在这种情况下，迫切需要寻找一种高效的时隙检测算法。为此，本文以粗糙到精细的方式解决了该任务，以降低网络的模型复杂度。

图1.本文提出的PSDet的体系结构。该模型是一个级联结构，第一级主要由backbone，几次下采样操作和插值过程组成。将这些插值后的特征图连接起来以获得包含标记点初始位置的特征图。在第二阶段中，将在第一阶段中获得的标记点的粗略位置作为中心来裁剪子图像，这些子图像被用作卷积神经网络的输入。最后，检测子图像中标记点的准确位置。

具体来说，本文的算法将任务分解为两个阶段，如图1所示。特别地，第一阶段学习回归标记点的粗略位置。这表明由于任务的简单性，第一阶段的优化具有快速收敛性。第二阶段将裁剪的子图像作为输入以预测的粗略位置为中心，并输出更精细的位置以进一步提高性能-粗略位置与ground truth之间的偏移。同时，在两个阶段使用大小不同的圆形描述符，粗略阶段（即第一阶段）比精细阶段（即第二阶段）使用更大的圆形描述符。

此外，为了验证实际应用中的性能，本文收集并标注了大规模benchmark停车位检测数据集（PSDD），该数据集由7种停车场景组成，包括砖、草、斜面、梯形、开放、矩形和立体停车位。实验证明了本文的方法在PSDD和ps2.0数据集上的有效性和效率。结果表明，PSDet在实现竞争性能的同时，其计算复杂度要比其他方法小得多。

顶点特征的通用表示

在现有的停车位检测方法中，很难找到通用的特征描述符来描述具有复杂和可变类型的停车位顶点。因此，本文将各种类型的停车位顶点定义为通用特征表达，并使用该范式描述不同类型的停车位顶点。与以前的矩形描述符和方向描述符相比，本文提出的圆形描述符可以描述不同类型的停车顶点模式。

顶点特征的概念

顶点特征是标记点周围的相邻像素的公共模式，它表示标记点周围的可变形标记线之间的重叠关系，如图3所示。

顶点区域和非顶点区域：顶点区域是包含停车线顶点的像素集合。非顶点区域是不以任何停车位顶点为中心的像素集合。

顶点特征的评价指标：

圆形描述符

为了描述停车位顶点区域p的顶点特征，本文引入了一个圆形区域描述符。圆形描述符是可变形的圆形模板，可以包含半径足够大的各种类型的停车位顶点。图4描绘了不同停车位的圆形描述符。圆形描述符能够提取更常见的图案并帮助解决非L-形状和非T形情况，例如倾斜、砖块和梯形等。圆形描述符能够包含各种类别的图案。这些圆形描述符可以根据不同标签给出的相应特征模式来学习，如图4所示。

顶点的下界

顶点的上界

本文方法：PSDET（EFFICIENT AND UNIVERSAL PARKING SLOT DETECTION）

1、实现细节

级联结构：首先计算顶点区域候选，然后回归到精确的顶点位置。更精确地说，在第一阶段，提取顶点的近似区域，以初步粗略地定位标记点。然后，从输入图像中裁剪以第一阶段生成的顶点候选为中心的子图像。此外，利用第二阶段网络将精确的顶点位置从子图像中以偏移的形式回归到粗略的顶点候选。

First Stage：给定一个320×240的全景图像I，裁剪成两个320×96的图像，并以I的左侧和右侧作为初始边界。然后从320×96图像中提取出一组特征图，如图1所示。此外，金字塔网络被用于提取具有不同分辨率的特征图，这可以将缩放鲁棒性引入网络。然后，将这些特征图插值入到固定大小，并concat到合并的特征图中。因此，获得了一系列大小为w1×h1×c1的特征图，如图6所示。例如，将其中一个特征图命名为M，将M中点的值命名为M（i，j）。（i，j）可以看作是输入图像对第一阶段圆形描述符的响应强度。此外，M（i，j）通过softmax归一化为[0,1]，如等式（5）所示。最后，保留其归一化值M′（i，j）≥0.5的点位置（i，j）作为停车位的顶点候选。

Second Stage：在第一阶段获得标记点的初始位置之后，以顶点候选的位置为中心，从输入图像中裁剪出一系列S×S子图像。然后使用基于CNN的回归模型和第二阶段圆形描述符模板进一步检测子图像中的所有顶点。最后，将输出特征图上响应强度最高的点的位置保留为停车位顶点的最终位置，并在第一阶段相应地纠正停车位顶点候选的位置偏差。这样，停车位的准确位置检测到停车位标记点。

2、损失函数

First Stage Loss.

Second Stage Loss

实验与结果

数据集PSDD制作：

PSDD数据集由从典型的室内和室外停车位收集的14628个校准的环视图像组成。对21种视频序列中的图像进行采样，这些视频序列在7种不同场景中捕获。每个场景有3个序列，进行帧拆分后，对PSDD中的样本进行过滤，从而得到14628个样本。数据集中每个类别数据的数量是不同的，这是由于现实应用中不同停车位的广泛普及，例如矩形停车位和开放式停车位最为常见。露天停车位类别共有3342个样本，矩形停车位类别共有5667个样本，草木停车位类别共有1242个样本，立体停车位类别共有63个样本，梯形停车位类别共有1946个样本，斜停车位类别共有500个样本，砖停车位类别共有1868个样本。一组样本如图7所示，所有实验中训练集与测试集的比例为1：1。

可视化测试

对比实验

实时性测试

更多实验细节，可以参考原文。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

停车位检测新数据集、新方法，精准又快速（含视频解读）的相关文章

我现在明白为什么github有些文件不用上传，不然显示的改动很多，实际我们只想看源码的改动，并不想看什么编译出的文件的改动。

我现在明白为什么github有些文件不用上传 xff0c 不然显示的改动很多我们只想看源码的改动我一开始为了想备份整个工程所以干脆整个搜上传 xff0c 后来发现这样以后查看自己的改动 xff0c 反而可能变得比较麻烦 xff0c 因为
rst文件的实时预览（我最后再vscode上实现了）

都是在说一个网站 xff1a http rst ninjs org 但是这个网站挂了 xff0c 似乎得自己下下来在本地跑 https www oschina net p rsted related https zhk me 870 htm
相机标定的目的：获取摄像机的内参和外参矩阵（同时也会得到每一幅标定图像的选择和平移矩阵），内参和外参系数可以对之后相机拍摄的图像就进行矫正，得到畸变相对很小的图像。

相机标定的目的 xff1a 获取摄像机的内参和外参矩阵 xff08 同时也会得到每一幅标定图像的选择和平移矩阵 xff09 xff0c 内参和外参系数可以对之后相机拍摄的图像就进行矫正 xff0c 得到畸变相对很小的图像摘自 xff1a
D435i的接口就是type-c接口，就和我的小米手机的接口一样
电脑主机的两个 USB 接口用一根数据线连起来

链接 xff1a https www zhihu com question 336104107 answer 795676460 USB Host端的DP和DM是有挂15K的下拉电阻 xff0c 但回答中图配错了这个图实际上主要展示了De
ROS查看节点图命令rqt_graph

ROS查看节点图命令rqt graph
PX4飞行模式简单对比梳理（转载）

摘自 xff1a https bbs amovlab com forum php mod 61 viewthread amp tid 61 886 amp extra 61 PX4飞行模式简单对比梳理 PX4飞行模式简单对比梳理 xff1a
recipe for target ‘px4_sitl_default‘ failed这有个出错就重新安装的

AmovLab阿木社区论坛入门学习问答专区 Pixhawk PX4 开发环境搭建 Ubuntu 遇到一些问题返回列表 Mr mystery
搭建无人机仿真环境之PX4安装中出现的一些问题的解决

摘自 xff1a https blog csdn net wangdongjiab article details 107230585 搭建无人机仿真环境之PX4安装 Djarea 2020 07 09 16 02 23 583 收藏 6
启动mavros节点经常看到两条红色报错 reject position controll的原因就是，那个时候T265的位置数据还没有传给飞控，飞控没有位置数据，当然拒绝切到定点模式。

启动mavros节点经常看到两条红色报错 reject position controll的原因就是 xff0c 那个时候T265的位置数据还没有传给飞控 xff0c 飞控没有位置数据 xff0c 当然拒绝切到定点模式而且这个时候你遥控器
px4开源飞控uORB学习笔记

这下面最重要的我觉得是这个图摘自 xff1a https www cnblogs com kinson p 12108591 html px4开源飞控uORB学习笔记 1 uORB是什么 xff0c 起什么作用 xff1f uORB Mi
*T265定点中的/tf消息是谁发布的，为什么是/tf（后来发现激光雷达的cartographer也是发布/tf）,位姿和坐标系变换都是用位置+四元数（欧拉角/旋转）表示的！！！

T265定点中的 tf消息是谁发布的 xff0c 为什么是 tf 可能也是因为讲课 xff0c 倒逼着我把这些真正弄清楚而不是马马虎虎差不多就行了首先我看节点图 xff0c 可以确认tf消息就是摄像头节点发出的我再去realsense
Odometry的发布和发布odom到base_link的tf变换

这里面我觉得重要的话 xff0c 而且我还看到了twist xff0c 这不正是前阵子普罗米修斯群里问的T265发布的带不带速度信息所说到的twist xff1f 导航包使用tf来确定机器人在世界中的位置 xff0c 并将传感器数据与静态地
ROS话题和服务（topic就像UDP，service就像TCP）

看这张图怎么感觉服务有种TCP的味道 xff0c 可靠连接 xff0c 三次握手 xff0c 话题像UDP xff0c 发出去我就不管了看来服务不单单是我请求你响应那么简单 xff0c 还得保证我收到摘自 xff1a https blo
PX4官方手册给的 Auterion 的VIO功能包（用于PX4 T265定点）的代码可以分析一下，感觉写的比vision_to_mavros简单一些

PX4官方手册给的 Auterion 的VIO功能包 xff08 用于PX4 T265定点 xff09 的代码可以分析一下 xff0c 感觉写的比vision to mavros简单一些 https github com Auterion
STM32Cube IDE与MX区别？STM32CubeMX介绍、下载与安装

一 STM32Cube IDE与MX区别 xff1f cubeIDE 61 cubeMX 43 Keil 如您用 keil cubeIDE 61 cubeMX 43 IAR 如您用 IAR cubeIDE 61 cubeMX 43 STUD
手把手教你实现ROS Melodic+Realsense D435i

转载自 xff1a https blog csdn net u013494161 article details 112392528
可以启动D435i的realsense2_camera的launch文件

见我的这篇博文 xff1a https blog csdn net sinat 16643223 article details 114272431
为什么都是source devel文件夹下的setup.bash，是不是只需要找到devel文件夹下的可执行文件就可以了

为什么都是source devel文件夹下的setup bash xff0c 是不是只需要找到devel文件夹下的可执行文件就可以了 xff0c 所以环境变量只需要知道devel文件夹就可以了 xff1f 下面是我的TX2板载计算机上的ba
从ROS功能包的角度分析vins-fusion vins-mono

我直接搜索cmakelists就可以确定它有几个功能包 xff0c 可以看出vins fusion并不是一个功能包是由几个功能包组成的 xff0c 这也和它的目录相符 xff0c 我在看别人使用vins的视频的时候再次印证了我的想法 ht

随机推荐

沈劭劼居然还是大疆的....大疆真的可怕。大疆如果做一款室内无人机不分分钟秒杀其他。

沈劭劼居然还是大疆的大疆真的可怕大疆如果做一款室内无人机不分分钟秒杀其他 https www aiimooc com club exshow htm itemid 908 html
ROS之命名空间

转载自 xff1a https blog csdn net u014587147 article details 75647002 ROS之命名空间小菜虎 2017 07 21 17 02 24 7143 收藏 47 分类专栏 xff1a
ROS----名字空间namespace

这里面很重要的一点就是说出了转载自 xff1a https blog csdn net cookie909 article details 79842334 ROS 名字空间namespace cookie909 2018 04 07 1
ROS源代码阅读（2）：ROS程序的初始化——从ros:init()出发

转载自 xff1a https blog csdn net wanghuiquan0712 article details 78014232 utm medium 61 distribute pc relevant none task bl
双目相机想想也确实需要联合标定这样才能对深度估计得准确啊，联合标定才能真正确定两个相机之间的准确的位置关系，这是估计深度的前提对吧。

双目相机想想也确实需要联合标定这样才能对深度估计得准确啊 xff0c 联合标定才能真正确定两个相机之间的准确的位置关系 xff0c 这是估计深度的前提对吧你理解了单目相机标定的重要性之后 xff0c 应该能比较好理解双目相机的联合标定了
opencv本质是什么，你自己写个opencv工程出来就清楚了（是个类库）

opencv本质是什么 xff0c 你自己写个opencv工程出来就清楚了 xff0c 就像ROS用多了自然知道是什么 https blog csdn net sinat 16643223 article details 115095514
STM32Cube高效开发教程（基础篇）

第一本全面使用STM32CubeMX和STM32CubeIDE作为开发软件 xff0c 系统性地介绍STM32的HAL库开发的书 STM32Cube高效开发教程 xff08 基础篇 xff09 详细目录 STM32Cube高效开发教程 xf
rosparam命令详解

https blog csdn net qq 26234707 article details 112913283
D435i启动遇到control_transfer returned error, index: 768, error: No data available, number: 61

这是我今天准备用D435i跑vins mono遇到的情况 xff0c 主要是启动rs camera launch有这个问题有时还会报这个错误 USB SCP overflow 百度只能搜到一个 xff0c 但是他给的方法没用 xff0c
如何用Realsense D435i运行VINS-Mono等VIO算法获取IMU同步数据（转载）

原来改跑vins改 rs camera launch文件里所修改的负都是参考这篇博文的转载自 xff1a https blog csdn net qq 41839222 article details 86552367 如何用Realse
【VINS-Fusion入门之一】让系统跑起来

转载自 xff1a https blog csdn net wangbaodong070411209 article details 86551370 VINS Fusion入门之一让系统跑起来北络 2019 01 19 13 18 1
单片机: 自定义串口通信协议的实现（转载）

转载自 xff1a https blog csdn net nk test article details 50240933 自定义串口通信协议的实现 weixin 33885253 2017 01 18 21 11 00 1926 收藏
pelco协议及其实现的简单认识

转载自 xff1a https blog csdn net subfate article details 36644419 pelco协议及其实现的简单认识李迟 2014 07 03 13 50 49 6272 收藏 10 分类专栏 x
PELCO-D与PELCO-P协议介绍

转载自 xff1a https blog csdn net wodexiaobaitu article details 43018249 PELCO D与PELCO P协议介绍 wodexiaobaitu 2015 01 22 13 26
开源HTTP解析器---http-parser和fast-http

转载自 xff1a https www cnblogs com arnoldlu p 6497837 html 开源HTTP解析器 http parser和fast http 由于项目中遇到需要发送http请求 xff0c 然后再解析接收到
OpenBTS和硬件平台搭建

OPENBTS安装目标项目使用OpenBTS进行GSM系统仿真 xff0c 用BladeRF进行硬件搭建收发平台所用软硬件版本 Ubuntu 14 04 LTS OpenBTS v 4 0 0 xff1b BladeRF Gnu Ra
OpenBTS for bladeRF代码修改

首先从https github com Nuand dev 上 git clone 下来下载打包的文件 xff0c 接着到本地dev目录下执行 clone sh下载OpenBTS以及它的其他依赖的安装包这里在openbts文件夹Trasc
通信协议/通讯协议有哪些？包含哪些分类？

通讯和通信的区别 xff1f 1 通信与通讯傻傻分得清传统意义上的通讯主要指电话电报电传通讯的讯指消息 xff08 Message xff09 媒体讯息通过通讯网络从一端传递到另外一端媒体讯息的内容主要是话音文字
增强现实入门实战，使用ArUco标记实现增强现实

点击上方 AI算法修炼营 xff0c 选择加星标或置顶标题以下 xff0c 全是干货在本文中 xff0c 我们将介绍ArUco标记以及如何使用OpenCV将其用于简单的增强现实任务 xff0c 具体形式如下图的视频所示一什么是Ar
停车位检测新数据集、新方法，精准又快速（含视频解读）

点击上方 AI算法修炼营 xff0c 选择星标公众号精选作品 xff0c 第一时间送达本文是一篇关于停车位检测的文章 xff0c 文章的视频有详细解读 xff0c 文章的创新点就是在圆形描述器来回归定点坐标地址 xff1a htt

停车位检测新数据集、新方法，精准又快速（含视频解读）

停车位检测新数据集、新方法，精准又快速（含视频解读） 的相关文章

随机推荐

热门标签

停车位检测新数据集、新方法，精准又快速（含视频解读）的相关文章