yolo-v3和SSD的一些对比

2023-05-16

初步总结的SSD和yolo-v3之间的一些区别。
其中的一些概念还有待充分解释。

SSDYOLOv3
LossSoftmax lossLogistic loss
Feature extractorVGG19Darknet-53
Bounding Box Predictiondirect offset with default boxoffset with grid cell by sigmoid activation
Anchor boxDifferent scale and aspect ratioK-means from coco and VOC
Small objectsSemantic value for bottom layer is not high. Worse for small objects.Higher resolution layers have higher semantic values. Better for small objects.
Big objectsBetter. Feature map rangers from 38 * 38 to 3 * 3 ,1 * 1.Worse. 13 * 13 feature map is the most coarse-grained.
Data Augmentationdifferent sample IOU crop on original imagerandomly put the scaled original image (from 0.25 to 2) on the gray canvas
Inputresize original image to fixed sizeRandom multi-scale input
FPNnowith FPN

SSD的loss中,不同类别的分类器是softmax,最终检测目标的类别只能是一类。而在yolo-v3中,例如对于80类的coco数据集,对于类别进行判断是80个logistic分类器,只要输出大于设置的阈值,则都是物体的类别,物体同时可以属于多类,例如一个物体同时是person和woman。

Backbone network。ssd原版的基础网络就是VGG19,也可以用mobile-net、resnet等。yolo-v3的基础网络是作者自己设计的darknet-53(因为具有53个卷积层),借鉴了resnet的shortcut层,根据作者的话,以更少的参数、更少的计算量实现了接近的效果。
这里写图片描述

Anchor box。ssd从faster-rcnn中吸收了这一思想,采用的是均匀地将不同尺寸的default box分配到不同尺度的feature map上。例如6个feature map的尺度,default box的大小从20%到90%的占比,同时有aspect_ratios = [[2], [2, 3], [2, 3], [2, 3], [2], [2]] ,最终可以计算出不同default box大小。而yolo-v3延续了yolo-v2的方法:从coco数据集中对bouding box 的(width, height)进行聚类,作者聚出9类,每类中心点取出作为一个box_size, 将每三个box_size划分给一个feature map。例如总共有(10,13), (16,30), (33,23), (30,61), (62,45), (59,119), (116,90), (156,198), (373,326)共9组w,h, 作者将后三个(116,90), (156,198), (373,326)作为13 * 13 的grid cell上的anchor box size。

图片输入。yolo-v3将输入图片映射到第一层feature map的固定比例是32。对于输入为416 * 416的图片,第一层feature map 大小为13 * 13。但是yolo-v3支持从300到600的所有32的倍数的输入。例如输入图片为320 * 320,这样第一层feature map就为10 * 10,在这样的grid cell中同样可以进行predict和match groudtruth。

Bounding Box 的预测方法。在不同的grid cell上,SSD预测出每个box相对于default box的位置偏移和宽高值。yolo-v3的作者觉得这样刚开始训练的时候,预测会很不稳定。因为位置偏移值在float的范围内都有可能,出现一个很大的值的话,位置都超出图片范围了,都是完全无效的预测了。所以yolov3的作者对于这位置偏移值都再做一个sigmoid激活,将范围缩为0-1 。b_x和b_y的值在(cell_x_loc, cell_x_loc+1), (cell_y_loc, cell_y_loc+1)之间波动。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

yolo-v3和SSD的一些对比 的相关文章

随机推荐

  • 网络应用基础 ——(2023新星计划文章二)

    一 xff0c TCP报头解析 数据打包与解析直观图 xff1a 1 0报文与报文字段 1 0 1 报文 报文是计算机网络中交换信息的基本单位 xff0c 是一种用于在网络中传递数据的结构化数据格式 在网络通信中 xff0c 数据会被封装成
  • ROS中工作空间和功能包的创建以及发布者Publisher的实现

    最近刚刚开始学习ROS xff0c 对于整个ROS的框架和功能正在一点点的了解 xff0c 跟着B站古月居的 ROS入门21讲 课程 xff0c 在安装好linux和ROS后 xff0c 正式开始ROS的学习 xff0c 动手实践敲代码 x
  • Failed to fetch https://mirrors.tuna.tsinghua.edu.cn/ubuntu//dists/bionic/main/binary-arm64/Packages

    在jeston nano执行 sudo apt update 的时候出现下列错误 xff1a Failed to fetch https mirrors tuna tsinghua edu cn ubuntu dists bionic ma
  • 场景设计法

    目录 一 场景设计法 1 理解 二 场景法的基本设计步骤 三 场景设计法需要掌握的基本知识 1 基本流和备选流 2 测试用例组成 四 优缺点 1 优点 2 缺点 五 使用场景 六 注意 七 实例 1 案例 2 分析需求 xff0c 确定基本
  • 【第一章】计算机网络知识点整理

    文章目录 第一章 概述1 1 计算机网络的定义及其特点1 定义2 计算机网络系统的组成3 功能4 七个典型特点 1 2 互联网概述1 internet 和 Internet 的区别2 互联网基础结构发展的三个阶段 1 3 互联网的组成一 边
  • C# 窗体应用常用基础控件讲解(萌新版)

    C 窗体应用常用基础控件讲解 xff08 适合萌新 xff09 前言 博主这篇文章主要讲解C 窗体应用的几个常用的控件 对新手很友好 xff0c 这几个控件在C 窗体应用中用的频率特别高 xff0c 如果你第一次学C 窗体应用 xff0c
  • 【安装】Ubuntu20.04下安装ROS的完整过程(内含已装好ROS的虚拟机、虚拟机创建过程、ROS安装过程及全过程录屏)

    2022 12 20重制 xff0c 精简流程 xff0c 直接去掉网络问题 现成的虚拟机 为方便大家学习 xff0c 如果安装ROS遇到的问题实在太多 xff0c 也可以直接下载我提供给大家的 已经安装好ROS的Ubuntu虚拟机 xff
  • C++和C的区别

    问 xff1a 能说一下C 43 43 和C的区别吗 xff1f 参考 xff1a 可以从设计思想 语法以及内存管理这三方面来说 1 设计思想上 xff1a C 43 43 是面向对象的语言 xff0c 而C是面向过程的结构化编程语言 2
  • 中文分词之最短路径法和N最短路径

    考虑到汉语分词存在切分歧义消除和未登录词识别两个主要问题 xff0c 因此 xff0c 有专家将分词分成两个阶段 xff1a 1 用分词算法进行粗分2 对粗分的最好结果进行歧义消除和未登录词识别 最短路径法是一种自动分词的算法 它将一句话中
  • redis分布式锁的原子保证

    分布式锁的原子保证 背景提出 分布式锁的原子性还能得到保证吗 分布式锁的加锁与解锁命令是什么 所以核心问题到底是什么 客户端的一条命令是如何执行的呢 两个机制是在这个过程的什么阶段发货作用呢 会不会影响命令执行的原子性 IO 多路复用机制多
  • 机器学习 python

    1 用DecisionTreeRegressor 对波士顿房价进行预测 xff1a 1 导入数据 sklearn datasets load boston 2 数据拆分25 作为测试集 sklearn model selection tra
  • MTPuTTY配置ssh连接Gitlab

    目录 一 简介二 生成SSH 密钥三 GitLab添加公钥四 同步本地与原项目 一 简介 远程仓库是指托管在网络上的项目仓库 xff0c 现在互联网上有很多项目托管平台 GitLab是一个利用 Ruby on Rails开发的开源应用程序
  • 优化淘宝商品比价定向爬虫--爬虫的浏览器伪装

    目录 一 原代码问题二 淘宝Robots协议三 User Agent四 查找headers和cookie五 完整代码 一 原代码问题 爬取不到任何内容处理原因 xff1a 由于淘宝的设置 xff0c 虽然可以requests爬取页面内容 x
  • Python数据分析与展示

    目录 一 xff1a Python数据分析基础Anaconda IDE的基本使用方法1 Anaconda是一个集成各类Python工具的集成平台2 包管理和环境管理工具 xff1a conda3 编程工具 Spyder4 交互式编程环境 x
  • Matplotlib.pyplot绘图示例

    目录 一 基础图表函数概述二 饼图的绘制三 直方图的绘制四 极坐标的绘制五 散点图的绘制 一 基础图表函数概述 函数说明plt plot x y fmt 绘制一个坐标图plt boxplot data notch position 绘制一个
  • Visual Studio Code 安装教程附插件推荐

    目录 1 VSCode下载及安装1 1 下载1 2 安装1 3 界面介绍 2 编辑器常用功能2 1 基础编辑 Basic editing2 2 导航 Navigation2 3 搜索和替换 Search and replace2 4 多光标
  • B/S方向

    目录 1 软件架构B SC S 2 开发B S架构软件需要哪些人才 xff1f 3 前端准备4 前端HTMLCSSJavaScriptJS 框架css 框架Web开发 5 后端VMware 虚拟机Linux基础后端语言 xff1a Java
  • VS2019 添加bits/stdc++.h万能头文件库

    目录 一 bits stdc 43 43 h介绍二 为VS添加万能库1 正常情况无法引用stdc 43 43 h2 在安装目录下找到bits文件3 添加stdc 43 43 h源码方式 未安装mingw64情况方式 安装了mignw64情况
  • IDEA SpringBoot SQL连接常见五大异常处理

    项目 xff1a Springboot 43 mybatis 43 MySQL 一 no data sources are configured to run this sql and provide advanced code assis
  • yolo-v3和SSD的一些对比

    初步总结的SSD和yolo v3之间的一些区别 其中的一些概念还有待充分解释 SSDYOLOv3LossSoftmax lossLogistic lossFeature extractorVGG19Darknet 53Bounding Bo