SSD目标检测算法原理(上)

2023-11-06

一、目标检测概述

1.1 项目演示介绍

在这里插入图片描述

项目架构

  • 数据采集层: 数据标注、数据的存储格式

  • 深度模型层:数据预处理,GPU训练得到模型

    • tensorflow serving 进行模型部署
    • web后台
  • 用户层: 网页、小程序、检测识别结果

项目安排三阶段

在这里插入图片描述

1.2 图片识别背景

图片识别常见示例

在这里插入图片描述

图像识别的三大任务:

  • 目标识别: 输出类别
  • 目标检测: 输出类别已经在物体在图片当中的位置
  • 目标分割: 把物体形状描述出来,背景进行剔除

图像识别的发展

  • 通用场景: 谷歌、阿里、百度提供的API,普及范围比较广,一般性的图像识别
  • 垂直场景:
    – 医疗领域:医疗影像的检测
    – 林木产业:木板树种的检测
    – 其他垂直领域:轮胎类型等。。。。

1.3 目标检测定义

识别图片中有哪些物体以及物体的位置(坐标位置)
在这里插入图片描述

位置信息的表示

在这里插入图片描述

极坐标表示示例

在这里插入图片描述

中心点坐标 表示示例

在这里插入图片描述
格式: x_center | y_center | box_weight | box_height

目标检测的发展历史

在这里插入图片描述

二、目标检测算法原理

2.1 任务描述

  • 目标
    –了解目标洁厕算法分类
    –知道目标检测常见指标IoU
    –了解目标定位的简单实现方式

2.2 目标检测算法必备基础

  • 两步走的目标检测: 先进性区域推荐,而后进行目标分类
    – 代表:R-CNN SPP-net Fast R-CNN Faster R-CNN

  • 端到端的目标检测: 采用一个网络一步到位
    – 代表:YOLO SSD

    pass:
    卷积层是深度学习中的一种基础层,最主要的功能是:
    特征提取:卷积层可以通过卷积核在输入数据上进行卷积操作,从而提取出数据中的特征。这些特征可以表示数据的局部信息,如图像中的边缘、角点等。
    池化层
    平均池化:计算图像区域的平均值作为该区域池化后的值。
    最大池化:选图像区域的最大值作为该区域池化后的值。
    主要功能:降维,特征压缩,减少网络模型计算量,可以扩大感受野

常见的模型

在这里插入图片描述

图片分类
评估指标 acc
在这里插入图片描述

目标检测
评估指标 IOU在这里插入图片描述

目标的位置框 :Bounding box
在目标检测中,有两种框:

  • Ground-trurh bounding box:图片中真是标记的框
  • Predicted bounding box: 预测的时候标记的框

IoU(交并比)的解释:
在这里插入图片描述
两个区域的重叠程度overlap
简述: 交集/并集

2.3目标检测算法模型输出

在原有基础上增加一个全连接层

  • FC1: 作为类别的输出
  • FC2:作为这个物体位置数值的输出
    在这里插入图片描述
    对于分类概率的评价指标,使用的是交叉熵损失 softmax
    对于位置信息的回归评价指标,使用的是MSE均方误差损失 L2损失

在这里插入图片描述
在这里插入图片描述

存在问题

图片中假设存在多个物体的时候,你的网络输出多少不确定,全连接层回归
输出几个坐标不确定。

在这里插入图片描述

目标检测 -overfeat模型

目标检测的暴力方法,是从左到右,从上到下滑动窗口,利用分类识别目标。
为了在不同观察距离处检测不同的目标类型,我们使用不同大小的宽高比的窗口。如下图所示:
在这里插入图片描述
在这里插入图片描述

模型构造大致如下: 滑动窗口大小为k

在这里插入图片描述

取出子图,并标记是否是数据

在这里插入图片描述

overfeat模型总结

在这里插入图片描述

R-CNN模型

完整的R-CNN的结构

在这里插入图片描述

步骤

在这里插入图片描述

pass:
CNN提取2000×4096维的矩阵
20个SVM分类器,获得2000×20维的矩阵
NMS对每一列(列对应的类)进行非极大抑制,剔除重叠的建议框

候选区域

选择性搜索 SelectiveSearch – SS
在这里插入图片描述

warp比crop缩放后失真程度更小

在这里插入图片描述

步骤一中:
通过选择性搜索(SS)算法,进行预选框的筛选
大小统一的框使用的是 warp图片缩放的方式

在这里插入图片描述

特征提取

步骤二中:
CNN提取特征,用的是AlexNet的结构,输入要求 277×277
提取的特征会保存在磁盘中
数据维度 (2000,4096) 如下图所示

20个类别是指,你训练的数据集一共就有20个类别,根据你的数据集的类别数量进行调整

在这里插入图片描述

列是候选区域,行是类别特征

在这里插入图片描述

非极大抑制 (NMS)

在这里插入图片描述

非极大抑制的过程

在这里插入图片描述

修正候选区域

在这里插入图片描述
在这里插入图片描述

预测值是A,目标是G,进行修正后得到 G’
如下图所示:
在这里插入图片描述
在这里插入图片描述

R-CNN的训练过程

正负样本准备+预训练+微调网络+训练SVM+训练边框回归器

正负样本准备

在这里插入图片描述

预训练

CNN模型层数多,模型容量大,通常会采用2012年的AlexNet来学习特征,包含5个卷积层和2个全连接,比如著名的ImageNet比赛的数据集,来训练AlexNet,保存其中的模型参数

微调
类似于迁移学习
在这里插入图片描述

总结:

  1. 正负样本标记
  2. 预训练:别人已经在大数据集上训练好的CNN网络模型model1
  3. 微调: 利用标记好的样本,输入到model1当中,继续训练,得出model2

在这里插入图片描述

R-CNN的测试过程

  1. 输入一张图片,利用selective search得到2000个region proposal
  2. 对说有的region proposal变换得到固定尺寸,并作为预训练好的CNN网络输入,每个候选框得到4096的特征
  3. 对已经训练好的每个类别的svm分类器对提取到的特征打分,所以SVM的weight matrix是4096 N,N是类别数
  4. 采用NMS(非极大抑制)去除候选框
  5. 得到region proposal进行回归预测,微调

R-CNN在VOC2007数据集上平均精确度达到66%

缺点:
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

SSD目标检测算法原理(上) 的相关文章

随机推荐

  • 系统地址和服务器地址不一致,服务器和ip地址不一致t3

    服务器和ip地址不一致t3 内容精选 换一换 输入AK SK后 已经确认AK SK内容准确 但仍然认证失败 界面报错关键信息如下 查看 root MindStudioMS 2 3 system log idea log 有如下日志报错 从日
  • 有符号数的四舍五入(round)(verilog实现)

    有符号数的表达方式见上篇 有符号小数的表示 扩展和计算 weixin 42330305的博客 CSDN博客 对于有符号数 正数和负数的四舍五入有些许不同 需要区别对待 一 正数 对于正数来说 如果被截掉的数的最高位为1 则结果为保留的数 1
  • 【分析方法】A/B test

    A B测试是什么 怎么做 有什么作用呢 本篇文章为大家分享了几种应用场景及案例 告诉大家如何在团队中有效推进A B测试 一 A B测试 为了检测某些用户到底属于哪一类别 我们定制了A类用户喜欢的产品和B类用户喜欢的产品 统计并对比了不同方案
  • 给jupyter添加多个python版本的kernel

    两种方法 1 想添加的python版本已存在 1 通过ipykernel为jupyter添加python环境 activate env name python m ipykernel install name env name 2 关闭py
  • Windows安装Anaconda,创建pytorch环境,pycharm配置环境

    目录 1 简介 2 安装Anaconda 3 创建一个独立的环境 4 安装依赖的库 5 安装pytorch 6 pycharm中使用conda环境 7 到这里安装就结束了 希望对您有所帮助 如有什么错误请指正 1 简介 安装Anaconda
  • C++:重载

    一 重载 重载 重载函数是函数的一种特殊情况 为方便使用 C 允许在同一范围中声明几个功能类似的同名函数 但是这些同名函数的形式参数 指参数的个数 类型或者顺序 必须不同 也就是说用同一个函数完成不同的功能 重载函数常用来实现功能类似而所处
  • git fatal: unable to access  Failed to connect to localhost port 1080: Connection refused

    git 拉取 更新子模块失败 提示失败 Submodule libXesBase https git xxxxx com xesoa libXesBase git registered for path libXesBase Cloning
  • 整合google,51ditu和mapbar的地图API

    http blog 163 com goodluck lq 126 blog static 63285386201001994058213
  • Java中的异常处理机制的简单原理和应用。

    异常是指java程序运行时 非编译 所发生的非正常情况或错误 与现实生活中的事件很相似 现实生活中的事件可以包含事件发生的时间 地点 人物 情节等信息 可以用一个对象来表示 Java使用面向对象的方式来处理异常 它把程序中发生的每个异常也都
  • 基于STM32F103单片机的车牌识别图像处理识别系统 原理图PCB程序设计

    硬件电路的设计 末尾附文件 系统硬件系统分析设计 1 STM32单片机核心电路设计 STM32系列处理器是意法半导体ST公司生产的一种基于ARM 7架构的32位 支持实时仿真和跟踪的微控制器 选择此款控制芯片是因为本系统设计并非追求成本的最
  • React通过axios拿到数据后,使用hooks,通过map函数对列表进行渲染

    导入hooks 导入你封装的http模块 引入样式 import React useEffect useState from react import http from API import index scss 默认导出一个函数组价 并
  • C#学习记录——.NET的三层架构

    每一个不曾起舞的日子 都是对生命的辜负 尼采 每一个不读书的的日子 都是对时光的辜负 今天学习 零基础学C 3 0 NET的三层架构 为了实现大型应用系统后续功能的扩展性和程序的灵活性 NET编程语言借鉴了JAVA的MVC思想 产生了三层架
  • MySQL - 第9节 - MySQL内外连接

    目录 1 内连接 2 外连接 2 1 左外连接 2 2 右外连接 3 简单案例 1 内连接 表的连接分为内连接和外连接 内连接实际上就是利用where 子句对两种表形成的笛卡儿积进行筛选 我们前面学习的查询都是内连接 也是在开发过程中使用的
  • Markdown语法--Obsidian笔记

    Markdown 语法 笔记 文章目录 Markdown 语法 笔记 语法分类 文字层级类 1 标题 2 段落 3 区块引用 4 代码区块 5 列表 6 待办事项 文字格式类 1 样式 2 表格 链接引用类 1 链接 2 图片 3 脚注 4
  • Dubbo与Spring Cloud的区别

    这是个老生常谈的问题 每个技术团队在业务转型微服务化架构的时候都会纠结过这个选型问题 首先 dubbo 之前确实在 2012 年的时候发布了最后一个版本 2 5 3 并且停止维护更新 在2017年的时候又 起死回生 官方宣布重启更新 并重点
  • 2021图像检索综述

    论文地址 Deep Image Retrieval A Survey 本文是2021年最新的关于图像检索的综述 介绍了基于内容的图像检索 content based image retrieval CBIR 在深度学习技术上的进展 目录 0
  • Traceback (most recent call last): File “D:/python_workspace/hello.py“, line 3, in <module>

    错误背景 python的初学者 在学习多行语句 错误信息如下 错误原因 变量有字符串类型 有整型类型 有浮点型 在java 里面 String标识字符串类型 Int标识整型 在python里面 a yy1 就是字符串类型 a 1就是数字类型
  • 29_content 阶段的concat 模块

    文章目录 提升性能 content 阶段的 caoncat 模块 concat 模块的指令 示例配置 提升性能 content 阶段的 caoncat 模块 功能 当页面需要访问多个小文件时 把它们内容合并到一次http 响应中返回 提升性
  • 数组排序的方法?

    1 sort排序 let arr 1 2 3 4 5 6 7 8 9 0 9 8 7 6 3 4 5 5 var res console log arr 排序前 1 2 3 4 5 6 7 8 9 0 9 8 7 6 3 4 5 5 arr
  • SSD目标检测算法原理(上)

    目录 一 目标检测概述 1 1 项目演示介绍 1 2 图片识别背景 1 3 目标检测定义 二 目标检测算法原理 2 1 任务描述 2 2 目标检测算法必备基础 2 3目标检测算法模型输出 目标检测 overfeat模型 R CNN模型 候选