卷积神经网络&目标检测

2023-11-06


一、Inception网络

一般来说,提升网络性能最保险的方法就是增加网络的宽度和深度,这样做同时也会伴随着副作用。首先,越来越深的网络有着巨大的参数量,数据量很少的时候会出现过拟合,并且当网络深度很深的时候,很容易造成梯度消失。Inception网络可以解决这两个问题。

1、Inception网络基本思想

在这里插入图片描述
有多个卷积层结构和Pooling结构,利用了padding的原理,让经过这些结构的最终结果大小不变。
多个Inception层组合在一起,就构成了Inception网络,但是这样计算量很大,所以下面使用1*1卷积核来降低计算量。

2、采用1×1卷积降低计算量

在这里插入图片描述
**包含11的卷积模块:**参数量为1125632+553264=59392个参数,连接数为((11256+1)32nn+(5532+1)64nn)=59488nn个
**不包含1
1的卷积模块:**参数量为5525664=409600个,连接数为(55256+1)64nn=409664nn个

3、Inception模块和Inception网络

在这里插入图片描述
Inception网络是由上面的Inception模块一环接一环构成。其中有时候还会包含输出端的全连接层,还有中间层引出多个输出,在连接softmax,这样可以减少过拟合。
在这里插入图片描述

二、迁移学习

可以从开源网站下载代码和权重,已经有许多训练好的模型可以利用,可以采用冻结前几个层的方法,将后面的层换位自己的隐藏层和softmax输出层。随着数据数据数目增多,可以训练更多的层次。也可以选取权重,作为自己的初始化权重。

三、数据扩充方法

1、镜像对称
2、随机修剪、旋转、局部扭曲
3、色彩转换

四、目标检测

在一张图片中,不仅仅要判断是否有目标物体,而且需要用框框选出。
利用神经网络进行对象定位,即通过输出四个参数值bx、by、bh和bw给出图片中对象的边界框。
概括地说,神经网络可以通过输出图片上特征点的(x,y)坐标来实现对目标特征的识别
在这里插入图片描述

1、特征点检测

构建一个人脸识别应用,希望算法可以给出眼角的具体位置,眼角坐标为(x,y),可以让神经网络的最后一层多输出两个数字 x和y,作为眼角的坐标值.
在这里插入图片描述

2、通过卷积网络进行对象检测

基于滑动窗口的目标检测算法

1、创建一个标签训练集,对于训练集的期望,一开始可以使用适当剪切的图片,让目标物体尽可能充满整个图片。
2、训练卷积网络。
3、可以用其来实现滑动窗口目标检测
具体步骤:
(1)选定一个特定大小的窗口,如下图。判断红色方框内是否有汽车。
(2)移动这个窗口,再次输入给卷积网络,输入给卷积网络的只有红色方框内的区域。重复操作。每个窗口位置按0或1进行分类。
在这里插入图片描述
缺点:计算成本过大,窗口一个一个进入卷积网络进行处理,计算数量巨大。

3、如何将全连接层转化为卷积层

全连接层:
在这里插入图片描述
卷积层:(优点:提高了算法的效率,缺点:边界框的位置可能不够准确)
在这里插入图片描述
在这里插入图片描述
可以不用连续的卷积操作来识别图片中的汽车,例如可以用大小为28*28的整张图片进行卷积操作,一次得到所有的预测值。

4、Yolo算法初步学习

在这里插入图片描述
判断对象是否在这个格子里面,是观察对象中点,将对象分配到中点所在的格子内。
优点:神经网络可以输出精确的边界框 ,不会受滑动框的步长限制。并且是卷积实现,没有将每个格子都跑一边程序。可以达到实时识别。
限制:每个格子的对象最多有一个
参数表示:
bx,by 目标对象相对于本格子左上角的坐标,[0,1]
bh,bw 红色框的长宽,可能>1

5、交并比(loU)——评价对象定位算法

loU(交并比)函数:
计算两个边界框交集和并集之比
评价标准:
一般情况,IoU >= 0.5 (人为规定)检测正确,反之错误。
在这里插入图片描述

6、非最大值抑制

算法可能对同一个对象作出多次检测,所以算法不是对某个对象检测出一次,而是检测出多次,非最大值抑制可以确保算法对于每个对象只检测一次

选取最高IoU值的矩阵,然后去掉其他IoU值较高(大于事先规定的IoU的界值)的矩阵
多个对象就要独立进行多次非最大值一直

7、Anchor Boxes

前面每个格子只能检测出一个对象,下面采用AnchorBox来处理一个格子多个对象的情况。
在这里插入图片描述

8、YOLO算法

在这里插入图片描述
非最大值抑制:
如果采用两个Anchor box 那么对于每一个都会有两个预测的边界框。其中一个P很低;下面抛弃概率低的预测,对于每个对象类别都要单独运行非最大值抑制。最终可以得到结果。

9、R-CNN算法 带区域的卷积网络

这个算法尝试选出一些区域,在这些区域上运行卷积网络分类器是有意义的,所以不再针对每一个滑动窗口跑检测算法,只是选择少数窗口上运行卷积网络分类器。
选择方法:
运行图像分割算法,在存在色块的地方运行卷积网络分类器
缺点:速度很慢
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

卷积神经网络&目标检测 的相关文章

  • idea导入本地jar编译提示找不到jar报包问题(gradle)

    问题描述 使用springboot项目 gradle依赖管理 在进行本地项目测试时 由于需要导入本地jar进行运行测试 在idea项目依赖中以引入此jar 编译运行时提示找不到符号 此时代码不提示报错 尝试直接在gradle中引入本地依赖的
  • 补码计算在计算机上的优点和缺点,相对于原码和反码,补码表示法有什么优点和缺点...

    2016 08 13 回答 原码表示法是机器数的一种简单的表示法 其符号位用0表示正号 用 表示负号 数值一般用二进制形式表示 机器数的反码可由原码得到 如果机器数是正数 则该机器数的反码与原码一样 如果机器数是负数 则该机器数的反码是对它
  • NLP实战

    为了预测电影评分 我们收集了豆瓣电影网站上2 8万名用户对5万多部电影的280万条评论 真实目的 其实是为了让大家能够通过这次的教程 更加了解自然语言处理 所以 使用电影评论来预测电影评分 到底需要分几步 项目简介 本项目只使用电影评论来预
  • 【牛客SQL】SQL24 获取所有非manager员工当前的薪水情况

    题目描述 描述 有一个员工表employees简况如下 有一个 部门员工关系表dept emp简况如下 有一个部门经理表dept manager简况如下 有一个薪水表salaries简况如下 获取所有非manager员工薪水情况 给出dep
  • DVWA暴力破解(安全等级high)

    条件 靶机地址 http 192 168 126 130 vulnerabilities brute 使用工具 burp suite v2 1 05 以爆破admin用户为目标 分析 我们先抓一个登录包看看 我们可以看到同前两个等级 这个传

随机推荐

  • Power BI矩阵格式设置

    Power BI矩阵格式设置13招
  • solidwork软件安装显示失败问题处理

    solidworks正版软件是由美国达索系统公司推出的一款集3D CAD设计软件 分析软件和产品数据管理等功能于一身的系统 由于功能过于丰富和好用 经常被人们用于工业设备零件 钣金与焊接设计 工程制图建模 机械模型设计等行业领域 那么在安装
  • centos7设置密码策略_CentOS7 设置密码复杂度

    在CentOS下设置密码复杂度分为两步 1 修改 etc login defs文件 vim etc login defs PASS MAX DAYS 90 密码最长过期天数 PASS MIN DAYS 80 密码最小过期天数 PASS MI
  • 三维刚体变换

    欢迎访问我的博客首页 三维刚体变换 1 坐标系 1 1 空间坐标系 1 2 右手坐标系与像素坐标系 2 旋转与平移 2 1 推导旋转 2 2 推导平移 2 3 推导变换 2 4 刚体变换 2 5 坐标系旋转与向量旋转 3 链式变换 4 Ei
  • KNOWLEDGE SOLVER: TEACHING LLMS TO SEARCH FOR DOMAIN KNOWLEDGE FROM KNOWLEDGE GRAPHS

    本文是LLM系列文章 针对 KNOWLEDGE SOLVER TEACHING LLMS TO SEARCH FOR DOMAIN KNOWLEDGE FROM KNOWLEDGE GRAPHS 的翻译 知识求解器 教LLMS从知识图谱中搜
  • 启动Tomcat时,出现Port 8080 required by Tomcat v8.0 Server at localhost is already in use.这样的提示解决方法

    在遇到问题的时候 首先我们应该粗略的阅读一下提示大致是什么意思 提示大概意思就是我们Tomcat服务器需要用的8080端口 现在已经正在被使用 所以当我们要启动Tomcat的时候 我们就需要将此端口进行释放 解决方法 第一步 确定端口号 确
  • 2022年3月20日-2022年3月26日(按照方案B,本周17小时,合计1236小时,剩8764小时。)

    因为编辑器上视频教程快学完了 而好多公司会做编辑器就可以了 可以学完后面面了 所以 这周仍然进行方案A 上周进度ue4视频教程mysql 1 1 tf1 2 1 oss 4 2 simpleThread 1 2 editor1 3 3 继续
  • 一次编辑多平台发布的终极解决方案(基于Markdown)

    导读 利用markdown语法 让更多的博客作者能够专注于写作本身 而不会因为各种设置打乱了创作的思绪 本文首先简单介绍markdown的编辑器Typora 接着描述了怎么通过Typora的代码模式将编辑好的文件发布到csdn和微信公众号
  • ajax传回的数据不显示,ajax请求返回的数据显示不出来?求教

    出现问题 PHP代码
  • 分布式事务与锁

    事务基础概念 事物的回顾 事务的定义 是数据库的操作的最小工作单元 是作为单个逻辑工作单元执行的一系列操作 这些操作作为一个整体一起向系统提交 要么都执行 要么都不执行 事务是一组不可在分割的操作集合 事务的ACID原则 事务具有四个基本特
  • 从程序员到项目经理:项目管理三大目标

    项目管理的三大目标即时间 成本和质量 实际是告诉项目经理应重点关注什么因素 项目控制应该做什么工作 三大目标虽然简单 但如果能将其真正贯彻 到自己的行动中 那么对项目计划制定 过程控制等工作 均能起到引导作用 有了努力的方向 项目经理也就可
  • Kali2022安装Nessus——Docker版

    下载镜像并且创建Nessus容器 root kali docker run itd name ramisec nessus p 8834 8834 ramisec nessus 更新nessus插件 root kali docker exe
  • Coding-数组(Array)

    数组 Array 面试中最常见的就是围绕数组进行出题 主要原则数组可以随机读取 一般遇到数组相关的题目 都不是直观看到的那样 第一步暴力解法 第二步是否可以排序 是否可以二分 是否可以使用数据结构 哈希表 队列 栈等 要时刻注意一个数组中有
  • 经典神经网络( AlexNet,VggNet,NiN,GoogLeNet,ResNet)

    卷积神经网络演化史 AlexNet 模型结构 贡献 ReLU激活函数 分布式GPU运算 LRN 局部响应归一化 提高泛化能力 重叠池化 池化窗的步长小于池化层的大小 在池 化时产生重叠 正则化方法 数据集增强 dropout 随机关闭神经元
  • Powershell:如何创建自定义对象,以及如何给自定义对象添加属性和方法

    还记得我刚学会使用PowerShell的时候 那种兴奋和幸福感 终于找到了在Windows下一个强大的Shell 因为他叫Power Shell 可以一边使用着熟悉的Windows桌面系统一边装X的Shell编程了 当我使用它来处理CSV时
  • Qt中的UI文件介绍

    UI文件是什么 u i ui ui通常是指Qt设计师设计出来的界面文件的后缀 它本质上是一个标准XML格式的文本文件 需要通过 u i
  • 前端moment库时间戳转标准时间不准确的问题解决

    做前端项目的时候 根据后台返回的一个时间戳 将时间戳需要转换成标准时间 因为项目中有moment这个时间处理包 而且moment对于时间的转换比较强大 可以根据特定的格式进行转换 最终将时间戳转换成 年 月 日 时 分 秒 这种形式 但是转
  • SpringQueryMap -SpringCloud feign get method 接受自定义对象参数

    feign中和controller中不一样的地方 controller中可以get方法使用对象参数无需任何注解 可默认绑定到对象 示例代码如下 GetMapping value ClueClient LIST OPERATIONS publ
  • J2EE基础集合框架之Set

    前言 上次与大家介绍了集合框架的LIst集合 List集合的特点的是元素有序且可重复 今天与大家分享的是也是一种集合 叫做Set集合 他和List集合是相反的 今天我们就一起去探究Set集合 首先跟思维导图来了解我今天要分享的内容吧 说明
  • 卷积神经网络&目标检测

    卷积神经网络 目标检测 一 Inception网络 1 Inception网络基本思想 2 采用1 1卷积降低计算量 3 Inception模块和Inception网络 二 迁移学习 三 数据扩充方法 四 目标检测 1 特征点检测 2 通过