基于深度学习场景分类算法

2023-05-16

目前出现的相对流行的场景分类方法主要有以下三类：

（1）基于对象的场景分类：

这种分类方法以对象为识别单位，根据场景中出现的特定对象来区分不同的场景；

基于视觉的场景分类方法大部分都是以对象为单位的，也就是说，通过识别一些有

代表性的对象来确定自然界的位置。典型的基于对象的场景分类方法有以下的中间步骤：

特征提取、重组和对象识别。

缺点：底层的错误会随着处理的深入而被放大。例如，上位层中小对象的识别往往会受到下属层

相机传感器的原始噪声或者光照变化条件的影响。尤其是在宽敞的环境下，目标往往会非常分散，

这种方法的应用也受到了限制。需要指出的是，该方法需要选择特定环境中的一些固定对

象，一般使用深度网络提取对象特征，并进行分类。

算法：AlexNet。

                除了传统的卷积层、pooling层、全连接层。AlexNet加入了

                （1）非线性激活函数：ReLU；

                （2）防止过拟合的方法：Dropout，Dataaugmentation。同时，使用多个GPU，LRN归一化层。

算法：VGG-Net。

                不同于AlexNet的地方是：VGG-Net使用更多的层，通常有16－19层，而AlexNet只有8层。

                同时，VGG-Net的所有 convolutional layer 使用同样大小的 convolutional filter，大小为 3 x 3。

算法：GoogLeNet。

提出的Inception结构是主要的创新点，这是（Network In Network）的结构，即原来的结点也是一个网络。

在单层卷积层上使用不同尺度的卷积核就可以提取不同尺寸的特征，单层的特征提取能力增强了。其使用之后整个网络结构的宽度和深度都可扩大，能够带来2-3倍的性能提升。

算法：ResNet。

ResNet引入了残差网络结构（residual network），通过在输出与输入之间引入一个shortcut connection,而不是简单的堆叠网络，这样可以解决网络由于很深出现梯度消失的问题，从而可可以把网络做的很深。这种方法目前也是业界最高水准了。

（2）基于区域的场景分类；

首先通过目标候选候选区域选择算法，生成一系列候选目标区域，

      然后通过深度神经网络提取候选目标区域特征，并用这些特征进行分类。

算法：RCNN

      技术路线：selective search + CNN + SVMs



      算法：Fast-R-CNN

      步骤：输入一幅图像和Selective Search方法生成的一系列Proposals，通过一系列卷积层

                和Pooling层生成feature map,然后用RoI（region ofineterst）层处理最后一个卷积层

                得到的feature map为每一个proposal生成一个定长的特征向量roi_pool5。

                RoI层的输出roi_pool5接着输入到全连接层, 产生最终用于多任务学习的特征并用于

计算多任务Loss。

                全连接输出包括两个分支：

1.SoftMax Loss:计算K+1类的分类Loss函数，其中K表示K个目标类别。

                2.RegressionLoss:即K+1的分类结果相应的Proposal的Bounding Box四个角点坐标值。

                最终将所有结果通过非极大抑制处理产生最终的目标检测和识别结果。



      算法：Faster-R-CNN：

                Faster-R-CNN算法由两大模块组成：1.PRN候选框提取模块 2.Fast R-CNN检测模块。

                其中，RPN是全卷积神经网络，通过共享卷积层特征可以实现proposal的提取；

                FastR-CNN基于RPN提取的proposal检测并识别proposal中的目标。

（3）基于上下文的场景分类：

这类方法不同于前面两种算法，而将场景图像看作全局对象而非图像中的某一对象或细节，

这样可以降低局部噪声对场景分类的影响。

将输入图片作为一个特征，并提取可以概括图像统计或语义的低维特征。该类方法的目的

即为提高场景分类的鲁棒性。因为自然图片中很容易掺杂一些随机噪声，这类噪声会对

局部处理造成灾难性的影响，而对于全局图像却可以通过平均数来降低这种影响。

基于上下文的方法，通过识别全局对象，而非场景中的小对象集合或者准确的区域边界，

因此不需要处理小的孤立区域的噪声和低级图片的变化，其解决了分割和目标识别分类方法遇到的问题。

算法：基于Gist的场景分类

步骤：通过 Gist 特征提取场景图像的全局特征。Gist 特征是一种生物启发式特征，

      该特征模拟人的视觉，形成对外部世界的一种空间表

      示，捕获图像中的上下文信息。Gist 特征通过多尺度

      多方向 Gabor 滤波器组对场景图像进行滤波，将滤波后

      的图像划分为 4 × 4 的网格，然后各个网格采用离散傅

      里叶变换和窗口傅里叶变换提取图像的全局特征信息。

     

      用CNN 进一步学习更深层次的特征，并在 CNN 最高层进行场景分类

作者：ccj_zj
来源：CSDN
原文：https://blog.csdn.net/ccj_ok/article/details/74157414
版权声明：本文为博主原创文章，转载请附上博文链接！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

基于深度学习场景分类算法的相关文章

【Linux operation 46】Centos 7.9中安装使用nmap

1 nmap 介绍 nmap xff08 Network Mapper xff09 是一个开源的网络探测和安全扫描程序 nmap 的设计目标是快速地扫描大型网络 xff0c 当然用它扫描单个主机也没有问题 nmap 以新颖的方式使用原始 I
Nginx配置ssl证书

1 下载证书在ssl证书管理界面下载对应于Nginx的证书下载的Nginx证书压缩文件解压后包含 xff1a pem xff1a 证书文件 PEM文件的扩展名为CRT格式 key xff1a 证书的密钥文件申请证书时如果未选择自动创建
0009基于51单片机智能门禁系统设计

资料下载地址单片机原理教程初级 xff08 视频 xff0c 源仿真源代码 xff09 功能 60 可输入密码进行解锁可以对IC卡进行注册或注销可用已注册的IC卡解锁可实现液晶显示当前时间密码连续输错三次时能强制退出并报警具有
基于openstreetmap数据的SUMO路网生成路线

一一步到位 xff1a 基于SUMO自带工具smWebWizard py 使用SUMO自带的osmWebWizard py脚本 xff08 sumo tools xff09 进行下载 xff0c 脚本执行后会打开一个操作网页 xff0c
STM32烧写一次程序后，再次烧写识别不到单片机

STM32cubeMX生成的程序 xff0c 编译后烧录一次后 xff0c 在次烧录会发现识别不到单片机了 xff0c 解决方案 xff1a 在STM32cubeMX工程中的SYS中 xff0c Debug中选择Serial Wire 使能
百度超级链学院开课啦！第一讲教你《如何快速建链》

百度超级链Xuperchain开源之后 xff0c 我们感受到了开发者伙伴们的热情关注 xff0c 其中有不少朋友提到希望进一步了解百度超级链网络的搭建方法今天 xff0c 百度超级链小X姐姐和百度资深研发工程师静姐姐 xff0c 为大家
centos7操作/关闭防火墙

前言 xff1a 测试环境部署不同端口的服务 xff0c 需要频繁使用防火墙放行端口 xff0c 比较麻烦 xff0c 所以需要彻底关闭防火墙 xff0c 整理了以下命令 xff0c 提供使用 systemctl status firewa
[kubernates]kube-flannel-ds 一直 CrashLoopBackOff

使用 Kubeadm 安装 K8s 集群 xff0c 在安装 flannel 网络插件后 xff0c 发现 kube flannel ds 一直处于 CrashLoopBackOff 状态 xff1a span class token pu
Bottom-up And Top-down

Bottom up 自下而上的处理可以理解为 xff1a 将感应器结果作为输入 xff0c 也就是激励因此自下而上可以被描述为是数据驱动的例如 xff0c 在一个人的花园正中有一朵花儿 xff0c 这个花儿的视觉和所有的激励信息都从视网
pyqt5在statusbar中不断的刷新显示不同的信息

在PYQT5中不断的显示新的信息需求 xff1a 需要在statusbar 上不断的显示新的测试数据现在在测试例子中 xff0c 数据由numpy生成总结如下 xff1a span class token comment coding
如何在VS下调试自己写的dll

一准备资料 1 qt写的应用程序 test pro xff0c 编译程序可执行文件test exe 2 qt写的动态库程序 dll pro 二调试步骤 1 用vs打开dll pro 2 dll工程右键属性如下图所示修改 3 编译运行dl
通俗理解网络架构搜索（NAS）

什么是NAS 我们假设模型必须是一个三层的全连接神经网络 xff08 一个输入层一个隐层一个输出层 xff09 xff0c 隐层可以有不同的激活函数和节点个数 xff0c 假设激活函数必须是relu或sigmoid中的一种 xff0c
GDB 的进入和退出

进入和退出GDB 本节讨论如何启动和退出GDB 主要包括 xff1a 输入 39 gdb 进入GDB调试器输入quit或者按下Ctrl d退出调用GDB xff1a 如何启动GDB退出GDB xff1a 如何退出GDBShell脚本命令 x
OpenGL 矩阵变换GLM库的使用

GLM和MVP矩阵操作速记连续工作15小时 xff0c 累了 xff0c 睡觉 include glm glm hpp include glm gtc matrix transform hpp 若未特别说明 xff0c 以下示例均假设矩阵
通俗理解RNN

全连接神经网络和卷积神经网络他们都只能单独的取处理一个个的输入 xff0c 前一个输入和后一个输入是完全没有关系的但是 xff0c 某些任务需要能够更好的处理序列的信息 xff0c 即前面的输入和后面的输入是有关系的比如 xff0c 当
基于深度学习的视频检测（一）

一简介图像目标检测任务在过去几年深度学习的发展背景下取得了巨大的进展 xff0c 检测性能得到明显提升但在视频监控车辆辅助驾驶等领域 xff0c 基于视频的目标检测有着更为广泛的需求由于视频中存在运动模糊 xff0c 遮挡 xff
硬核解读 | 一篇文章看透百度XuperChain系统架构

本期百度超级链学院邀请来资深研发工程师 xff0c 为各位开发者带来超硬核解读 xff0c 揭秘百度XuperChain系统架构到底是怎样的 xff01 背景百度XuperChain在2019年5月底正式宣布开源在开源后很快获得了开
基于深度学习的视频检测（三）目标跟踪

搭建环境 Ubuntu16 04 43 CUDA9 43 cudnn7 43 python3 5 43 源码编译Tensorflow1 4 43 opencv3 3 基于 darkflow yolo v2 和 sort deep sort
基于深度学习的视频检测（六）行人计数，监控视频人员管理

搭建 darkflow与 sort deep sort 环境修改 darkflow net yolov2 predict py span class hljs keyword import span numpy span class hl
C++面试设计模式之单例模式（C++11）

单例模式确保一个类只有一个实例 xff0c 并提供了一个全局访问点单例模式 xff0c 可以说设计模式中最常应用的一种模式了 xff0c 据说也是面试官最喜欢的题目但是如果没有学过设计模式的人 xff0c 可能不会想到要去应用单例模式

随机推荐

异常检测 Deep One-Class Classification

ICML 2018 参考 https www zhihu com question 22365729 answer 115048306 https zhuanlan zhihu com p 32784067 https blog csdn
TensorFlow和Keras解决数据量过大内存溢出

将上万张图片的路径一次性读到内存中 xff0c 自己实现一个分批读取函数 xff0c 在该函数中根据自己的内存情况设置读取图片 xff0c 只把这一批图片读入内存中 xff0c 然后交给模型 xff0c 模型再对这一批图片进行分批训练 xf
LQ-Nets: Learned Quantization for Highly Accurate and Compact Deep Neural Networks

ECCV 2018 ABSTRACT 虽然权重和激活值的量化是深度神经网络 xff08 DNN xff09 压缩的有效方法 xff0c 并且具有很大的潜力来提高利用位操作的推理速度 xff0c 但是在量化模型和full precision模
关于事件的理解

以前的时候 xff0c 事件这个东西虽然说是经常用 xff0c 但是没有真正意义上去理解它 xff0c 为什么要用事件 xff0c 事件有什么好处 xff0c 明明可以直接用方法实现为什么还要去用事件 xff0c 说到底 xff0c 事件就
Maven打包常见问题

Maven打包常见问题 1 Maven 打包时无法将scope为system的jar文件打包进war和jar中分析问题通过对maven打包的生命周期进行分析在package阶段未将scope为system的jar打包到war或者ja
VS2015 无法启动程序“***\\***.exe” 系统找不到指定的文件

问题 xff1a 无法启动程序 exe 系统找不到指定的文件解决方案 xff1a 将链接器 gt 常规 gt 输出文件中的内容手动改为 OutDir Target Name TargetExt 或者选择 lt 从父级或项目默认设置继承 g
VS2015 MFC 类向导 “未将对象引用设置到对象的实例”

问题描述 xff1a MFC工程跨机器移动后 xff0c 使用类向导 xff0c 提示 34 未将对象引用设置到对象的实例 34 解决方法 xff1a 删除MFC工程中的 vs目录
qt 编译运行步骤

1 先qmake 由 pro文件生成Makefile文件到构建目录 xff0c makefile文件保存了编译器和连接器的参数选项还表述了所有源文件之间的关系源代码文件需要的特定的包含文件可执行文件要求包含的目标文件模块及库等构建
VS2015 插件

Visual Assist 代码颜色 xff0c 关键字高亮 Inden Guides Mode 缩进辅助线 FeinBrace 括号跳转 Toggle Comment 快速注释解除注释
VS内存泄漏定位方法

内存泄漏检测宏定义 ifdef DEBUG define DEBUG CLIENTBLOCK new CLIENT BLOCK FILE LINE else define DEBUG CLIENTBLOCK endif DEBUG defi
tar: 由于前次错误，将以上次的错误状态退出

问题描述 tar cvfz test tar gz test tar test tar gz xff1a 无法 stat 没有那个文件或目录 test rwt tar 由于前次错误 xff0c 将以上次的错误状态退出原因分析 xff1a
VSCode登录Microsoft账户无效

现象经过上述两步 xff0c 并没有弹出登录界面解决方法 xff1a 使用腾讯电脑管家电脑诊所 IE浏览器出错崩溃修复后重新执行上述两步 xff0c 可以正常登录
Qt munmap_chunk(): invalid pointer

现象 xff1a 软件退出时报munmap chunk invalid pointer 产生原因 xff1a 单例了窗口采用的静态变量写法并且把单例的窗口添加到了另一个窗口中软件退出时 xff0c 父窗口析构了单例的窗口 Qt的对象管理
node.js 跨域访问

配置 node js http server启动方式 http span class token operator span server span class token operator span p span class token
Linux修改系统编码方法总结

Linux系统安装后 xff0c 发现中文显示乱码因为系统编码为en US UTF 8 xff0c 应改为支持中文的编码 xff08 即zh CN UTF 8 xff09 检查系统编码英文环境如下 xff1a root 64 local
std::cout输出十六进制数据

std vector lt uint8 t gt data 0x11 0x22 0x33 0x99 0xff std ofstream ofs 34 test txt 34 std ios app for int i 61 0 i lt d
ubuntu 缺少lsusb lspci insmod等

lsusb gt usbutils lspci gt pciutils insmod gt module init tools
hexo知识点

配置环境安装Node xff08 必须 xff09 作用 xff1a 用来生成静态页面的到Node js 官网下载相应平台的最新版本 xff0c 一路安装即可安装Git xff08 必须 xff09 作用 xff1a 把本地的hexo
安装Ubuntu下的开发工具

安装Ubuntu下的开发工具安装Ubuntu下的开发工具刚安装好的Ubuntu xff0c 还缺乏很多开发工具这些工具都可以通过网络进行安装如果网络不佳 xff0c 也可以使用光盘中的工具包如果要使用光盘中的工具包 xff0c 先
基于深度学习场景分类算法

目前出现的相对流行的场景分类方法主要有以下三类 xff1a xff08 1 xff09 基于对象的场景分类 xff1a 这种分类方法以对象为识别单位 xff0c 根据场景中出现的特定对象来区分不同的场景 xff1b 基于视觉的场景分类方法大

基于深度学习场景分类算法

基于深度学习场景分类算法 的相关文章

随机推荐

热门标签

基于深度学习场景分类算法的相关文章