关于深度残差网络（Deep residual network, ResNet）

2023-11-16

深度残差网络：

深度残差网络的设计就是为了克服这种由于网络深度加深而产生的学习效率变低，准确率无法有效提升的问题（也称为网络退化）。

甚至在一些场景下，网络层数的增加反而会降低正确率。这种本质问题是由于出现了信息丢失而产生的过拟合问题（overfitting，所建的机器学习模型或者是深度学习模型在训练样本中表现的过于优越，导致在验证数据集及测试数据集中表现不佳，即为了得到一致假设而使假设变得过度复杂）。解决思路是尝试着使他们引入这些刺激的差异性和解决泛化能力为主。

Residual net(残差网络)：

将前若干层的数据输出直接跳过多层而引入到后面数据层的输入部分。

后面的任何一层向量的内容会有一部分由其前面的某一层线性贡献。
在这里插入图片描述
进入正文：

ResNet在2015年被提出，在ImageNet比赛classification任务上获得第一名，因为它“简单与实用”并存，之后很多方法都建立在ResNet50或者ResNet101的基础上完成的，检测，分割，识别等领域都纷纷使用ResNet，Alpha zero也使用了ResNet，所以可见ResNet确实很好用。（https://blog.csdn.net/lanran2/article/details/79057994 ）

ResNet的意义：

随着网络的加深，出现了训练集准确率下降的现象，我们可以确定这不是由于Overfit过拟合造成的(过拟合的情况训练集应该准确率很高)；所以作者针对这个问题提出了一种全新的网络，叫深度残差网络，它允许网络尽可能的加深。

残差是指什么？

其中ResNet提出了两种mapping：一种是identity mapping，指的就是上图中”弯弯的曲线”，另一种residual mapping，指的就是除了”弯弯的曲线“那部分，所以最后的输出是 y=F(x)+x

identity mapping顾名思义，就是指本身，也就是公式中的x，而residual mapping指的是“差”，也就是y−x，所以残差指的就是F(x）部分。

理论上，对于“随着网络加深，准确率下降”的问题，Resnet提供了两种选择方式，也就是identity mapping和residual mapping，如果网络已经到达最优，继续加深网络，residual mapping将被push为0，只剩下identity mapping，这样理论上网络一直处于最优状态了，网络的性能也就不会随着深度增加而降低了。
ResNet的结构：

它使用了一种连接方式叫做“shortcut connection”，顾名思义，shortcut就是“抄近道”的意思
在这里插入图片描述
这是文章里面的图，我们可以看到一个“弯弯的弧线“这个就是所谓的”shortcut connection“，也是文中提到identity mapping，这张图也诠释了ResNet的真谛，当然大家可以放心，真正在使用的ResNet模块并不是这么单一，文章中就提出了两种方式：
这两种结构分别针对ResNet34（左图）和ResNet50/101/152（右图），一般称整个结构为一个”building block“。其中右图又称为”bottleneck design”，目的一目了然，就是为了降低参数的数目，第一个1x1的卷积把256维channel降到64维，然后在最后通过1x1卷积恢复，整体上用的参数数目：1x1x256x64 + 3x3x64x64 + 1x1x64x256 = 69632，而不使用bottleneck的话就是两个3x3x256的卷积，参数数目: 3x3x256x256x2 = 1179648，差了16.94倍。
对于常规ResNet，可以用于34层或者更少的网络中，对于Bottleneck Design的ResNet通常用于更深的如101这样的网络中，目的是减少计算和参数量（实用目的）。
ResNet50和ResNet101

这里把ResNet50和ResNet101特别提出，主要因为它们的出镜率很高，所以需要做特别的说明。给出了它们具体的结构：
表2，Resnet不同的结构
首先我们看一下表2，上面一共提出了5中深度的ResNet，分别是18，34，50，101和152，首先看表2最左侧，我们发现所有的网络都分成5部分，分别是：conv1，conv2_x，conv3_x，conv4_x，conv5_x，之后的其他论文也会专门用这个称呼指代ResNet50或者101的每部分。
拿101-layer那列，我们先看看101-layer是不是真的是101层网络，首先有个输入7x7x64的卷积，然后经过3 + 4 + 23 + 3 = 33个building block，每个block为3层，所以有33 x 3 = 99层，最后有个fc层(用于分类)，所以1 + 99 + 1 = 101层，确实有101层网络；
注：101层网络仅仅指卷积或者全连接层，而激活层或者Pooling层并没有计算在内；
这里我们关注50-layer和101-layer这两列，可以发现，它们唯一的不同在于conv4_x，ResNet50有6个block，而ResNet101有23个block，差了17个block，也就是17 x 3 = 51层。

基于ResNet101的Faster RCNN

实际的基于ResNet101的Faster RCNN的结构图：
在这里插入图片描述
上图展示了整个Faster RCNN的架构，其中蓝色的部分为ResNet101，可以发现conv4_x的最后的输出为RPN和RoI Pooling共享的部分，而conv5_x(共9层网络)都作用于RoI Pooling之后的一堆特征图(14 x 14 x 1024)，特征图的大小维度也刚好符合原本的ResNet101中conv5_x的输入；
最后大家一定要记得最后要接一个average pooling，得到2048维特征，分别用于分类和框回归。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

resnet

关于深度残差网络（Deep residual network, ResNet）的相关文章

「通信原理」格雷码的生成与破译

通信原理格雷码的生成与破译格雷码 gray code 相邻两数之间只有一个bit发生了改变因此相比于自然编码的二进制系统格雷编码的更不容易出错使用卡诺图化简布尔代数式的时候也会用到格雷码本文将介绍三种格雷码的生成与破译方法即

随机推荐

现代密码学案例研究之索尼PS3破解

ECDSA案例研究之索尼PS3被破解背景介绍 ECDSA算法介绍破解算法介绍 Reference 索尼因为PlayStation 3糟糕的加密实现而受到了黑客的破解那么事情是怎么样的呢设计了哪些密码学的算法呢背景介绍在2010年
STM32HAL库-针对芯片内部EEprom读写操作介绍

目录概述一使用方法二 STM32CubeMx配置三 Examples 四运行结果五总结概述本篇文章介绍如何使用STM32HAL库操作芯片内部EEprom读写数据类似操作Flash 可实现掉电保存数据功能注有些型号
CSS盒模型垂直居中的方式（前提已知宽高情况下）

1 flex布局 box height 300px width 300px border 1px solid 000 margin 50px auto flex布局实现 display flex align items center jus
java串口通讯详解

序言说到开源恐怕很少有人不挑大指称赞学生通过开源代码学到了知识程序员通过开源类库获得了别人的成功经验及能够按时完成手头的工程商家通过开源软件赚到了钱总之是皆大欢喜然而开源软件或类库的首要缺点就是大多缺乏详细的说明文档和使用的例
法兰克机械手手动操作_学习FANUC机器人编程设定，必懂这2个技巧！

原标题学习FANUC机器人编程设定必懂这2个技巧本文由成途机器人编程培训中心推荐多年来 Fanuc工业机器人在全球机器人销量市场份额中一直处于无可撼动的地位尤其是在汽车制造行业在机器人编程培训学习中不同品牌的工业机器人编程设定
动态规划之01背包问题（最易理解的讲解）

01背包问题是用来介绍动态规划算法最经典的例子网上关于01背包问题的讲解也很多我写这篇文章力争做到用最简单的方式最少的公式把01背包问题讲解透彻 01背包的状态转换方程 f i j Max f i 1 j Wi Pi j gt Wi
使用Qt开发VxWorks应用程序

使用Qt开发VxWorks应用程序在嵌入式系统开发中 VxWorks是一款广泛使用的实时操作系统而Qt则是一款跨平台的GUI开发框架可以帮助开发者快速创建漂亮的用户界面和交互式应用程序本文介绍如何使用Qt在VxWorks上开发应用程
IEEE latex会议模版中通讯作者的标注不显示解决方法

在模版备注里有一段说明 conference papers do not typically use thanks and this command is locked out in conference mode If really ne
construct2--仿超级马里奥platform游戏

construct2作为一个简单的游戏制作工具能为你们带来制作游戏的快乐接下来我将讲述一下有关construct中platform游戏的制作学习platform游戏的制作我们就可以轻松的做出类似超级马里奥的游戏了下面我将带来一个制
python3callable使用_Python callable()函数用法实例分析

本文实例讲述了Python callable 函数用法分享给大家供大家参考具体如下 python中的内建函数callable 可以检查一个对象是否是可调用的对于函数方法 lambda 函数式类以及实现了 call 方法的类实例
AllenNLP框架学习笔记（数据篇之tokenizers）

tokenizers是数据模块中的一个子模块在里面主要包含了token与tokenizer的定义和使用现在做一个简单的介绍描述字符串是如何载入到TextFields中的 Token 简单的token抽象其属性包括文本偏移量 pos
单链表的原地逆置—适用于O(1)空间复杂度

单链表的原地逆置一代码二分析三验证一代码先放出代码注表尾指针 r 按需设置在单链表的逆置过程中并不重要 void ReverseList LinkList L LNode r L gt next 建立表尾指针其实可
python中怎样将字符转换成asc编码_Python字符和字符值(ASCII或Unicode码值)转换方法...

这篇文章主要介绍了Python字符和字符值 ASCII或Unicode码值转换方法即把字符串在ASCII值或者Unicode值之间相与转换的方法需要的朋友可以参考下目的将一个字符转化为相应的ASCII或Unicode码或相反的操
【因果推断与机器学习】Causal Inference：Chapter_4_instrument_variables

Instrument Variables Introduction 我们在因果识别中的目标是找到一种方法用可观察的统计关系来表达两个特征之间的因果关系在许多情况下我们可以使用图形假设和do calculus来理清我们对统计关系的观察
如何在Linux下配置nginx以及docker环境

nginx环境的配置环境准备编译 php fpm环境的搭建 docker环境的配置什么是docker 在linux中安装docker nginx环境的配置环境准备我这里使用的是 centos7 以下操作都是在这个环境下进行执行的
JavaScript 逆向调试常用技巧

1 断点调试接下来介绍一个非常重要的功能断点调试在调试代码的时候我们可以在需要的位置上打断点当对应事件触发时浏览器就会自动停在断点的位置等待调试此时我们可以选择单步调试在面板中观察调用栈变量值以更好地追踪对应位置的执行逻
100个python算法超详细讲解：分糖果

1 问题描述 10个小孩围成一圈分糖果老师分给第1个小孩10块第2个小孩2块第3个小孩8块第4个小孩22块第5个小孩16块第6个小孩4块第7个小孩10块第8个小孩6块第9个小孩14块第10个小孩20块然后所有的小孩
【AI视野·今日CV 计算机视觉论文速览第215期】Tue, 8 Jun 2021

AI视野今日CS CV 计算机视觉论文速览 Tue 8 Jun 2021 showing first 100 of 133 entries Totally 100 papers 上期速览更多精彩请移步主页 Daily Computer
一文了解语音合成技术（TTS）

TTS是Text To Speech的缩写即从文本到语音它将计算机自己产生的或外部输入的文字信息转变为可以听得懂的流利的汉语口语或者其他语言语音输出的技术隶属于语音合成 SpeechSynthesis 语音在人类的发展过程
关于深度残差网络（Deep residual network, ResNet）

深度残差网络深度残差网络的设计就是为了克服这种由于网络深度加深而产生的学习效率变低准确率无法有效提升的问题也称为网络退化甚至在一些场景下网络层数的增加反而会降低正确率这种本质问题是由于出现了信息丢失而产生的过拟合问题 overf

关于深度残差网络（Deep residual network, ResNet）

关于深度残差网络（Deep residual network, ResNet） 的相关文章

随机推荐

热门标签

关于深度残差网络（Deep residual network, ResNet）的相关文章