3D机器学习（12）：AlexNet、VGG、GoogNet、Resnet、Densenet、nn.Module、数据增强

2023-05-16

从2010年开始，深度学习开始进入人们视野，2012年的Alexnet是第一个真真意义上的深度网络，尽管只有8层，但其错误率只有16.4%，2015年微软亚洲研究院的何凯明同学的Resnet使得错误率降低至3.57。

AlexNet 人工分配两块GPU，因此上图会有两条路线，但现在都是框架自己主动分配了。使用了11*11的卷积核。7层隐藏层，共8层，60M的参数，训练了1周。现在不会用这种网络结构了，因为太过时了。

VGG是牛津大学的成果，共有6个版本。比如-16版，-19版，11版。创新在于使用小窗口感受器（卷积核）。拿到了2014年的imageNet的第二名。1*1的卷积核作用：把多个通道累加起来，减少通道数，即减少维度。

2014年第一名是GoogNet，也使用了更小的卷积核。这个网络特点是使用了不同尺寸的卷积核对同一个通道操作，即同一层有不同的尺寸的卷积核，然后把结果concat，如果输出尺寸不一致，则可以控制步长即可。因此可以感受到不同层次的数据。共22层

按理说层数越多，模型复杂度可以更复杂。但当层数到了20层以上，训练很难，容易不收敛。因为随着网络深度加深，参数不断增加，每次求梯度都会使得梯度衰减，或者说梯度的误差累计，进而导致后面的网络因梯度消失而训练不动了。

深度残差网络：Resnet引入短路，可以退化至浅层网络。使得更深层次网络的训练成为可能。短路操作又叫残差，因为短路之间的部分网络，学习的是前后连接之间的差值。比如Resnet可以退化到VGG。152层。Resnet在多个领域都有10%以上的提升，是跨时代的网络。

这张图可以看出，性能最好的是inception-V4、resnet。尽管Alexnet计算量小，但是性能只有55%。VGG计算量非常大，但性能中等。所以不要使用VGG。所以现在使用inception-V4、resnet就OK。

Resnet由上图的基本单元堆叠而成，因此只需要实现基本单元，再在容器里堆叠即可。以上代码是实现基本单元。先是一个conv1卷积层，然后是一个BatchNorm2d归一化。激活函数使用F.relu。假设ch_in（通道输入）是256通道的图片，ch_out输出是256通道的图片，输入输出通道一致。如果不一致，即代码中extra中间部分if ch_out!=ch_in部分，可以使用1*1的卷积核降低通道数。中间是1*1的卷积核，降低维度至64通道，然后继续用3*3尺寸卷积核提取特征，此时仍然为64通道，最后用1*1返回成256通道。先变成64通道是为了减少参数数量。代码中和图片不太一致，是用了两个3*3的卷积核，每次用完后赶紧数据归一化。最后是残差相加，即extra+out得到最终的out。

Densenet是在Resnet上改进的，上图是Resnet，下图是Densenet，使得每两层之间都可能断开，而不是仅相邻层间可以断开。因为断开很密集，所以叫Dense。

nn.Module是一个类，因此在我们自定义网络时，如下的My_Linear网络，先继承nn.Module类，再初始化定义w和b参数，然后定义前向计算构建的过程。

直接继承nn.Module的好处：nn.Module是一个基本的父类，其中有很多方便调用的函数（方法），比如nn.Conv2d，各种激活函数，各种卷积层。还有nn.Senquential函数可以方便重复某些网络，比如要建立152层网络，就可以使用这个，自动完成152层的前向计算。此外也方便管理w\b参数。

数据增强

Flip翻转

随机垂直翻转+随机水平翻转，再转化为Tensor，如果有需要可以Normalize归一化。

Rotate旋转、random Move随机移动、Crop裁剪

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

3D机器学习（12）：AlexNet、VGG、GoogNet、Resnet、Densenet、nn.Module、数据增强的相关文章

深度学习（2）：DenseNet与图片文字识别

目的 xff1a 基于深度学习算法DenseNet对图片进行文字识别 xff0c 即OCR转换为文字 xff0c 并将图片进行可视化输出一 DenseNet算法 DenseNet的基本思路与ResNet一致 xff0c 但是它建立的是前面
人工智能学习：CIFAR-10数据分类识别-VGG网络（5）

这里尝试采用VGG网络对CIFAR 10数据集进行分类识别 1 导入需要的模块 span class token keyword import span numpy span class token keyword as span np s
RepVGG: Making VGG-style ConvNets Great Again

文章地址 xff1a RepVGG Making VGG style ConvNets Great Again 代码地址 xff1a https github com megvii model RepVGG 文章发表于CVPR2021 xf
【CV】RepVGG：通过结构重参数化实现训练和推理解耦的类 VGG 架构

论文名称 xff1a RepVGG Making VGG style ConvNets Great Again 论文下载 xff1a https arxiv org abs 1704 04861 论文年份 xff1a 2021 论文被引 x
TensorFlow搭建VGG-Siamese网络

TensorFlow搭建VGG Siamese网络 Siamese原理 Siamese网络 xff0c 中文称为孪生网络大致结构如下图所示 xff1a Siamese网络有两个输入 xff0c 一个输出其中 xff0c 两个输入经过相同
3D resnet根据UCF101数据集制作自己的数据集实现动作识别

3D resnet根据UCF101数据集制作自己的数据集实现动作识别配置要求数据集数据集结构构建数据集训练测试配置要求作者代码 3D resnet pytorch gt 0 4FFmpeg FFprobePython 3 我这里使用
深度学习图像分类实战——pytorch搭建卷积神经网络(AlexNet, LeNet, ResNet50)进行场景图像分类（详细）

目录 1 一实验过程 1 1 实验目的 1 2 实验简介 1 3 数据集的介绍 1 4 一 LeNet5网络模型 1 5 二 AlexNet网络模型 1 6 三 ResNet50 xff08 残差网络 xff09 网络模型二实验代码
深入理解AlexNet网络

AlexNet 论文 xff1a ImageNet Classification with Deep Convolutional Neural Networks 第一个典型的CNN是LeNet5网络结构 xff0c 但是第一个引起大家注意的
Pytorch源码学习之五：torchvision.models.densenet

0 基本知识 DenseNet论文地址 DenseNet加强了每个Dense Block内部的连接 xff0c 每层输出与之前所有层进行concat连接 xff0c 使用三个Dense Block的网络示意图如下 xff1a 每个Block
Windows下，Pytorch使用Imagenet-1K训练ResNet的经验（有代码）

感谢中科院 xff0c 感谢东南大学 xff0c 感谢南京医科大 xff0c 感谢江苏省人民医院以的赞助题记只有被ImageNet真正殴打过一次才算是真的到了深度学习的坑边 xff0c 下一步才是入坑引用装备所兰海大佬的一句话 xff
Alexnet输入大小227x227能否调整，kernel_size偶数有什么影响。

这篇博客对你有点用的话记得给我点赞我会更加乐于分享的前言以下是我个人遇到的一些困惑以及自己的理解和一些验证稍微记录一下仅供参考首先我觉得输入大小肯定是可以调的只不过相应的每一层网络的参数都要做调整调整后结果如何没有
憨批的语义分割7——基于resnet模型的segnet讲解（划分斑马线）

憨批的语义分割7 基于resnet模型的segnet讲解划分斑马线学习前言模型部分什么是Segnet模型什么是Resnet模型 segnet模型的代码实现 1 主干模型resnet 2 segnet的Decoder解码部分代码测
几种经典的卷积神经网络模型

目录 1 卷积神经网络解决的问题 2 经典的卷积神经网络 2 1 LeNet 2 2 AlexNet 2 3 VGG 2 3 1 VGG块 2 3 2 VGG网络 2 4 NiN 2 4 1 Nin块 2 4 2 Nin网络 2 5 Goo
【OpenVINO】将TensorFlow模型转成IR文件，并部署到NCS2上运行

TensorFlow模型这里以本人用TensorFlow实现的AlexNet模型为例详见文章用TensorFlow实现AlexNet 且下面的过程都在激活OpenVINO环境后打开的jupyter notebook中完成模型转换编写
使用tf-slim的ResNet V1 152和ResNet V2 152预训练模型进行图像分类

本文使用tf slim的ResNet V1 152和ResNet V2 152预训练模型进行图像分类并研究slim网络的scope命名等 tf slim文档不太多实现过程中多参考官网的源码 https github com tensor
学习TensorFlow，调用预训练好的网络（Alex, VGG, ResNet etc）

视觉问题引入深度神经网络后针对端对端的训练和预测网络可以看是特征的表达和任务的决策问题分类回归等当我们自己的训练数据量过小时往往借助牛人已经预训练好的网络进行特征的提取然后在后面加上自己特定任务的网络进行调优目前 ILSVR
关于深度残差网络（Deep residual network, ResNet）

深度残差网络深度残差网络的设计就是为了克服这种由于网络深度加深而产生的学习效率变低准确率无法有效提升的问题也称为网络退化甚至在一些场景下网络层数的增加反而会降低正确率这种本质问题是由于出现了信息丢失而产生的过拟合问题 overf
【深度学习】经典的卷积神经网络模型介绍（LeNet、AlexNet、VGGNet、GoogLeNet、ResNet和MobileNet）

经典的卷积神经网络模型介绍卷积神经网络简介一 LeNet 1 INPUT层输入层 2 C1层卷积层 3 S2层池化层下采样层 4 C3层卷积层 5 S4层池化层下采样层 6 C5层卷积层 7 F6层全连接层二 Ale
预处理使用 keras 函数 ImageDataGenerator() 生成的图像来训练 resnet50 模型

我正在尝试训练 resnet50 模型来解决图像分类问题在我拥有的图像数据集上训练模型之前我已经加载了 imagenet 预训练权重我正在使用 keras 函数 flow from directory 从目录加载图像 train da
TensorFlow ValueError：应定义输入的通道维度。发现“无”

我正在尝试实现一个扩张残差网络如此处所述Paper https arxiv org abs 1705 09914在 TensorFlow 中 s PyTorch 实现here https github com fyu drn 来训练它城

随机推荐

Linux防火墙iptables重启生效解决方案

输入完iptables t nat A PREROUTING p tcp dport 80 j REDIRECT to port 8080 后执行iptables save 注意 xff1a iptables save是连在一起的 xff
Docker安装Oracle数据库

一准备工作 1 安装docker ce xff08 有docker老版本也可以直接使用 xff09 安装依赖的软件包 yum install y yum utils device mapper persistent data lvm2 配
ubuntu20.04 -vm-扩展硬盘后30G后不能联网，没IP

之前虚拟机ssh连接没问题 xff0c 今天竟然连不上了打开虚拟机 ip a 网卡ens33没有ip root 64 ubuntu Desktop ip a 1 lo lt LOOPBACK UP LOWER UP gt mtu 6553
【数据库】navicat --oracle数据库创建

第一次登录 xff0c 与plsql相同 xff0c 以管理员身份登录图0 1 图0 2 请注意 xff0c 这里需要sysdba xff1f 1 navicat连接到数据库服务器上的本地或相同 xff0c 此屏幕快照演示了本地数据库
百度OCR接口使用详细教程

如何把图片 PDF文件中的文字进行识别提取 xff0c 这个问题仿佛困扰了我们很多年 xff0c 直到现在 xff0c 当急需OCR功能时也没有一个快速高效且免费的在线工具或软件能马上拿来用前阵子的工作中正好有这个需求 xff0c 我要
【NPM】ubuntu20.04安装npm

ubuntu20 04安装npm sudo apt install npm ubuntu20 04安装nodejs sudo apt install nodejs 1 package is looking for funding run n
【Redis】Redis Cluster集群原理

Redis Cluster是Redis官方提供的集群解决方案由于业务的飞速增长 xff0c 单机模式总会遇到内存性能等各种瓶颈 xff0c 这个时候我们总会喊 xff0c 上集群啊就跟我家热得快炸了 xff0c 你总喊开空调呀一样的
[Bigdata]Ranger权限管理(用户认证kerberos)

一介绍 1 1 什么是Ranger Apache Ranger是一个用来在Hadoop平台上进行监控 xff0c 启用服务 xff0c 以及全方位数据安全访问管理的安全框架 Ranger的愿景是在Apache Hadoop生态系统中提供全
【LeetCode】笔试题LeetCode

package com mumu test 39 39 39 39 96 96
Shell脚本生成随机密码

生成随机密码 urandom版本 bin bash Author 丁丁历险 Jacob dev urandom文件是Linux内置的随机设备文件 cat dev urandom可以看看里面的内容 xff0c ctrl 43 c退出查看查看
UBUNTU创建桌面快捷图标_pycharm, jupyter notebook为例

安装完应用后如果要建立桌面图标如下操作以本人安装好PYCHARM为例创建或者编辑 xff09 桌面图标文件 sudo gedit Desktop pycharm desktop 或者 sudo gedit home 改成你的用户名
目标跟踪（2）GOTURN:基于深度学习的目标跟踪

在这篇文章中 xff0c 我们将了解一种名为 GOTURN 的基于深度学习的对象跟踪算法 GOTURN 的原始实现是在 Caffe 中 xff0c 但它已被移植到 OpenCV 跟踪 API xff0c 我们将使用这个 API 在 C 43
VS2019&CUDA | VS2019编程CUDA环境配置

1 打开vs2019 xff0c xff08 我们可以观察到 xff0c 在VS2017模板一栏下方出现了 NVIDIA CUDA 10 2 xff09 创建一个空win32程序即cuda test项目 2 选择cuda test xff
笔记本电脑win10打开照相机显示灰色相机解决办法

1 xff09 Win 43 R打开命令端 xff0c 输入regedit运行 xff1b xff08 2 xff09 进入HKEY LOCAL MACHINE SOFTWARE Microsoft Windows Media Founda
树形控件添加学生信息应用——MFC基于对话框的应用(4)

新建一个基于mfc对话框的程序 xff1a 设计界面为 xff1a 如果List Contrl 的控件不是以上格式 xff0c 而是则右键属性 xff0c 点开View选择Report xff08 报表 xff09 即可为九个方框添加变
51单片机-定时器（简易时钟的实现）

文章目录前言一定时器的功能以及定时器的结构定时器的功能定时器的结构二定时器的控制工作模式寄存器TMOD控制寄存器TCON写代码来初始化定时器三定时器引发中断简易时钟主程序main c延时函数Delay c控制LCD162模块LC
c++向前声明解决循环引用问题，简化依赖关系

两个类A和B相互关联 xff0c 相互引用 xff0c 如果采用彼此包含对方头文件的方式会出现循环引用 xff0c 所以采用了类的前置声明的方式 class A采用前置声明的方式声明class B在Class B的头文件中包含class A
Ubuntu系统：安装Anaconda后在桌面或收藏夹创建导航器（anaconda-navigator）图标（快捷方式）

和其他应用一样 xff0c 只需要写一个 desktop文件即可经过尝试 xff0c 给大家一个样例 xff0c 自己电脑上需要改其中一部分文件目录即可打开终端 xff0c 可以用快捷键Ctrl 43 alt 43 T 进入 usr s
3D机器学习（6）：交叉熵（cross entropy loss），一种收敛更快的损失函数

1 交叉熵 xff08 cross entropy loss xff09 简介熵 61 entropy 61 不确定性 61 惊讶的度量越高的熵越低的信息度 xff0c 因此不确定性或者混乱性越高 xff0c 熵越高数学定义 xff0
3D机器学习（12）：AlexNet、VGG、GoogNet、Resnet、Densenet、nn.Module、数据增强

从2010年开始 xff0c 深度学习开始进入人们视野 xff0c 2012年的Alexnet是第一个真真意义上的深度网络 xff0c 尽管只有8层 xff0c 但其错误率只有16 4 xff0c 2015年微软亚洲研究院的何凯明同学的Re

3D机器学习（12）：AlexNet、VGG、GoogNet、Resnet、Densenet、nn.Module、数据增强

3D机器学习（12）：AlexNet、VGG、GoogNet、Resnet、Densenet、nn.Module、数据增强 的相关文章

随机推荐

热门标签

3D机器学习（12）：AlexNet、VGG、GoogNet、Resnet、Densenet、nn.Module、数据增强的相关文章