李宏毅 - 卷积神经网络（CNN）

2023-11-15

李宏毅 - 卷积神经网络（CNN）

卷积神经网络主要用于图像分类。一张图片通过我们的卷积神经网络也就是Model计算出概率值，通过Cross entropy (交叉熵)归一化到0和1，概率最大的显示为1，其余显示为0。
在这里插入图片描述
那么一张图片是怎么输入到Model里面的呢？我们知道图片是一个三维的tensor(张量)，张量可以理解为超过二维的矩阵。以下图举例我们可以写成（100，100，3）的形式，我们需要把这样的图片转化成一维的形式，也就是一个巨大的向量。这个巨大的向量才可以输入到我们的Model里。
在这里插入图片描述
Model怎么分辨图片里是什么动物呢？我们人是怎么分辨的，机器就是怎么分辨的。我们一般找图片的特征，比如:鸟嘴，眼睛，爪子等，机器也是这样的。我们深入思考一下，一张图片里的特征只占很小的部分，是不需要看整张图片的。这样处理起来，参数和计算量就少多了。
在这里插入图片描述
我们让一个神经元只考虑一小部分的范围，这个小部分的范围叫做Receptive filed(感受野)，用来表示网络内部的不同位置的神经元对原图像的感受范围的大小。把一个Receptive filed 的数据（3，3，3）拉直变成一个27维的向量，输入到神经元里，神经元为这个27维的向量分别添加27个weight再加上一个bias，就可以传入到下一层了。
在这里插入图片描述
通常为了让感受野覆盖全部的图片我们会设置stride=2 或者 stride= 1,超出图片的部分使用padding，最经典的kernel size 是3*3。每一个Receptive filed 使用一连串的neurons来守护，比如64，128

第二个观察是，特征会出现在一张图片的不同区域，以下图为例：鸟嘴出现在左上角，左上角的Receptive filed含有侦测鸟嘴的neuron，第二张图的中间也含有侦察鸟嘴的neuron,我们不就有很多重复的neuron了嘛？
在这里插入图片描述
我们要做的就是share parameters(共享参数)，让检测鸟嘴的neuron拥有相同的weight和bias. 注意喽，此时的拥有相同参数的neuron不能出现在同一个receptive field。为什么呢？在同一个 receptive field 就是有相同的输入，参数完全一样，那输出也完全一样了。
在这里插入图片描述
我们把参数相同的neuron叫做一个filter.

把我们前面介绍的综合到一起，Fully Connected Layer 就是输入一张图片，拉直展平，直接放到Model里面，具有灵活性。在此基础上，我们做了一点点改进，加入了Receptive Filed 每次只侦察图片的一小部分，然后我们有做了一点点改进，让相同功能的neuron参数也相同，也就是参数共享。基于这两个小小改进的网络层叫做Convolutional Layer（卷积层），含有Convolutional Layer（卷积层）的网络叫做Convolutional Neural Network（CNN,卷积神经网络）。
在这里插入图片描述

把一张图片做subsampling（下采样），就是生成图像对应的缩略图。如何实现下采样呢? 我们引入了pooling.
在这里插入图片描述
Pooling 可以通过下面两张图来说明。

Max Pooling 就是留下每组数据最大的那个数。当然还有Mean Pooling等。

Pooling存在的理由主要是减少运算量。

下面就是一般cnn会用到的网络层。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

李宏毅 - 卷积神经网络（CNN）的相关文章

台达plc控制伺服电机编程实例_PPT图文讲解PLC控制系统的设计及编程实例

今天主要是关于PLC控制系统设计分成四个方面以图文的形式来为大伙做讲解一 PLC控制系统设计概述二 PLC控制系统设计三 PLC的安装运行与维护四 PLC的编程实例一 PLC控制系统设计概述 1 系统设计的原则 2 系统设计
chooseAddress:fail the api need to be declared in …报错解决方法

在app js中与pages同级添加 requiredPrivateInfos getFuzzyLocation choosePoi chooseAddress 如果提示无效的json文件在顶部工具栏微信开发者工具检查更新更新到最新
一致性算法（paxos、raft）

背景分布式一致性模型 1 弱一致性最终一致性 1 1 DNS 1 1 Gossip 2 强一致性 2 1 同步 2 1 paxos 2 1 raft multi paxos 2 1 ZAB multi paxos 与raft相似心跳
error C2144: 语法错误:“int”的前面应有“;”

error C2144 语法错误 int 的前面应有 C error C2144 syntax error int should be preceded by 注我使用VS2010时遇到的问题解决办法在某个 h文件里你自定义的某个类
软件工程的发展历程及展望

软件工程发展至今催生出了许多优秀的编程语言和编程思想本文将带领大家一起了解软件工程经历的四个阶段汇编语言表达业务逻辑过程化语言表达业务逻辑面向对象和模块化思想表达业务逻辑服务化和组件化表达业务逻辑最后谈一谈未来可能的发展方式

随机推荐

刷脸支付是新奇的安全的支付体验

扫脸支付刷脸付钱的新奇便利有效率和安全的支付体验能够大大提高客户对刷脸商品的和信赖度刷脸不仅仅在过程中时间还将吸引消费者注意力的时间延长了5秒到8秒右左这几秒就会有巨大的商业价值是让顾客同商家的经营生产有效多维充分接触的5
OSI/RM七层参考模型---开放式的系统互联参考模型

一 OSI的设计目的 OSI模型的设计目的是成为一个所有销售商都能实现的开放网路模型来克服使用众多私有网络模型所带来的困难和低效性 OSI是在一个备受尊敬的国际标准团体的参与下完成的这个组织就是ISO 国际标准化组织什么是OSI OS
一个很好用的 vue-picker组件

vue picker a picker componemt for vue2 0 走了一圈 github 都没有找到自己想要的移动端的 vue picker的组件于是自己就下手撸了一个出来感受下效果图 demo demo 地址 htt
Gradle查看第三方依赖关系图

1 使用Android Studio Terminal 配置变量前提是 java 和 Android Sdk配置正确 java version adb 进行验证增加变量名 GRADLE HOME 变量值 D gradle gradle
期货开户不要过度交易

不同状态下的心态管理若你在昨日的交易中有所斩获那恭喜你取得了小阶段的胜利你可以自信而放松但却不可忘乎所以请记得你做出正确决策时的感觉并重复此状态在你的下一次交易中只有在交易时集中注意力观察行情变化勇敢果断地应对突发变化你才
【笔记】状态同步笔记

状态同步位置和技能适用于fps和mmorpg类游戏客户端A的同步阀值减少同步量客户端A本地会存储一份对其他客户端看到的A的预测状态当本地真实状态和预测状态偏差超过阀值时则发起同步同时更新客户端A本地的预测状态玩家运动的关键点
QT学习笔记（六）

第11章容器类 Qt提供了自己的容器类在编写Qt程序时既可以使用Qt容器也可以使用STL容器连续容器 1 向量QVector
计算机丢失d3dx9_41.dll,d3dx9_41.dll

不知道怎么下载点我游戏介绍 d3dx9 41 dll 当运行程序或者游戏时系统弹出错误提示找不到 d3dx9 41 dll 或者没有找到 d3dx9 41 dll 时说明您系统中缺失这个dll文件或者该dll文件没有被注册您需
“视频云营业厅”-阿里云 mPaaS 加速金融机构数字化转型

视频云营业厅发布蚂蚁 mPaaS 加速金融机构数字化转型移动终端时代随着 5G 基础设施的高速发展 AI 技术的日渐成熟相关政策的鼓励和加持以及当前疫情大环境的催化远程无接触的业务办理方式由创新模式快速走向通用通过多媒体音视
Doris数据模型

目录基本概念 Aggregate 模型示例1 导入数据聚合示例2 保留明细数据示例3 导入数据与已有数据聚合 Unique 模型读时合并与聚合模型相同的实现方式写时合并 Duplicate 模型聚合模型的局限性 Unique
【常见错误】UART接收不到数据错误

利用FPGA控制DAC产生波形的实验在完成利用FPGA控制DAC的实验中在对UART发送数据时显示中断已经打开但是把数据发送过去时并没有显示中断相当于数据知识发送出去而没有被接收到经过debug后发现原来是在硬件中 viv
python上传Excel文件

python上传Excel文件方法一直接使用requests的data files参数方法二使用MultipartEncoder 方法一直接使用requests的data files参数直接上代码吧 def import car
python基础(一)

python基础 1 数据类型整数浮点数字符串布尔值 True False 注意大小写空值是none 列表list 相当于别的语言里的数组字典 2 编码设置与注释编码 coding utf 8 注释使用或者是和这种表
redis的编译安装

下载 http download redis io releases redis 5 0 8 tar gz tar xzvf redis 5 0 8 tar gz cd redis 5 0 8 hadoop node1 redis 5 0
8位二进制数的原码、反码、补码以及它能表示的范围

1 正数的反码和补码都与原码相同 2 而负数的反码为对该数的原码除符号位外各位取反 3 负数的补码为对该数的原码除符号位外各位取反然后在最后一位加1 1 原码表示法规定用符号位和数值表示带符号数正数的符号位用 0 表示负数的符号位用
【Kubernetes存储篇】StorageClass存储类动态生成PV详解

文章目录一 StorageClass存储类理论二案例 Storageclass存储类实战演示 1 搭建NFS服务端 2 搭建NFS供应商 provisioner 3 创建StorageClass存储类 4 创建PVC 通过Storag
2023年1月9日--1月15日(osg+glsl+ue+socket，42小时，合计1859小时，剩余8141小时)

目前 ue视频教程进行到了mysql 7 1 tf1 4 11 oss 12 2 蓝图反射 1 9 moba 1 5 webapp 2 4 mmoarpg 00A 04 socket 2 57 Opengl 5 9 GLSL 2 8 周一到
Conda建立虚拟环境及torch安装

本人的系统环境 Ubuntu 16 04 Cuda 9 0 Cudnn 7 0 5 Python 3 7 Anaconda 3 这里推荐大家使用Anaconda 可以比较方便的创建Python虚拟环境避免不同的Python库之间产生冲突
C语言-基本运算

1 除法运算整数除于整数还是整数参与运算的操作数必须是同类型 1 2的值是0 参与运算的操作数是什么类型得出的值就是什么类型 10 5 10将右边的10提升为了double类型自动类型提升 int b 10 5 1 7 自动将大类
李宏毅 - 卷积神经网络（CNN）

李宏毅卷积神经网络 CNN 卷积神经网络主要用于图像分类一张图片通过我们的卷积神经网络也就是Model计算出概率值通过Cross entropy 交叉熵归一化到0和1 概率最大的显示为1 其余显示为0 那么一张图片是怎么输入到Mod

李宏毅 - 卷积神经网络（CNN）

李宏毅 - 卷积神经网络（CNN）

李宏毅 - 卷积神经网络（CNN） 的相关文章

随机推荐

热门标签

李宏毅 - 卷积神经网络（CNN）的相关文章