李宏毅 - 卷积神经网络(CNN)

2023-11-15

李宏毅 - 卷积神经网络(CNN)

卷积神经网络主要用于图像分类一张图片通过我们的卷积神经网络也就是Model计算出概率值,通过Cross entropy (交叉熵)归一化到0和1,概率最大的显示为1,其余显示为0。
在这里插入图片描述
那么一张图片是怎么输入到Model里面的呢?我们知道图片是一个三维的tensor(张量),张量可以理解为超过二维的矩阵。以下图举例我们可以写成(100,100,3)的形式,我们需要把这样的图片转化成一维的形式,也就是一个巨大的向量。这个巨大的向量才可以输入到我们的Model里。
在这里插入图片描述
Model怎么分辨图片里是什么动物呢?我们人是怎么分辨的,机器就是怎么分辨的。我们一般找图片的特征,比如:鸟嘴,眼睛,爪子等,机器也是这样的。我们深入思考一下,一张图片里的特征只占很小的部分,是不需要看整张图片的。这样处理起来,参数和计算量就少多了。
在这里插入图片描述
我们让一个神经元只考虑一小部分的范围,这个小部分的范围叫做Receptive filed(感受野),用来表示网络内部的不同位置的神经元对原图像的感受范围的大小。把一个Receptive filed 的数据(3,3,3)拉直变成一个27维的向量,输入到神经元里,神经元为这个27维的向量分别添加27个weight再加上一个bias,就可以传入到下一层了。
在这里插入图片描述
通常为了让感受野覆盖全部的图片我们会设置stride=2 或者 stride= 1,超出图片的部分使用padding,最经典的kernel size 是3*3。每一个Receptive filed 使用一连串的neurons来守护,比如64,128
在这里插入图片描述
第二个观察是,特征会出现在一张图片的不同区域,以下图为例:鸟嘴出现在左上角,左上角的Receptive filed含有侦测鸟嘴的neuron,第二张图的中间也含有侦察鸟嘴的neuron,我们不就有很多重复的neuron了嘛?
在这里插入图片描述
我们要做的就是share parameters(共享参数),让检测鸟嘴的neuron拥有相同的weight和bias. 注意喽,此时的拥有相同参数的neuron不能出现在同一个receptive field。为什么呢?在同一个 receptive field 就是有相同的输入,参数完全一样,那输出也完全一样了。
在这里插入图片描述
我们把参数相同的neuron叫做一个filter.
在这里插入图片描述
把我们前面介绍的综合到一起,Fully Connected Layer 就是输入一张图片,拉直展平,直接放到Model里面,具有灵活性。在此基础上,我们做了一点点改进,加入了Receptive Filed 每次只侦察图片的一小部分,然后我们有做了一点点改进,让相同功能的neuron参数也相同,也就是参数共享。基于这两个小小改进的网络层叫做Convolutional Layer(卷积层),含有Convolutional Layer(卷积层)的网络叫做Convolutional Neural Network(CNN,卷积神经网络)。
在这里插入图片描述

把一张图片做subsampling(下采样),就是生成图像对应的缩略图。如何实现下采样呢? 我们引入了pooling.
在这里插入图片描述
Pooling 可以通过下面两张图来说明。
在这里插入图片描述
Max Pooling 就是留下每组数据最大的那个数。当然还有Mean Pooling等。
在这里插入图片描述
Pooling存在的理由主要是减少运算量。
在这里插入图片描述
下面就是一般cnn会用到的网络层。
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

李宏毅 - 卷积神经网络(CNN) 的相关文章

随机推荐

  • 刷脸支付是新奇的安全的支付体验

    扫脸支付 刷脸付钱的新奇 便利 有效率和安全的支付体验 能够大大提高客户对刷脸商品的和信赖度 刷脸不仅仅在过程中时间 还将吸引消费者注意力的时间延长了5秒到8秒右左 这几秒就会有巨大的商业价值 是让顾客同商家的经营生产有效多维 充分接触的5
  • OSI/RM七层参考模型---开放式的系统互联参考模型

    一 OSI的设计目的 OSI模型的设计目的是成为一个所有销售商都能实现的开放网路模型 来克服使用众多私有网络模型所带来的困难和低效性 OSI是在一个备受尊敬的国际标准团体的参与下完成的 这个组织就是ISO 国际标准化组织 什么是OSI OS
  • 一个很好用的 vue-picker组件

    vue picker a picker componemt for vue2 0 走了一圈 github 都没有找到自己想要的移动端的 vue picker的组件 于是自己就下手 撸了一个出来 感受下效果图 demo demo 地址 htt
  • Gradle查看第三方依赖关系图

    1 使用Android Studio Terminal 配置变量 前提是 java 和 Android Sdk配置正确 java version adb 进行验证 增加 变量名 GRADLE HOME 变量值 D gradle gradle
  • 期货开户不要过度交易

    不同状态下的心态管理 若你在昨日的交易中有所斩获 那恭喜你取得了小阶段的胜利 你可以自信而放松 但却不可忘乎所以 请记得你做出正确决策时的感觉 并重复此状态在你的下一次交易中 只有在交易时集中注意力观察行情变化 勇敢果断地应对突发变化 你才
  • 【笔记】状态同步笔记

    状态同步位置和技能 适用于fps和mmorpg类游戏 客户端A的同步阀值 减少同步量 客户端A本地会存储一份对其他客户端看到的A的预测状态 当本地真实状态和预测状态偏差超过阀值时 则发起同步 同时更新客户端A本地的预测状态 玩家运动的关键点
  • QT学习笔记(六)

    第11章 容器类 Qt提供了自己的容器类 在编写Qt程序时 既可以使用Qt容器 也可以使用STL容器 连续容器 1 向量QVector
  • 计算机丢失d3dx9_41.dll,d3dx9_41.dll

    不知道怎么下载 点我 游戏介绍 d3dx9 41 dll 当运行程序或者游戏时 系统弹出错误提示 找不到 d3dx9 41 dll 或者 没有找到 d3dx9 41 dll 时 说明您系统中缺失这个dll文件或者该dll文件没有被注册 您需
  • “视频云营业厅”-阿里云 mPaaS 加速金融机构数字化转型

    视频云营业厅 发布 蚂蚁 mPaaS 加速金融机构数字化转型 移动终端时代 随着 5G 基础设施的高速发展 AI 技术的日渐成熟 相关政策的鼓励和加持 以及当前疫情大环境的催化 远程无接触的业务办理方式由创新模式快速走向通用 通过多媒体音视
  • Doris数据模型

    目录 基本概念 Aggregate 模型 示例1 导入数据聚合 示例2 保留明细数据 示例3 导入数据与已有数据聚合 Unique 模型 读时合并 与聚合模型相同的实现方式 写时合并 Duplicate 模型 聚合模型的局限性 Unique
  • 【常见错误】UART接收不到数据错误

    利用FPGA控制DAC产生波形的实验 在完成利用FPGA控制DAC的实验中 在对UART发送数据时 显示中断已经打开 但是把数据发送过去时 并没有显示中断 相当于数据知识发送出去 而没有被接收到 经过debug后 发现原来是在硬件中 viv
  • python上传Excel文件

    python上传Excel文件 方法一 直接使用requests的data files参数 方法二 使用MultipartEncoder 方法一 直接使用requests的data files参数 直接上代码吧 def import car
  • python基础(一)

    python基础 1 数据类型 整数 浮点数 字符串 布尔值 True False 注意大小写 空值 是none 列表list 相当于别的语言里的数组 字典 2 编码设置与注释 编码 coding utf 8 注释 使用 或者是 和 这种表
  • redis的编译安装

    下载 http download redis io releases redis 5 0 8 tar gz tar xzvf redis 5 0 8 tar gz cd redis 5 0 8 hadoop node1 redis 5 0
  • 8位二进制数的原码、反码、补码以及它能表示的范围

    1 正数的反码和补码都与原码相同 2 而负数的反码为对该数的原码除符号位外各位取反 3 负数的补码为对该数的原码除符号位外各位取反 然后在最后一位加1 1 原码表示法规定 用符号位和数值表示带符号数 正数的符号位用 0 表示 负数的符号位用
  • 【Kubernetes存储篇】StorageClass存储类动态生成PV详解

    文章目录 一 StorageClass存储类理论 二 案例 Storageclass存储类实战演示 1 搭建NFS服务端 2 搭建NFS供应商 provisioner 3 创建StorageClass存储类 4 创建PVC 通过Storag
  • 2023年1月9日--1月15日(osg+glsl+ue+socket,42小时,合计1859小时,剩余8141小时)

    目前 ue视频教程进行到了mysql 7 1 tf1 4 11 oss 12 2 蓝图反射 1 9 moba 1 5 webapp 2 4 mmoarpg 00A 04 socket 2 57 Opengl 5 9 GLSL 2 8 周一到
  • Conda建立虚拟环境及torch安装

    本人的系统环境 Ubuntu 16 04 Cuda 9 0 Cudnn 7 0 5 Python 3 7 Anaconda 3 这里推荐大家使用Anaconda 可以比较方便的创建Python虚拟环境 避免不同的Python库之间产生冲突
  • C语言-基本运算

    1 除法运算 整数除于整数 还是整数 参与运算的操作数必须是同类型 1 2的值是0 参与运算的操作数是什么类型 得出的值就是什么类型 10 5 10将右边的10提升为了double类型 自动类型提升 int b 10 5 1 7 自动将大类
  • 李宏毅 - 卷积神经网络(CNN)

    李宏毅 卷积神经网络 CNN 卷积神经网络主要用于图像分类 一张图片通过我们的卷积神经网络也就是Model计算出概率值 通过Cross entropy 交叉熵 归一化到0和1 概率最大的显示为1 其余显示为0 那么一张图片是怎么输入到Mod