【2017CS231n】第十五讲:神经网络模型压缩和加速(硬件、算法层面)

2023-05-16

一.算法

1.剪枝

不是所有的神经网络连接都有用。
减少连接,但不降低准确性。
尝试性:剪枝,训练不断重复,找到对准确性影响最高的那一部分连接。

2.参数共享

1.98 2.09 1.92 1.87 都用2来表示,不是所有权重都需要用精确的数字来表示,这样反而可能会造成过拟合。
思路:所有权重聚类,如果相近,就用聚类质心来表示其他数。
霍夫曼编码:对经常出现使用的权重采用霍夫曼编码

3.量化

用标准浮点数训练一个网络,统计每一层的权重和激活值。最大值到最小值,多少位数字可以表示(如果可以用4位数表示,则不用32位,降低了冗余)。

4.低秩近似

可以将卷积层分解成两步卷积。

5.二元/三元权重

再极端一些,只用0 -1 1三个数表示网络中的权重。

6.Winograd卷积


二.硬件

TPU:针对深度学习设计的专用硬件

    但是仅仅拥有好的硬件,而不能发挥硬件全部的性能也不可以。

    计算量和存储带宽决定硬件整体性能的两大因素。

    由于存储带宽限制,为了降低延迟,只能将数据分成很多小批次来处理。这没有发挥出硬件应有的性能。我们希望更少的内存读写来降低存储带宽的需求:压缩模型。

    任何数乘以0都得0,这些数据不需要计算也不需要保留(稀疏权重:0*A=0,稀疏激活值:W*0=0);近似表示;权值共享机制,可以用4位而不是32位来表示每一个权值。
    通过上述方法,降低存储带宽的需求,更好的发挥硬件性能。

三.训练

1.并行

数据并行:同时读取处理两张图片
模型并行:切分图片或卷积权重来切分模型

2.混合精度训练

16位和32位混合使用:16位进行乘法运算,32位进行加法运算,输出的权值转成32位存储。

3.模型Distillation(模型精简)

    我们有了GoogleNet、VGG等训练好的高级的网络模型,使这些训练好的模型去训练一些简单的网络。就像几个老师教一个学生一样,使学生学到老师的本领。
    这时我们不使用车、猫、狗等这些硬标签,而是使用几个模型一起给出的结果。例如GooglNet给出狗的概率是90%,猫的概率是10%。这里需要一个软标签,狗的概率是30%,猫的概率是20%。狗的概率依然高于猫所以预测仍然准确。此时使用了软标签来训练网络。

4.密-疏-密训练(更好的正则化)


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【2017CS231n】第十五讲:神经网络模型压缩和加速(硬件、算法层面) 的相关文章

  • 各种预训练模型的理论和调用方式大全

    诸神缄默不语 个人CSDN博文目录 本文主要以模型被提出的时间为顺序 xff0c 系统性介绍各种预训练模型的理论 xff08 尤其是相比之前工作的创新点 xff09 调用方法和表现效果 最近更新时间 xff1a 2023 5 10 最早更新
  • 对天乙社区bbscs8实现的详细分析三

    经过前面的分析 我们已经理清楚了业务层 接下来的部分将是web层部分 首先我们从web xml开始 我们知 道任何一个java web应用系统都是从WEB INF web xml启动的 根据servlet2 4规范filter执行是按照 w
  • linux下安装node和npm

    linux下安装node和npm 1 打开linux的命令窗口 xff0c 进入根目录 cd 2 使用wget命令下载node包 注 xff1a 这里作者下载的是16 14版本的node xff0c 如果有需要可以直接更换制定版本的node
  • FreeRTOS小知识点

    61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 FreeRTOS 中实现临界区的两种途径 61 61 61 61 61 61 61 61 61 61 61 61 61 61
  • 51单片机连接ESP8266串口WiFi模块

    烧录固件 引脚连接 WiFi51单片机VCC3 3V xff08 5V连接时间过长可能会烧坏WiFi模块 xff09 GNDGNDCH PD3 3VGPIO0GNDUTXDTXDURXDRXD 烧录固件 打开烧录软件 xff0c 选择配置选
  • linux 远程可视化

    实验linux是vmware上的rhel6 0 xff0c 安装的是centos社区桌面 xff0c ip 192 168 31 223 xff0c win设置的固定ip 192 168 31 166 xff0c 且远程ssh软件用的是Se
  • 【七夕节】浪漫七夕,代码传情。将爱意变成绚烂的立体场景,给她(他)一个惊喜!(送代码)

    浪漫七夕 xff0c 代码传情 将爱意变成绚烂的立体场景 xff0c 给她 xff08 他 xff09 一个惊喜 xff01 一 python代码 xff08 情话转二进制编码 xff09 二 js代码部分 xff08 二进制编码生成立体场
  • 【可信执行环境】Keystone 简介

    当下 xff0c 安全挑战是一个非常突出的问题 可行执行环境TEE Trusted Execution Environment 成为必须满足的特性 1 安全挑战与TEE 1 1 安全挑战的来源 xff1a 1 1 1 被抄板 导致研发投入的
  • 超长docker笔记

    docker ce 和docker ee docker操作容器只需要id前4位就可以 docker编译安装 https blog csdn net lwyeluo article details 51765309 删除命令 docker r
  • 第1课【寄存器开发到库开发】寄存器 库 位操作 封装 分层 GPIO

    目录 基本知识框架课堂笔记什么是寄存器开发什么是库开发寄存器开发和库开发的关联寄存器开发的基本流程寄存器开发的优缺点 库开发的基本流程库开发的优缺点 结论 如何从寄存器开发实现库开发 xff08 GPIO口为例 xff0c 通过操作其寄存器
  • python str基本用法

    目录 1 没什么用的 1 1 调用实例属性后自动执行 getattribute 1 2 实例化后自动调用 new 1 3 将其他变量转变为字符串 repr 1 4 反向替代占位符 格式化 rmod 1 5 字符串反向做乘法 rmul 1 6
  • 32.QButtonGroup

    目录 1 创建和添加按钮 1 1 创建按钮组 1 2 添加按钮 addButton 2 查看按钮 2 3 获取当前选中的按钮 CheckedButton 3 从按钮组中移除按钮 removeButton 4 ID操作 4 1 设置 setI
  • Windows下的Win32串口编程

    在工业控制中 xff0c 工控机 xff08 一般都基于Windows平台 xff09 经常需要与智能仪表通过串口进行通信 串口通信方便易行 xff0c 应用广泛 一般情况下 xff0c 工控机和各智能仪表通过RS485总线进行通信 RS4
  • Ubuntu内网穿透

    本文借鉴 使用frp进行内网穿透 少数派 目录 1 准备材料 2 服务端部署 3 服务端后台运行 4 客户端部署 1 准备材料 1 一台具有公网IP的实体机 xff08 服务端 xff0c 也可以是vps 2 一台网页部署内网的实体机 客户
  • Ubuntu系统基本操作

    文章中所需要的文件可以在这里下载 链接 xff1a https pan baidu com s 1NYXxHD0jebngmCTEwgjGbQ 提取码 xff1a 2jyo 目录 1 安装谷歌浏览器 2 修改开机启动项 3 快捷键查找与设置
  • Ubuntu向日葵锁定之后忘记密码后解除锁定状态

    此操作会重置本机识别码与本机验证码 我们在使用向日葵的时候会使用锁定按钮 设置完密码之后 xff0c 我们忘了 xff0c 就会导致无法使用向日葵 重新安装也不能解决问题 xff0c 这个时候我们找到etc orayconfig conf
  • 26.疲劳检测

    目录 1 项目介绍 2 代码实现 2 1 导入库 2 2 定义68个关键点 2 3 定义eye aspect ratio 2 4 定义参数 2 5 定义阈值 2 6 定义次数 2 7 创建检测器 2 8 获取左眼与右眼的起始点与终止点 2
  • NX点亮oled

    效果是这样的 目录 1 接线 2 配置环境 3 运行代码 4 显示开发板信息 1 接线 小屏幕的名称叫oled xff0c 使用芯片SSD1306驱动 上面有四个引脚 xff0c 与NX接线如下 VCC 5V GND GND SDA 3 S
  • 43.一维卷积-航空公司评论情感预测

    之前我们使用的都是二维卷积 xff0c 二维卷积处理图像问题 xff0c 这次我们使用一维卷积 xff0c 一维卷积处理序列问题 一维卷积就是在一个序列上进行滑动 xff0c 从而得出一维卷积的结果 xff0c 详细一维卷积的介绍可以看一下
  • serial库常见用法

    安装的时候要输入 pip install pyserial 进行安装 serial是python做串口通讯的库 xff0c 在这里介绍了NX与Windows串口通讯 NX串口通讯windows Suyuoa的博客 CSDN博客 目录 1 使

随机推荐