【模型量化】

2023-10-30

文章认为量化会使网络激活值的均值发生偏移，通过对偏移进行修正，可以有效提高量化模型的性能。

首先考虑“激活值的均值偏移”。

网络BN会统计出数据经过某层后的均值和方差信息。
而网络在经过量化后，同样的数据经过该层后，其均值已经不符合原BN统计出的均值，也即数据分布发生了变化(注意BN存在于多个层，这里说的数据分布是泛指各个层的激活，而不仅仅指第一层网络的输入)。

如上图所示，是32张图片经过MobileNet某层某channel后激活值分布情况，Q是量化模型，FP是float模型，可以看到两个数据分布是不一样的，均值会发生偏移。
在这里插入图片描述

其次感性上理解这个过程：某个channel的均值发生偏移，感性上可以理解为量化模型在该channel上计算出的值会偏大或偏小。那么既然我们知道量化模型某层的激活会偏大或偏小，那么我们就可以对其进行修正。

IBC方法：使用calibration数据，逐层迭代，逐channel进行偏差修正，具体如下：

# IBC伪代码
for：对网络层数进行遍历：
    for：对该层channel进行遍历：
         偏差deta = 该channel float网络激活值 - 该channel量化网络激活值
         量化网络的bias += 偏差deta
     end
end   

# 注意“该channel float网络激活值”和“该channel量化网络激活值”都是在全部calibration
# 数据下计算出平均激活值，calibration数据集文章说只需要8-64张；

目前在网络量化上，偏差修正已经成了一个较为常见的操作，涨点明显。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

模型量化

算法

【模型量化】的相关文章

数据结构之排序：快速排序

快速排序 Quick Sort 由 C A Hoare 在1962年提出是冒泡排序的一种改进采用了分治策略将原问题划分成若干个规模更小但与原问题相似的子问题然后递归方法解决合并问题的解基本思想通过一趟排序将序列分割成独立的两个

随机推荐

C++ & QT 琐碎知识点

此文仅记录C 和QT 学习过程中一些琐碎知识点 shadow build 是将源码路径和构建路径分开主要将makefile和其它生成的文件分开保证源码文件的清洁 qmke和cmake都有采用 pro user 用于记录打开工程的路径所
SpringCloud Stream消息驱动

目录一 SpringCloud Stream概述二 Binder 三 Consumer Groups 针对消费者四 Publish Subscribe 介绍一下yml配置的含义五消息分组六消息分区 1 生产者方配置 2 消费者
osgEarth的Rex引擎原理分析（三十五）osgEarth地球椭球体ellipsoid 大地基准面datum 地图投影Projection详解

目标二十九中的问题83 地球椭球体的中心为地心形状为椭球体大地基准面是适应某一区域的椭球体球体中心不一定在地心地图投影是球面和平面映射关系的方法 Horizontal Datum A datum is a reference p
学Transformer前，你需要了解的Attention机制（基于注意力机制的Seq2seq可视化神经机器翻译模型）

在我们开始学习transformer之前应该了先解下什么是attention注意力机制相关内容获取欢迎关注公众号 AI技术星球发送 222 序列到序列 Sequence to sequence 模型已经在机器翻译文本摘要和图像字幕
ubuntu18.04 配置nfs服务

1 安装nfs服务器软件 sudo apt install nfs kernel server 2 修改配置文件添加nfs server上用于共享的目录并设置允许访问该目录的客户机IP 及其读写权限 sudo vim etc expor
YOLOV5 和 Yolov5s各个版本的发展史、论文、各个版本代码资源分享合集！！！

点击上方码农的后花园选择星标公众号精选文章第一时间送达 2020年2月份YOLO之父Joseph Redmon宣布退出计算机视觉的研究的时候很多人都以为目标检测神器YOLO系列就此终结没想到的是 2020年4月份曾经参与YO
后台获取数据库时间出现的格式问题记录

问题描述要从数据库获取时间类型然后传给前台页面数据库中的时间格式是yyyy MM dd HH mm ss 如图所示但是获取出来时格式就变成了Mon Dec 13 10 04 16 CST 2021这种解决可以在前端或者后端解决后
MYSQL数据库和表

一安装MYSQL数据库时生成系统使用的数据库 1 显示数据库 2 创建数据库 3 选择数据库 mysql gt use stusys Database changed 4 修改数据库 mysql gt alter database stu
win32应用程序_不是有效的win32应用程序怎么解决

在日常办公中经常用到电脑有许多使用技巧本次给大家介绍不是有效的win32应用程序怎么办快来看看吧方法一不是有效的win32应用程序表示这个应用程序和系统不兼容用户可以在计算机属性页面查看系统是32位还是64位之后下载相对应的应
【源码】贝叶斯变化点检测与时间序列分解

BEAST 突变季节性和趋势的贝叶斯估计器是一种快速通用的贝叶斯模型平均算法用于将时间序列或1D序列数据分解为单个组件例如突变趋势和周期季节性变化如Zhao等人 2019 所述 BEAST可用于变化点检测即断点或结构中断
mysql进阶1——proxysql中间件

文章目录一基本了解二安装部署三 proxysql管理配置 3 1 内置库 3 1 1 main库表 3 1 2 stats库表 3 1 3 monitor库 3 2 常用管理变量 3 2 1 添加管理用户 3 2 2 添加普通用户
WSL无法访问网络的解决办法

今天在用WSL的时候突然网络抽风域名解析出了问题 apt update都用不了网上查了很多方法什么vEthernet的IP啊 ifconfigip啊 ip route add default啥的都不管用最后还是看了一下 etc r
多益网络提前批前端面试(凉)

题外话面试时间是晚上7点多多益还是加班严重啊这点哈哈哈哈下面正文自我介绍问项目问看过的书籍这里就是挖坑了尽量找自己会的说 XHR HTTP1和HTTP2的区别隐藏一个HTML标签 v for 为什么不能用index做ke
QT基础部件学习笔记

目录一 QT程序开发流程二 QT基础部件分类 1 按钮类普通工具单选复选命令连接编辑编辑 2 布局类水平垂直网格两列该类的实例具体与其他类同时使用编辑 3 输出类标签文本浏览器日历七段数码管进度条 4
反编译解析数组为什么可以使用foreach

反编译解析数组为什么可以使用foreach 一说明二集合使用foreach 三数组使用foreach 四数组使用for 五 javap反编译程序 5 1 TestCollection结果 5 2 TestArray结果 5 3 T
阿里云mysql gtid_阿里云RDS mysql报错：Statement violates GTID consistency

近日有用户反馈使用RDS mysql8 0时在执行语句 create table select时报错了主要错误是 Statement violates GTID consistency 字面理解是语句违反GTID一致性报错截图 Sta
图像增强 cnn

目录实时图像增强基于间距自适应查找表的方法 CVPR 2022 Image Adaptive 3DLUT 水下图像增强UWCNN wtf 直方图均衡化 CycleGan增强 2个项目实时图像增强基于间距自适应查找表的方法 C
Qt基础：四、多窗口切换

这是一个测试多窗口切换的程序点击主界面上得按键然后弹出一个新的对话框窗口 1 在主界面添加一个按键 2 实现按键的槽函数 void MyWidget on showChildButton clicked QDialog dialog n
优化Java应用程序性能：解决高GC耗时问题

优化Java应用程序性能解决高GC耗时问题在开发和维护Java应用程序时我们经常遇到性能问题其中之一是高GC 垃圾收集耗时垃圾收集是Java虚拟机 JVM 的一项重要任务用于自动管理内存和释放不再使用的对象然而当GC耗时过
【模型量化】

文章认为量化会使网络激活值的均值发生偏移通过对偏移进行修正可以有效提高量化模型的性能首先考虑激活值的均值偏移网络BN会统计出数据经过某层后的均值和方差信息而网络在经过量化后同样的数据经过该层后其均值已经不符合原BN统计出的均

【模型量化】

【模型量化】 的相关文章

随机推荐

热门标签

【模型量化】的相关文章