深度学习模型参数量/计算量(附计算代码)

2023-11-20

参考:

  1. https://mp.weixin.qq.com/s?__biz=MzI4MDYzNzg4Mw==&mid=2247546551&idx=2&sn=f198b6365e11f0a18832ff1203302632&chksm=ebb70e63dcc0877569d1838b2391744be628bf6cbb6e203a49f855e0769ecbbbf5a9929fe2db&scene=27

  1. https://www.cnblogs.com/king-lps/p/10904552.html

  1. https://zhuanlan.zhihu.com/p/337810633

在测试一个模型时,我们经常会用到FLOPS,FLOPs,Params↓

FLOPS

注意S大写,是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。

计算公式:

对卷积层:(K_h * K_w * C_in * C_out) * (H_out * W_out)

对全连接层:C_in * C_out

FLOPs

注意s小写,是floating point operations的缩写(s表复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度

GFLOPS

GFLOPS 就是 Giga Floating-point Operations Per Second,即每秒10亿次的浮点运算数,常作为GPU性能参数但不一定代表GPU的实际表现,因为还要考虑具体如何拆分多边形和像素、以及纹理填充,理论上该数值越高越好。1GFlops = 1,000MFlops

一点常用的换算关系:

一个 MFLOPS (megaFLOPS) 等于每秒1百万 (=10^6) 次的浮点运算,

一个 GFLOPS (gigaFLOPS) 等于每秒10亿 (=10^9) 次的浮点运算,

一个 TFLOPS (teraFLOPS) 等于每秒1万亿 (=10^12) 次的浮点运算,

一个 PFLOPS (petaFLOPS) 等于每秒1千万亿 (=10^15) 次的浮点运算。

Params

是指模型训练中需要训练的参数总数

模型参数量计算公式为:

对卷积层:(K_h * K_w * C_in)* C_out

对全连接层:C_in * C_out

注意:

1.params只与你定义的网络结构有关,和forward的任何操作无关。即定义好了网络结构,参数就已经决定了。FLOPs和不同的层运算结构有关。如果forward时在同一层(同一名字命名的层)多次运算,FLOPs不会增加

  1. Model_size = 4*params 模型大小约为参数量的4倍

计算方法

方法1-使用thop库

import torch
from thop import profile
from models.yolo_nano import YOLONano

device = torch.device("cpu")
#input_shape of model,batch_size=1
net = YOLONano(num_classes=20, image_size=416) ##定义好的网络模型

input = torch.randn(1, 3, 416, 416)
flops, params = profile(net, inputs=(input, ))

print("FLOPs=", str(flops/1e9) +'{}'.format("G"))
print("params=", str(params/1e6)+'{}'.format("M")

方法2-使用torchstat库

torchstat这个库来查看网络模型的一些信息,包括总的参数量params、MAdd、显卡内存占用量和FLOPs等

from torchstat import stat
from torchvision.models import resnet50
model = resnet50()
stat(model, (3, 224, 224))

方法3-使用 ptflops:https://github.com/sovrasov/flops-counter.pytorch

from ptflops import get_model_complexity_info
from torchvision.models import resnet50
model = resnet50()
flops, params = get_model_complexity_info(model, (3, 224, 224), as_strings=True, print_per_layer_stat=True)
print('Flops:  ' + flops)
print('Params: ' + params)

方法4-使用 pytorch-OpCounter (pytorch版本>=1.0)

from torchvision.models import resnet50
from thop import profile
model = resnet50()
flops, params = profile(model, input_size=(1, 3, 224,224))

方法5自己计算

print('Total params: %.2fM' % (sum(p.numel() for p in net.parameters())/1000000.0))

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习模型参数量/计算量(附计算代码) 的相关文章

随机推荐

  • [LeetCode-100]-Same Tree(判断两颗二叉树是否相同)

    文章目录 0 题目相关 1 Solution 0 题目相关 题目解读 给定两颗二叉树 对这两颗二叉树进行比较 判断这两棵二叉树是否相同 原题描述 原题链接 Given two binary trees write a function to
  • @PostConstruct和线程池导致事务问题

    测试一个xxl job 遇到问题事务问题 情景再现 使用 PostConstruct注解来测试 由于是上传素材 比较耗时 所以使用了线程池 一切很顺利的是时候 保存日志的时候报了个错 org springframework transact
  • uniapp 上传音频(H5可以App不行),并播放后端返回的音频

    1 上传 record let this this uni chooseFile count 1 默认100 extension m4a mp3 根据文件拓展名过滤 每一项都不能是空字符串 默认不过滤 success function re
  • python爬虫环境准备-安装anaconda

    在windows环境下 比较头疼的就是包管理和Python不同版本的问题 为了解决这些问题 有不少发行版的Python 比如WinPython Anaconda等 这些发行版将python和许多常用的package打包 方便python开发
  • 华为OD机试 - 猜数字(Java)

    题目描述 一个人设定一组四码的数字作为谜底 另一方猜 每猜一个数 出数者就要根据这个数字给出提示 提示以XAYB形式呈现 直到猜中位置 其中X表示位置正确的数的个数 数字正确且位置正确 而Y表示数字正确而位置不对的数的个数 例如 当谜底为8
  • 将本地的代码上传到github完整版本

    1 注册github账号 2 安装git https git for windows github io 3 进入Github首页 点击New repository新建一个项目 Public Private 仓库权限 公开共享 私有或指定合
  • 1077 Kuchiguse

    PTA 程序设计类实验辅助教学平台 一个测试点没过 不知道哪的原因 include
  • 逍遥子突然辞去阿里一切职务!之前不再担任董事长,现在阿里云CEO也卸了

    金磊 发自 凹非寺量子位 公众号 QbitAI 阿里巴巴史上最大架构重组仅半年后 再次迎来重大变革 原集团CEO张勇 花名 逍遥子 正式卸任 同时辞去阿里云董事长和CEO职务 这一次 阿里巴巴掌门的接力棒交到了蔡崇信和吴泳铭 花名 东邪 手
  • dalle2:hierarchical text-conditional image generation with clip

    DALL E 2 论文精读 哔哩哔哩 bilibili更多论文 https github com mli paper reading 视频播放量 30350 弹幕量 256 点赞数 1767 投硬币枚数 1318 收藏人数 751 转发人数
  • Linux之编辑器强大的vim使用手册

    目录 vim三种模式 vim常用操作 环境参数配置 命令合集 方向命令 插入命令 定位命令 删除命令 复制和剪切命令 替换和取消命令 搜索和搜索替换命令 保存和退出命令 其他命令 使用技巧 把一个文件的内容导入当前文件中光标所在位置 定义快
  • swarm与kubernetes的对比

    前言 docker swarm 与kubernetes都是集群管理工具 一个是docker原生自带 一个是谷歌项目下的容器编排工具 那么到底他们到底有什么有缺点呢 kubernetes kubernetes 是Google多年大规模容器管理
  • Windows10如何添加开机启动项

    在日常生活中 偶尔要求其中的软件在开机时便能自动启动 比如MySQL一般被设置为自启动项 今天将为大家介绍window10中如何添加开机启动项 操作过程 1 按下win R调出运行窗口 并输入 shell startup 即可进入开机启动文
  • KPCA数据降维

    文章目录 效果一览 文章概述 部分源码 参考资料 效果一览 文章概述 KPCA数据降维 Matlab核主成分分析 数据降维 可直接运行 适合作为创新点 部分源码 清空环境变量 warning off 关闭报警信息 close all 关闭开
  • Java【多线程】笔记总结

    多线程 概念 方法间调用 普通方法调用 从哪里来就到那里去 闭合的一条路径 多线程调用 开辟了多条路径 在操作系统中运行的程序就是进程 如看视频 线程就是独立的执行路径 在程序运行时 即使没有自己创建线程 后台也会存在多个线程 如gc 线程
  • git本地仓库与远程仓库同步

    在学习和工作中 我们经常遇到这样的场景 我们已经在本地创建了一个git仓库 并添加了文件和修改记录 后面你又想在github或者gitlab上新建一个空白git仓库 并且让这2个仓库进行远程同步并且保存之前本地仓库的修改记录 这样一来git
  • Java 之 认识String类

    目录 一 String类的重要性 二 常用方法 1 字符串构造 2 String对象的比较 3 字符串查找 4 转化 5 字符串替换 6 字符串拆分 7 字符串截取 8 其他操作方法 9 字符串的不可变性 10 字符串修改 三 String
  • 《动手学深度学习 Pytorch版》 2.7 查阅文档

    2 7 1 查找模块中的所有函数和类 import torch 可以调用 dir 函数查询函数中有哪些模块和类 以 双下划线 开始和结束的函数是 Python 中的特殊对象 以 单下划线 开始的函数是内部函数 通常以上两种函数可以忽略 di
  • 如何下载英伟达NVIDIA旧版本驱动,旧版本驱动官方网址

    https www nvidia cn Download Find aspx lang cn 也可以直接搜索英伟达官网 点击驱动程序 然后点击试用版驱动程序 里面不但有试用版的驱动 还有之前发布的所有驱动
  • 2023年信息素养大赛智能算法挑战复赛初中组

    智能算法挑战复赛初中组 总共 4 道题 1 修复机器人的对话词库错误 题目描述 基于人工智能技
  • 深度学习模型参数量/计算量(附计算代码)

    参考 https mp weixin qq com s biz MzI4MDYzNzg4Mw mid 2247546551 idx 2 sn f198b6365e11f0a18832ff1203302632 chksm ebb70e63dc