pytorch：计算网络模型在gpu上的推理时间

2023-11-12

计算网络模型的推理时间，网络模型的推理过程是在gpu上进行的。

方法一：

import torch
import time
net = net().to('cuda')  # 网络模型
input = input.to('cuda')  # 输入
time_start = time.time()
predict = net(input)
time_end = time.time()
time_sum = time_end - time_start
print(time_sum)

方法二：

import torch
import time
net = net().to('cuda')  # 网络模型
input = input.to('cuda')  # 输入
torch.cuda.synchronize()
time_start = time.time()
predict = net(input)
torch.cuda.synchronize()
time_end = time.time()
time_sum = time_end - time_start
print(time_sum)

方法一是正常计算程序的运算时间，比较适合计算程序在cpu的时间，对于网络模型在gpu的运算时间，方法二比较准确。如果采用方法一，测试的时间会很短，因为执行完time_end=time.time()程序就退出了，后台的cu也因为python的退出而退出了。如果采用方法二来计算，torch.cuda.synchronize()会同步时钟的，等待gpu上的操作执行完才执行time_end=time.time()。

方法三：

import torch
import time
net = net().to('cuda')  # 网络模型
input = input.to('cuda')  # 输入
time_start = time.time()
predict = net(input)
print(predict)  # 输出结果
time_end = time.time()
time_sum = time_end - time_start
print(time_sum)

方法三得到的时间和方法二差不多，也可以把print(predict)换成predict=predict.to(‘cpu’)，计算出来的时间也差不多。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

python

深度学习

pytorch：计算网络模型在gpu上的推理时间的相关文章

无法在我的 Django 项目中使用 Sphinx 生成自动文档

我正在向我的 Django 项目添加文档 github链接 https github com augustakingfoundation queryjane app 该项目是开源的使用sphinx 但是当尝试生成python文件的auto
为什么 pandas 在简单的数学运算上比 numpy 更快？

最近我观察到 pandas 的乘法速度更快我在下面的例子中向您展示了这一点如此简单的操作怎么可能做到这一点这怎么可能呢 pandas 数据帧中的底层数据容器是 numpy 数组测量我使用形状为 10k 10k 的数组数据框 i
区分大小写的实体识别

我的关键字全部以小写形式存储例如折扣耐克鞋我正在尝试对其执行实体提取我遇到的问题是 spaCy 在 NER 方面似乎区分大小写请注意我不认为这是 spaCy 特有的当我跑步时 doc nlp u i love nike sho
高效地将大型 Pandas 数据帧写入磁盘

我正在尝试找到使用 Python Pandas 高效地将大型数据帧 250MB 写入磁盘或从磁盘写入的最佳方法我已经尝试了所有方法Python 数据分析但表现却非常令人失望这是一个更大项目的一部分该项目探索将我们当前的分析数据管理
在 Jupyter Notebook 中设置环境变量的不同方法

在某些情况下我在 Windows 10 计算机上使用 Jupyter 笔记本我想通过设置环境变量 GOOGLE APPLICATION CREDENTIALS 来向 GCP 进行身份验证我想知道这两种设置环境变量的方式有什么区别当
如何使用 python、openCV 计算图像中的行数

我想数纸张所以我正在考虑使用线条检测我尝试过一些方法例如Canny HoughLines and FLD 但我只得到处理过的照片我不知道如何计算有一些小线段就是我们想要的线我用过len lines or len contours
检查子字符串是否在字符串列表中？

我之前已经找到了这个问题的一些答案但它们对于当前的Python版本来说似乎已经过时了或者至少它们对我不起作用我想检查字符串列表中是否包含子字符串我只需要布尔结果我找到了这个解决方案 word to check or wordlis
Python 中 time.sleep 和多线程的问题

我对 python 中的 time sleep 函数有疑问我正在运行一个脚本需要等待另一个程序生成 txt 文件虽然这是一台非常旧的机器所以当我休眠 python 脚本时我遇到了其他程序不生成文件的问题除了使用 time sl
将多索引转换为行式多维 NumPy 数组。

假设我有一个类似于以下示例的 MultiIndex DataFrame多索引文档 http pandas pydata org pandas docs stable advanced html gt gt gt df 0 1 2 3 fir
从字典中绘制直方图

我创建了一个dictionary计算 a 中出现的次数list每个键的内容我现在想绘制其内容的直方图这是我想要绘制的字典的内容 1 27 34 1 3 72 4 62 5 33 6 36 7 20 8 12 9 9 10 6 11 5
dask apply：AttributeError：“DataFrame”对象没有属性“name”

我有一个参数数据框并对每一行应用一个函数该函数本质上是几个 sql queries 和对结果的简单计算我正在尝试利用 Dask 的多处理同时保持结构和界面下面的例子有效并且确实有显着的提升 def get metrics row
如何仅注释堆积条形图的一个类别

我有一个数据框示例如下所示 data Date 2021 07 18 2021 07 19 2021 07 20 2021 07 21 2021 07 22 2021 07 23 Invalid NaN 1 1 NaN NaN NaN N
Python：“直接”调用方法是否实例化对象？

我是 Python 新手在对我的对象进行单元测试时我注意到一些奇怪的东西 class Ape object def init self print ooook def say self s print s def main Ape
Jupyter笔记本突然变得很慢

我以前在anaconda环境下运行jupyter运行得很好显示警告后 IOPub data rate exceeded The notebook server will temporarily stop sending output to
导入目录下的所有模块

有没有办法导入当前目录中的所有模块并返回它们的列表例如对于包含以下内容的目录 mod py mod2 py mod3 py 它会给你
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
无法将matplotlib安装到pycharm

我最近开始使用Python速成课程学习Python编程我陷入困境因为我无法让 matplotlib 在 pycharm 中工作我已经安装了pip 我已经通过命令提示符使用 pip 安装了 matplotlib 现在当我打开 pych
异步异常处理程序：在事件循环线程停止之前不会被调用

我正在我的异步事件循环上设置异常处理程序但是在事件循环线程停止之前它似乎不会被调用例如考虑以下代码 def exception handler loop context print Exception handler called
在 anaconda 环境下运行 qsub

我有一个程序通常在 Linux 的 conda 环境中运行因为我用它来管理我的库指令如下 source activate my environment python hello world py 我怎样才能跑你好世界 py在与 PBS
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import

随机推荐

【Unity/Kinect】Kinect入门——项目搭建

本文是Unity Store里的官方Demo包中的ReadMe翻译别人翻的介绍了用Unity如何入门搭建起一个Kinect项目工程非常感谢下面这位大大的无私奉献 http www manew com thread 50097 1 1
linux镜像文件iso下载RedHat,RedHat Enterprise Linux ISO文件下载镜像站点

RedHat Enterprise Linux ISO文件下载镜像站点 ASMLib 06 Mar 2012 12 00 dell 06 Jun 2010 09 45 6 2 log 10 Dec 2011 22 55 4014 JB EA
如何读取Jar包里面的文件

原先写的 File f new File this getClass getResource filename toURI 失败了本来在代码环境下运行是正常的换到了jar包下出现URI is not hierarchical 错误把地
（转载）解决 npm i 及 yarn install 都无法进行安装的问题和node-sass安装太慢的问题

转载 https blog csdn net tyro java article details 79772442 经过沉着冷静的思考后分析关键词 tunneling socket could not be established 通过百
QT错误：ui_xxx.h: 找不到 no such file or directory

解决方法在pro里添加了QT widgets
服务器经常被DDOS攻击，如何做好防御措施

DDoS攻击是目前黑客经常采用且难以防范的攻击手段不管是出于什么目的攻击对企业来说都会造成严重损失所以预防DDoS攻击对企业来说至关重要在借鉴DDoS攻防工程师总结的一些经验企业客户在DDoS防护体系建设上需要做好的工作包括 1
MSYS2：设置国内源,加速下载

https mirror tuna tsinghua edu cn help msys2 收录架构 MINGW i686 x86 64 MSYS i686 x86 64 安装请访问该镜像目录下的 distrib 目录 x86 64 i68
YOLOV5改进：CVPR 2023

显著的渠道或空间有效性注意力产生机制更加可辨特征表示用各种计算机进行了说明视觉任务然而跨通道建模关系与通道降维可能在提取深度视觉表征时带来副作用本文提出了一种新的高效多尺度注意力 EMA 方法模块提出专注于保留信息每个通道上并减
10.6-7 Java.抽象类与其最佳实践-模板设计模式.课堂笔记

10 6 抽象类 10 6 1 问题引入 10 6 2 解决之道抽象类快速入门要点 1 当一个类中存在抽象方法时需要将该类声明为 abstract 类 2 一般来说抽象类会被继承有其子类来实现抽象方法 package Senior
gsoap报文打印

作为客户端的时候 soap begin recv 发送完请求报文获取请求报文信息 g str reqXml clear std string strBuf std string size type pos1 std string npos
Java基本语法（初学者必看，值得收藏）

目录一计算机基础 1 计算机组成 2 程序 3 编程语言二 Java 1 Java简介 2 发展历史 3 JDK的安装和配置 4 第一个Java程序三 Java基础 1 输出 2 代码注释 3 变量 1 概念 2 变量三要素 3 数
计算机基础——Word 2010

天软备考交流群 365218976 1 Office应用程序的启动与退出 1 1 Office程序启动 1 2 Office程序退出 2 Word窗口组成 2 1 标题栏 2 1 1 快速访问工具栏 2 2 选项卡 2 3 文档编辑区 2
cudaStreamSynchronize vs CudaDeviceSynchronize vs cudaThreadSynchronize CUDA中的屏障同步

cudaStreamSynchronize vs CudaDeviceSynchronize vs cudaThreadSynchronize These are all barriers Barriers prevent code exe
python中import与from方法总结

这篇文章主要介绍了python中import与from方法总结文中通过示例代码介绍的非常详细对大家的学习或者工作具有一定的参考学习价值需要的朋友们下面随着小编来一起学习学习吧一模块包简介模块所谓模块就是一个 py文件用来存
ufo帧率测试网站_移动全平台性能测试分析工具：PerfDog性能狗

点击关注我们共同每天进步一点点 PerfDog是腾讯出品的移动端性能测试工具致力于提升移动应用和游戏的性能和品质主打游戏APP 当然应用APP也能用介绍移动全平台iOS Android性能测试分析工具平台快速定位分析性能问题
Linux下安装单节点kafka

Linux下单节点kafka的安装官网下载地址 http kafka apache org downloads 1 查看Linux防火墙 firewall cmd state 2 解压kafka到想要安装的Linux目录下 tar zxv
Gogs push 报 HTTP 401 错误解决方法

Gogs push 报 HTTP 401 错误解决方法 error RPC failed HTTP 401 curl 22 The requested URL returned error 401 错误原因用户名和密码错误导致验证不通过
笔记学习51单片机串口中断

单片机的串口通信功能是比较常用的功能 80C51的串行口我在学习的过程中觉得SBUF的使用方法是最难的于是对着这个图和资料一步步理解才搞明白一点 A SBUF 和 SBUF A 的意思 51单片机通过特殊功能寄存器SBUF对串行接收
【前端】Vue项目：旅游App-（8）city：标签页Tabs动态数据：网络请求axios与request、数据管理store与pinia、各种封装

文章目录目标过程与代码安装相关库封装网络请求相关代码网络请求数据网络请求数据操作封装 pinia管理数据并封装 tab栏改为动态数据效果本篇总结总代码修改或新建的文件 service index modules的city
pytorch：计算网络模型在gpu上的推理时间

计算网络模型的推理时间网络模型的推理过程是在gpu上进行的方法一 import torch import time net net to cuda 网络模型 input input to cuda 输入 time start time