在进行 w.r.t. 评估时，是否应将数据批次移至 CPU 并（从 torch Tensor）转换为 numpy 数组？训练期间的指标？

2023-12-02

我正在经历Andrew Ng 在 CS230 斯坦福课程中的教程，并在训练的每个时期，通过计算指标来进行评估。

但在计算指标之前，他们将批次发送到 CPU 并将其转换为 numpy 数组（代码在这里).

# extract data from torch Variable, move to cpu, convert to numpy arrays
output_batch = output_batch.data.cpu().numpy()
labels_batch = labels_batch.data.cpu().numpy()

# compute all metrics on this batch
summary_batch = {metric: metrics[metric](output_batch, labels_batch) for metric in metrics}

我的问题是：他们为什么这样做？他们为什么不直接计算指标（这是完成的here）在 GPU 上使用 torch 方法（例如torch.sum相对于np.sum)?

我认为 GPU 到 CPU 的传输会减慢速度，所以应该有一个很好的理由这样做？

我是 PyTorch 的新手，所以我可能会遗漏一些东西。

如我错了请纠正我。即使在进入下一个循环周期时内存被替换，将数据发送回 CPU 也可以减少 GPU 负载。此外，我相信转换为numpy具有释放内存的优点，因为您要将数据从计算图中分离出来。你最终会操纵labels_batch.cpu().numpy() a fixed数组与labels_batch通过 linkedin 连接到整个网络的张量backward_fn回调。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

deeplearning

Pytorch

在进行 w.r.t. 评估时，是否应将数据批次移至 CPU 并（从 torch Tensor）转换为 numpy 数组？训练期间的指标？的相关文章

围绕 readline 构建的 python 批处理的触发器选项卡完成

背景我有一个 python 程序它导入并使用 readline 模块来构建自制的命令行界面我有第二个 python 程序围绕 Bottle 一个 Web 微框架构建充当该 CLI 的前端第二个 python 程序向第一个程序打开
如何在 AWS CDK 创建的 Python Lambda 函数中安装外部模块？

我在 Cloud9 中使用 Python AWS CDK 并且我部署简单的 Lambda 函数那应该是发送 API 请求到 Atlassian 的 API当对象上传到 S3 存储桶时也是由 CDK 创建的这是我的 CDK 堆栈代码 fr
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
Python逻辑运算符优先级[重复]

这个问题在这里已经有答案了哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
如何为每个屏幕添加自己的 .py 和 .kv 文件？

我想为每个屏幕都有一个单独的 py 和 kv 文件应通过 main py main kv 中的 ScreenManager 选择屏幕设计应从文件 screen X kv 加载类等应从文件 screen X py 加载 Screens
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
列表值的意外更改

这是我的课 class variable object def init self name name alias parents values table name of the variable self name 这是有问题的函数 f
您可以使用关键字参数而不提供默认值吗？

我习惯于在 Python 中使用这样的函数方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

在 Django 中创建自定义 User 模型时，继承 models.Model 和 AuthUser 之间有什么区别？

我见过两种在 Django 中扩展用户模型的方法方法一 class User AuthUser new fields 方法二 class MyUser models Model user models OneToOneField User
Raphael-拖放时检测重叠元素

我试图通过拖放另一个元素来获取元素例如我有 2 个圆圈 c1 和 c2 我想要做的是如果我将 c2 放在 c1 之上因此它们重叠并非完全必要我可以得到圆圈 c1 例如 id 标题等 http jsfiddle net Tome
MySQL错误无法添加外键约束

怎么了 mysql gt create table price gt p code char 1 not null gt p description varchar 20 gt p rentfee decimal 2 2 not null
如何向 Twilio studio Say/Play 小部件添加暂停

我有一个发言小部件 gt Hello Thanks 我尝试向该元素添加像 twiML 这样的暂停字符串如下所示 gt Hello
OpenTK：为什么 GraphicsMode 不可用？

我刚开始学习OpenTK 在学习过程中偶然发现一个问题本教程这是我尝试过的 using System using OpenTK using OpenTK Graphics using OpenTK Windowing Desktop us
MS Access VBA 错误：运行时错误“70”权限被拒绝

我相信此问题是由于 MS Office Access 或 Windows 10 最近更新造成的当我运行此代码时 Dim s As String With CreateObject Scriptlet TypeLib s Left Guid
JavaScript - 为什么这个函数声明是在函数表达式“未定义”中创建的？

我只是想了解这个函数表达式看来如果我创建一个函数表达式 p 似乎包含函数声明函数声明a 返回未定义 var p p function a return Hello typeof p returns function typeof a r
C# 计算距离指定时间跨度还有多长时间

所以我试图计算距离某个特定时间还有多长时间但我似乎无法让它发挥作用举个例子我想计算从现在到早上 06 00 00 需要多长时间所以说现在是晚上 10 30 我想看看到第二天早上 6 点还有多长时间所以正确答案是 7 小时 30 分钟
关于在 FreeBSD 中编写自己的系统调用的问题

好的我刚刚读完 FreeBSD 的 Kill 2 的实现并尝试编写我自己的 kill 这个系统调用需要uid and signum并将信号发送到 uid 拥有的进程不包括调用进程我怎样才能通过uid到系统调用在kill 2 中 p
在 ColdFusion 中隐藏/加密 URL 变量

如果我有一个网站并且 URL 是www example com mainpage cfm id 0123 app 2 我怎样才能隐藏id 0123 and app 2那么用户将无法更改这些变量我正在查看一个由我之前的人编写的复杂程序他通
合并两个日期返回二进制？

为什么COALESCE date1 date2 return Blob 二进制两列都是类型DATETIME 完整的sql查询如下 SELECT COALESCE last modified date purchased As LastMo
如何从数组中删除仅包含空格的元素？

如何删除仅包含空格的数组的所有元素 not元素中的空白例如 foobar 但只是空数组元素例如 Thanks preg grep 是你的朋友 array array This is a test array preg grep s z
C++中结构体成员变量的初始化

我有一个带有一些双值的结构 struct A double a double b 如果我创建一个新结构例如A a 是所有成员例如a a 在 C 中自动初始化为零默认情况下不是除非它是静态存储的变量即static或全局变量有几种方
使用 jQuery.ajax 发送 multipart/formdata

我在使用 jQuery ajax 函数将文件发送到服务器端 PHP 脚本时遇到问题可以通过以下方式获取文件列表 fileinput attr files 但是如何将这些数据发送到服务器呢得到的数组 POST 在服务器端 php 脚本是
Scala：Spark SQL to_date(unix_timestamp) 返回 NULL

Spark Version spark 2 0 1 bin hadoop2 7 Scala 2 11 8 我正在将原始 csv 加载到 DataFrame 中在csv中虽然该列支持日期格式但它们被写为20161025而不是2016 1
Android 网页视图

参考这个WebView教程特别是这个方法 private void setupWebView String MAP URL http gmaps samples googlecode com svn trunk articles andr
为什么 vbs 能够找到 INSTALLLOCATION，而使用 DTF 和 MSI API 的 C# 却找不到？

VBS 按我的预期工作但是使用 C 的 COM API 和 DTF 都无法找到 InstallLocation 以下是我到目前为止所做的事情谢谢这个帖子我能够使用 vbs 找到注册表上不可用的 InstallLocation 我知道
如何使用路径列表创建层次结构？

我正在使用 Dropbox 的 Delta API 当我调用 delta 方法时我会得到自上次调用以来更改的路径列表 photos public photos sample album photos sample album boston
docker 容器中的 Firebase 身份验证模拟器 UI 无法在本地主机上运行

我有这个泊坞窗文件 FROM node 16 ADD src WORKDIR src Install OpenJDK 11 RUN echo deb http ftp debian org debian stretch backports
在进行 w.r.t. 评估时，是否应将数据批次移至 CPU 并（从 torch Tensor）转换为 numpy 数组？训练期间的指标？

我正在经历Andrew Ng 在 CS230 斯坦福课程中的教程并在训练的每个时期通过计算指标来进行评估但在计算指标之前他们将批次发送到 CPU 并将其转换为 numpy 数组代码在这里 extract data from tor

在进行 w.r.t. 评估时，是否应将数据批次移至 CPU 并（从 torch Tensor）转换为 numpy 数组？训练期间的指标？

在进行 w.r.t. 评估时，是否应将数据批次移至 CPU 并（从 torch Tensor）转换为 numpy 数组？训练期间的指标？ 的相关文章

随机推荐

热门标签

在进行 w.r.t. 评估时，是否应将数据批次移至 CPU 并（从 torch Tensor）转换为 numpy 数组？训练期间的指标？的相关文章