TensorFlow：如何测量每个张量占用多少 GPU 内存？

2024-03-12

我目前正在实施YOLO http://pjreddie.com/media/files/papers/yolo.pdf在 TensorFlow 中，我对它占用的内存量感到有点惊讶。在我的 GPU 上，我可以使用它们来训练 YOLODarknet http://pjreddie.com/darknet/批处理大小为 64 的框架。在 TensorFlow 上，我只能使用批处理大小 6 来执行此操作，而使用 8 时，我已经耗尽了内存。对于测试阶段，我可以使用批量大小 64 运行，而不会耗尽内存。

我想知道如何计算每个张量消耗了多少内存？所有张量默认都保存在GPU中吗？我可以简单地将总内存消耗计算为形状 * 32 位吗？
我注意到，由于我使用动量，所以我所有的张量也有一个/Momentum张量。这也可能使用大量内存吗？
我正在用一种方法扩充我的数据集distorted_inputs，与中定义的非常相似CIFAR-10 教程 https://tensorflow.googlesource.com/tensorflow/+/master/tensorflow/models/image/cifar10/cifar10.py。难道这部分占用了很大的内存？我相信 Darknet 会在 CPU 中进行修改。

现在1258 https://github.com/tensorflow/tensorflow/issues/1258已关闭，您可以在导入 TensorFlow 之前通过设置环境变量来启用 Python 中的内存日志记录：

import os
os.environ['TF_CPP_MIN_VLOG_LEVEL']='3'
import tensorflow as tf

将会有一个lot由此导致的日志记录。您需要 grep 结果以找到适当的行。例如：

grep MemoryLogTensorAllocation train.log

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

TensorFlow：如何测量每个张量占用多少 GPU 内存？的相关文章

当我想在电脑中加载该模型时，我可以在 colab bu 中加载我的深度模型，但我不能

我在colab中通过keras 2 3 1和tensorflow 2 1 0训练了一个深度模型我用JSON和Keras保存了我的模型 saveWeightPath content drive My Drive model info mod
分布式张量流 tf.train.SyncReplicasOptimizer 似乎不同步

我使用两个工作程序副本和一个参数服务器喜欢 ps hosts hosta com 2222 worker hosts hosta com 2223 hostb com 2223 使用tf train SyncReplicasOptimi
如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
如何将one-hot向量转换为多标签？

我有一项多分类任务并且我得到了像这样的单热类型预测 0 1 1 0 1 0 1 0 1 我希望将这个单热向量转换为标签例如 1 2 1 0 2 我已经尝试过 tf argmax 但它不起作用那么我该如何处理呢使用列表理解 oheLi
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
访问 AWS 上的 Tensorboard

我正在尝试访问 AWS 上的 Tensorboard 这是我的设置张量板 tensorboard host 0 0 0 0 logdir train 在端口 6006 上启动 TensorBoard b 39 您可以导航到http 172
在不丢失基数信息的情况下对 TensorFlow 数据集进行窗口处理？

tf data Dataset window返回一个新的数据集其元素是数据集这些嵌套数据集的元素是所需大小的窗口如果您有一个数据集例如 Dataset range 10 并想要一个像这样的窗口数据集 0 1 2 1 2 3 7 8
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
Tensorflow `tf.layers.batch_normalization` 不会向 `tf.GraphKeys.UPDATE_OPS` 添加更新操作

以下代码复制粘贴可运行说明了如何使用tf layers batch normalization import tensorflow as tf bn tf layers batch normalization tf constant
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
Tensorflow conv2d_transpose 大小错误“out_backprop 的行数与计算的不匹配”

我正在张量流中创建一个卷积自动编码器我得到了这个确切的错误 tensorflow python framework errors InvalidArgumentError Conv2DBackpropInput Number of row
张量流服务错误：参数无效：JSON 对象：没有命名输入

我正在尝试使用 Amazon Sagemaker 训练模型并且希望使用 Tensorflow 服务来为其提供服务为了实现这一目标我将模型下载到 Tensorflow 服务 docker 并尝试从那里提供服务 Sagemaker 的训练
使用预训练的 word2vec 初始化 Seq2seq 嵌入

我对使用预训练的 word2vec 初始化tensorflow seq2seq 实现感兴趣我已经看过代码了嵌入似乎已初始化 with tf variable scope scope or embedding attention deco
为 TFliteconverter 创建代表性数据集的正确方法是什么？

我正在尝试推断tinyYOLO V2 with INT8权重和激活我可以使用 TFliteConverter 将权重转换为 INT8 为了INT8激活我必须提供代表性数据集来估计缩放因子我创建此类数据集的方法似乎是错误的正确的程序是
Ray：如何在一个 GPU 上运行多个 Actor？

我只有一个 GPU 我想在该 GPU 上运行许多 Actor 这是我使用的方法ray 下列的https ray readthedocs io en latest actors html https ray readthedocs io en
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im

随机推荐

Kivy - windows - 根本找不到任何有价值的 Window 提供商

我从猕猴桃开始这是我正在运行的示例代码 import kivy from kivy app import App from kivy uix button import Label kivy require 1 9 0 class Hel
关于实例方法上 id 的行为

我有以下脚本 class A object def f self pass a A b A print map id A f a f b f print map id a f b f Out 4299312976 4298026672 42
使用 ASP.NET MVC 导出 PDF 文件

我有一个 ASP NET MVC4 应用程序我想在其中将 html 页面导出到 PDF 文件我使用此代码它工作正常 code http www codeproject com Articles 260470 PDF reporting
如何在 Eclipsce juno 中开发 Liferay 项目并在 Jboss 上构建它

我已经下载了 Liferay 6 1 和 jboss 7 1 1 Bundle 以及 Liferay IDE Eclipsce Juno 我所要做的就是开发 Liferay 项目并在 Jboss 服务器上运行它我可以在 localhost
结构体数组替换其自身的值

好的我有下面的代码我只是从文件中提取各种内容并将它们输入到结构数组中它看起来最初工作但是当我在文件完成后打印它时它似乎已将所有课程和名称替换为最后一个值奇怪的是整数成绩不会发生这种情况成绩确实可以正确输入 inclu
Entity Framework Code First：通过 ID 添加多对多关系

我有一个多对多关系定义如下 public class Post NOT SHOWN Other properties public virtual ICollection
将注释框添加到 ggplot 对象的网格中

我正在准备37个网格ggplot使用grid arrange功能节省轴标签当前占用的空间并添加一些信息例如Sys time 我会在图形网格的右下角添加一个框使用的最小示例mtcars数据可以在下面找到真实数据将覆盖 x 轴上非常不同
Python：将按字母顺序拼写的数字转换为数字？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找图书馆服务或代码建议以将拼写出的数字和金额例如三十五美元十五美分一点五转换为数字
在这种情况下，如何在 php 代码内的 html 中回显 php 代码？ [复制]

这个问题在这里已经有答案了我正在尝试回显 buddypress 会员链接我无法回显代码因为它在 html 代码内请参阅下面的代码链接内的 php 代码但此链接和列表位于 php 代码内我知道我做错了什么 php代码在html里
使用 Azure DevOps 任务“Azure App Service Deploy”v3 部署到 Azure Web App Web 根目录

我使用 Azure DevOps 和 Azure 应用服务部署任务 AzureRmWebAppDeployment 3 来部署到 Azure 网站但在部署到 Web 根目录时遇到问题该应用程序是 PHP 的有一个公共文件夹该文
Flex 4.5.1 运行时 ReferenceError：错误 #1065：变量...未定义

好的我在这方面需要一些帮助我从 Flash Builder 4 升级到 Flash Builder 4 5 并将我的项目切换到 4 5 1 sdk 我使用 ant 脚本来构建我的项目因此我对其进行了修改以使用适当的 flexTasks
如何在通过 maven 创建 zip 文件时排除某些文件夹
检查IP有效性

如何在 shell 脚本中检查 IP 地址在范围内的有效性0 0 0 0 to 255 255 255 255 如果您使用的是 bash 则可以对模式进行简单的正则表达式匹配而无需验证四边形 usr bin env bash ip 1 2
在 OWL 中的同一属性中定义多个域/范围

在 OWL 中设置数据对象属性的域范围的正确方法是什么如果我有两节课A B和数据属性hasName
将 Subversion Server 从 1.7 升级到 1.8

相关如何将SVN服务器从1 6升级到1 7 https stackoverflow com questions 8565096 how to upgrade svn server from 1 6 to 1 7 and TortoiseSV
Obj-C 中的“Nil”代表什么？

所以有NULL 一般用于指针并且nil 用于对象指针现在我看到还有Nil 由较低级别的 Obj C 运行时函数使用例如class getProperty 这与nil哲学上是的我知道它们实际上都是 0 为什么要引入它或者如果Nil
类型错误：“bool”对象不可下标 Python 3

我收到以下错误 TypeError Traceback most recent call last C Users levanim Desktop Levani Predictive cosinesimilarity1 py in
Highcharts 散点图中的单个点颜色

请尝试以下代码 div style height 400px div and function var chart new Highcharts Chart chart renderTo container type column seri
将函数作为参数传递的最佳方法

在 C 中有多种将函数作为参数传递的方法但我想了解每种方法的优点和优点例如从算法中查看函数的签名 template
TensorFlow：如何测量每个张量占用多少 GPU 内存？

我目前正在实施YOLO http pjreddie com media files papers yolo pdf在 TensorFlow 中我对它占用的内存量感到有点惊讶在我的 GPU 上我可以使用它们来训练 YOLODarknet

TensorFlow：如何测量每个张量占用多少 GPU 内存？

TensorFlow：如何测量每个张量占用多少 GPU 内存？ 的相关文章

随机推荐

热门标签

TensorFlow：如何测量每个张量占用多少 GPU 内存？的相关文章