如何让TensorFlow 100%使用GPU？

2023-12-13

我有一台配备 RTX 2060 GPU 的笔记本电脑，我使用 Keras 和 TF 2 在其上训练 LSTM。我还通过以下方式监控 GPU 使用情况nvidia-smi我注意到 jupyter 笔记本和 TF 的使用率最多为 35%，而 GPU 通常使用率在 10-25% 之间。

以目前的条件，训练这个模型花了7个多小时，我想知道是我做错了什么还是Keras和TF的限制？

我的 nvidia-smi 输出：

Sun Nov  3 00:07:37 2019       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 430.26       Driver Version: 430.26       CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 2060    Off  | 00000000:01:00.0  On |                  N/A |
| N/A   51C    P3    22W /  N/A |    834MiB /  5931MiB |     24%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1032      G   /usr/lib/xorg/Xorg                           330MiB |
|    0      1251      G   /usr/bin/gnome-shell                         333MiB |
|    0      1758      G   ...equest-channel-token=622209288718607755   121MiB |
|    0      5086      G   ...uest-channel-token=12207632792533837012    47MiB |
+-----------------------------------------------------------------------------+

My LSTM:

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.layers import LSTM
from tensorflow.keras.layers import Dropout

regressor = Sequential()

regressor.add(LSTM(units = 180, return_sequences = True, input_shape = (X_train.shape[1], 3)))
regressor.add(Dropout(0.2))

regressor.add(LSTM(units = 180, return_sequences = True))
regressor.add(Dropout(0.2))

regressor.add(LSTM(units = 180, return_sequences = True))
regressor.add(Dropout(0.2))

regressor.add(LSTM(units = 180, return_sequences = True))
regressor.add(Dropout(0.2))

regressor.add(LSTM(units = 180, return_sequences = True))
regressor.add(Dropout(0.2))

regressor.add(LSTM(units = 180))
regressor.add(Dropout(0.2))

regressor.add(Dense(units = 1))

regressor.compile(optimizer = 'adam', loss = 'mean_squared_error')

regressor.fit(X_train, y_train, epochs = 10, batch_size = 32, callbacks=[cp_callback])

假设后者已正确安装，TensorFlow 会自动通过 CUDA 和 cuDNN 优化 GPU 资源分配。您看到的使用统计信息主要是内存/计算资源“活动”的统计信息，不一定是实用程序（执行）；看这个答案。您的效用“仅”25% 是一件好事 - 否则，如果您大幅增加模型大小（按原样来说并不大），您就会 OOM。

要增加使用量，请增加批量大小、模型大小或任何会增加并行性计算；请注意，使模型更深会增加 GPU 的内存利用率，但其计算利用率却要低得多。

另外，考虑使用CuDNNLSTM代替LSTM，可以运行速度提高 10 倍并使用lessGPU 内存（由算法技术提供），但计算效用更高。最后，插入Conv1D作为第一层strides > 1将通过减少输入大小来显着提高火车速度，而不一定会损害性能（事实上它可以提高性能）。

Update：对 GPU 进行超频是一种选择，但我建议不要这样做，因为从长远来看它会磨损 GPU（并且所有 DL 都是“长期运行”）。还有“过电压”和其他硬件调整，但所有这些都应该用于一些短期应用。最大的不同是你的输入数据管道.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何让TensorFlow 100%使用GPU？的相关文章

错误 - AttributeError：“DirectoryIterator”对象在 keras 的自动编码器设计中没有属性“ndim”

我是 Python 3 5 的新手我正在尝试编写一个简单的自动编码器它将在 60 张苹果图像的数据集上进行训练并尝试重建根中给出的图像我使用了以下代码 from keras layers import Input Dense fro
从tensorflow_cc和tensorflow_framework生成静态库

据我了解使用 bazel 我只能生产libtensorflow cc so and libtensorflow framework so 我需要生产静态库与位置无关 fPIC 因为稍后我会将它们链接到我自己的动态库 I found 这个答
如何在google colab中降级到tensorflow-gpu版本1.12

我正在运行一个仅与旧版本的tensorflow GPU兼容的GAN 因此我需要将google colab中的tensorflow gpu从1 15降级到1 12 我尝试使用本中建议的以下命令thread https stackoverflo
安装tensorflow的正确命令

当尝试在 Anaconda 上安装 Tensorflow 时我尝试了两种类型的命令 conda install tensorflow gpu工作得很好然而当尝试conda install c anaconda tensorflow g
Keras ZeroDivisionError：整数除法或以零为模

我正在尝试使用 Keras 和 Tensorflow 实现卷积神经网络我有以下代码 from keras models import Sequential from keras layers import Conv2D MaxPoolin
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
为什么不使用均方误差来解决分类问题？

我正在尝试使用 LSTM 解决一个简单的二元分类问题我正在尝试找出网络的正确损失函数问题是当我使用二元交叉熵作为损失函数时与使用均方误差 MSE 函数相比训练和测试的损失值相对较高经过研究我发现二元交叉熵应该用于分类问题 MS
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
可视化 TFLite 图并获取特定节点的中间值？

我想知道是否有办法知道 tflite 中特定节点的输入和输出列表我知道我可以获得输入输出详细信息但这不允许我重建发生在Interpreter 所以我要做的是 interpreter tf lite Interpreter model
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
带有 CUDA 的 Tensorflow：导入错误

我已经按照 NVIDIA 教程中的说明一步步安装了 TensorFlow Ubuntu 16 04 桌面版 GTX 970 http www nvidia com object gpu accelerated applications te
无法加载动态库“libcudart.so.11.0”；

我尝试将 Tensorflow 2 7 0 与 GPU 结合使用但我不断遇到同样的问题 2022 02 03 08 32 31 822484 W tensorflow stream executor platform default ds
TensorFlow：在训练时更改变量

如果我将输入管道从 feed dict 更改为 tf data dataset 如何在每次迭代后的训练期间更改网络内参数的值澄清一下旧代码看起来像这样 Define Training Step model is some class t
我可以在我的机器上同时安装 python 2.7 和 3.5 的tensorflow吗？

目前我通过 Anaconda 在我的机器 MAC OX 上安装了 Python 2 7 Python 3 5 Tensorflow for Python 3 5 我也想在我的机器上安装 Tensorflow for Python 2 7 当
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
无法初始化 NVML：几个小时后 Docker 中出现未知错误

我遇到有趣而奇怪的问题当我使用 GPU 启动 docker 容器时它工作正常并且我看到 docker 中的所有 GPU 然而几个小时或几天后我无法在docker中使用GPU 当我做nvidia smi在泊坞窗机器中我看到这条消息
张量流中的复杂卷积

我正在尝试运行一个简单的卷积但包含复数 r np random random 1 10 10 10 i np random random 1 10 10 10 x tf complex r i conv layer tf layers c

随机推荐

启动项目时出现无法理解的错误（gradle）

我连接了一个库compile com balancedpayments balancedpayments 1 4 去项目时没有错误但是当我尝试运行时我看到错误 Executing tasks app assembleDebug Conf
PHP header() 不起作用

有人知道为什么我的 header 不重定向吗我的脚本的最后一部分是 header location test php die died 它写道 died 它应该在死亡之前重定向但它没有你有什么想法吗您可能正在调用 header af
JSONB sqlalchemy 聚合函数

使用 SQLAlchemy 我想重现可用的聚合函数来自子查询的 jsonb object aggsq objects from sqlalchemy import select func s select sq objects c obje
为什么将 html 代码打印为字符串会给出十六进制数字作为 python 中的输出？

我写了一个Python代码来修改我的html内容但是在再次将其写入 html 文件时我得到了奇怪的十六进制数字 import re search www abc com description blah blah f open myht
将三个js的IIFE函数转换为es6？

我正在尝试将我的 Threejs 项目分解为更小的模块但我遇到了困难以这个函数为例 var updateCamera function var euler new THREE Euler 0 0 0 YXZ return functio
Python删除组合字典列表中的重复值

我需要一点家庭作业帮助我必须编写一个将多个字典组合成新字典的函数如果某个键出现多次新字典中与该键对应的值应该是唯一的列表作为一个例子这是我到目前为止所拥有的 f a apple c cat b bat d dog g c car
如何使用make_cudaExtent正确定义cudaExtent？

我想在 CUDA 中有一个 3d 浮点数组这是我的代码 define SIZE X 128 numbers in elements define SIZE Y 128 define SIZE Z 128 typedef float Vol
忍者绑定

如何将我的接口绑定到不同程序集中的具体类我的解决方案中有以下项目 Foo DataFoo 域名在 Structure Map 中我将两个程序集名称添加到 StructureMap config 文件中然后使用 PluginFamil
可以在导航选项中使用 navigation.toggleDrawer()

在我的导航文件中当我想切换抽屉时出现以下错误类型错误 navigation openDrawer 不是一个函数在 navigation openDrawer navigation openDrawer 未定义这是我的抽屉 cons
Laravel：preg_replace（）：参数不匹配，模式是字符串，而替换是数组

我想将结果保存在数据库中但出现错误异常在我看来我有一个单选按钮数组它可以获取每个学生的结果即出席迟到缺席其他这是我的观点 td users gt student id td td users gt student fir
jQuery：执行同步 AJAX 请求

我过去曾做过一些 jQuery 但我完全坚持这一点我知道使用同步 ajax 调用的优点和缺点但在这里它是必需的远程页面已加载由 firebug 控制但未显示返回我应该做些什么来使我的函数正确返回 function getRemo
函数内的右值引用参数的类型是什么？ [复制]

这个问题在这里已经有答案了我这里有一个非常简单的函数定义 void testRvalue int r printf rvalue ref is called n testRvalue r this line gives no known
Docker 出现错误“无法计算缓存密钥：未找到” - 在 Visual Studio 中运行正常

我使用 Visual Studio 生成了一个 Dockerfile 它在 Visual Studio 中运行得很好现在我正在尝试从 Windows 本身构建它 docker build 并且我尝试了很多组合但我收到以下错误 gt bu
SqlAlchemy Postgres JSON如何使用问号运算符进行过滤？

我正在努力将其转换为 ORM 过滤器查询 select count from issues WHERE pending notifications flooby ending notifications 是一个包含简单 JSON 数组的 J
如何为 MvxItemTemplate 创建视图的操作侦听器

我有一个包含 MvxListView 和表单的视图我可以在视图代码中使用以下代码隐藏软键盘因为这是纯粹的视图问题 var editText FindViewById
流式传输 MP3，而不是使用 HTML5 音频标签下载它

In the document ready功能我有这个 audioElement document createElement audio audioElement setAttribute src http www mfiles co
当的值更改时，会触发哪些事件？

只是想知道是否有人知道 HTML5 发生了什么事件
根据向量指定的变量“开头为”字符串过滤行

我正在尝试根据特定的 ICD9 诊断代码过滤患者数据库我想使用一个向量来指示 ICD9 代码的前 3 个字符串示例数据库包含每次患者就诊的 IC9 代码的 3 个字符变量 var1 到 var3 下面是数据示例 patient lt
Firefox 自定义视频控制器不显示

我的自定义视频控制器遇到问题在 Firefox 中打开视频时控制器不会以全屏模式显示我尝试了与该主题相关的所有内容但到目前为止还没有运气这是 HTML div class border div div div
如何让TensorFlow 100%使用GPU？

我有一台配备 RTX 2060 GPU 的笔记本电脑我使用 Keras 和 TF 2 在其上训练 LSTM 我还通过以下方式监控 GPU 使用情况nvidia smi我注意到 jupyter 笔记本和 TF 的使用率最多为 35 而 GP

如何让TensorFlow 100%使用GPU？

如何让TensorFlow 100%使用GPU？ 的相关文章

随机推荐

热门标签

如何让TensorFlow 100%使用GPU？的相关文章