tensorflow gpu仅在CPU上运行

2024-02-18

我在 Windows 10 上安装了 Anaconda-Navigator 和所有必需的 Nvidia/Cuda 软件包，创建了一个名为 tensorflow-gpu-env 的新环境，更新了 PATH 信息等。当我运行模型时（使用tensorflow.keras），我看到 CPU 利用率显着增加，GPU 利用率为 0%，并且模型只是不训练。

我运行了一些测试来确保事情看起来如何：

print(tf.test.is_built_with_cuda())
True

上面的输出（“True”）看起来是正确的。

另一种尝试：

from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())

Output:

[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 1634313269296444741
, name: "/device:GPU:0"
device_type: "GPU"
memory_limit: 1478485606
locality {
  bus_id: 1
  links {
  }
}
incarnation: 16493618810057409699
physical_device_desc: "device: 0, name: GeForce 940MX, pci bus id: 0000:01:00.0, compute capability: 5.0"
]

到目前为止一切顺利...稍后在我的代码中，我使用以下代码开始训练：

history = merged_model.fit_generator(generator=train_generator,
                                     epochs=60,
                                     verbose=2,
                                     callbacks=[reduce_lr_on_plateau],
                                     validation_data=val_generator,
                                     use_multiprocessing=True,
                                     max_queue_size=50,
                                     workers=3)

我还尝试按如下方式进行培训：

with tf.device('/gpu:0'):
    history = merged_model.fit_generator(generator=train_generator,
                                         epochs=60,
                                         verbose=2,
                                         callbacks=[reduce_lr_on_plateau],
                                         validation_data=val_generator,
                                         use_multiprocessing=True,
                                         max_queue_size=50,
                                         workers=3)

无论我如何开始训练，它都永远不会开始训练，我不断看到 CPU 利用率增加而 GPU 利用率为 0%。

为什么我的tensorflow-gpu安装只使用CPU？花了几个小时，实际上没有任何进展。

ADDENDUM

当我跑步时conda list在控制台上，我看到有关张量流的以下内容：

tensorflow-base           1.11.0          gpu_py36h6e53903_0
tensorflow-gpu            1.11.0                    <pip>

这个张量流基础是什么？它会引起问题吗？在安装tensorflow-gpu之前，我确保使用conda和pip卸载了tensorflow和tensorflow-gpu；然后使用安装tensorflow-gpupip。我不确定这个张量流基础是否与我的tensorflow-gpu安装。

附录2看起来tensorflow-base是conda的一部分，因为我可以用以下命令卸载它conda uninstall tensorflow-base。我仍然安装了tensorflow-gpu，但现在无法再导入tensorflow。它说“没有名为tensorflow的模块”。看来我的 conda 环境没有看到我的 tensorflor-gpu 安装。我现在很困惑。

根据网络的大小，您的 CPU 大部分时间都在加载数据。

由于您使用的是 Python 生成器，因此您的大部分时间都花在打开文件的 Python 代码上。生成器可能是您的管道的瓶颈。

数据加载后，可能会立即在 GPU 上进行评估，导致 GPU 利用率几乎为 0%，因为您的 Gpu 一直在等待新数据。您可以尝试使用 TensorFlowdataset https://www.tensorflow.org/api_docs/python/tf/data/DatasetAPI。 tfrecords 的加载时间非常快。看看这个article https://medium.com/@moritzkrger/speeding-up-keras-with-tfrecord-datasets-5464f9836c36?source=linkShare-b7d1e0266b3-1540036306

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow gpu仅在CPU上运行的相关文章

无法满足显式设备规范“/device:GPU:0”，因为没有匹配的设备

我想在我的 Ubuntu 14 04 机器上使用 TensorFlow 0 12 作为 GPU 但是当将设备分配给节点时我收到以下错误 InvalidArgumentError see above for traceback Canno
Tensorflow：获取为零的数组行索引

对于张量 1 2 3 1 0 0 0 0 1 3 5 7 0 0 0 0 3 5 7 8 如何获取 0 行的索引 IE 列表 1 3 在 Tensorflow 中据我所知您无法像使用 NumPy 等更高级的库那样在一个命令中真正做到这一
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
Tensorflow 的 LSTM 输入

I m trying to create an LSTM network in Tensorflow and I m lost in terminology basics I have n time series examples so X
Keras LSTM 密集层多维输入

我正在尝试创建一个 keras LSTM 来预测时间序列我的 x train 形状像 3000 15 10 示例时间步长特征 y train 形状像 3000 15 1 我正在尝试构建一个多对多模型每个序列 10 个输入特征产生 1
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

与 CUDA 的任何事情一样最基本的事情有时也是最难的所以我只想将变量从 CPU 复制到 GPUconstant变量我很难过这就是我所拥有的 constant int contadorlinhasx d int main int
Keras 服装回调。生成精确召回时，我在 _flow_index 中收到错误

我正在使用 Keras 训练二元分类器我想在每个时期后生成 precision score 和 recall score 以便更深入地分析训练在互联网上我找到了教程帮助例如 https medium com thongonary h
张量流急切模块错误

我的操作系统是 Ubuntu 16 04 Python版本是3 5 张量流版本是14 0 当我尝试为 TF Eager 模块编写简单代码时 import tensorflow as tf import tensorflow contrib
OutOfRangeError（请参阅上面的回溯）：FIFOQueue '_1_batch/fifo_queue' 已关闭并且元素不足（请求 32，当前大小 0）

我在使用队列中张量流读取图像时遇到问题请让我知道我犯了什么错误下面是代码 import tensorflow as tf slim tf contrib slim from tensorflow python framework imp
ValueError：维度 (-1) 必须在 [0, 2) 范围内

我的python版本是3 5 2 我已经安装了keras和tensorflow 并尝试了官方的一些示例示例链接示例标题用于多类 softmax 分类的多层感知器 MLP https keras io getting started s
在不丢失基数信息的情况下对 TensorFlow 数据集进行窗口处理？

tf data Dataset window返回一个新的数据集其元素是数据集这些嵌套数据集的元素是所需大小的窗口如果您有一个数据集例如 Dataset range 10 并想要一个像这样的窗口数据集 0 1 2 1 2 3 7 8
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
错误 - AttributeError：“DirectoryIterator”对象在 keras 的自动编码器设计中没有属性“ndim”

我是 Python 3 5 的新手我正在尝试编写一个简单的自动编码器它将在 60 张苹果图像的数据集上进行训练并尝试重建根中给出的图像我使用了以下代码 from keras layers import Input Dense fro
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
批量归一化，是还是否？

我使用 Tensorflow 1 14 0 和 Keras 2 2 4 以下代码实现了一个简单的神经网络 import numpy as np np random seed 1 import random random seed 2 imp
从tensorflow_cc和tensorflow_framework生成静态库

据我了解使用 bazel 我只能生产libtensorflow cc so and libtensorflow framework so 我需要生产静态库与位置无关 fPIC 因为稍后我会将它们链接到我自己的动态库 I found 这个答
Tensorflow Hub - 获取模型的输入形状和问题域？

我正在使用最新版本的tensorflow hub 想知道如何获取有关模型的预期输入形状以及模型属于什么类型的集合的信息例如有没有办法以这种方式在 Python 中加载模型后获取有关预期图像形状的信息 model hub load htt
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client

随机推荐

Easy_install 没有安装 Mechanize？

我正在从旧的 Win2K 机器迁移到新的功能更强大的 Vista 64 位 PC 大部分迁移都进行得相当顺利但我确实发现我需要重新安装所有与 Python 相关的工具我已经下载了 mechanize 0 1 11 tar gz 文件并
在 Matlab 中使用 svmtrain 内存不足

我有一组数据正在尝试使用 SVM 来学习对于上下文数据的维数为 35 包含大约 30 000 个数据点我之前用这个数据集在 Matlab 中训练过决策树大约花了 20 秒由于对错误率不太满意我决定尝试 SVM 我第一次尝试svm
MySql 中的 EntityFunctions 支持

我在 MySQL 中使用 EntityFunctions DiffMinutes 时遇到错误下面是我的代码 return db DiscoveredDevices Where m gt EntityFunctions DiffMinute
哪个 Hook 可以更改 WooCommerce 购物车页面中的数量更新？

当购物车中的产品数量发生变化时我试图触发一个功能更具体地说我想在客户修改购物车中的金额时运行此功能我正在寻找购物车中剩余的金额然后拦截更新购物车事件目前我正在使用 add action woocommerce remove ca
将 pandas 数据框中的单元格拆分为多行

我有一个包含订单数据的数据框每个订单都有多个包存储为逗号分隔的字符串 package package code 列我想拆分包裹数据并为每个包裹创建一行包括其订单详细信息这是一个示例输入数据框 import pandas as pd
带有返回旧值的 glob 的行输入运算符

以下摘录代码在 perl 5 16 3 及更早版本上运行时具有奇怪的行为其中对行输入运算符中的 glob 的后续调用会导致 glob 继续返回以前的值而不是重新运行 glob usr bin env perl use strict u
cin >> 对于较大的数字失败，但对于较小的数字有效？

为什么cin失败当我输入一个数字如 3999999999 但它适用于较小的数字如 5 include
系统.绘图.图形

我有一个与按给定中心旋转椭圆有关的问题假设我有一个椭圆应该是按用户给定的点旋转该椭圆并且椭圆应该围绕该给定点旋转我努力了 g RotateTransform g TranslateTransform Code Graphics g
使用公共字段的最佳实践是什么？

当我编写类时我总是通过公共属性公开私有字段如下所示 private int MyField public int MyField get return MyField 什么时候可以像这样公开一个公共字段 public int MyFie
如何查看Python的__builtins__源代码？

我可以让 python 打印源代码吗 builtins 直接地或更优选源代码的路径名是什么 builtins 我至少知道以下几件事 builtins 是一个模块通过输入type builtins 我已经尝试过针对这个问题的更一般情况
Guice：如何绑定所有类型的泛型？

假设我的代码中经常重复以下模式 class A
获取 csh 脚本时如何获取 `__FILE__`

我有一个脚本用于在调用 csh shell 中设置一些环境变量其中一些变量取决于脚本的位置如果该文件是正确的 csh 脚本我可以使用 0 来访问 FILE 但如果我使用源运行脚本它只会告诉我 csh 或 tcsh 由于我使用它在父
C# 将数据从数据表插入到 SQL Server 数据库

我几乎尝试了该网站上的所有解决方案但无法解决这个问题我有通过 ODBC 连接从数据库检索的数据数据就在那里它将很好地进入数据网格视图但我无法将此数据放入我的本地 SQL 数据库请告诉我我做错了什么 public partial
按名称调用参数

任何人都可以给我解释如何在 scala 编译器中按名称调用该方法的语法快捷方式如下 arg gt Int将转变为arg gt Int并捕获传递给函数的参数如何闭包即按名称调用参数的实际类型例如 Function0 Thanks 正如
目录：资产/tessdata

我从 github 下载了 OCR 文本识别器我的问题是我想在不在线的情况下启动我的应用程序但每次我在手机上安装 apk 时它都会开始下载英语和 tesseract OCR 引擎我找到了一个在线指南其中说我必须在资产文件夹中创建
Watchkit 、带有 WatchKit 扩展的 openParentApplication

第一次不行 Null 在iPhone中打开应用程序之前有时不起作用但我想要一个循环或计时器来重复此请求以获取结果这是我的代码 void application UIApplication application handleWatch
如何 Django ORM update() 嵌套在带有数值的 JSONField 中的值？

我在 PostgreSQL 上有一个 Django JSONField 其中包含一个字典我想使用queryset update 使用数字最终是计算得出的值批量更新一个最终是几个键我看到有关于添加的讨论对此有更好的支持 https
使用 service tomcat8 start 启动服务 tomcat8 失败

我正在使用 Vagrant 部署到 Ubuntu Linux 并尝试启动tomcat8服务 Tomcat 8 安装者apt get install tomcat8 当使用service tomcat8 start命令我收到以下错误 tom
' | Home'))' aria-label='使用规范进行测试，railstutorial 第 3 章中的水豚不起作用 (have_selector('title', :text => ' | Home'))'> 使用规范进行测试，railstutorial 第 3 章中的水豚不起作用 (have_selector('title', :text => ' | Home'))

我正在处理 ruby railstutorial org ruby on rails tutorial book 我使用 Rails 3 2 7 spork rspec capybara launchy 和一些 Guards 我在第三章的测
tensorflow gpu仅在CPU上运行

我在 Windows 10 上安装了 Anaconda Navigator 和所有必需的 Nvidia Cuda 软件包创建了一个名为 tensorflow gpu env 的新环境更新了 PATH 信息等当我运行模型时使用tens

tensorflow gpu仅在CPU上运行

tensorflow gpu仅在CPU上运行 的相关文章

随机推荐

热门标签

tensorflow gpu仅在CPU上运行的相关文章