TensorFlow的map_fn仅在CPU上运行

2024-02-12

我在尝试获取 TensorFlow 时遇到了一个奇怪的问题map_fn在我的 GPU 上运行。这是一个最小的损坏示例:

import numpy as np
import tensorflow as tf

with tf.Session() as sess:
    with tf.device("/gpu:0"):
        def test_func(i):
            return i
        test_range = tf.constant(np.arange(5))
        test = sess.run(tf.map_fn(test_func, test_range, dtype=tf.float32))
print(test)

这会导致错误:

InvalidArgumentError:无法分配设备进行操作 “map/TensorArray_1”:无法满足显式设备规范 '' 因为该节点与一组需要的节点位于同一位置 不兼容的设备 '/device:GPU:0' Colocation 调试信息:Colocation 组具有以下类型和设备: TensorArrayScatterV3:CPU TensorArrayGatherV3:GPU CPU 范围:GPU CPU TensorArrayWriteV3:CPU TensorArraySizeV3:GPU CPU TensorArrayReadV3:CPU 输入:GPU CPU TensorArrayV3:CPU 常量:GPU CPU

托管成员和用户请求的设备:
地图/TensorArrayStack/范围/增量(常量)
地图/TensorArrayStack/范围/开始(常量)地图/TensorArray_1 (TensorArrayV3)映射/while/TensorArrayWrite/TensorArrayWriteV3/Enter (输入)/设备:GPU:0地图/TensorArrayStack/TensorArraySizeV3 (TensorArraySizeV3)地图/TensorArrayStack/范围(范围)
地图/TensorArrayStack/TensorArrayGatherV3 (TensorArrayGatherV3)
地图/TensorArray (TensorArrayV3) 地图/while/TensorArrayReadV3/Enter (输入)/设备:GPU:0常量(常量)/设备:GPU:0
地图/TensorArrayUnstack/TensorArrayScatter/TensorArrayScatterV3 (TensorArrayScatterV3) /设备:GPU:0 地图/while/TensorArrayReadV3 (TensorArrayReadV3) /设备:GPU:0
映射/while/TensorArrayWrite/TensorArrayWriteV3 (TensorArrayWriteV3) /设备:GPU:0

[[节点:map/TensorArray_1 = TensorArrayV3clear_after_read=true, dtype = DT_FLOAT,dynamic_size = false,element_shape =, 相同的元素形状=真, 张量数组名称=“”]]

在我的 CPU 上运行时,代码的行为符合预期,并且执行简单操作,例如:

import numpy as np
import tensorflow as tf

with tf.Session() as sess:
    with tf.device("/gpu:0"):
        def test_func(i):
            return i
        test_range = tf.constant(np.arange(5))
        test = sess.run(tf.add(test_range, test_range))
print(test)

在我的 GPU 上运行良好。这个帖子 https://stackoverflow.com/questions/47045026/is-there-a-way-to-use-tensorflow-map-fn-on-gpu似乎描述了类似的问题。有人有什么建议吗?该帖子的答案意味着map_fn在 GPU 上应该可以正常工作。我在 Arch Linux 上的 Python 3.6.4 上运行 TensorFlow 1.8.0 版本,在 GeForce GTX 1050 上运行 CUDA 版本 9.0 和 cuDNN 版本 7.0。

Thanks!


该错误实际上源于以下事实:np.arange产生int32默认情况下为 s 但您指定了float32返回类型。错误消失了

import numpy as np
import tensorflow as tf

with tf.Session() as sess:
    with tf.device("/gpu:0"):
        def test_func(i):
            return i
        test_range = tf.constant(np.arange(5, dtype=np.float32))
        test = sess.run(tf.map_fn(test_func, test_range, dtype=tf.float32))
print(test)

我同意您收到的错误消息相当令人困惑。通过删除设备放置,您会收到“真正的”错误消息:

import numpy as np
import tensorflow as tf

with tf.Session() as sess:
        def test_func(i):
            return i
        test_range = tf.constant(np.arange(5))
        test = sess.run(tf.map_fn(test_func, test_range, dtype=tf.float32))
print(test)
# InvalidArgumentError (see above for traceback): TensorArray dtype is float but Op is trying to write dtype int32.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

TensorFlow的map_fn仅在CPU上运行 的相关文章

随机推荐

  • 缩放时如何保持d3正交投影居中

    我正在尝试复制 Jason Davies 旋转世界 可视化中显示的缩放功能 https www jasondavies com maps rotate https www jasondavies com maps rotate 我可以旋转和
  • 即使表单没有焦点也拦截按键

    我构建了一个 winforms 应用程序 通过重写 ProcessCmdKey 方法来检查 CTR ALT S 和 CTRL ALT E 按键 这很好用 但如果屏幕保护程序继续运行然后关闭 则表单不会获得焦点 并且按键不会被拦截 即使表单没
  • 如何在 Nuxt 3 中添加脚本块到头部?

    我只是想添加一个script块在head tag Example 我花了几个小时来找出解决方案 解决像这样简单的问题 关于添加有很多答案inline脚本 但没有脚本block for Nuxt 3 我们怎样才能做到这一点Nuxt 3 好吧
  • 在同一个for循环中遍历django模板中的多个列表

    我想在同一个 for 循环中遍历 django 模板中的多个列表 我该怎么做 一些想法链接到这里 for item1 item2 item3 in list1 list2 list3 item1 item2 item3 endfor 这样的
  • 使用scikit-learn(sklearn),如何处理线性回归的缺失数据?

    我尝试了这个 但无法让它适用于我的数据 使用 Scikit Learn 对时间序列 pandas 数据框进行线性回归 https stackoverflow com questions 29748717 use scikit learn t
  • Facebook 聊天 API - php

    我已经成功通过 xmpp 协议登录 Facebook 我使用了 facebook 文档中提供的 PHP 代码
  • 自定义ipython笔记本的欢迎页面

    我可以自定义 iPython 笔记本服务器 版本 2 3 的登录页面吗 我的意思是 在起始页 类似于 http localhost 8888 tree 我想显示欢迎来到 John Doe 的 i Py 笔记本或修改现有横幅 这可能吗 您可以
  • Mac OS X /bin/bash:python:在某些 IDE 中找不到命令

    当我编译的时候test py 一个非常简单的Python文件 在Sublime Text或CodeRunner中 我收到错误 bin bash python command not found 然后我输入python test py在终端应
  • Swing Worker 模态对话框不会关闭

    我有一个 SwingWorker 线程 它启动一个模式对话框 从侦听启动的 StateValue 的属性更改侦听器 并且 swing 工作线程继续执行其工作 但是 看起来 did 方法没有被调用 因为它是在 EDT 上调用的 但 swing
  • Numpy 数组到 TFrecord

    我正在尝试通过张量流对象检测 API 训练自定义数据集 数据集包含 40k 训练图像和标签 采用 numpy ndarray 格式 uint8 训练数据集形状 2 40000 23456 和标签形状 1 0 3 我想为此数据集生成 tfre
  • 如何升级pip3?

    I want to use python3 5 for development but many times when I install the module for python 3 5 it always fails The term
  • 派生类型中的可变长度数组

    我主要使用 Python 进行科学编程 并没有大量的 Fortran 90 95 经验 对于我的一个项目 我想定义一个派生类型并为该类型重载一堆运算符 至关重要的是 我希望派生类型的变量之一成为可变长度的数组 至少 我在代码的不同部分需要两
  • 删除 tar 生成的尾随空字符

    我正在尝试压缩一些文件并通过 php passthru 命令将它们传递给用户 问题是 尽管 tar 文件应该只有 2k 大小 但它始终是 10240 有趣的数字对吗 所以我把它分解为 sh 4 1 tar czf test wc c 102
  • iPhone 上针对 RTL 语言的翻转布局

    这是我的问题 我已将我的应用程序本地化为阿拉伯语 它实际上与常规本地化略有不同 因为我有不同的目标 每种语言一个 在模拟器上 由于自动布局和约束的前导 尾随部分 视图被正确翻转 但我似乎无法在设备上获得相同的结果 AutoLayout RT
  • bash 创建带有序列号的目录

    我正在创建一个在 OS X 上运行的脚本 该脚本将由新手用户经常运行 因此希望通过每次创建一个新的目录结构并在最后一个上使用 n 1 来保护目录结构 target001下一次运行创建target002 到目前为止我有 lastDir fin
  • 重置按钮处理点击后执行 Javascript 操作

    如何立即执行某项操作after an
  • EF Core 查询存储过程映射到类型

    我有一个项目需要查询数据库并将结果返回到 Web api 有几个由数据库管理员即时创建的存储过程 它们有一个 UI 用于创建存储过程的定义及其名称 而 Web API 服务仅调用该 SP 并应返回结果 根据下面的代码 我无法将返回对象获取到
  • 我在 for 循环中使用 let 关键字给出了语法错误:意外的标识符

    我在 for 循环中使用 let 关键字 如下所示 for let methd1 in servUrl let methd methd1 for let pth1 in servUrl methd let pth pth1 app meth
  • 有没有办法使用 cron 重新启动 pm2 进程,但前提是它尚未运行?

    我想通过 PM2 重新启动我的 Node Js 应用程序 pm2 restart app js 使用 crontab 但仅当应用程序尚未运行时 例如 如果我的服务器崩溃并重新启动并且 pm2 没有重新启动 即使它正在运行 上面的命令也会重新
  • TensorFlow的map_fn仅在CPU上运行

    我在尝试获取 TensorFlow 时遇到了一个奇怪的问题map fn在我的 GPU 上运行 这是一个最小的损坏示例 import numpy as np import tensorflow as tf with tf Session as