TensorFlow 设备上下文、流和上下文切换

2024-04-18

In the GPU设备 https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/common_runtime/gpu/gpu_device.cc#L264代码，我注意到一个GPU设备上下文 https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/common_runtime/gpu/gpu_device.cc#L308是按流制作的。

这样做的目的是让每个上下文都可以控制一个 OpKernelContext，然后当需要执行各种流时，只需切换上下文即可将不同的数据/代码推送到 GPU 上然后执行。

各种流是否注册为不同的设备（即“/gpu:0”和“/gpu:1”）？

Per this https://stackoverflow.com/questions/39399890/tensorflow-device-contexts，ThreadPoolDevice 没有上下文，但是如果我将上下文添加到 ThreadPoolDevice 中，它们是否最适合作为 ThreadContext 的一种？

对于 GPU，我们维护一些用于执行的流：计算流（大多数计算内核在其上运行）和一些内存复制流（用于在主机和设备之间执行内存副本，反之亦然）。这样做是为了重叠 GPU 设备上的通信和计算，但对于我们使用 GPU 的方式来说是特定的。人们还可以轻松地为所有计算和通信创建一个 GPU 流，这将是正确的，尽管速度较慢。

我们希望将计算流提供给进行计算的内核，并将内存复制流提供给进行复制的内核。我们为每个流创建一个 GPUDeviceContext 对象，然后将正确的设备上下文对象传递给 OpKernelContext。

因此，这里的特定实现反映了异步硬件设备（GPU）的属性，这就是 ThreadPoolDevice 没有此类机制的原因。在 CPU 上，所有计算都是同步的，因此不需要诸如流之类的抽象。

定制硬件的执行模型可能会决定定制设备支持在 TensorFlow 中需要什么样的状态和管理。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

TensorFlow 设备上下文、流和上下文切换的相关文章

Tensorflow构建量化工具-bazel构建错误

我正在尝试编译量化脚本如下所述皮特沃登的博客 https petewarden com 2016 05 03 how to quantize neural networks with tensorflow 但是在运行以下 bazel
使用 anaconda3 python 3.5 安装 Tensorflow 出现“读取超时错误”

我正在尝试安装tensorflow gpu 使用python3 6和anaconda 3 我正在按照以下链接中的安装步骤进行操作https www tensorflow org install install windows https w
3D 卷积神经网络输入形状

我在使用 3D CNN 提供数据时遇到问题Keras http keras io和 Python 对 3D 形状进行分类我有一个文件夹其中包含一些 JSON 格式的模型我将这些模型读入 Numpy 数组模型为 25 25 25 表示
张量流多元线性回归不收敛

我正在尝试使用张量流训练具有正则化的多元线性回归模型由于某种原因我无法获取以下代码的训练部分来计算我想要用于梯度下降更新的误差我在设置图表时做错了什么吗 def normalize data matrix averages np av
如何查找冻结模型的输入和输出节点

我想使用张量流optimize for inference py来自模型动物园的冷冻模型的脚本 ssd mobilenet v1 coco 如何查找确定模型的输入名称和输出名称雇用张量板生成的图的版本 https i stack img
Keras Maxpooling2d 层给出 ValueError

我正在尝试在 keras 中复制 VGG16 模型以下是我的代码 model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224 model add Convoluti
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
在 TensorFlow 中对伯努利随机变量进行采样

给定一个包含伯努利分布均值的一维张量如何使用给定的均值对相应的一维张量进行采样 TensorFlow 似乎只有random normal and random uniform实现的功能我可以使用一些复杂的东西例如 tf ceil tf
Tensorflow无法分配设备进行操作

我正在尝试跑步NVidia 脸部生成器演示 https github com tkarras progressive growing of gans在我的电脑上我使用的是 Windows 10 我已经下载了源代码并尝试按照页面下方的步骤
如何在 Windows 上的 Python 2.7 上安装 Tensorflow？

我尝试通过 pip 安装 TensorFlow pip install tensorflow 但是得到这个错误找不到满足tensorflow要求的版本来自版本这个问题有解决办法吗我还是想通过pip安装如果您只因为 Keras 而需
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
在 Chaquopy 中转换数组和张量

我该怎么做呢我看到你的帖子说你可以将 java 对象传递给 Python 方法但这不适用于 numpy 数组和 TensorFlow 张量以下以及其各种变体是我尝试过的但没有成功 double anchors new double
无法满足显式设备规范“/device:GPU:0”，因为没有匹配的设备

我想在我的 Ubuntu 14 04 机器上使用 TensorFlow 0 12 作为 GPU 但是当将设备分配给节点时我收到以下错误 InvalidArgumentError see above for traceback Canno
如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
如何将one-hot向量转换为多标签？

我有一项多分类任务并且我得到了像这样的单热类型预测 0 1 1 0 1 0 1 0 1 我希望将这个单热向量转换为标签例如 1 2 1 0 2 我已经尝试过 tf argmax 但它不起作用那么我该如何处理呢使用列表理解 oheLi
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
TensorFlow：在输入处获取梯度时性能缓慢

我正在使用 TensorFlow 构建一个简单的多层感知器并且我还需要获取神经网络输入损失的梯度或误差信号这是我的代码它有效 cost tf reduce mean tf nn softmax cross entropy with
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana

随机推荐

Java ImageWriter BufferedImage 到 GIF

我希望你们能帮我解决这个问题我不确定这是 Java 中的错误还是我做错了什么但我会选择后者我想将 BufferedImage 转换为 GIF 图像然后我希望将 GIF 以字节数组的形式保存在内存中我不想将文件保存到磁盘该程序应该
>> Python 中的运算符

什么是 gt gt 运营商做什么例如下面的操作是做什么的10 gt gt 1 5 do 它是右移位运算符将所有位向右移动一次 10 的二进制是 1010 向右移动它变成 0101 这是 5
Python 单击多个命令名称

是否可以使用 Python Click 执行类似的操作 click command name my command my cmd def my command pass 我希望我的命令行是这样的 mycli my command and m
Spring JPA 原子获取或创建方法

我正在使用 Spring Boot 和JPA with Hibernate 我有一个方法进入我的服务检查数据库中是否已存在特定实体例如我需要检查是否已经有用户为此我使用自定义 JPQL 查询我的 JPA 存储库之后如果上一步
在 Android 中打开日历

如何在按钮单击上打开日历并获取可单击的日期看一下这个 http www developer com ws article php 3850276 Working with the Android Calendar htm http www
如何使用 Phonegap 将图像加载到 HTML5 Canvas 上

尝试将图像加载到 html5 画布上然后使用 Phonegap 在 Android 上运行 html5 这是我的 HTML
Vaadin 14 组合框选择鼠标悬停时的工具提示

我正在使用 Vaadin 14 Java 我有一个带有枚举的组合框作为可能的选择项我想在组合框中显示枚举作为可能的选择但我想在鼠标悬停工具提示上显示较长的属性名称我看到旧版本的 Vaadin 也存在同样的问题显然没有解决方案并
CSS 注入在 content_scripts 中使用声明失败，但在通过注入的 JavaScript 加载时有效

我注意到将 CSS 注入第三方页面的预期方式似乎无法正常工作相关的manifest json部分 content scripts matches youtube com watch v css css youTubeInject css
我无法访问 SQL 2005 实例的所有原因

我已经安装了 SQL 2005 Express 的实例
如何将循环中的变量更新为对循环内创建的值的引用？

我想进入一个带有变量的循环n这是函数借用的每一步 n取新值当退出循环时工作在其他变量的帮助下完成并且n will never再次使用如果我不使用引用我会有这样的东西 fn test n Thing gt usize stuff
JDBC.SQLServerException：结果集没有当前行

因此我创建的解决方案引发了此异常 jdbc SQLServerException The result set has no current row在下面代码中标记的行上 public String get64BitEncodedImag
Scala 映射函数签名的解释？

此代码将函数应用于整数列表并将选项列表中的每个值设置为值 4 val l List 1 2 3 4 5 gt l List Int val v 4 gt v Int 4 def g v Int List v 1 v v 1 gt g v
CSS 容器 div 未获取高度

我希望我的容器 div 获得其子级高度的最大值不知道孩子的身高div将会有我正在尝试JSFiddle http jsfiddle net gtdfY 2 容器div为红色哪个没有出现为什么添加以下属性 c overflow hid
为什么 DOMDocument 嵌套段落 (
) 标记？

有没有办法阻止 DOMDocument 嵌套标签这是一个例子 dom gt loadHTML p text1 p p text2 p LIBXML HTML NOIMPLIED LIBXML HTML NODEFDTD Outputs
python删除字符串中的2个字符

python搜索字符 x 下一步删除该字符 x 字符 x 1字符串中的位置 Example x 1 520 2 529 我要搜索x 并删除和之前的数字最后我希望它看起来像x 520 529 在我创建这个主题之前我只发现用一个字符替换一
OpenGL：仅使用一个帧缓冲区并切换目标纹理

我是否可以只创建一个帧缓冲区对象并通过在需要时切换其目标纹理来实现相同的结果而不是使用多个帧缓冲区对象在所有情况下这都是一个坏主意吗如果是为什么我一直在实现一个功能render SetTargetTexture 在我的程序的 AP
在大多数设备上使用 Google 地图 v2 时应用程序崩溃

我正在尝试编写一些使用 Google 地图 API 的应用程序地图显示在主要活动中在某些手机包括模拟器上应用程序启动后立即崩溃它唯一兼容的手机是我的 Galaxy S1 它运行 CM10 1 4 2 2 它在我的 HTC DES
通过iPhone编程发送短信？ [复制]

这个问题在这里已经有答案了可能的重复如何在 iPhone 上以编程方式发送短信 https stackoverflow com questions 10848 how to programmatically send sms on th
Java - 在 try/catch 中执行 try/catch 是一种不好的做法吗？

我有一些代码想要在发生异常时执行但该代码也可能生成异常但我从未见过有人在另一个 try catch 中执行 try catch 我的做法很糟糕也许有更好的方法 Uri uri Uri parse some url Intent int
TensorFlow 设备上下文、流和上下文切换

In the GPU设备 https github com tensorflow tensorflow blob master tensorflow core common runtime gpu gpu device cc L264代码

TensorFlow 设备上下文、流和上下文切换

TensorFlow 设备上下文、流和上下文切换 的相关文章

随机推荐

热门标签

TensorFlow 设备上下文、流和上下文切换的相关文章