Tensorflow 跨设备通信

2023-11-24

正如tensorflow论文所述，Tensorflow的跨设备通信是通过在设备中添加“接收节点”和“发送节点”来实现的。

根据我的理解，设备（请考虑仅涉及CPU设备）负责执行操作的计算。然而，数据（例如：操作产生的张量、变量缓冲区）驻留在内存中。不知道如何实现从一台设备到另一台设备的数据传输身体上的。我猜数据传输是通过共享内存来实现的。是对的吗？

我将感谢有关如何实现数据传输的任何解释/相应代码。附：TensorFlow 论文链接，图4展示了跨设备通信机制。

在 TensorFlow 中，跨设备通信是通过使用Rendezvous接口，它有多种不同的实现，具体取决于部署。该界面的评论描述了总体思路：

// A Rendezvous is an abstraction for passing a Tensor
// from a producer to a consumer, where the consumer may safely
// request the Tensor before or after it has been produced.  A
// producer never blocks when using a Rendezvous.  A consumer has the
// choice of making a blocking call or providing a callback: in either
// case, the consumer receives the Tensor as soon as it is available.

正如您在问题中指出的，TensorFlow 使用以下方式表示数据流图中的通信Send and Recv当图表跨设备分区时自动添加到图表中的操作。对于在不同设备上具有源和目标的每条边，图分区器会插入一对Send and Recv共享相同“集合点键”（自动生成的字符串名称，用作要通信的待处理张量的集合点索引中的键）的操作。这的实施Send op很简单：它调用Rendezvous::Send()，传入其集合点键和单个输入张量，然后立即返回而不会阻塞。这的实施Recv op稍微复杂一些：它注册一个回调，当具有给定键的张量可用时调用。那callback负责“产生”输出Recvop，并解除后续计算的阻塞。

The Rendezvous实现执行传输数据的实际工作：

IntraProcessRendezvous在同一进程中处理设备之间的数据传输。如果传输发生在同一进程中的两个 CPU 设备之间（不太可能），则可以通过simple Tensor任务。否则，TensorFlow揭开序幕用于在 CPU 和 GPU 设备之间传输数据的设备特定 DMA 例程。
The BaseRemoteRendezvous类及其子类在发送方和接收方可以位于不同进程的情况下处理跨设备通信。该类的主要实现是RpcRemoteRendezvous, which 使用 gRPC处理远程传输。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

tensorflowserving

Tensorflow 跨设备通信的相关文章

为什么平均百分比误差（mape）非常高？

我已获得代码掌握机器学习 https machinelearningmastery com time series prediction lstm recurrent neural networks python keras 我修改了mod
TensorFlow：使用不同的输入张量重新运行网络？

假设我在 TensorFlow 中有一个典型的 CNN 模型 def inference images images 4D tensor of batch size IMAGE SIZE IMAGE SIZE 3 size conv 1 c
TensorFlow 运算符重载

有什么区别 tf add x y and x y 在 TensorFlow 中当您使用以下命令构建图表时您的计算图表会有什么不同代替tf add 更一般地说有或者其他张量超载的操作如果至少有一个x or y is a tf Te
如何在arm64主机上运行amd64 docker镜像

警告请求的映像平台 linux amd64 与检测到的主机平台 linux arm64 v8 不匹配并且未请求特定平台 2021 07 28 22 25 06 349222 F tensorflow core platform cpu
Tensorflow - 获取队列中的样本数量？

对于性能监控我想关注当前排队的示例我正在平衡用于填充队列的线程数量和队列的最佳最大大小我如何获得这些信息我正在使用一个tf train batch 但我猜这些信息可能在下面的某个地方FIFOQueue 我本以为这是一个局部变量但我
如何在 TensorFlow 中访问原型中的值？

我从tutorial https www tensorflow org extend tool developers 我们可以这样做 for node in tf get default graph as graph def node pr
在 Tensorflow2 中将图冻结为 pb

我们通过图形冻结保存来自 TF1 的许多模型 tf train write graph self session graph def some path get graph definitions with weights output g
张量流中检查点之间的间隔

如何指定张量流中两个连续检查点之间的间隔里面没有选项tf train Saver来指定这一点每次我使用不同数量的全局步骤运行模型时我都会得到检查点之间的新间隔 The tf train Saver https www tensorf
TensorFlow：Dst 张量未初始化

The MNIST For ML Beginners当我运行时教程给我一个错误print sess run accuracy feed dict x mnist test images y mnist test labels 其他一切都运行
UnimplementedError：图形执行错误：在张量流上运行 nn

我一直遇到这个错误我不知道为什么特别是因为我完全遵循某人的代码并且该人在运行此错误时没有错误 img shape 128 128 3 load pretrained model base model tf keras applicati
GPU 上的 AWS SageMaker [已关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在尝试在 AWS 上训练神经网络 Tensorflow 我有一些 AWS 积分据我了解 AWS
在 Windows 上，运行“导入张量流”会生成“没有名为“_pywrap_tensorflow”的模块”错误

在 Windows 上 TensorFlow 在执行后报告以下一个或两个错误import tensorflow陈述 No module named pywrap tensorflow DLL load failed 对我来说问题是 cuDN
使用 Keras 和 fit_generator 绘制 TensorBoard 分布和直方图

我正在使用 Keras 使用 fit generator 函数训练 CNN 这似乎是一个已知问题 https github com fchollet keras issues 3358TensorBoard 在此设置中不显示直方图和分布有
我想知道对象检测 api 中边界框的大小

我已经用过API https github com tensorflow models tree master object detection https github com tensorflow models tree master
在 Tensorflow 中学习新单词嵌入时进行地面预训练嵌入

我尝试使用以下代码片段为预训练的嵌入奠定基础并仅针对新词汇学习嵌入但预定义单词的嵌入也发生了变化 None
Tensorflow 初始化给出所有 1

张量流1 12 0 在下面的代码片段中 wrapped rv val和seq rv val似乎应该是等效的但事实并非如此相反 seq rv val 被正确初始化为随机生成的 init val 数组但wrapped rv val 设置为
导入一个简单的 Tensorflow freeze_model.pb 文件并用 C++ 进行预测

我正在尝试将从 Tensorflow Python 导出的图形导入到 Tensorflow C 中我已经成功地将图表重新导入到 Python 中我现在唯一想要的就是用 C 编写相同的代码但我不确定 C api 函数和用法因为 Ten
Tensorflow 数据 API - 预取

我正在尝试使用 TF 的新功能即 Data API 但我不知道如何使用prefetch作品在下面的代码中 def dataset input fn dataset tf data TFRecordDataset filenames co
在自定义 keras 层的调用函数中传递附加参数

我创建了一个自定义 keras 层目的是在推理过程中手动更改前一层的激活以下是基本层它只是将激活值乘以一个数字 import numpy as np from keras import backend as K from keras
如何使用 keras.backend.gradients() 获取梯度值

我试图获得 Keras 模型的输出相对于模型输入 x 而不是权重的导数似乎最简单的方法是使用 keras backend 中的梯度它返回梯度张量 https keras io backend https keras io backe

随机推荐

添加注释到pdf

我开发了一个 pdf 查看器其中包含您的所有建议和代码片段谢谢现在我想把它变成一个pdf编辑器我想为 iphone ipad 创建一个类似于 PDFKit 的应用程序仅适用于桌面我希望用户能够添加注释并突出显示文本部分我该怎么
为什么卷积神经网络可以具有低损失，但精度却非常低？

I am new to machine learning and am currently trying to train a convolutional neural net with 3 convolutional layers and
jQuery SVG，为什么我不能 addClass？

我正在使用 jQuery SVG 我无法向对象添加或删除类有人知道我的错误吗 The SVG
同步两个RichTextBox的滚动位置？

在我的申请表中我有两个RichTextBox对象它们的文本行数始终相同我想同步这两者之间的垂直滚动以便当用户更改其中一个的垂直滚动位置时另一个滚动相同的量我该怎么做呢感谢杰伊的回答经过更多搜索我也找到了所描述的方法he
Formik + 是的：如何在安装时立即验证表单？

我想在安装表单时显示字段错误提交后不行 Yup const validation Yup object shape field Yup string required Required Formik
golang中星号（*struct）表示法是什么意思

NewReaderSize returns a new Reader whose buffer has at least the specified 43 size If the argument io Reader is already
geom_area 绘图默认堆叠区域

我在用geom area绘制一个非常简单的数据集绘图时使用geom line一切正常但是当我切换到geom area绘制更高的值我认为查看图表是代表我的问题的最佳方式 require tidyverse x lt structure
在 CPanel 中编辑 DNS 记录的 PHP 脚本

我想变得自给自足因此不需要 DNSDynamic 和 DYNDNS 等服务而且我不喜欢为我自己可以做的服务付费场景如下我的主网站由托管公司托管我还有一个家庭服务器上面有我的音乐等但问题是我的 ISP BT 不向消费者提供静态
确保第一个 ajax 函数在第二个之前完成

我有一个 JavaScript 函数它使用 jQuery 发出两个连续的 Ajax 请求我想确保在调用第二个函数之前第一个请求已加载我有办法做到这一点吗要么指定async false in the ajax选项或者进行第二个 aj
样式图标标记 - 融合表

这是为像我这样的其他新手提供的帮助我花了很长时间才弄清楚如何在我的融合表项目中将不同的图标分配给不同类别的标记我发现文档有限且令人困惑我想如果我感到困惑那么其他人可能也会如此在其他人的帮助和大量测试的帮助下我现在可以与您分享两种
JMeter、JUnit 和 Spring Java 配置

是否可以使用 JUnit 插件采样器和 Spring Java 配置来运行 JMeter 当我尝试执行此操作时未创建 Spring 自动装配 bean 尽管测试用例运行但由于尚未创建 bean 我收到了空指针异常我正在使用Sprin
如何从 char 数组进行转换 [char; N] 到字符串切片 &str?

给定一个固定长度char数组如 let s char 5 h e l l o 我如何获得 str 你不能没有一些分配这意味着你最终会得到一个String let s2 String s iter collect 问题是 Rust 中的字符
如何修复我的包中的“.dist-info 目录未找到”？

我有一个 Python 2 软件包我正在尝试将其升级到 Python 3 它是由曾经在我现在所在的同一团队工作的某个人编写的但他已不再在公司工作不幸的是没有人离开公司团队能够提供帮助对包的文件运行 2to3 后我运行python
R匹配2个以上条件并返回响应值

您好我有两个数据集其中第一个是一组索引 ind1 lt rep c E W times 20 ind2 lt sample 100 150 40 y lt c 1 40 index lt data frame cbind ind1 in
如果内存大小相等，如何将 C 结构体转换为另一种结构体类型？

我有 2 个矩阵结构意味着相同的数据但具有不同的形式如下所示 Matrix type 1 typedef float Scalar typedef struct Scalar e 4 Vector typedef struct Vect
该字符串未被识别为有效的日期时间。有一个从索引 0 开始的未知单词

我有以下 C 在尝试将字符串解析为日期时间时出现上述错误 DateTime backupdate System Convert ToDateTime imageflowlabel Text DateTime currentdate Syst
gTTS直接输出

我想让聊天机器人做出回应audio和文字所有使用 gTTS 的示例代码似乎都需要将文本保存到文件中然后播放该文件是否有另一种方法可以简化流程例如使用 gTTS 自动播放聊天机器人的响应如果你简单地看一下the docs 您会看
悬停时开始和暂停 SVG 动画

当用户将鼠标悬停在以下 SVG 上时我想对齿轮进行动画处理也就是说当鼠标进入时两个齿轮都开始从它们停止的地方旋转当鼠标离开时齿轮会停止在它们所在的任何位置如果可能的话我希望动画使用缓入缓出功能开始和结束如何使用 SVG
使用 sf 在 R 中求多边形的交集

我想通过查看 400m 步行 5 分钟内其他点的数量来评估每个点与其他等效点的空间接近程度我在地图上有一些点我可以在它们周围画一个简单的 400 m 缓冲区我想确定哪些缓冲区重叠然后计算重叠的数量这个重叠数应该与原始点相关这样
Tensorflow 跨设备通信

正如tensorflow论文所述 Tensorflow的跨设备通信是通过在设备中添加接收节点和发送节点来实现的根据我的理解设备请考虑仅涉及CPU设备负责执行操作的计算然而数据例如操作产生的张量变量缓冲区驻留在内存

Tensorflow 跨设备通信

Tensorflow 跨设备通信 的相关文章

随机推荐

热门标签

Tensorflow 跨设备通信的相关文章