了解张量流间/内并行线程

2024-07-04

我想更多地了解这两个参数：操作内和操作间并行线程

session_conf = tf.ConfigProto(
  intra_op_parallelism_threads=1,
  inter_op_parallelism_threads=1)

我读过这篇文章，其中有很好的解释：TensorFlow：操作间和操作内并行性配置 https://stackoverflow.com/questions/41233635/tensorflow-inter-and-intra-op-parallelism-configuration

但我正在寻求确认，并在下面提出新问题。我正在 keras 2.0.9、tensorflow 1.3.0 中运行我的任务：

当两者都设置为 1 时，是否意味着在具有 4 个核心的计算机上，四个核心将仅共享 1 个线程？
为什么使用 1 个线程似乎对我的任务速度没有太大影响？我的网络具有以下结构：dropout、conv1d、maxpooling、lstm、globalmaxpooling、dropout、dense。上面引用的帖子说，如果有大量矩阵乘法和减法运算，使用多线程设置会有所帮助。我对下面的数学了解不多，但我想我的模型中有很多这样的矩阵运算？然而，将两个参数从 0 设置为 1 只会使 10 分钟的任务慢 1 分钟。
为什么多线程可能成为不可重现结果的来源？看使用 Python 中的 Keras 和 TensorFlow 无法重现结果 https://stackoverflow.com/questions/46836857/results-not-reproducible-with-keras-and-tensorflow-in-python。这是我在进行科学实验时需要使用单线程的主要原因。当然，随着时间的推移，张量流一直在改进，为什么这个版本没有解决这个问题？

提前谢谢了

当两个参数都设置为 1 时，将有 1 个线程在 4 个核心中的 1 个上运行。它运行的核心可能会改变，但每次总是 1。
当并行运行某些东西时，总是需要在通信损失时间和通过并行化获得时间之间进行权衡。根据所使用的硬件和特定任务（如矩阵的大小），加速会发生变化。有时并行运行某些东西甚至比使用一个核心还要慢。
例如，当在 cpu 上使用浮点数时，(a + b) + c将不等于a + (b + c)因为浮点精度。使用多个并行线程意味着像这样的操作a + b + c并不总是以相同的顺序计算，导致每次运行都会得到不同的结果。然而，这些差异非常小，在大多数情况下不会影响整体结果。通常仅在调试时才需要完全可重现的结果。强制执行完全的可重复性会大大减慢多线程的速度。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

了解张量流间/内并行线程的相关文章

如何在对象检测 API 中同时训练和评估？

我想同时在我自己的数据集上训练评估 ssd mobilenet v1 cocoObject Detection API 然而当我尝试这样做时我面临着 GPU 内存几乎已满因此评估脚本无法启动以下是我用于训练和评估的命令在一个终端
如何使用 keras/tensorflow 构建无监督 CNN 模型？

我正在尝试为图像到图像转换应用程序构建 CNN 模型的输入是图像输出是置信图训练期间没有标记的置信度作为基本事实但设计了损失函数来引导模型获得正确的输出我在用 keras 构建神经网络时遇到困难因为 model fit 函数需要训
使用 WALS 方法在 Tensorflow 2.0 中进行矩阵分解

我使用 WALS 方法来执行矩阵分解最初在tensorflow 1 13中我可以使用导入factorization ops from tensorflow contrib factorization python ops import f
AudioSet 和 Tensorflow 理解

With AudioSet https research google com audioset index html发布并为那些进行合理研究分析的人提供了一个全新的研究领域最近几天我一直在努力深入研究如何分析和解码这些数据数据在 tf
模型返回错误 - ValueError：logits 和标签必须具有相同的形状 ((None, 18) vs (None, 1))

我正在使用基于 keras 的多标签分类器我创建了一个加载训练和测试数据的函数然后在函数本身内处理拆分 X Y 我在运行模型时遇到错误但不太确定其含义这是我的代码 def KerasClassifer df train df te
给定 url，如何加载图像，然后将其转换为 Javascript 中的 tf.tensor 数据？

我是前端和 javascript 新手现在我正在编写一个基于 CNN 的 Web 应用程序要从给定的 url 加载图像然后将图像输入 CNN 我尝试编写以下代码 async function getImage var img new
tensorflow Protobuf编译问题

我想为 google 对象检测 API 编译 protobuf 库我按照官方教程输入protoc object detection protos proto python out 然后我得到的是 object detection prot
如何正确设置Tensorflow中Adadelta算法的参数？

我一直在使用 Tensorflow 进行回归我的神经网络非常小有 10 个输入神经元单层 12 个隐藏神经元和 5 个输出神经元激活函数是relu 成本是产出与实际价值之间的平方距离我的神经网络可以与其他优化器例如 Gradie
Tensorflow，在另一个 tf.estimator model_fn 中使用 tf.estimator 训练的模型

有没有办法在另一个模型 B 中使用 tf estimator 训练的模型 A 这是情况假设我有一个经过 model a fn 训练的模型 A 模型 A 获取图像作为输入并输出一些类似于 MNIST 分类器的向量浮点值还有另一个模型
是否有解决方法可以解决使用 Tensorflow 时 GPU 内存不足的问题？

我目前正在构建一个 3D 卷积网络用于视频分类主要问题是我太容易耗尽内存了即使我将batch size设置为1 仍然没有足够的内存来按照我想要的方式训练我的CNN 我使用的是带有 4Gb VRAM 的 GTX 970 3 2Gb 可免
如何创建使用几个客户端权重的 FL 算法？

基于此link https github com tensorflow federated tree 3c0852c5fef375198f5931ce31fd97f2df9c4d05 tensorflow federated python
RStudio/ R 上的 Tensorflow 设置 |中央操作系统

在过去的 5 天里我试图让 Keras Tensorflow 包在 R 中工作我使用 RStudio 进行安装并使用conda miniconda virtualenv但最后每次都会崩溃安装库不应该是一场噩梦尤其是当我们谈论 R 时
Android Things - 创建相机预览会话失败，并且不显示预览

我正在尝试部署 Android TensorFlow Lite 示例特别是检测器活动我已成功将其部署在平板电脑中该应用程序运行良好它能够检测对象在其周围放置一个边界矩形并带有标签和置信度然后我设置了 Raspberry Pi
tensorflow 2 TextVectorization过程张量和数据集错误

我想在 Jupyter 笔记本上使用 TensorFlow 2 8 处理文本 my code import re import string import tensorflow as tf from tensorflow import ke
如何：在 GPU 支持下从 Conda 导入 Jupyter Notebook 中的 TensorFlow？

我已经使用 anaconda 环境安装了tensorflow 如张量流网站 https www tensorflow org versions r0 9 get started os setup html anaconda installa
tf.contrib.rnn.BasicLSTMCell 是单个 LSTM 单元还是 LSTM 层？

在tensorflow中有一个lstm实现称为BasicLSTMCell哪个在tf contrib rnn BasicLSTMCell 并且它有一个参数num units这意味着 LSTM 单元中的单元数但我不知道这意味着什么如果我像
如何在Mandlebrot张量流程序中显示图像。当前输出是

导入模拟库 import tensorflow as tf import numpy as np 导入可视化 from PIL Image from io import BytesIO from IPython display import
如何从张量流中的两个张量创建字典？

我有两个张量一个用于键一个用于值我正在尝试从它们创建一个字典以便我可以使用创建的字典来更新另一个字典update 功能我怎样才能实现这个我不是在寻找tf contrib lookup HashTable 我尝试过使用tf map
张量流批量稀疏乘法

我想将稀疏张量乘以密集张量但在批次内进行例如我有一个稀疏张量其相应的密集形状为 20 65536 65536 其中 20 是批量大小我想将批次中的每个 65536 65536 与具有密集表示的张量形状 20 65536 中的相应
了解张量流间/内并行线程

我想更多地了解这两个参数操作内和操作间并行线程 session conf tf ConfigProto intra op parallelism threads 1 inter op parallelism threads 1 我读过这篇

随机推荐

Zend 框架表单与 jquery

有人知道如何使用 Zend Form 和 jquery 简单地创建一个表单吗我想使用 Zend Form 来验证表单这样我就不必在 JavaScript 和 PHP 中编写表单的双重脚本谢谢你伊沃特罗姆伯特那里没问题如果您使用
获取JQuery中选定单选按钮的文本

在 Jquery 中如何获取所选单选按钮的文本而不是值如下所示
CacheStoreMode USE 和 REFRESH 有什么区别

javadoc 为缓存存储模式 http docs oracle com javaee 6 api javax persistence CacheStoreMode html区分我无法真正理解的一点 javadoc 为USE mode 从数
何时何地打开数据库连接

我正在努力实现发现的 mysql 类的使用here http www ricocheting com scripts php mysql wrapper php在现有脚本中该脚本几乎总是需要与数据库交互即使有时不需要在这种情况下最佳
将图像添加到Toast？

是否可以以编程方式将图像添加到 toast 弹出窗口 Yes 您可以使用 setView 方法将 imageview 或任何视图添加到 toast 通知中使用此方法您可以根据您的要求自定义 Toast 在这里我创建了一个要膨胀到 Toa
用于结构化数据格式（XML、JSON）内的目标内容的标准表示法？

问题是这样的我处于 Web 环境中并且拥有以某种结构化格式例如 XML 或 JSON 表示的数据我想定位这些表示内的元素这是一个例子动物园的 XML 表示形式
避免 xjc 生成的代码出现编译器警告

我的根本问题是如何从未经检查的泛型类型 Eclipse 编译器警告中受益但问题视图中没有这些警告列表这些警告被 xjc 从 xsd 文件生成的 java 类的噪声污染通过 maven jaxb2 插入我读过其他地方我可以忽略每个
将字符串中的每个字符转换为 ASCII

谁能告诉我如何轻松地将字符串中的每个字符转换为 ASCII 值以便我可以对这些值求和我需要对哈希函数的值求和字符串中的每个字符都已经是 ascii include
GlassFish 服务器日志的位置

我在 Windows 7 64 位计算机上安装了 NetBeans IDE 显然 NetBeans 附带了 GlassFish 服务器我目前在一个项目中遇到问题想检查服务器日志请问这些保存在哪里一般来说日志位于 YOUR GLAS
/lib64/libc.so.6：找不到版本“GLIBC_2.14”。为什么我会收到此错误？

我在 Node js 中工作我已经安装了鹰嘴豆泥包它安装正确我正在使用这个包来修改 pdf 文件下载 pdf 时我调用鹰嘴豆泥单击下载时出现此错误 Error lib64 libc so 6 version GLIBC 2 14
部署到 10.6 时出现 ARC 错误

我的应用程序在 10 7 上运行和测试但后来意识到我也需要它在早期版本上运行不幸的是我从一开始就在 ARC 的情况下开始了这个项目现在我的构建设置是调试基础 sdk 10 7 并发布基础 sdk 10 6 当我尝试存档我的应用程序
Laravel 4 中的图标链接

有人可以帮忙重写这个从 HTML 到 Laravel4 吗 a href index php span i class icon home i span Home a 该页面的路由名称只是我知道如何在 Laravel 中编写简单的链接
为什么 List.contains() 在 Collections Java 中将 Object 作为参数 [重复]

这个问题在这里已经有答案了 The java util List contains Object o 方法需要Object作为参数并在内部使用Object equals Object o 如上所述here http docs oracle
查找 R 中已知中心点的半径范围内的纬度/经度

我有一个具有已知纬度和经度的已知点中心并且我在 df 中有一些坐标以纬度经度为单位我想查看哪些坐标在距中心点 5 公里或更小的半径内 Centre mylon lt c 2 106472 mylat lt c 57 14455 坐
调整图像大小以适合父节点

如何让 ImageView 中的图像自动调整大小以使其始终适合父节点这是一个小代码示例 Override public void start Stage stage throws Exception BorderPane pane new
覆盖引导样式不起作用

我有这种简单的情况我有一种没有定义的风格display属性值我最近在我的项目中添加了 bootstrap 没有出现重大问题只有一个 In label bootstrap style is defined a display inlin
Angular Service Worker 在不支持的浏览器上

Angular 团队做得非常出色并在版本 5 中引入了 Service Worker 支持文档 https angular io guide service worker intro非常有帮助在阅读相关文章后我真的可以看到这些事情是如
Numpy“shape”函数返回 2D 数组的 1D 值

所以我创建了这个数组作为示例 a np array 1 1 1 1 2 2 2 2 3 3 3 3 4 13 49 13 49 10 10 2 2 11 1 1 1 2 22 2 2 3 33 3 3 4 133 49 13 49 100
如何读取PHP上传的文件头？

我们能否在PHP中读取文件的头信息来判断上传的文件类型我不想依赖 FILES control name from client type 我们知道该属性通过读取上传文件的扩展名来确定文件类型如果用户重命名怎么办 test jpg gt
了解张量流间/内并行线程

我想更多地了解这两个参数操作内和操作间并行线程 session conf tf ConfigProto intra op parallelism threads 1 inter op parallelism threads 1 我读过这篇

了解张量流间/内并行线程

了解张量流间/内并行线程 的相关文章

随机推荐

热门标签

了解张量流间/内并行线程的相关文章