并行化 tf.data.Dataset.from_generator

2023-12-20

我有一个不平凡的输入管道from_generator非常适合...

dataset = tf.data.Dataset.from_generator(complex_img_label_generator,
                                        (tf.int32, tf.string))
dataset = dataset.batch(64)
iter = dataset.make_one_shot_iterator()
imgs, labels = iter.get_next()

Where complex_img_label_generator动态生成图像并返回一个代表图像的 numpy 数组(H, W, 3)图像和一个简单的string标签。我不能将处理表示为从文件中读取并且tf.image运营。

我的问题是如何并行化生成器？我如何让 N 个这些生成器在它们自己的线程中运行。

一种想法是使用dataset.map with num_parallel_calls处理线程；但地图是在张量上运行的...另一个想法是创建多个生成器，每个生成器都有自己的prefetch并以某种方式加入它们，但我不知道如何加入 N 个生成器流？

我可以遵循任何典型的例子吗？

原来我可以使用Dataset.map如果我使生成器超轻量级（仅生成元数据），然后将实际的重型照明移至无状态函数中。这样我就可以将繁重的部分与.map用一个py_func.

作品;但感觉有点笨拙...如果能够添加就太好了num_parallel_calls to from_generator :)

def pure_numpy_and_pil_complex_calculation(metadata, label):
  # some complex pil and numpy work nothing to do with tf
  ...

dataset = tf.data.Dataset.from_generator(lightweight_generator,
                                         output_types=(tf.string,   # metadata
                                                       tf.string))  # label

def wrapped_complex_calulation(metadata, label):
  return tf.py_func(func = pure_numpy_and_pil_complex_calculation,
                    inp = (metadata, label),
                    Tout = (tf.uint8,    # (H,W,3) img
                            tf.string))  # label
dataset = dataset.map(wrapped_complex_calulation,
                      num_parallel_calls=8)

dataset = dataset.batch(64)
iter = dataset.make_one_shot_iterator()
imgs, labels = iter.get_next()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

tensorflowdatasets

并行化 tf.data.Dataset.from_generator 的相关文章

Tensorflow图像读取空

这个问题是基于 Tensorflow图像读取与显示 https stackoverflow com questions 33648322 tensorflow image reading display 根据他们的代码我们得到以下内容 s
用于测试张量流安装的速度基准

我怀疑我的 GPU 机器上是否正确配置了张量流因为在我精美的 GPU 机器上训练一个简单的线性回归模型批量大小 32 1500 个输入特征 150 个输出变量的每次迭代速度比在笔记本电脑上慢 100 倍我使用的是 Titan X 配
tf.gfile 在 TensorFlow 中起什么作用？

我见过人们使用以下几个函数tf gfile例如tf gfile GFile or tf gfile Exists 我有一个想法tf gfile处理文件但是我无法找到官方文档来了解它还提供了什么如果你能帮我的话那就太好了对于登陆这里的
Tensorflow 对象检测 API 无效参数：元组组件 16 中的形状不匹配。预期为 [1,?,?,3]，得到 [1,182,322,4]

这是来自的后续问题这个 Github 问题 https github com tensorflow tensorflow issues 13044 长话短说我尝试将 Tensorflow 对象检测 API 与我自己的数据集结合使用一切都
Tensorflow：尽管数据中没有字符串，但使用 tflearn 时不支持将字符串转换为浮点数错误

我似乎无法在我的代码中找到错误其中有任何字符串被错误地转换为浮点数但它却给了我这个错误 W tensorflow core framework op kernel cc 958 Unimplemented Cast string to
Tensorflow 到 ONNX 的转换

我目前正在尝试转换我使用本教程创建的已保存且正在工作的 pb 文件 https github com thtrieu darkflow https github com thtrieu darkflow 到 onnx 文件中我目前正在
Keras：binary_crossentropy 和 categorical_crossentropy 混淆

使用 TensorFlow 一段时间后我阅读了一些 Keras 教程并实现了一些示例我找到了几个使用卷积自动编码器的教程keras losses binary crossentropy作为损失函数我想binary crossentro
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
从 swift 数组创建张量

这工作正常 import TensorFlow var t Tensor
使用tensorflow获取真阳性、假阳性、假阴性和真阴性列表

这是我的工作我注释了活细胞的图像约 8 000 和死细胞的图像约 2 000 800 和 200 用于测试集我正在使用 CNN 带有张量流和 keras 将图像分类为活或死我训练了我的模型验证损失 0 35 召回率
ExpirationError（代码= StatusCode.DEADLINE_EXCEEDED，详细信息=“超过截止日期”）

我正在关注tutorial https www youtube com watch v T afaArR0E8用于使用tensorflow services部署inception模型我使用的是ubuntu 16 04和bazel 13 0
我无法使用 scikeras.wrappers.KerasRegressor 执行 cross_val_score

from tensorflow import keras from sklearn model selection import cross val score from sklearn datasets import make regre
Tensorflow：ValueError：形状必须具有相同的等级，但为 0 和 2

我在乘以 x1 Wo1 时遇到形状错误但我找不到原因错误 ValueError 形状必须具有相同的等级但为 0 和 2将形状 0 与其他形状合并对于 add 2 x 操作 Pack 输入形状 20 1 import tensorfl
无法加载 DLL“tensorflow”或其依赖项之一（ML.NET）

我有一个用于图像分类的 NET Core 3 应用程序使用 Microsoft 的 ML NET 框架在我的开发机器上我可以运行代码并且一切正常但是当我将其部署到临时服务器时我在运行时收到此错误 System Reflectio
Tensorflow 检查点模型被删除

我使用以下代码每 10 个时期后使用张量流检查点 checkpoint dir os path abspath os path join out dir checkpoints checkpoint prefix os path join
TensorFlowdynamic_rnn 回归器：ValueError 维度不匹配

我想构建一个用于回归的玩具 LSTM 模型 This http mourafiq com 2016 05 15 predicting sequences using rnn in tensorflow html不错的教程对于初学者来说已经太
AudioSet 和 Tensorflow 理解

With AudioSet https research google com audioset index html发布并为那些进行合理研究分析的人提供了一个全新的研究领域最近几天我一直在努力深入研究如何分析和解码这些数据数据在 tf
模型返回错误 - ValueError：logits 和标签必须具有相同的形状 ((None, 18) vs (None, 1))

我正在使用基于 keras 的多标签分类器我创建了一个加载训练和测试数据的函数然后在函数本身内处理拆分 X Y 我在运行模型时遇到错误但不太确定其含义这是我的代码 def KerasClassifer df train df te
TensorFlow 的 Print 或 K.print_tensor 不会在损失函数中打印中间张量

我为 Keras 模型编写了一个相当复杂的损失函数并且它不断返回nan训练时因此我需要在训练时打印中间张量我知道你不能在损失函数中执行 K eval 因为张量未初始化不过我都尝试过K print tensor and tf Pr

随机推荐

如何使用 Teams JS SDK v2 向 Microsoft Teams 中的用户或频道发送大文本消息？

我目前正在使用 Microsoft Teams JavaScript SDK v2 TeamsJS 开发一个应用程序并且正在努力寻找一种向特定用户或频道发送大文本消息的方法我已成功使用 selectPeople API 使用户能够从列表
什么是 Cache-Control: private？

当我访问时chesseng herokuapp com http chesseng herokuapp com我得到一个响应标头如下所示 Cache Control private Connection keep alive Conten
如何在docker中运行无头浏览器？

我正在使用无头浏览器构建一个爬虫但现在我想对我的应用程序进行 dockerize 我已经在我的 docker 映像中安装了 chrome 但在运行脚本时它会抛出错误启动Chrome js const chromeLauncher req
@Transactional 与 JPA 和 Hibernate 有什么用？

我正在学习如何使用 JPA 和 Hibernate 以及 MySQL 数据库创建 REST API 并且我看到了这个 Transactional 注释有人能解释一下这个注释有什么用吗例如我有这个简单的 DAO 类 Repository
将 csv 导入到 xlsx python

我正在尝试将 csv 文件中的一些数据放入现有的 Excel 文件中我现有的 Excel 文件包含图像而 xlrd 无法获取图像我尝试使用 xlsxwriter 但它无法附加到现有的 xslx 我找到的唯一解决方案是使用 openpy
AppDelegate 文件适合 MVC 中的什么位置？

我正在学习 iPhone iPad 编程我相信我理解了MVC的概念我遇到的困难是理解普通 iPhone iPad 应用程序中的某些文件如何适合 MVC 当您使用基于视图的应用程序模板创建新应用程序时将创建 AppDelegate
Python pandas - 如果该项目在列表中，则新列的值

我想在 pandas 数据框中创建一个新列第一列包含国家地区名称该列表包含我感兴趣的国家例如欧盟新列应指示数据框中的国家地区是否在列表中以下是代码的简化版本 import pandas as pd import numpy a
如何求一系列数字的最小公倍数？

给定一个由两个数字组成的数组让它们定义一系列数字的开始和结束例如 2 6 表示范围 2 3 4 5 6 我想编写 javascript 代码来查找范围的最小公倍数我下面的代码仅适用于小范围而不是类似的 1 13 即范围 1 2 3
SSH 握手抱怨缺少主机密钥

我正在尝试连接到远程主机并检查文件是否存在在这个阶段我只是尝试连接但出现错误 2017 08 01 18 16 39 unable to connect ssh handshake failed ssh required host k
如何并行化 Azure ML 服务计算集群上的工作？

我可以使用计算集群将作业提交到 Azure ML 服务它运行良好并且自动缩放与自定义环境的良好灵活性相结合似乎正是我所需要的然而到目前为止所有这些作业似乎只使用集群的一个计算节点理想情况下我希望使用多个节点进行计算但我看到的
当我在 android 中使用哈希映射时显示警告（使用新的 SparseArray）

我是 Android 开发新手在我使用的 Android 应用程序中HashMap 但我收到警告 Use new SparseArray
URL 中的段落字符？

我刚刚遇到了这个Google 应用引擎文章 http code google com googleapps appsscript articles appengine html在某些 URL 中使用有趣的反向 P 字符查看第一个代码框顶部
使用 FastObjImporter 在场景中加载并显示 obj 模型

在我的 Unity 项目中我想使用在互联网上找到的 FastObjImporter 类将 obj 放入场景中我是否必须创建一个空的 GameObject 并将已处理的 obj 分配给它尝试使用空的游戏对象 GameObject go
如何使用 Flutter 在 Android 和 iOS 上实现振动？

我正在尝试使用 Flutter 在单击按钮时实现振动我发现说实话非常困难我尝试使用以下软件包但未成功振动 https pub dev packages vibration and vibrate https pub dev packa
无法使用 Jekyll 生成任何内容

当我运行 Jekyll 时它不会生成任何内容我看到的输出 Configuration from home mbsheikh techtraits techtraits blog config yml Auto regenerating
调用纯虚函数[重复]

这个问题在这里已经有答案了可能的重复在构造函数中调用虚函数 https stackoverflow com questions 962132 calling virtual functions inside constructors 看
JAXB 是否存在内存利用率问题？

我使用 JAXB 进行 xml 解析是否存在任何性能或内存利用率问题需要注意的一件事是JAXBContext newInstance 是一个非常慢的操作这是发生大量反射和类生成的地方导致 duffymo 提到的烫发空间问题值得庆幸
如果我仅使用 JSON.Net，我可以安全地删除 C# 模型类中指定后缀的字段和属性吗

我有一个 C 应用程序我有一个从 xsd 生成的类该类如下所示 public class Transaction public bool amountSpecified get set public double amount get
Ocaml 中查找树深度的尾递归函数

我有一个类型tree定义如下 type a tree Leaf of a Node of a a tree a tree 我有一个函数可以找到树的深度如下所示 let rec depth function Leaf x gt 0 Node
并行化 tf.data.Dataset.from_generator

我有一个不平凡的输入管道from generator非常适合 dataset tf data Dataset from generator complex img label generator tf int32 tf string dat

并行化 tf.data.Dataset.from_generator

并行化 tf.data.Dataset.from_generator 的相关文章

随机推荐

热门标签