具有多处理功能的 Tensorflow2.x 自定义数据生成器

2024-01-12

我刚刚升级到tensorflow 2.3。我想制作自己的数据生成器用于训练。使用tensorflow 1.x，我这样做了：

def get_data_generator(test_flag):
  item_list = load_item_list(test_flag)
  print('data loaded')
  while True:
    X = []
    Y = []
    for _ in range(BATCH_SIZE):
      x, y = get_random_augmented_sample(item_list)
      X.append(x)
      Y.append(y)
    yield np.asarray(X), np.asarray(Y)

data_generator_train = get_data_generator(False)
data_generator_test = get_data_generator(True)
model.fit_generator(data_generator_train, validation_data=data_generator_test, 
                    epochs=10000, verbose=2,
                    use_multiprocessing=True,
                    workers=8,
                    validation_steps=100,
                    steps_per_epoch=500,
                    )

这段代码在tensorflow 1.x 上运行良好。系统中创建了8个进程。处理器和显卡加载完美。 “数据已加载”打印了 8 次。

使用tensorflow 2.3我收到警告：

警告：tensorflow：多处理可能与 TensorFlow 交互不良，导致不确定性死锁。对于高性能数据管道，建议使用 tf.data。

“数据已加载”打印一次（应该是8次）。 GPU 没有得到充分利用。每个 epoch 都会有内存泄漏，因此训练会在几个 epoch 后停止。 use_multiprocessing 标志没有帮助。

如何在tensorflow(keras) 2.x中制作一个可以轻松跨多个CPU进程并行化的生成器/迭代器？死锁和数据顺序并不重要。

With a tf.data管道中，有几个地方可以并行化。根据数据的存储和读取方式，您可以并行读取。您还可以并行化增强，并且可以在训练时预取数据，因此您的 GPU（或其他硬件）永远不会渴望数据。

在下面的代码中，我演示了如何并行化增强和添加预取。

import numpy as np
import tensorflow as tf

x_shape = (32, 32, 3)
y_shape = ()  # A single item (not array).
classes = 10

# This is tf.data.experimental.AUTOTUNE in older tensorflow.
AUTOTUNE = tf.data.AUTOTUNE

def generator_fn(n_samples):
    """Return a function that takes no arguments and returns a generator."""
    def generator():
        for i in range(n_samples):
            # Synthesize an image and a class label.
            x = np.random.random_sample(x_shape).astype(np.float32)
            y = np.random.randint(0, classes, size=y_shape, dtype=np.int32)
            yield x, y
    return generator

def augment(x, y):
    return x * tf.random.normal(shape=x_shape), y

samples = 10
batch_size = 5
epochs = 2

# Create dataset.
gen = generator_fn(n_samples=samples)
dataset = tf.data.Dataset.from_generator(
    generator=gen, 
    output_types=(np.float32, np.int32), 
    output_shapes=(x_shape, y_shape)
)
# Parallelize the augmentation.
dataset = dataset.map(
    augment, 
    num_parallel_calls=AUTOTUNE,
    # Order does not matter.
    deterministic=False
)
dataset = dataset.batch(batch_size, drop_remainder=True)
# Prefetch some batches.
dataset = dataset.prefetch(AUTOTUNE)

# Prepare model.
model = tf.keras.applications.VGG16(weights=None, input_shape=x_shape, classes=classes)
model.compile(optimizer="adam", loss="sparse_categorical_crossentropy")

# Train. Do not specify batch size because the dataset takes care of that.
model.fit(dataset, epochs=epochs)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Keras

tfkeras

datageneration

customtraining

具有多处理功能的 Tensorflow2.x 自定义数据生成器的相关文章

在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
在 Keras 上使用回调 Tensorboard 时出现 AttributeError：“Model”对象没有属性“run_eagerly”

我已经使用 Keras 的功能 API 构建了一个模型当我将 Tensorboard 实例添加到 model fit 函数的回调中时它会抛出一个错误 AttributeError Model object has no attribut
将 Dropout 与 Keras 和 LSTM/GRU 单元结合使用

在 Keras 中您可以像这样指定 dropout 层 model add Dropout 0 5 但对于 GRU 单元您可以将 dropout 指定为构造函数中的参数 model add GRU units 512 return se
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
张量流如何处理无法存储在一个盒子中的大变量

我想通过训练超过十亿特征维度的数据来训练 DNN 模型因此第一层权重矩阵的形状将为 1 000 000 000 512 这个权重矩阵太大无法存储在一个盒子中目前有没有什么解决方案来处理这么大的变量例如将大的权重矩阵划分为多个框 Up
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
无法加载动态库“libcudart.so.11.0”；

我尝试将 Tensorflow 2 7 0 与 GPU 结合使用但我不断遇到同样的问题 2022 02 03 08 32 31 822484 W tensorflow stream executor platform default ds
Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
TensorFlow：在训练时更改变量

如果我将输入管道从 feed dict 更改为 tf data dataset 如何在每次迭代后的训练期间更改网络内参数的值澄清一下旧代码看起来像这样 Define Training Step model is some class t
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs
使用预训练的 word2vec 初始化 Seq2seq 嵌入

我对使用预训练的 word2vec 初始化tensorflow seq2seq 实现感兴趣我已经看过代码了嵌入似乎已初始化 with tf variable scope scope or embedding attention deco
验证 Transformer 中多头注意力的实现

我已经实施了MultiAttention head in Transformers 周围有太多的实现所以很混乱有人可以验证我的实施是否正确 DotProductAttention 引用自 https www tensorflow org
TensorFlow 无法编译

尝试从源代码编译 TensorFlow 时出现以下错误任何想法都会有帮助 bazel out host bin solib local U S Stensorflow Spython Cgen Unn Uops Upy Uwrappers
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
TensorFlow HVX 加速支持

我成功构建并运行了测试应用程序https github com tensorflow tensorflow tree master tensorflow contrib hvx https github com tensorflow ten
在 Keras 模型中删除然后插入新的中间层

给定一个预定义的 Keras 模型我尝试首先加载预先训练的权重然后删除一到三个模型内部非最后几层层然后用另一层替换它我似乎找不到任何有关的文档keras io https keras io 即将做这样的事情或从预定义的模型中删除
Keras：如何保存模型或权重？

如果这个问题看起来很简单我很抱歉但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
使用 Keras np_utils.to_categorical 的问题

我正在尝试将整数的 one hot 向量数组制作为 keras 将能够使用的 one hot 向量数组来拟合我的模型这是代码的相关部分 Y train np hstack np asarray dataframe output vecto

随机推荐

YouTube 播放器在移动设备上几秒钟后停止

我的移动网页中嵌入了 YouTube 视频在桌面上它可以正常播放然而在手机上在 Android 上模拟它会在一段时间后停止并抛出错误当我在控制台中调试时会生成以下错误无法加载资源 net ERR FAILED XMLHtt
使用 Spring Batch 依次链接两个作业的最佳方法

我有两份工作工作1 工作2 Job2 依赖于 job1 的结果所以它必须等到 job 1 完成我需要以某种方式链接它们当 job1 完成时它需要调用 job2 怎么做使用tasklet到底会调用job2哪个另一种方式可能是调用
更快的 Aho-Corasick PHP 实现

是否有有效的实施阿霍科拉西克 http en wikipedia org wiki Aho E2 80 93Corasick string matching algorithm在 PHP 中有一个PHP 中的 Aho Corasick
Android按钮setOnClickListener设计

我正在构建一个 Android 应用程序我注意到我在每个类中创建了许多与此类似的重复代码 Button buttonX Button findViewById R id buttonXName Register the onClick l
R 中一个 PDF 页面上的多个 hexbin 图

我正在尝试创建一个包含多个内容的 PDFhexbin我希望每页有特定数量的绘图这个有效 PDFPath C temp some pdf pdf file PDFPath par mfrow c 2 2 for i in seq 5 10
如何在 Tkinter 消息窗口中自动滚动

我编写了以下类用于在额外的窗口中生成监视输出不幸的是它不会自动向下滚动到最新行怎么了因为我在 Tkinter 和 ipython 方面也有问题 qt4 的等效实现会是什么样子这是代码 import Tkinter class
在html/css中实现白色不透明效果

有没有办法以跨浏览器兼容的方式实现这种效果而无需准备单独的图像基本上文本所在的框架有一个不透明度为 50 的白色覆盖层我想要一个除了背景之外不涉及创建任何其他图像的解决方案但我不知道这是否可能尝试 RGBA 例如 div bac
如何在不同的文件中为 Angular JS 定义常量

我想为我的 Angular JS 应用程序编写几个常量我想将它们写在一个单独的文件中并想要访问它们我尝试过像这样使用 IIFE 立即调用函数表达式常量 js var Constants function var allConstant
如何使用自定义资源的分数格式（即 X/Y）显示 kubectl 列

在 Kubernetes 中是否可以使用 CRD 的 additionalPrinterColumns 字段以分数格式即 X Y 显示列更准确地说我想要kubectl使用与下面的 READY 字段相同的格式显示 CR 字段的描述 k
如何修复“无法使受保护的最终 java.lang.Class java.lang.ClassLoader.defineClass？

我已经使用 java 16 启动了一个项目但项目中到处都出现错误 An error has occurred See error log for more details Unable to make protected final ja
修改用于查找和替换的 VBA 代码以循环访问多个工作表

我有以下代码用于搜索工作表中名为 Front Wing 的一系列单元格它将用首字母缩略词 B 列中的单元格值替换与工作表中名为首字母缩略词 A 列的值相匹配的任何单元格值我有多个工作表不仅仅是 Front Wing 所以我想修改此
在 Spark 和 GraphX 中，通过取消持久图连接两个具有不同索引的 VertexPartition 速度很慢

抱歉标题不准确且较长如果您能理解我在说什么请帮我编辑它谢谢代码如下如果你执行它你将得到 14 06 12 14 33 24 WARN ShippableVertexPartitionOps Joining two Vertex
在Python 3中打印列表中不是3的倍数的数字

给定一个数字列表你必须在 python 3 中打印那些不是 3 的倍数的数字输入格式第一行包含由空格分隔的数字列表输出格式将数字打印在一行中并用空格分隔且这些数字不是 3 的倍数 Example Input 1 2 3 4 5
如何使用 parquet-cpp 编写流式/面向行的数据而不进行缓冲？

我的 C 应用程序中基本上有面向行流数据 Netflow 我想将数据写入 Parquet gzip 文件看着示例 reader writer cc 程序 https github com apache parquet cpp blob
如何在 Objective-C 中监听网络端口

我正在尝试为 iPhone 制作一个应用程序可以侦听特定网络端口上的流量我网络上的服务器正在特定端口上发送消息服务器处理的设备的不同状态消息我的问题是当我创建一个线程并 makePairWithSocket 时我会阻止其他想要向
Actionscript-3和其他语言中存在接口的原因是什么

这个接口的意义是什么即使我们在一个类上实现一个接口每次在不同的类上实现它时我们都必须一次又一次地声明它的功能那么接口存在于as3或任何其他具有接口的语言上的原因是什么谢谢我基本上同意到目前为止发布的答案只是补充一点首先回答简
按名称返回所有因子水平作为三列 data.table [R] 中的新列

有什么办法使用 data table 或 dplyr 来解决以下问题 library data table DT data table a LETTERS c 1 1 3 8 b c 2 4 7 c as factor c bob mary
解码嗅探到的数据包

我知道每个数据包都有一些标头看起来像是字符的随机组合另一方面内容本身可以是纯 ascii 格式因此它可能是人类友好的我嗅探到的一些数据包是可读的当然是原始的 html 标头但有些数据包看起来像这样 0000 00 15 af
合并列数据框

我有以下数据框 df1 startTimeIso endTimeIso id 2023 03 07T03 28 56 969000 2023 03 07T03 29 25 396000 5 2023 03 07T03 57 08 73400
具有多处理功能的 Tensorflow2.x 自定义数据生成器

我刚刚升级到tensorflow 2 3 我想制作自己的数据生成器用于训练使用tensorflow 1 x 我这样做了 def get data generator test flag item list load item list t

具有多处理功能的 Tensorflow2.x 自定义数据生成器

具有多处理功能的 Tensorflow2.x 自定义数据生成器 的相关文章

随机推荐

热门标签

具有多处理功能的 Tensorflow2.x 自定义数据生成器的相关文章