使用 keras 在 gcloud ml-engine 上处理 TB 数据的最佳方法

2023-11-29

我想使用 gcloud 存储上约 2TB 的图像数据训练模型。我将图像数据保存为单独的 tfrecords 并尝试按照此示例使用张量流数据 api

https://medium.com/@moritzkrger/speeding-up-keras-with-tfrecord-datasets-5464f9836c36

但看起来像keras'model.fit(...)不支持基于以下内容的 tfrecord 数据集验证

https://github.com/keras-team/keras/pull/8388

有没有更好的方法可以使用我所缺少的 ml-engine 中的 keras 处理大量数据？

多谢！

如果你愿意使用tf.keras您可以实例化一个而不是实际的 KerasTFRecordDataset与tf.dataAPI 并将其直接传递给model.fit(). 奖励：您可以直接从 Google Cloud 存储进行流式传输，无需先下载数据:

# Construct a TFRecordDataset
ds_train tf.data.TFRecordDataset('gs://') # path to TFRecords on GCS
ds_train = ds_train.shuffle(1000).batch(32)

model.fit(ds_train)

要包含验证数据，请创建TFRecordDataset与您的验证 TFRecords 并将其传递给validation_data的论证model.fit()。注意：这是可能的从 TensorFlow 1.9 开始.

最后注意：您需要指定steps_per_epoch争论。我用来了解所有 TFRecord 文件中示例总数的方法是简单地迭代文件并进行计数：

import tensorflow as tf

def n_records(record_list):
    """Get the total number of records in a collection of TFRecords.
    Since a TFRecord file is intended to act as a stream of data,
    this needs to be done naively by iterating over the file and counting.
    See https://stackoverflow.com/questions/40472139

    Args:
        record_list (list): list of GCS paths to TFRecords files
    """
    counter = 0
    for f in record_list:
        counter +=\
            sum(1 for _ in tf.python_io.tf_record_iterator(f))
    return counter

你可以用它来计算steps_per_epoch:

n_train = n_records([gs://path-to-tfrecords/record1,
                     gs://path-to-tfrecords/record2])

steps_per_epoch = n_train // batch_size

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Keras

googlecloudml

tensorflowdatasets

TFRecord

使用 keras 在 gcloud ml-engine 上处理 TB 数据的最佳方法的相关文章

没有带有张量板的图表

我正在读一本关于 Tensorflow 的书我发现了这段代码 from future import absolute import from future import division from future import print
在 keras 中集成采样的 softmax 失败

基于如何在 Keras 模型中使用 TensorFlow 的采样 softmax 损失函数 https stackoverflow com questions 47892380 how can i use tensorflows sampl
NotImplementedError：尚未为未构建的模型子类启用“fit_generator”

我正在使用以下代码 import tensorflow as tf traindata tf keras preprocessing image ImageDataGenerator rescale 1 255 shear range 0
Keras ZeroDivisionError：整数除法或以零为模

我正在尝试使用 Keras 和 Tensorflow 实现卷积神经网络我有以下代码 from keras models import Sequential from keras layers import Conv2D MaxPoolin
了解 YOLO 是如何训练的

我试图了解 YOLO v2 是如何训练的为此我使用这个 keras 实现https github com experiencor keras yolo2 https github com experiencor keras yolo2在
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
为什么不使用均方误差来解决分类问题？

我正在尝试使用 LSTM 解决一个简单的二元分类问题我正在尝试找出网络的正确损失函数问题是当我使用二元交叉熵作为损失函数时与使用均方误差 MSE 函数相比训练和测试的损失值相对较高经过研究我发现二元交叉熵应该用于分类问题 MS
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
ValueError：张量：（...）不是该图的元素

我正在使用 keras 的预训练模型在尝试获取预测时出现错误我在烧瓶服务器中有以下代码 from NeuralNetwork import app route uploadMultipleImages methods POST def
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
可视化 TFLite 图并获取特定节点的中间值？

我想知道是否有办法知道 tflite 中特定节点的输入和输出列表我知道我可以获得输入输出详细信息但这不允许我重建发生在Interpreter 所以我要做的是 interpreter tf lite Interpreter model
Tensorflow conv2d_transpose 大小错误“out_backprop 的行数与计算的不匹配”

我正在张量流中创建一个卷积自动编码器我得到了这个确切的错误 tensorflow python framework errors InvalidArgumentError Conv2DBackpropInput Number of row
带有 CUDA 的 Tensorflow：导入错误

我已经按照 NVIDIA 教程中的说明一步步安装了 TensorFlow Ubuntu 16 04 桌面版 GTX 970 http www nvidia com object gpu accelerated applications te
TensorFlow：在训练时更改变量

如果我将输入管道从 feed dict 更改为 tf data dataset 如何在每次迭代后的训练期间更改网络内参数的值澄清一下旧代码看起来像这样 Define Training Step model is some class t
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm
张量流服务错误：参数无效：JSON 对象：没有命名输入

我正在尝试使用 Amazon Sagemaker 训练模型并且希望使用 Tensorflow 服务来为其提供服务为了实现这一目标我将模型下载到 Tensorflow 服务 docker 并尝试从那里提供服务 Sagemaker 的训练
Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型训练集测试集和验证集的变量名称是不言自明的该数据集有 19 个类因此网络的最后一层有 19 个输出标签也是 one hot 编码的 nb classes 19 m
在张量流中向卷积神经网络提供可变大小的输入

我正在尝试使用 feed dict 参数将不同大小的 2d numpy 数组列表传递给卷积神经网络 x tf placeholder tf float32 batch size None None None y tf placeholder
为 TFliteconverter 创建代表性数据集的正确方法是什么？

我正在尝试推断tinyYOLO V2 with INT8权重和激活我可以使用 TFliteConverter 将权重转换为 INT8 为了INT8激活我必须提供代表性数据集来估计缩放因子我创建此类数据集的方法似乎是错误的正确的程序是

随机推荐

2 个用户之间的产品订单

我有三个模型用户产品报价以及这些模型之间的关系的问题设想用户 1 发布产品用户 2 可以向用户 1 发送报价例如 10 美元用户 1 可以接受或拒绝报价我现在的问题是用户产品和报价之间的正确关系是什么我该如何处理这些
为什么不推荐使用带有单个参数（没有转换说明符）的 printf ？

我正在读的一本书里是这么写的printf不推荐使用单个参数没有转换说明符建议替换 printf Hello World with puts Hello World or printf s Hello World 有人可以告诉我为什么吗p
Windows 上 PHP7 的 php_ibm_db2.dll 扩展？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我很难找到一个php ibm db2 dllWindows 上 PHP7 的扩展最新版本在https pecl php net package i
如何使 readLine() 超时

我的应用程序基本上是一个 CLI 具有所有预期的功能如提示历史记录等它需要等待 STDIN 来获取用户输入为此我使用 readLine 系统调用我创建了一个网络套接字用于将从用户读取的消息发送到服务器我的应用程序是单线程的
给定三个点如何计算圆的中心点？

我正在使用 Javascript 并且我知道 3 个点的位置我想用它们来找出圆的中心点我发现了这个逻辑不是选择的答案而是有 11 票赞成的答案 https math stackexchange com questions 21365
如何在 Perl 中找到从某个包继承的所有包？

我有许多不同的网站我从这些网站下载数据并将其转换为其他格式使用 Perl 以便在工作中使用这些网站都是从一个 Perl 脚本运行的如下所示 usr bin perl use strict use My Package1 use My
使用 Woocommerce 挂钩显示匹配订单项元值中选定的 BACS 帐户

基于选择要在 WooCommerce 的感谢页面中显示的 BACS 帐户回答我的问题之一的代码我更改了 Woocommerce 核心文件 class wc gateway bacs php 以便选择感谢页面上显示的正确银行帐户该帐户
高负载下 Java Beanshell 解释器中的锁争用

我们在应用程序中使用 Java BeanShell 解释器 v1 2 b7 来动态执行标准 Java 语法示例代码 bsh Interpreter interpreter new bsh Interpreter interpreter s
带有变量的 NSURL 中的空格不会加载

大家好我有一个 Objective C 困境 P 我对 Objective C 很陌生我尝试寻找答案但没有成功所以这是我的情况我现在就把代码放在这里否则就没多大意义了我正在写下我需要的东西这段代码现在不起作用稍后我会解释
如果应用程序是调试版本或发布版本，Firebase 会写入不同的文件

我刚刚发现 Firebase 出现了一些非常奇怪的情况我想知道是我做错了什么还是这个问题有解决方案基本上这是我开发应用程序时一直写的内容这正是我所期望的 nscoachtools gmail com maxMatches 60 ma
将 jQuery 与 Raphael 一起使用

我和拉斐尔一起创建了一个图像映射我希望当单击图像映射中的路径之一下例中的路径 10 时包含 Raphael 画布的 div 使用 jQuery 淡出下面的代码不起作用但我走在正确的轨道上吗
Smack 4.1.4 Stanza 中的自定义扩展元素

我正在将我的 Android 应用程序从 asmack android 库移至 Smack 4 1 4 我在 Smack 的 asmack 版本中有一些 PacketExtension 它使用 PacketExtension 和 Packe
如何在输入中添加按钮

使用 HTML 和 CSS 如何直观地将按钮放置在输入元素内如下所示用户应该能够正常与输入交互文本不应位于按钮后面即使文本很长焦点应该可以正常工作该表单应该可以在屏幕阅读器中访问并正常工作整个组件应该可以使用 CSS 设置样式
在 AngularJs 中定义控制器的最佳方法

我是 AngularJs 的新手我很困惑哪一种是为其创建控制器的最佳方法ng app mainApp 在编程时我曾使用过的其他编程语言建议将相关数据保存在一起但在 AngularJs 中当我们可以在主应用程序模块上定义控制器时为控
如何提高 Tesseract 中 OCR 文本的准确性？

我使用 Google 的 Tesseract API 创建了一个用于识别文本的基本应用程序并将其与我的相机应用程序集成它工作正常但唯一的问题是准确性因为有时文本被识别为随机字符集我猜准确度约为 50 此外当它尝试扫描图像中超过四
Angular 2：无法读取未定义的属性“push”

在我的 Angular 2 应用程序中我有一个函数 notification Array
如何使组合框项目列表动态化？

我在工作表上使用生成按钮当我单击该按钮时会出现一个弹出窗口表单其中包含两个组合框根据第一个组合框中的选择填充第二个组合框选项列表对于第一个组合框当我对项目值进行硬编码时它工作正常表单代码如下 Private Sub
在sql和pyodbc中参数化TOP值

我尝试参数化从表中获取的顶行数我尝试过 db cursor execute SELECT TOP VALUE FROM mytable WHERE param top value param 它表明 pyodbc ProgrammingE
跨 REST 微服务的事务？

假设我们有一个用户钱包 REST 微服务和一个将事物粘合在一起的 API 网关当 Bob 在我们的网站上注册时我们的 API 网关需要通过 User 微服务创建用户并通过 Wallet 微服务创建钱包现在这里有一些可能出现问题的场
使用 keras 在 gcloud ml-engine 上处理 TB 数据的最佳方法

我想使用 gcloud 存储上约 2TB 的图像数据训练模型我将图像数据保存为单独的 tfrecords 并尝试按照此示例使用张量流数据 api https medium com moritzkrger speeding up keras

使用 keras 在 gcloud ml-engine 上处理 TB 数据的最佳方法

使用 keras 在 gcloud ml-engine 上处理 TB 数据的最佳方法 的相关文章

随机推荐

热门标签

使用 keras 在 gcloud ml-engine 上处理 TB 数据的最佳方法的相关文章