从 TFRecordDataset 获取数据集作为 numpy 数组

2024-01-10

我正在使用新的tf.data API为 CIFAR10 数据集创建迭代器。我正在读取两个数据.tfrecord文件。一个保存训练数据 (train.tfrecords)，另一个保存测试数据 (test.tfrecords)。这一切都很好。然而，在某些时候，我需要两个数据集（训练数据和测试数据）作为numpy 数组.

是否可以从 numpy 数组中检索数据集tf.data.TFRecordDataset目的？

您可以使用tf.data.Dataset.batch() https://www.tensorflow.org/api_docs/python/tf/data/Dataset#batch转变和tf.contrib.data.get_single_element() https://www.tensorflow.org/api_docs/python/tf/contrib/data/get_single_element去做这个。作为复习，dataset.batch(n)将需要长达n的连续元素dataset并通过连接每个组件将它们转换为一个元素。这要求所有元素的每个组件都具有固定的形状。如果n大于中的元素数量dataset (or if n没有精确地划分元素数量），那么最后一批可以更小。因此，您可以选择较大的值n并执行以下操作：

import numpy as np
import tensorflow as tf

# Insert your own code for building `dataset`. For example:
dataset = tf.data.TFRecordDataset(...)  # A dataset of tf.string records.
dataset = dataset.map(...)  # Extract components from each tf.string record.

# Choose a value of `max_elems` that is at least as large as the dataset.
max_elems = np.iinfo(np.int64).max
dataset = dataset.batch(max_elems)

# Extracts the single element of a dataset as one or more `tf.Tensor` objects.
# No iterator needed in this case!
whole_dataset_tensors = tf.contrib.data.get_single_element(dataset)

# Create a session and evaluate `whole_dataset_tensors` to get arrays.
with tf.Session() as sess:
    whole_dataset_arrays = sess.run(whole_dataset_tensors)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从 TFRecordDataset 获取数据集作为 numpy 数组的相关文章

Daphne Django 文件上传大小限制

我使用 Daphne 进行套接字和 http 连接我正在运行 4 个工作容器并且现在在 docker 容器中本地运行所有内容如果我尝试上传 400MB 的文件我的 daphne 服务器会失败它适用于最大 15MB 的小文件我的
Python 的 pack("

我不太了解 python 但从文档中可以看出代码 str AAAA str pack

如何在仍然使用 unique = True 的同时允许 ModelForm 中的空字段？

目前在models py I have class ModelName models Model rowname models CharField max length 100 blank True unique True 就确保相同的值不
组内条件计数

我想在之后进行条件计数groupby 例如按列的值分组A 然后计算每组中值出现的频率5出现在列中B 如果我整个过程都这样做DataFrame 只是len df df B 5 所以我希望我能做到df groupby A df B 5 siz
将 Python 列表（JSON 或其他）插入 MySQL 数据库

所以我在Python中有一堆数组数据嗯相反我有一个清单我试图将此数组存储到 MySQL 数据库中的单个单元格中我尝试使用 JSON 来序列化我的数据但也许我不明白 JSON 是如何工作的因此在连接到我的数据库后我尝试了上游
增加 sigmoid 预测输出值？

我创建了一个用于文本分类的 Conv1D 模型当在最后一个密集处使用 softmax sigmoid 时它产生的结果为 softmax gt 0 98502016 0 0149798 sigmoid gt 0 03902826 0 00
查找张量流运算所依赖的所有变量

有没有办法找到给定操作通常是损失所依赖的所有变量我想用它来将该集合传递到optimizer minimize or tf gradients 使用各种set intersection 组合到目前为止我已经找到了op op input
使用 python3 查找表情符号的宽度

我尝试使用 python 中的模式打印字母 A def printA length height symbol a for i in range length for i in range height for i in range hei
使用unittest时如何知道每次测试花费的时间？

Unittest 仅显示运行所有测试所花费的总时间但不单独显示每个测试所花费的时间使用unittest时如何添加每个测试的计时我想目前不可能 http bugs python org issue4080 http bugs pyth
在 Django(Python) 中向用户提供 Excel(xlsx) 文件下载

我正在尝试使用 Django 创建和提供 Excel 文件我有一个 jar 文件它获取参数并根据参数生成 excel 文件并且它可以正常工作但是当我尝试获取生成的文件并将其提供给用户下载时文件损坏了它的大小为 0kb 这是我用
Django 自定义文件存储系统

我有一个自定义存储 import os from django core files storage import Storage class AlwaysOverwriteFileSystemStorage Storage def get
Keras 中批量大小可变的batch_dot

我正在尝试编写一个层来合并 2 个张量formula https i stack imgur com I49aj png x 0 和x 1 的形状都是 1 500 M是500 500的矩阵我希望输出为 500 500 我认为这在理论上是可
如何使用 python 在 XML 声明后添加注释

import xml etree ElementTree as ET def addCommentInXml fileXml C Users Documents config xml tree ET parse fileXml root t
布尔 pandas 之间的操作对称性破缺。具有不等索引的系列

隐式索引匹配pandas用于不同之间的操作DataFrame Series很棒而且大多数时候它都有效但是我偶然发现了一个无法按预期工作的示例 import pandas as pd 0 21 0 import numpy as np
将连续行与相同的列值合并

我有一个看起来像这样的东西我该如何处理 0 d 0 The DT 1 Skoll ORGANIZATION 2 Foundation ORGANIZATION 3 4 based VBN 5 in IN 6 Silicon LOCATIO
无法使用python和beautifulsoup抓取网页中的某些href

我目前正在使用 Python 3 4 和 bs4 爬取网页以收集塞尔维亚在里约 2016 年的比赛结果所以网址here http rio2016 fivb com en volleyball women teams srb serbia
Django Admin Media 前缀 URL 问题

我有以下文件夹结构 src BAT templates admin base html src BAT media base css src BAT media admin media base css 设置 py MEDIA ROOT o
仅将唯一行插入 SQLite (python)

我在用着cursor executemany将 CSV 文件中的批量行插入到 SQLite 表中根据主键字段其中一些行预计会重复当我执行该命令时可以预见的是我会收到完整性错误并且不会插入任何内容如何有选择地仅插入非重复行而无
评估 df 每行中的日期时间函数是否落在另一个 df 中的日期时间范围内

我是 python 新手需要一些帮助来解决有关日期时间函数的问题 I have df a其中有一列标题为time 我正在尝试创建一个新专栏id在这个df a 我想要id根据时间是否包含在某个时间范围内来确定的列df b date 和 da
XGBoostError：[10：10：03] /workspace/src/tree/updater_gpu_hist.cu：1407：gpu_hist 中的异常：NCCL 失败

PROJECT Nvidia 开发者项目 https developer nvidia com blog gradient boosting decision trees xgboost cuda 在 Google Colab 环境中 MY

随机推荐

如何接收短信并根据短信内容拨打电话提醒某人？

因此我尝试接收传入的短信并根据短信的内容拨打带有特定录音的电话例如我有一个带调制解调器的门传感器可以在门打开或关闭时向我的 twilio 发送文本如果 Twilio 收到门已打开文本则 twilio 将拨打我的手机并播放显
如何创建所有数字组合的n维数组？

我想创建一个函数AllCombnations d maxValue 这将创建一个包含从 0 到的所有数字组合的 d 维数组maxValue 例如在 3D 空间中创建所有数字组合从 0 到maxValue可能是这样的 for int i
挽救模块内特定类型的所有错误

我有一个模块在其中执行项目的所有加密解密任务我想抓住任何OpenSSL Cipher CipherError该模块中发生的异常以便我可以处理它们是否可以做类似的事情 rescue from OpenSSL Cipher Cipher
Symfony 4 Composer 脚本

我刚刚安装了 Symfony 4 项目并在中找到了此部分composer json scripts auto scripts cache clear symfony cmd assets install PUBLIC DIR symfony
如何获得没有标签的地图？

我想要一张有路网的地图我只需要一张图片但没有标签地图上的文字我尝试从 Google API 获取这样的地图并想 element geometry works 但是例如依然充满文字如何获取没有文字标签的路网图静态图片也可以任
如何打开两个Javafx窗口？

我正在使用 javafx 想在按钮的 setOnAction 中编写代码来关闭 javafx1 类并运行 javafx2 类但我看到错误应用程序启动不得被调用多次我怎样才能解决这个问题 This code is in the clas
这段 JavaScript 代码是什么意思？

var myval function 我不明白 function 含义甚至其他代码你所拥有的是自调用匿名函数您首先通过在函数本身周围添加括号来创建函数表达式只是为了写 function 在这种情况下不起作用因为这将定义一个函数声明
Magento 扩展 404 错误

我很难过我有一个自定义扩展可以在 Mac Leopard 本地完美运行但是在将实时推送到主机 Centos Linux 后当我尝试调用前端路由器时出现 Magento 404 错误例如这个网址 domain shop index
PHP 如何获取带有类和名称空间路径的方法名称作为字符串？

我真的很讨厌写这个问题因为我是一种研究人员而且我总是能找到我正在寻找的东西但这一个让我很烦恼我在任何地方都找不到答案所以事情是这样的正如标题所示我需要获取一个方法名称其中尾随类和命名空间路径作为字符串我的意思是这样的
关于android加速度计onSensorChanged的信息

我正在尝试在android平台上编写一个体感游戏我将整个运动检测算法包含到 onSensorChanged 函数中问题在于该函数根据输入执行不同的时间我对函数如何执行和调用有一些疑问 1 如果我的函数执行很长时间并且发生了 2 个
使用 Julia 中的 Images 导出图像

假设我有一个m by n by 3的数组Uint8它表示一个图像其中假定使用 RGB 色彩空间我想使用以下命令将其导出为每像素 24 位 PNG 图像Images包裹我怎样才能做到这一点我天真地尝试申请imwrite到随机生成的原始
附加 pandas 数据框自动转换为 float 但需要 int

如何让 pandas 附加一个整数并保留整数数据类型我意识到我可以在输入数据后将 df test astype int 添加到整个列但如果我可以在附加数据时执行此操作那么这似乎是一个更好的方法这是一个示例 from bitstrin
即使包含当前脚本，也要获取当前脚本的 URL？

我有一个 PHP 脚本需要知道它的 URL 即使它包含在另一个脚本中我试过了 SERVER REQUEST URI 但这不会将 URI 返回到我的脚本而是将 URI 返回到包括脚本我也尝试过 dirname FILE 但我似乎无法将
通过 gcloud 命令行工具触发特定 git 提交的构建

我遇到的所有示例均采用以下格式 gcloud container builds submit config cloudbuild yaml 手册页内容如下 SOURCE The source directory on local disk
自定义按钮的核心图形与图像

我什么时候应该使用核心图形而不是图像来制作自定义 UIButton 核心显卡速度更快吗除了分辨率独立之外还有其他主要好处吗核心显卡的优点绘制按钮的代码可能比图像文件小允许动态修改轻微更改而无需添加完整的第二个图像正如您提到的
在 Rust 中多次使用同一个迭代器

编者注此代码示例来自 1 0 之前的 Rust 版本当时实现了许多迭代器Copy 此代码的更新版本会产生不同的错误但答案仍然包含有价值的信息我正在尝试编写一个函数来将字符串拆分为字母和数字块例如 test123test 会变成 t
Haskell 编译器如何决定是在堆上分配还是在堆栈上分配？

Haskell 不具有显式内存管理功能并且所有对象都是按值传递的因此也没有明显的引用计数或垃圾收集 Haskell 编译器通常如何决定是为给定变量生成在堆栈上分配的代码还是在堆上分配的代码它是否会在堆或堆栈上为同一函数在不同的调用站点
如何使用 webmock 正则表达式匹配器？

如何匹配 URL 例如 http www example com foo id bar http www example com foo 1 bar http www example com foo 999 bar 存根请求帖子 www
使用 onmousedown 来获取您刚刚按下鼠标的元素的 ID？

这可能吗我正在尝试为 onmousedown 编写一个函数它将返回您刚刚单击的元素的 ID 以便稍后在不同的 div 中重新创建该元素时使用您可以使用事件委托 http www sitepoint com blogs 2008 07
从 TFRecordDataset 获取数据集作为 numpy 数组

我正在使用新的tf data API为 CIFAR10 数据集创建迭代器我正在读取两个数据 tfrecord文件一个保存训练数据 train tfrecords 另一个保存测试数据 test tfrecords 这一切都很好然而在某

从 TFRecordDataset 获取数据集作为 numpy 数组

从 TFRecordDataset 获取数据集作为 numpy 数组 的相关文章

随机推荐

热门标签

从 TFRecordDataset 获取数据集作为 numpy 数组的相关文章