将tensorflow 2.0 BatchDataset转换为numpy数组

2024-06-01

我有这个代码：

(train_images, _), (test_images, _) = tf.keras.datasets.mnist.load_data()

train_dataset = tf.data.Dataset.from_tensor_slices(train_images).shuffle(TRAIN_BUF).batch(BATCH_SIZE)
test_dataset = tf.data.Dataset.from_tensor_slices(test_images).shuffle(TRAIN_BUF).batch(BATCH_SIZE)

print(train_dataset, type(train_dataset), test_dataset, type(test_dataset))

我想投这两个BatchDataset变量到numpy arrays，我能轻松做到吗？我在用TF 2.0，但我刚刚找到了要转换的代码tf.data with TF 1.0

对数据集进行批处理后，最后一批的形状可能与其余批次的形状不同。例如，如果数据集中共有 100 个元素，并且批处理的大小为 6，则最后一批的大小仅为 4。(100 = 6 * 16 + 4)。

因此，在这种情况下，您将无法直接将数据集转换为 numpy。因此，您将不得不使用drop_remainder https://www.tensorflow.org/versions/r2.0/api_docs/python/tf/data/Dataset#batch批处理方法中的参数为 True。如果最后一批尺寸不正确，它将丢弃它。

之后，我附上了有关如何将数据集转换为 Numpy 的代码。

import tensorflow as tf
import numpy as np

(train_images, _), (test_images, _) = tf.keras.datasets.mnist.load_data()

TRAIN_BUF=1000
BATCH_SIZE=64

train_dataset = tf.data.Dataset.from_tensor_slices(train_images).
                          shuffle(TRAIN_BUF).batch(BATCH_SIZE, drop_remainder=True)
test_dataset = tf.data.Dataset.from_tensor_slices(test_images).
                          shuffle(TRAIN_BUF).batch(BATCH_SIZE, drop_remainder=True)

# print(train_dataset, type(train_dataset), test_dataset, type(test_dataset))

train_np = np.stack(list(train_dataset))
test_np = np.stack(list(test_dataset))
print(type(train_np), train_np.shape)
print(type(test_np), test_np.shape)

Output:

<class 'numpy.ndarray'> (937, 64, 28, 28)
<class 'numpy.ndarray'> (156, 64, 28, 28)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

casting

将tensorflow 2.0 BatchDataset转换为numpy数组的相关文章

如何在 Windows 10 上使用 python 3.7 的 anaconda 包？

我使用的是 Windows 10 Pro 64 位版本我从此页面下载Anaconda3 2019 03 Windows x86 64 exe https www anaconda com distribution https www an
优化完美平方问题，类似于Python中的硬币找零

我这里有一个硬币兑换的解决方案 python 中的 leetcode 硬币兑换 https stackoverflow com questions 69517078 coin change leetcode in python 因为完全平方
如何忽略传递给函数的意外关键字参数？

假设我有一些功能 f def f a None print a 现在如果我有一本字典比如dct a Foo 我可以打电话f dct 并得到结果Foo打印但是假设我有一本字典dct2 a Foo b Bar 如果我打电话f dct2
使用 Python 在 Google Cloud Storage 存储桶中创建/上传新文件

如何使用 Python 和可用的客户端库在 Google Cloud Storage 中创建新的空文件或者如何使用 blob 函数 upload from filename 将新文件上传到选定的存储桶要初始化 blob 对象我们应该在
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
类型错误：需要 Future 或协程

我尝试在 asyncssh 上自动重新连接 ssh 客户端 SshConnectManager 必须留在后台并在需要时进行 ssh 会话 class SshConnectManager object def init self host u
使用 python 只读取 Excel 中的可见行

我想只读取 python 中 Excel 工作表中的可见行输入 Excel表所以当我过滤时作为 python 中的输出在本例中我将仅获得可见数据 1 行这是我的代码 from openpyxl import load workbo
如何为 Python 中的应用程序设置专用屏幕区域？

MS OneNote 就是一个很好的例子它可以选择固定在屏幕的一侧并将所有其他窗口推到一侧当最大化或调整其他窗口大小时它们只能扩展到 OneNote 的边缘 Python 使用 Tkinter 或其他模块是否具有此功能感谢您的帮助
PyCharm 无法识别字典值类型

我有一个简单的代码片段其中我将字典值设置为空列表 new dict for i in range 1 13 new dict i 现在如果在下一行的循环内我会输入new dict i 并添加一个点我希望 PyCharm 向我显示可用于
如何测试列表中多个值的成员资格

我想测试两个或多个值是否在列表中具有成员资格但我得到了意外的结果 gt gt gt a b in b a foo bar a True 那么 Python 可以同时测试列表中多个值的成员资格吗这个结果意味着什么 See also How
Python 中的十进制到二进制半精度 IEEE 754

我只能使用以下命令将十进制转换为二进制单精度 IEEE754struct pack模块或者使用相反的方法 float16 或 float32 numpy frombuffer 是否可以使用 Numpy 将十进制转换为二进制半精度浮点数我
Python 队列 get()/task_done() 问题

我的消费者端队列 m queue get queue task done
如何限制scrapy请求对象？

所以我有一个蜘蛛我认为它正在泄漏内存结果当我检查 telnet 控制台 gt gt gt prefs 时它只是从链接丰富的页面中抓取了太多链接有时它会超过 100 000 个现在我已经一遍又一遍地浏览文档和谷歌但我找不到一种方法
Scrapy 抓取并跟踪 href 中的链接

我对 scrapy 很陌生我需要从 url 的主页跟踪 href 到多个深度再次在 href 链接内我有多个 href 我需要遵循这些href 直到到达我想要抓取的页面我的页面的示例 html 是初始页 div class page
Pip 突然使用了错误版本的 Python

在 os x 上使用 pip 时遇到一个奇怪的问题据我所知快速查看我的 bash history 似乎可以确认我最近没有对我的配置进行任何更改唉 pip 命令似乎突然使用了与以前不同的 python 版本到目前为止我使用命令 p
如何配置 Eclipse 在使用 Pydev 插件选择“运行”或“调试”时启动浏览器

我正在使用 Eclipse Pydev 插件学习 Python 和 Django 当我按运行或调试时我希望内部或外部浏览器使用 URL http 127 0 0 1 启动或刷新我见过用 PHP 插件完成的但没有用 Pydev
在至少 7 天内连续三天登录该产品的用户

我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1
通过 ManyToManyField = Value 对 django 查询集进行排序

如果有一些模型例如 class Tag models Model name models CharField class Thing models Model title models CharField tags models Many

随机推荐

输入数字或 Q 退出

大家好我在设定的任务中遇到了一些问题任务的第一部分是输出具有以下规则的价格表 50 件以内的价格为每件 5 英镑 51 至 80 之间的价格为每张 4 英镑而 81 至 100 之间的价格为每张 2 50 英镑使用循环结构和选择语句
查找回收器视图中的第一个可见项目是否是列表的第一项

我有一个包含 13 个数据项的回收器视图我想知道列表中的第一项是否可见我知道像这样的方法findFirstVisibleItemPosition and findLastVisibleItemPosition但他们没有说明第一个可见项目
切换到工作区并在 Xcode 中添加 CocoaPods 后提交 git 吗？

我刚刚在 Xcode 5 中将 CocoaPods 添加到我当前的项目中当然 CocoaPods 创建了一个工作区并且我已在 Xcode 中启动了该工作区我在工作区中看到了我的项目和 Pods 项目我的项目从第一天起就处于源代码控制
C# .NET 4.0 测试框架？

如果我没记错的话 NUnit 是单元测试事实上的标准但我刚刚下载了它编写了一个简单的测试然后显然我必须启动 GUI 并加载我的 exe组装根本就失败了我尝试编辑 C Program Files x86 NUnit 2 5 7 bi
如何检测不渲染 .png 透明的浏览器

我有这段代码可以根据一周中的某一天渲染图像但在 IE6 及更低版本以及可能其他一些浏览器中它不会呈现 png 不透明度所以我想稍微改变一下这样它就会检测到不渲染 alpha 透明度的浏览器并告诉他们加载这个图像 img horar
从 xsd 生成 cXML 类会引发错误“元素‘uri:ds:Signature’丢失。”

我正在尝试根据 cXML 1 2 034 版本生成 cXML 类http cxml org http cxml org XSD 由 Visual Studio 转换我将 cXML dtd 转换为 xsd 然后尝试运行 xsd exe cX
最有效地将编译时大小的数组的所有元素相加

我正在尝试使用最少量的指令有效地将所有内容添加到编译时大小的数组中当然我正在使用模板我创造了这个 template
SQL Server 2008：如何使用 powershell 获取“消息”选项卡（在 Management Studio 中）输出

我在用invoke sqlcmd管理我的数据库它工作得很好我将 Management Studio 中结果选项卡的输出保存到日志文件中当我做一个BACKUP DATABASE 输出是在消息选项卡上完成的我想将其保存在日志文件
Powershell：根据属性过滤属性

我对 PowerShell 的自学经验有限所以这可能是一些基本的东西但我似乎无法正确理解我在 Active Directory 中需要提取电子邮件地址不以 SamAccountName 开头的用户列表因此如果您的登录名是 jdo
如何使用 AngularJS、Devise 和 UI Router 全局实现身份验证？

我对 Angular 很陌生所以这可能是一个新手问题我正在尝试实现一个简单的任务管理器只是一个练习以 Rails 作为后端以 Angular 作为前端到目前为止我遵循了教程一切正常现在我想在全球范围内实施身份验证这意味着
检测CloudFoundry/Bluemix的版本

我正在尝试检测 Bluemix Cloud Foundry 的版本我可以使用一个命令来执行此操作吗 cf version 告诉您命令行界面的版本但不告诉您要推送到的服务器的版本 thanks anthony 您可以通过 CloudF
翠儿。让流永远运行

我对 tweepy python 库比较陌生我想确保我的流 python 脚本始终在远程服务器上运行因此如果有人能够分享如何实现这一目标的最佳实践那就太好了现在我正在这样做 if name main while True try
加载时覆盖 WordPress 插件翻译文件

我正在使用带有插件的法语版 WordPress活动日历 http wordpress org plugins the events calendar 该插件附带了捆绑的法语翻译但有一些错误我想修复它们但替换原始文件是一个坏主意因为它
如何比较两个碳时间戳？

我有两个时间戳 edited at 我创建的和created at Laravel 的在数据库中两者都有时间戳类型和默认值 0000 00 00 00 00 00 但是 var dump edited at variable 正在给出
无法获得与取消存档模块一起使用的“排除”选项

我有一个 tar gzip 文件我正在使用 ansible 取消归档模块将其提取到主机列表中以下是configs tgz的部分内容列表 rw rw r ian ian 1295 2015 09 25 15 27 Makefile rw
Notepad++:: 通过正则表达式完全删除包含问号的行

嗯我想这就是我的标题这对于我将要实现的目标来说是不言自明的这是我当前的文本文件的示例 Diva was the winning song of the Eurovision Song Contest 1998 Who will win
将 char* 转换为字符串 C++

我知道字符串的起始地址例如 char buf 和最大长度int l 字符串的即字符总数小于或等于l 获取值的最简单方法是什么string来自指定的内存段换句话说如何实现string retrieveString char buf i
如何使用 cython 编译扩展？

我正在尝试从示例页面编译一个简单的 cython 扩展here http docs cython org src userguide tutorial html在我安装了 Python 2 6 64 位版本的 Windows 7 64 位计
Android studio 在日志猫中“清除全部”，更改日志级别过滤器时日志仍然会回来

在 LogCat 中当我单击全部清除按钮时它似乎清除了所有日志但是如果我更改日志级别并返回到之前的日志级别则所有日志都会返回例如我正在查看 Verbose 我选择全部清除日志清除我切换到调试我切换回详细现在所
将tensorflow 2.0 BatchDataset转换为numpy数组

我有这个代码 train images test images tf keras datasets mnist load data train dataset tf data Dataset from tensor slices train

将tensorflow 2.0 BatchDataset转换为numpy数组

将tensorflow 2.0 BatchDataset转换为numpy数组 的相关文章

随机推荐

热门标签

将tensorflow 2.0 BatchDataset转换为numpy数组的相关文章