TFRecords 和记录改组

2023-12-28

我的理解是，最好的做法是对每个时期的训练样本进行洗牌，以便每个小批量包含整个数据集的一个很好的随机样本。如果我将整个数据集转换为包含 TFRecords 的单个文件，那么在加载整个数据集的情况下如何实现这种改组？我的理解是，没有对 TFRecord 文件进行有效的随机访问。因此，具体来说，我正在寻找有关如何在此场景中使用 TFRecord 文件的指导。

事实并非如此 - 您可以通过将输入分成多个输入数据文件，然后处理它们来稍微改进混合正如这个答案中所解释的 https://stackoverflow.com/questions/34258043/getting-good-mixing-with-many-input-datafiles-in-tensorflow.

如果您需要任何接近“完美”的洗牌，则需要将其读入内存，但在实践中，对于大多数事情，您可能只需分割成 100 或 1000 个文件，然后使用洗牌即可获得“足够好”的洗牌队列足够大，可以容纳 8-16 个文件的数据。

我内心渴望编写一个可以溢出到磁盘的外部随机洗牌队列，但它在我的优先级列表中非常低——如果有人想贡献一个，我自愿审查它。 :)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

TFRecords 和记录改组的相关文章

如何在 Tensorflow 对象检测 API 中查找边界框坐标

我正在使用 Tensorflow 对象检测 API 代码我训练了我的模型并获得了很高的检测百分比我一直在尝试获取边界框坐标但它不断打印出 100 个奇怪数组的列表经过在线广泛搜索后我发现数组中的数字意味着什么边界框坐标相对于底层
类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
Tensorflow：如何通过 tf.gather 传播梯度？

我在尝试传播损失函数相对于代表收集索引的变量的梯度时遇到一些问题类似于空间变换器网络中所做的事情 https github com tensorflow models blob master transformer spatial tra
让 TensorFlow 在 ARM Mac 上使用 GPU

我已经安装了TensorFlow在 M1 上 ARM Mac 根据这些说明 https github com apple tensorflow macos issues 153 一切正常然而模型训练正在进行CPU 如何将培训切换到GPU
为什么平均百分比误差（mape）非常高？

我已获得代码掌握机器学习 https machinelearningmastery com time series prediction lstm recurrent neural networks python keras 我修改了mod
在优化器期间保持变量不变

我有一个损失张量 L 的 TensorFlow 计算图它取决于 2 个 tf Variables A 和 B 我想在保持 B 固定的同时在变量 A 上运行梯度上升 A L 与 A 的梯度反之亦然在 B 上运行梯度上升 B L 与 B
TensorFlow：使用不同的输入张量重新运行网络？

假设我在 TensorFlow 中有一个典型的 CNN 模型 def inference images images 4D tensor of batch size IMAGE SIZE IMAGE SIZE 3 size conv 1 c
如何在google colaboratory上使用GPU升级tensorflow

目前google colaboratory使用tensorflow 1 4 1 我想升级到1 5 0版本每次当我执行时 pip install upgrade tensorflow命令 notebook实例成功将tensorflow版本升
Keras 中批量大小可变的batch_dot

我正在尝试编写一个层来合并 2 个张量formula https i stack imgur com I49aj png x 0 和x 1 的形状都是 1 500 M是500 500的矩阵我希望输出为 500 500 我认为这在理论上是可
mac安装Tensorflow出错

我正在尝试使用以下说明在 mac 中安装 Tensorflow https www tensorflow org install https www tensorflow org install 但是当我想导入tensorflow时我总是
Scipy 稀疏 CSR 矩阵到 TensorFlow SparseTensor - 小批量梯度下降

我有一个 Scipy 稀疏 CSR 矩阵它是根据 SVM Light 格式的稀疏 TF IDF 特征矩阵创建的特征数量巨大且稀疏所以我必须使用 SparseTensor 否则速度太慢例如特征数量为 5 示例文件如下所示 0 4 1
TensorFlow：Dst 张量未初始化

The MNIST For ML Beginners当我运行时教程给我一个错误print sess run accuracy feed dict x mnist test images y mnist test labels 其他一切都运行
张量流输入管道，其中多行对应于单个观察？

所以我刚刚开始使用 Tensorflow 并且我正在努力正确理解输入管道我正在研究的问题是序列分类我正在尝试读取形状为 100000 4 的 CSV 文件前 3 列是特征第四列是标签但是数据表示长度为 10 的序列即第 1 1
在 Windows 上，运行“导入张量流”会生成“没有名为“_pywrap_tensorflow”的模块”错误

在 Windows 上 TensorFlow 在执行后报告以下一个或两个错误import tensorflow陈述 No module named pywrap tensorflow DLL load failed 对我来说问题是 cuDN
为什么使用“self”定义的变量在继承自 tf.keras.Model 时会自动给出 ListWrapper() ？

我不熟悉ListWrapper 但它被应用于使用创建的所有列表变量self当我的班级继承自tf keras Model https www tensorflow org api docs python tf keras models Mod
导入一个简单的 Tensorflow freeze_model.pb 文件并用 C++ 进行预测

我正在尝试将从 Tensorflow Python 导出的图形导入到 Tensorflow C 中我已经成功地将图表重新导入到 Python 中我现在唯一想要的就是用 C 编写相同的代码但我不确定 C api 函数和用法因为 Ten
Keras 显示 GPU 训练速度没有任何改进（部分 GPU 使用？！）

我正在尝试在我的 Jupyter Notebook 的 AWS p2 xlarge 实例上的 GPU 而不是 CPU 上训练我的模型我正在使用tensorflow gpu后端仅tensorflow gpu已安装并在中提到requirem
ptb_word_lm中batch_size的含义（tensorflow的LSTM模型）

我是张量流的新手我现在对它的含义有点困惑batch size 众所周知其含义是batch size是每批次的样本数但是根据中的代码ptb word lm 似乎不是读者 py data len tf size raw data the
如何使用 TFlearn 中的 ImageAugmentation 训练 CNN 中的图像和数据混合

我想使用图像像素信息和数据的混合在 Tflearn Tensorflow 中训练卷积神经网络由于我的图像数量较少因此我需要使用图像增强来增加传递到网络的图像样本数量但这意味着我只能传递图像数据作为输入数据必须在稍后阶段大概在全

随机推荐

Java 8 流中聚合运行时异常

假设我有一个抛出运行时异常的方法我正在使用一个Stream对列表中的项目调用此方法 class ABC public void doStuff MyObject myObj if throw new IllegalStateExcepti
如何在kivy+python中从数据库获取数据并显示在表格中

list py import kivy kivy require 1 9 0 replace with your current kivy version import sqlite3 as lite from kivy uix scree
PHP foreach 更改原始数组值[重复]

这个问题在这里已经有答案了我对多维数组非常陌生这让我很烦恼我的数组如下 fields array names gt array type gt text class gt name name gt name text before g
JavaScript 倒计时和重定向

我有一个 javascript 脚本它运行倒计时然后重定向到另一个链接由于我现在所有网站都使用静态域运行相同的代码因此我想知道是否可以编辑脚本以使其根据其周围的 span 标签重定向到不同的链接我还删除了这段代码所以如果有人有更
在外部存储器/SD卡上缓存图像的推荐路径

当我在 Android 文件传输或 Astro 文件管理器中查看 SD 卡根目录时发现很混乱因为应用程序到处都存储着文件作为开发人员我们通过缓存图像文件等来遵循最佳实践以使我们的应用程序更快并且我们使用Environment
如何仅向测试人员发布新版本的 Chrome 扩展程序

我有一个有很多用户的 Chrome 扩展程序我想更新它我已准备好一切但我需要测试更新以确保当前用户不会丢失数据有没有办法只将新版本发布给受信任的测试人员我创建了一个测试组我插入受信任的测试人员电子邮件帐户我已在测试帐户下登录
架构和数据字典有什么区别？

模式的定义是数据库中数据的逻辑结构它由用户拥有并与数据库用户同名模式包含表的名称它的列类型是什么等数据字典也仅包含元数据当然它是在数据库级别而不是用户级别模式和数据字典之间的确切区别是什么这些定义来自我的经验 20 多年的程序
VBS代码中的With语句，在PowerShell中如何表达

有没有可以快速将VBS代码转换为PowerShell代码的软件或工具另外我想知道的是以下WithVBS代码中的语句在PowerShell中如何表达 The With语句很棒可以缩短代码我可以在PowerShell中实现类似的功能
错误：未授予权限...react-native-image-picker

我正在尝试使用客户端应用程序中的内存上传图像反应本机图像选择器 0 26 4 执行以下示例片段后我以意想不到的方式得到了响应 ImagePicker showImagePicker options response gt console
WPF 应用程序基于角色的访问控制 - 最佳实践

我需要实施某种RBAC http en wikipedia org wiki Rbac对于我目前正在编写的 WPF 应用程序自 v2 0 起 ASP NET 就拥有了安全性成员身份和角色管理基础架构如所述here http weblo
jaxws-api 2.2 未在 Maven 构建中加载

我已经使用 Apache CXF 工具 wsdl2java 生成了 Java 代码在我的服务评论中它说我应该支持 Jaxws API 2 2 但不知道这意味着什么在我的 Maven POM 中我有这个
如何以编程方式圆角并设置随机背景颜色

我想圆化视图的角并根据运行时的内容更改视图的颜色 TextView v new TextView context v setText tagsList get i if i 2 0 v setBackgroundColor Color R
以编程方式在 Swift 中模拟滑动手势

我正在实现一个用于在 Swift 中滑动的手势识别器我希望能够模拟卡片的投掷以编程方式滑动视图我以为会有一个内置函数来实现这一点但我发现的只是点击手势而不是滑动手势这就是我实现滑动手势的方式 let gesture UIPanGe
如何在 VS Code 中自定义多个主题的 textMateRules？ [复制]

这个问题在这里已经有答案了 In VS Code 我想定制一些textMateRules多个主题相同例如两者都用于Atom One Dark and Default Dark 但在不影响任何其他主题的情况下我想让keywords it
使用 CreateProcess 运行批处理文件

我正在尝试使用 CreateProcess 启动一个新的环境块并在新的环境块中运行批处理文件我已经阅读了 CreateProcess 的 msdn 示例并得出了如下所示的代码发生了什么它将打开新的命令提示符并停在那里由于某种原因
Angular 材质 md-button 悬停颜色变化

div class non active div
sublimerepl getenv 失败

我想将 SiblimeREPL 包与 Sublime Text 一起使用当我尝试启动 REPL 时我得到 SublimeREPL obtaining sane environment failed in getenv Check con
通过 TinyXML 深度复制 XML

我正在使用tinyxml 如何复制或创建现有 XMLDocument 的副本 http www grinninglizard com tinyxmldocs classTiXmlDocument html a4e8c1498a76dcde7
如何正确使用VAVR集合做到线程安全？

VAVR 集合是不可变的那么如果我有静态变量例如保存所有 WebSocket 会话我将如何使用 VAVR 以使集合是线程安全的例如 ServerEndpoint actions public class DeviceWebSo
TFRecords 和记录改组

我的理解是最好的做法是对每个时期的训练样本进行洗牌以便每个小批量包含整个数据集的一个很好的随机样本如果我将整个数据集转换为包含 TFRecords 的单个文件那么在加载整个数据集的情况下如何实现这种改组我的理解是没有对 TFRe

TFRecords 和记录改组

TFRecords 和记录改组 的相关文章

随机推荐

热门标签

TFRecords 和记录改组的相关文章