TFRecords 和记录改组

2023-12-28

我的理解是,最好的做法是对每个时期的训练样本进行洗牌,以便每个小批量包含整个数据集的一个很好的随机样本。如果我将整个数据集转换为包含 TFRecords 的单个文件,那么在加载整个数据集的情况下如何实现这种改组?我的理解是,没有对 TFRecord 文件进行有效的随机访问。因此,具体来说,我正在寻找有关如何在此场景中使用 TFRecord 文件的指导。


事实并非如此 - 您可以通过将输入分成多个输入数据文件,然后处理它们来稍微改进混合正如这个答案中所解释的 https://stackoverflow.com/questions/34258043/getting-good-mixing-with-many-input-datafiles-in-tensorflow.

如果您需要任何接近“完美”的洗牌,则需要将其读入内存,但在实践中,对于大多数事情,您可能只需分割成 100 或 1000 个文件,然后使用洗牌即可获得“足够好”的洗牌队列足够大,可以容纳 8-16 个文件的数据。

我内心渴望编写一个可以溢出到磁盘的外部随机洗牌队列,但它在我的优先级列表中非常低——如果有人想贡献一个,我自愿审查它。 :)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

TFRecords 和记录改组 的相关文章

随机推荐

  • Java 8 流中聚合运行时异常

    假设我有一个抛出运行时异常的方法 我正在使用一个Stream对列表中的项目调用此方法 class ABC public void doStuff MyObject myObj if throw new IllegalStateExcepti
  • 如何在kivy+python中从数据库获取数据并显示在表格中

    list py import kivy kivy require 1 9 0 replace with your current kivy version import sqlite3 as lite from kivy uix scree
  • PHP foreach 更改原始数组值[重复]

    这个问题在这里已经有答案了 我对多维数组非常陌生 这让我很烦恼 我的数组如下 fields array names gt array type gt text class gt name name gt name text before g
  • JavaScript 倒计时和重定向

    我有一个 javascript 脚本 它运行倒计时 然后重定向到另一个链接 由于我现在所有网站都使用静态域运行相同的代码 因此我想知道是否可以编辑脚本以使其根据其周围的 span 标签重定向到不同的链接 我还删除了这段代码 所以如果有人有更
  • 在外部存储器/SD卡上缓存图像的推荐路径

    当我在 Android 文件传输或 Astro 文件管理器中查看 SD 卡根目录时 发现很混乱 因为应用程序到处都存储着文件 作为开发人员 我们通过缓存图像 文件等来遵循最佳实践 以使我们的应用程序更快 并且我们使用Environment
  • 如何仅向测试人员发布新版本的 Chrome 扩展程序

    我有一个有很多用户的 Chrome 扩展程序 我想更新它 我已准备好一切 但我需要测试更新以确保当前用户不会丢失数据 有没有办法只将新版本发布给受信任的测试人员 我创建了一个测试组 我插入受信任的测试人员电子邮件帐户 我已在测试帐户下登录
  • 架构和数据字典有什么区别?

    模式的定义是数据库中数据的逻辑结构 它由用户拥有并与数据库用户同名 模式包含表的名称 它的列类型是什么等 数据字典也仅包含元数据 当然它是在数据库级别而不是用户级别 模式和数据字典之间的确切区别是什么 这些定义来自我的经验 20 多年的程序
  • VBS代码中的With语句,在PowerShell中如何表达

    有没有可以快速将VBS代码转换为PowerShell代码的软件或工具 另外 我想知道的是 以下WithVBS代码中的语句 在PowerShell中如何表达 The With语句很棒 可以缩短代码 我可以在PowerShell中实现类似的功能
  • 错误:未授予权限...react-native-image-picker

    我正在尝试使用客户端应用程序中的内存上传图像 反应本机图像选择器 0 26 4 执行以下示例片段后 我以意想不到的方式得到了响应 ImagePicker showImagePicker options response gt console
  • WPF 应用程序基于角色的访问控制 - 最佳实践

    我需要实施某种RBAC http en wikipedia org wiki Rbac对于我目前正在编写的 WPF 应用程序 自 v2 0 起 ASP NET 就拥有了安全性 成员身份和角色管理基础架构 如所述here http weblo
  • jaxws-api 2.2 未在 Maven 构建中加载

    我已经使用 Apache CXF 工具 wsdl2java 生成了 Java 代码 在我的服务评论中 它说我应该支持 Jaxws API 2 2 但不知道这意味着什么 在我的 Maven POM 中我有这个
  • 如何以编程方式圆角并设置随机背景颜色

    我想圆化视图的角 并根据运行时的内容更改视图的颜色 TextView v new TextView context v setText tagsList get i if i 2 0 v setBackgroundColor Color R
  • 以编程方式在 Swift 中模拟滑动手势

    我正在实现一个用于在 Swift 中滑动的手势识别器 我希望能够模拟卡片的投掷 以编程方式滑动视图 我以为会有一个内置函数来实现这一点 但我发现的只是点击手势而不是滑动手势 这就是我实现滑动手势的方式 let gesture UIPanGe
  • 如何在 VS Code 中自定义多个主题的 textMateRules? [复制]

    这个问题在这里已经有答案了 In VS Code 我想定制一些textMateRules多个主题相同 例如 两者都用于Atom One Dark and Default Dark 但在不影响任何其他主题的情况下 我想让keywords it
  • 使用 CreateProcess 运行批处理文件

    我正在尝试使用 CreateProcess 启动一个新的环境块并在新的环境块中运行批处理文件 我已经阅读了 CreateProcess 的 msdn 示例 并得出了如下所示的代码 发生了什么 它将打开新的命令提示符 并停在那里 由于某种原因
  • Angular 材质 md-button 悬停颜色变化

    div class non active div
  • sublimerepl getenv 失败

    我想将 SiblimeREPL 包与 Sublime Text 一起使用 当我尝试启动 REPL 时 我得到 SublimeREPL obtaining sane environment failed in getenv Check con
  • 通过 TinyXML 深度复制 XML

    我正在使用tinyxml 如何复制或创建现有 XMLDocument 的副本 http www grinninglizard com tinyxmldocs classTiXmlDocument html a4e8c1498a76dcde7
  • 如何正确使用VAVR集合做到线程安全?

    VAVR 集合是 不可变的 那么 如果我有静态变量 例如 保存所有 WebSocket 会话 我将如何使用 VAVR 以使集合是线程安全的 例如 ServerEndpoint actions public class DeviceWebSo
  • TFRecords 和记录改组

    我的理解是 最好的做法是对每个时期的训练样本进行洗牌 以便每个小批量包含整个数据集的一个很好的随机样本 如果我将整个数据集转换为包含 TFRecords 的单个文件 那么在加载整个数据集的情况下如何实现这种改组 我的理解是 没有对 TFRe