使用 Tensorflow 对象检测 api 打乱训练数据集

2024-03-10

我正在使用 Faster-RCNN 模型和 Tensorflow 对象检测 API 来开发徽标检测算法。我的数据集按字母顺序排列（因此有一百个阿迪达斯徽标，然后是一百个苹果徽标等）。我希望在训练时对其进行洗牌。

我在配置文件中添加了一些值：

train_input_reader:{
          shuffle: true
          queue_capacity: some value
          min_after_dequeue : some other value}

然而，无论我输入什么值，算法首先对所有 a 的徽标（阿迪达斯、苹果等）进行训练，并且在开始看到 b 的徽标（宝马等）后仅经过一段时间，然后c 是一个等等。

当然，我可以直接打乱输入数据集，但我想了解其背后的逻辑。

PS：我见过这个post https://stackoverflow.com/questions/43028683/whats-going-on-in-tf-train-shuffle-batch-and-tf-train-batch关于洗牌和min_after_dequeue，但我仍然不太明白。我的批量大小是 1 所以不应该使用tf.train.shuffle_batch()但只有tf.RandomShuffleQueue

我的训练数据集大小是 5000，如果我写min_after_dequeue: 4000 or 5000它仍然没有被正确洗牌。为什么呢？

更新： @AllenLavoie 这对我来说有点难；因为有很多依赖项，而且我是 Tensorflow 的新手。但最终队列是由

tf.contrib.slim.parallel_reader.parallel_read(    _, string_tensor = parallel_reader.parallel_read(
        config.input_path,
        reader_class=tf.TFRecordReader,
        num_epochs=(input_reader_config.num_epochs
                    if input_reader_config.num_epochs else None),
        num_readers=input_reader_config.num_readers,
        shuffle=input_reader_config.shuffle,
        dtypes=[tf.string, tf.string],
        capacity=input_reader_config.queue_capacity,
        min_after_dequeue=input_reader_config.min_after_dequeue)

看来当我把num_readers = 1在配置文件中，数据集最终按照我想要的方式进行洗牌（至少在开始时），但是当开始时有更多的徽标时，徽标将按字母顺序排列。

我建议在训练之前对数据集进行洗牌。当前发生的洗牌方式并不完美，我对正在发生的情况的猜测是，一开始队列是空的，并且只获得以“A”开头的示例——过了一段时间，它可能会更加洗牌，但没有当队列尚未填满时绕过开始部分。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Tensorflow 对象检测 api 打乱训练数据集的相关文章

在目标检测中使用步长为 1 的最大池化层的目的是什么

我正在使用单次探测器 SSD 更具体地说这个实现 https github com pierluigiferrari ssd keras在喀拉斯当我检查 SSD300 时正如我注意到的这也适用于 SSD512 我注意到在每个卷积组之后
如何解释和转换 Keras 分类器的预测值？

我正在训练我的 Keras 模型来预测使用提供的数据参数它是否会射击并且它将以 0 表示否 1 表示是的方式表示然而当我尝试预测它时我得到的是浮点值我尝试使用与训练数据完全相同的数据来获取 1 但它不起作用我使用下面的数据尝
在训练期间启用和禁用变量学习

我想在训练期间开始或停止变量的学习虽然Variable的构造函数有一个trainable参数该参数构建后不可更改为了实现这种效果我当前的解决方案是在我想要更改变量的可训练状态时保存模型将变量设置为所需的可训练状态来重建网络然后重
TensorFlow 队列关闭后可以重新打开吗？

我想将项目入队关闭队列以确保其他会话将所有剩余项目出队然后在下一个纪元稍后重新打开它这可能吗 q tf FIFOQueue close q q close reopen q with tf Session as sess sess r
Google Tensorflow 中的事件文件

我正在使用 Tensorflow 构建神经网络我想在 Tensorboard 上显示训练结果到目前为止一切正常但我对 Tensorboard 的事件文件有疑问我注意到每次运行 python 脚本时它都会生成不同的事件文件当我
如何在 Tensorflow 上测试自己的图像到 Cifar-10 教程？

我训练了 Tensorflow Cifar10 模型我想为其提供自己的单个图像 32 32 jpg png 我想将标签和每个标签的概率视为输出但我对此遇到了一些麻烦搜索堆栈溢出后我发现了一些帖子this https stackove
在 Numpy 中预处理 Tensorflow 张量

我在 Tensorflow 中设置了一个 CNN 用 TFRecordReader 读取数据它工作得很好但我想做一些比提供的更多的预处理和数据增强tf image功能我特别想做一些随机缩放是否可以在 Numpy 中处理 Tensor
TF 数据 API：如何有效地从图像中采样小块

考虑创建从高分辨率图像目录中采样随机小图像块的数据集的问题 Tensorflow 数据集 API 提供了一种非常简单的方法来实现此目的即构建图像名称的数据集对它们进行排序将其映射到加载的图像然后映射到随机裁剪的补丁然而这种幼稚的
如何在java中排队并调用实际方法（而不是立即评估）？

有一个对时间敏感的任务列表但在这种情况下时间对于另一个程序告诉我的内容是任意的它更像是滴答声而不是时间但是我不希望立即评估所述方法我希望一个在另一个完成后执行我在队列中使用链表但我不确定如何是否可以访问类中的实际方法
AttributeError：“模块”对象没有 tf.app.run() 的属性“main”

我正在尝试测试一个简短的程序该程序非常简单如下所示 import numpy as np import tensorflow as tf flags tf app flags FLAGS flags FLAGS import tenso
TensorFlow：张量不是该图的元素

file for inputing the data for testing from scipy import ndimage image file test png image data ndimage imread image fil
Odroid XU4 上的 Tensorflow 编译

我正在尝试在 Odroid XU4 16GB eMMc Ubuntu 16 上编译 Tensorflow 尝试了完整和精简版但出现如图所示的错误 https www dropbox com sh j86ysncze1q0eka AAB8R
target_vocab_size 在方法 tfds.features.text.SubwordTextEncoder.build_from_corpus 中到底意味着什么？

根据这个链接 https www tensorflow org datasets api docs python tfds features text SubwordTextEncoder build from corpus target
使用java工具的类似Sidekiq的队列？

我想要一个工作队列其行为几乎与 ruby 的 sidekiq 完全相同它不need使用 Redis 但它可以我只是不能使用 ruby 甚至不能使用 Jruby 基本上我希望能够创建使用某些参数运行的作业并且工作池执行作业工作人员
使用一个或多个标准 FIFO 队列实现延迟队列 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 延迟队列是一种队列其中每条消息都有
在 jupyter 中找不到 Tensorboard 作为魔法函数

我想使用最新的tensorflow 2 0 0a0在jupyter中运行tensorboard 使用tensorboard版本1 13 1和python 3 6 using tensorboard logdir logs base dir
tensorflow SavedModel - 如何迭代保存

我正在采用新的SavedModel据我所知 API 是未来应该优先于tf train Saver 我想要实现的目标是每次保存一个模型N批次数我想最多保留 20 个已保存的模型显然我可以自己监控这一点但如果tf train Save
如何将“实例键”添加到 keras 模型输入以在 gcloud ai-platform 中进行批量预测？

我正在尝试添加键以匹配 Google AI Platform 的批量预测输出但是我的模型输入只允许一个输入看起来像这样 input tf keras layers Input shape max len x tf keras lay
没有名为“_pywrap_tensorflow_internal”的模块

在尝试验证tensorflow gpu的安装时在尝试执行 import tensorflow as tf 时出现ImportError 我在 Windows 7 上使用 Quadro K620 Tensorflow 是使用 pip 安装的
将张量的完整值打印到控制台或写入张量流中的文件

我需要将一个大张量 32 32 3 打印到控制台中并且我只得到如下输出 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245

随机推荐

在 Valgrind 下运行 Eclipse

这里有人成功运行 Eclipse 吗Valgrind http valgrind org 我正在与涉及 JNI 代码的特别棘手的崩溃作斗争并希望 Valgrind 或许可以再次证明其卓越性但是当我在 Valgrind 下运行 Ecl
nltk 函数计算某些单词的出现次数

nltk书中有一个问题使用 state union 语料库阅读器阅读国情咨文演讲的文本计算每个文档中男性女性和人物的出现次数随着时间的推移这些词的使用发生了什么变化我想我可以使用像 state union 1945 Truman
Selenium WebDriver 中的 DesiredCapability 有什么用？

Selenium WebDriver 中的 DesiredCapability 有什么用我们什么时候想使用它以及如何使用举例回答将不胜感激您应该阅读有关的文档所需能力 https github com SeleniumHQ selen
终端进程命令无法启动退出代码：0 和退出代码：2

Visual Studio 代码终端无法工作捷径ctrl 因为终端不工作 Error The terminal process terminated with exit code 0 终端进程命令 C WINDOWS System32 W
t.Cleanup 有什么用？

问题我想知道的用例t CleanupGo1 14中引入与使用 defer 相比 t Cleanup 有何便利 https golang org pkg testing T Cleanup https golang org pkg tes
图像文件的加密与解密

结合我的另一个question https stackoverflow com questions 12131627 image encryption decryption 并且在更改了这一小部分代码之后 FileOutputStream
使用 Twilio 和 SIP 进行 SMS 消息传递

我正在尝试使用 Twilio 在我的 iPhone 上发送和接收短信我已设置呼入和呼出呼叫遵循这些说明 https stackoverflow com questions 48346740 how do i forward a twili
Azure Functions 错误 - 无法将参数绑定到字符串类型

我正在尝试使用 Azure 函数将文件保存到 FTP json是这样的 type apiHubFile name outputFile path folder ps DateTime txt connection ftp FTP direc
如何读入边列表以制作 scipy 稀疏矩阵

我有一个大文件其中每行都有一对 8 个字符串就像是 ab1234gh iu9240gh 在每行上这个文件实际上代表了一个图每个字符串都是一个节点 ID 我想读入文件并直接制作一个 scipy 稀疏邻接矩阵然后我将使用 pytho
“没有这样的模块‘Alamofire’”Xcode 无法识别 Alamofire 框架

我意识到在其他问题中也提出了同样的错误例如here https stackoverflow com questions 25817479 cannot install alamofire in new xcode project no s
CakePHP 仅在输入数据时进行表单验证

我正在尝试上传其中一个模特的照片并且当我进入编辑模式时当用户只想编辑与该记录相关的文本时它仍然要求我上传照片以下是我的验证规则 display photo gt array uploadError gt array rule gt
读取音频文件信息php

如何从声音文件中读取比特率长度等信息不同的文件格式 mp3 wmw 等我想那里有一些图书馆课程也许我可以尝试一下有什么建议么 getID3 http getid3 org 是一个 PHP 脚本可以从 MP3 和其他多媒体文件格
Android ProgressBar 的样式类似于 SwipeRefreshLayout 中的进度视图

I use android support v4 widget SwipeRefreshLayout在我的 Android 应用程序中它包裹着一个ListView 列表视图的内容是从服务器下载的当用户向下滑动以从服务器重新加载数据时会
Docker - 无法从容器内部 ping 主机子网上的任何内容

我有一台 IP 地址为 192 168 11 10 的 Mac 主机我有一个使用默认网络配置运行的 docker compose 项目我需要从 docker 容器内连接到 IP 地址 192 168 11 11 上的设备从容器内我可
jUnit 在多种文化中测试 Double.toString

我有一个开源库其中有大量比较字符串形式的数字的单元测试这些测试通过良好en GB en US以及其他文化中数字通常以以下形式书写1 234 00 然而在德国和法国等文化中这些值的格式不同因此测试会失败如何强制 jUnit 测试运
R - 查找包含所有字符串/模式的所有向量元素 - str_detect grep

样本数据 files in path c a 4 0 name 2015 NY RDS b 4 0 name 2016 CA RDS c 4 0 name 2015 PA RDS strings to find c 4 0 PA 我想要一个
多个表行作为backbone.js 视图？

所以我有一个数据网格网格中的每个项目都有一个关联的模型和视图我需要将每个项目渲染为two表行以实现所需的 UI 不这不是我的设计第一次尝试在视图中render 方法只需渲染两行并将它们添加到this el 然后我将每个视图附加到
将向量转换为向量（优雅的方式）

我想知道是否有一种优雅的方式或内置函数来转换vector
在绑定到 Winforms 数据源的 gridview 的 bool 列中显示是/否？

我有一个绑定到数据源 Windows 窗体 VB NET 的 gridview 其中一列是布尔类型的属性我想在该列中显示是否而不是 0 1 或真假这可能吗您可以编辑绑定列的显示吗我遇到了同样的问题不幸的是我没有找到优雅的
使用 Tensorflow 对象检测 api 打乱训练数据集

我正在使用 Faster RCNN 模型和 Tensorflow 对象检测 API 来开发徽标检测算法我的数据集按字母顺序排列因此有一百个阿迪达斯徽标然后是一百个苹果徽标等我希望在训练时对其进行洗牌我在配置文件中添加了一些值 tr

使用 Tensorflow 对象检测 api 打乱训练数据集

使用 Tensorflow 对象检测 api 打乱训练数据集 的相关文章

随机推荐

热门标签

使用 Tensorflow 对象检测 api 打乱训练数据集的相关文章