在自己的数据集上训练 Tensorflow 对象检测

2024-01-03

在花了几天时间尝试完成这项任务之后，我想分享一下我如何回答这个问题的经验：

我该如何使用TS 物体检测 https://github.com/tensorflow/models/tree/master/research/object_detection使用我自己的数据集进行训练？

这假设该模块已经安装。请参考他们的文档 https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/installation.md if not.

免责声明

这个答案并不意味着right or only训练目标检测模块的方法。这只是我分享我的经验和对我有用的东西。我愿意接受建议并了解更多相关信息，因为我对机器学习总体来说还是新手。

TL;DR

创建您自己的 PASCAL VOC 格式数据集
从中生成 TFRecords
配置管道
可视化

该答案的每个部分都包含相应的编辑（见下文）。阅读完每个部分后，请阅读其编辑部分以获取说明。为每个部分添加了更正和提示。

使用的工具

LabelImg https://github.com/tzutalin/labelImg：创建PASCAL VOC格式注释的工具。

1. 创建您自己的 PASCAL VOC 数据集

PS: 为简单起见，我的答案的文件夹命名约定遵循 Pascal VOC 2012

一窥2012 年 5 月数据集 http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar，您会注意到该文件夹具有以下结构

+VOCdevkit +VOC2012 +Annotations +ImageSets +Action +Layout +Main +Segmentation +JPEGImages +SegmentationClass +SegmentationObject

暂时对以下文件夹进行了修改：

注释：这是所有图像对应的 XML 文件将被放置的地方。使用上面建议的工具来创建注释。不要担心<truncated> and <difficulty>标签，因为它们将被训练和评估二进制文件忽略。

JPEG图像：实际图像的位置。确保它们的类型为 JPEG，因为这是当前支持的类型，以便使用其提供的脚本创建 TFRecord。

图像集->主：这仅由文本文件组成。对于每个类，都有一个对应的火车.txt, 训练值.txt and val.txt。以下是该内容的示例飞机_火车.txt在 VOC 2012 文件夹中

2008_000008 -1
2008_000015 -1
2008_000019 -1
2008_000023 -1
2008_000028 -1
2008_000033  1

该结构基本上是图像名称，后跟一个布尔值，表示相应的对象是否存在于该图像中。以图像为例2008_000008不包含飞机，因此标有-1但是图像2008_000033 does.

我编写了一个小的 Python 脚本来生成这些文本文件。只需迭代图像名称并在其旁边分配 1 或 -1 表示对象存在。我通过打乱图像名称在文本文件中添加了一些随机性。

The {类名}_val.txt文件由 ~~testing~~ 验证数据集组成。将此视为训练期间的测试数据。您希望将数据集分为训练和验证。更多信息可以找到here https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set。这些文件的格式与训练的格式类似。

此时，您的文件夹结构应该是

+VOCdevkit +VOC2012 +Annotations --(for each image, generated annotation) +ImageSets +Main --(for each class, generated *classname*_train.txt and *classname*_val.txt) +JPEGImages --(a bunch of JPEG images)

1.1 生成标签图

准备好数据集后，我们需要创建相应的标签图。导航模型/对象检测/数据并打开pascal_label_map.pbtxt.

该文件由一个 JSON 组成，该 JSON 为每个项目分配 ID 和名称。修改此文件以反映您想要的对象。

2. 生成TFRecord

如果你查看他们的代码，尤其是这个line https://github.com/tensorflow/models/blob/master/research/object_detection/create_pascal_tf_record.py#L162，他们明确地抓住了飞机_火车.txt仅有的。对于好奇心强的人来说，这就是为什么 https://stackoverflow.com/questions/44891732/create-pascal-voc-for-tensorflow-object-detection-api/44937455#44937455。将此文件名更改为您的任何班级列车文本文件。

确保VOC开发套件在里面模型/物体检测然后你就可以继续生成 TFRecord https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/preparing_inputs.md#generating-the-pascal-voc-tfrecord-files.

如果遇到任何问题，请先查看他们的代码。它是不言自明的并且有据可查。

3. 管道配置

The 指示 https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/configuring_jobs.md应该是不言自明的来涵盖这一部分。示例配置可以在以下位置找到对象检测/样本/配置 https://github.com/tensorflow/models/tree/master/research/object_detection/samples/configs.

对于那些像我一样想要从头开始训练的人，只需确保删除fine_tune_checkpoint and from_detection_checkpoint nodes. Here's https://pastebin.com/z7a2G2Dq我的配置文件是什么样子以供参考。

从这里开始，您可以继续tutorial https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/running_locally.md#running-the-training-job并运行训练过程。

4. 可视化

确保与训练并行运行评估，以便能够可视化学习过程。去引用乔纳森·黄 https://github.com/tensorflow/models/issues/1877

最好的方法是运行 eval.py 二进制文件。我们通常运行这个与训练并行的二进制文件，将其指向保存的目录正在训练的检查点。 eval.py 二进制文件将写入记录到eval_dir您指定然后可以指向的与张量板。

您希望看到 mAP 在最初几个小时内“起飞”，然后你想看看它何时收敛。很难说没有看看这些图你需要多少步。

编辑一（2017 年 7 月 28 日）：

我没想到我的回答会受到如此多的关注，所以我决定回来回顾一下。

Tools

对于我的苹果用户来说，你实际上可以使用矩形标签 https://itunes.apple.com/us/app/rectlabel-labeling-images-for-object-detection/id1210181730?mt=12用于注释。

帕斯卡VOC

经过一番挖掘，我终于意识到训练值.txt实际上是训练和验证数据集的联合。

请看看他们的官方开发套件 https://pjreddie.com/media/files/VOC2012_doc.pdf更好地理解格式。

标签图生成

在我撰写本文时，ID 0 代表none_of_the_above。建议您的 ID 从 1 开始。

可视化

运行评估并将张量板定向到 Eval 目录后，它将向您显示每个类别的 mAP 以及每个类别的性能。这很好，但我喜欢同时看到我的训练数据和 Eval。

为此，请在不同的端口上运行tensorboard并将其指向您的火车目录

tensorboard --logdir=${PATH_TO_TRAIN} --port=${DESIRED_NUMBER}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在自己的数据集上训练 Tensorflow 对象检测的相关文章

TensorFlow：Dst 张量未初始化

The MNIST For ML Beginners当我运行时教程给我一个错误print sess run accuracy feed dict x mnist test images y mnist test labels 其他一切都运行
UnimplementedError：图形执行错误：在张量流上运行 nn

我一直遇到这个错误我不知道为什么特别是因为我完全遵循某人的代码并且该人在运行此错误时没有错误 img shape 128 128 3 load pretrained model base model tf keras applicati
期望最大化算法的数值示例[重复]

这个问题在这里已经有答案了由于我不确定给出的公式有人可以提供 EM 算法的简单数字示例吗一个非常简单的具有 4 或 5 个笛卡尔坐标的坐标就可以了那这个呢 http en wikibooks org wiki Data Mining
如何跨多个文本文件查找字典中键的频率？

我应该计算文档 individual articles 中所有文件中字典 d 的所有键值的频率这里文档 individual articles 大约有20000个txt文件文件名为1 2 3 4 例如假设 d Britain 5 7
在 Windows 上，运行“导入张量流”会生成“没有名为“_pywrap_tensorflow”的模块”错误

在 Windows 上 TensorFlow 在执行后报告以下一个或两个错误import tensorflow陈述 No module named pywrap tensorflow DLL load failed 对我来说问题是 cuDN
使用决策树

我知道 tl dr 我将尝试解释我的问题而不会用大量蹩脚的代码来打扰您我正在做一项学校作业我们有蓝精灵的图片我们必须通过前景背景分析来找到它们我有一个 Java 决策树其中包含所有数据 HSV 直方图 1 一个节点然后尝试找到
在 Tensorflow 中学习新单词嵌入时进行地面预训练嵌入

我尝试使用以下代码片段为预训练的嵌入奠定基础并仅针对新词汇学习嵌入但预定义单词的嵌入也发生了变化 None
如何以干净高效的方式在 pytorch 中获得小批量？

我试图做一件简单的事情即使用火炬通过随机梯度下降 SGD 训练线性模型 import numpy as np import torch from torch autograd import Variable import pdb def
Tensorflow ctc_loss_calculator：找不到有效路径

当运行我的神经网络双向 LSTM 进行音频识别时我使用连接主义时间分类 CTC 但在某些时候训练网络时我几乎每批都会收到来自 Tensorflow 的警告 W tensorflow core util ctc ctc loss cal
Tensorflow 初始化给出所有 1

张量流1 12 0 在下面的代码片段中 wrapped rv val和seq rv val似乎应该是等效的但事实并非如此相反 seq rv val 被正确初始化为随机生成的 init val 数组但wrapped rv val 设置为
Tensorflow 数据 API - 预取

我正在尝试使用 TF 的新功能即 Data API 但我不知道如何使用prefetch作品在下面的代码中 def dataset input fn dataset tf data TFRecordDataset filenames co
Keras 显示 GPU 训练速度没有任何改进（部分 GPU 使用？！）

我正在尝试在我的 Jupyter Notebook 的 AWS p2 xlarge 实例上的 GPU 而不是 CPU 上训练我的模型我正在使用tensorflow gpu后端仅tensorflow gpu已安装并在中提到requirem
什么是tensorflow.python.data.ops.dataset_ops._OptionsDataset？

我正在使用来自tensorflow的Transformer代码 https www tensorflow org beta tutorials text transformer https www tensorflow org beta t
TensorFlow.js 调整 3D 张量大小

我有一个具有以下尺寸的 3D 张量宽度 x 高度 x 深度我需要将可变大小的体积调整为特定形状例如 256 x 256 x 256 不幸的是在 TensorFlow js 中他们有一组用于调整大小的方法例如tf image re
神经网络的激活函数选择[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我们可以对神经网络的隐藏层和输出层使用不同的激活函数吗使用这种方案有什么明显的优势吗对于网络的最后一层激活单元也取决于任务分类
TensorFlow CUDA_ERROR_OUT_OF_MEMORY

我正在尝试在 TensorFlow 中构建一个大型 CNN 并打算在多 GPU 系统上运行它我采用了塔式系统并为两个 GPU 拆分批次同时将变量和其他计算保留在 CPU 上我的系统有 32GB 内存但是当我运行代码时出现错误
张量流中有哪些资产？

我正在阅读有关保存和恢复模型的张量流教程并遇到以下声明 If assets need to be saved and written or copied to disk they can be provided when the firs
我的训练和验证代码（张量流）是否正确以及模型是否过度拟合？

这是我的代码 for it in range EPOCH 24410 BATCH SIZE tr pa tr sp sess run tr para tr spec train loss sess run loss fw op feed d
为什么反向传播神经网络中必须使用非线性激活函数？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我一直在阅读一些有关神经网络的内容并且了解单层神经网络的一般原理我理解需要额外的层但为什么要使用非线性激活函数这个问题后面跟着这个
监控培训课程如何运作？

我试图理解使用之间的区别tf Session and tf train MonitoredTrainingSession 以及我可能更喜欢其中之一似乎当我使用后者时我可以避免许多杂务例如初始化变量启动队列运行程序或设置文件编写器以

随机推荐

Spring 异常处理 - @ControllerAdvice 无法处理 HttpServletResponse#sendError()

我在用着 ControllerAdvice实现全局异常处理程序但我在使用时遇到了一些问题HttpServletResponse sendError 方法 ExceptionHandler可以捕获各种异常但不能HttpServletRes
Perl 中的尾随逗号是一种不好的做法吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案今天我参加了一个 Webex 会议在屏幕上展示了我编写的一些 Perl 代码当其他人都在关注和听到时我的老板突然告诉我我必须从哈希和数
在玩笑中模拟 useDispatch 并在功能组件中使用该调度操作来测试参数

您好我正在使用笑话和酶编写功能组件测试当我模拟单击时组件的参数使用 useState 的组件状态会发生变化当状态更改时然后 useEffect 调用并且在 useEffect 中我在更改后使用参数调度一些异步操作所以我想
将单个值传递给 NUnit TestCase 中的 params 参数

我有以下测试 ExpectedException typeof ParametersParseException TestCase param1 TestCase param1 param2 TestCase param1 param2 p
Rails 4.1 和 Bootstrap 3 字形图标无法正常工作

我正在尝试消除使用 Bootstrap 3 的 Rails 4 项目中的字形错误我没有使用任何 Bootstrap gem 将其添加到资产管道中我手动将 bootstrap css 和 bootstrap js 添加到各自的app as
R Markdown - 更改默认的pdf表格标题前缀

默认函数示例Table Table one 在 R Markdown pdf 文档中获取表格标题很好但我很难从默认的英文表格更改为其他内容同时保持位置表格上方和编号编号是可以解决的我可以编写自己的计数函数但位置必须位于表
在存储过程中传递动态订单

我正在创建下面的存储过程 declare PageNum as Int declare PerPageResult as Int declare StartDate as varchar 25 declare EndDate as varc
在 JavaScript 中将字符串转换为 base64。 btoa 和 atob 已弃用

我最近一直在 VS Code 中处理一些项目突然开始在我的代码中收到 btoa 和 atob 现已弃用的通知除了 VS Code 之外我找不到任何相关资源如果这是真的还有什么替代方案呢 Node btoa 和 atob 函数是唯一
通过滚动窗口分区计算不同客户的数量

我的问题类似于redshift 通过窗口分区计算不同客户的数量 https stackoverflow com questions 47736584 redshift count distinct customers over window
我不知道 Postgresql 如何在我的 mac 上创建用户

前两天开始学习postgresql 我在网上遵循的大多数教程要么是旧的要么是代码不能在我的 Mac 上运行我遵循了很多教程做了很多完全不同的事情当我今天打开系统时我注意到 Postgresql 在我的 mac 上创建了一个用户我
@Input() 在 Angular 中的用途是什么？

我正在学习创建功能组件 https angular io tutorial toh pt3 add the input hero propertyangular io 上的教程然后我注意到 Input装饰器属性 src app hero d
wtforms 表单类子类化和字段排序

我有一个用户窗体类 class UserForm Form first name TextField u First name validators Required last name TextField u Last name vali
确定事件处理程序的优先级

我有以下代码我处理一个事件两次但我总是想确保mynewclass始终首先处理事件然后触发本地事件处理程序代码我知道 MyClass 事件应该首先触发因为这是第一个创建的事件但由于线程和排队正在发生我认为它花费了太长时间并且它在
在 Python 程序中嵌入 Python shell

我正在用 Python 创建一个科学实验室用户可以在其中创建修改和分析各种对象我想在程序中放置一个Python shell 以便用户可以通过shell操作对象注他还可以通过常用的 GUI 来操纵对象一个模型可以说明这一点 htt
jQuery load() 在 IE 中抛出“权限被拒绝”错误

我正在通过 AJAX 使用 jQuery 加载页面load 功能它在 IE8 中不起作用给出权限被拒绝错误使用 IE 调试器似乎当 jQuery 尝试打开 xhr 时 ie 会阻止它问题是我的页面有一个 javascript
jars 似乎不再被签名。 JARSigningException：找到未签名的条目

NB 7 4RC2 Win 7 在 Java 控制面板中选中保留临时 Internet 文件复选框我正在使用受信任的证书签署我的 Web Start 应用程序然而 dist lib 中的第 3 方 jar 似乎未签名 C Prog
更改代码后，PowerShell ISE 有时会出现不可预测的行为

我正在使用 PowerShell ISE PS 版本 5 0 如果我运行这段代码 Write Host This 它输出 This 如果我像这样修改脚本 Write Host That 它输出 That 伟大的正如预期的那样现在如果我
无法在第二轮中将项目添加到集合中

基本上我的 Windows 服务应用程序中有一个阻塞集合每次我想向集合中添加 4 个项目然后对其进行处理第一轮还好第二轮就失败了错误是 BlockingCollection 已被标记为已完成添加 My code public sta
Python - 以毫秒为单位的时间差对我不起作用

我读过一些关于此的文章并认为我有一些有效的代码如果两个值之间的差异小于 1 秒则显示的毫秒是正确的如果差异超过一秒它仍然只显示毫秒的差异如下 Correct now wind 2013 08 25 08 43 04 776209
在自己的数据集上训练 Tensorflow 对象检测

在花了几天时间尝试完成这项任务之后我想分享一下我如何回答这个问题的经验我该如何使用TS 物体检测 https github com tensorflow models tree master research object detect

在自己的数据集上训练 Tensorflow 对象检测

在自己的数据集上训练 Tensorflow 对象检测 的相关文章

随机推荐

热门标签

在自己的数据集上训练 Tensorflow 对象检测的相关文章