使用TensorFlow Object Detection API进行图像物体检测

2023-05-16

参考 https://github.com/tensorflow/models/tree/master/object_detection

准备

安装TensorFlow

参考 https://www.tensorflow.org/install/

如在Ubuntu下安装TensorFlow with GPU support, python 2.7版本

wget https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.2.0-cp27-none-linux_x86_64.whl
pip install tensorflow_gpu-1.2.0-cp27-none-linux_x86_64.whl

配置TensorFlow Models

下载TensorFlow Models

git clone https://github.com/tensorflow/models.git

编译protobuf


# From tensorflow/models/

protoc object_detection/protos/*.proto --python_out=.

生成若干py文件在object_detection/protos/。

添加PYTHONPATH


# From tensorflow/models/

export PYTHONPATH=$PYTHONPATH:`pwd`:`pwd`/slim

测试


# From tensorflow/models/

python object_detection/builders/model_builder_test.py

若成功，显示OK。

准备数据

参考 https://github.com/tensorflow/models/blob/master/object_detection/g3doc/preparing_inputs.md

这里以PASCAL VOC 2012为例。

下载并解压


# From tensorflow/models

wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
tar -xvf VOCtrainval_11-May-2012.tar

生成TFRecord


# From tensorflow/models

mkdir VOC2012
python object_detection/create_pascal_tf_record.py \
    --label_map_path=object_detection/data/pascal_label_map.pbtxt \
    --data_dir=VOCdevkit --year=VOC2012 --set=train \
    --output_path=VOC2012/pascal_train.record
python object_detection/create_pascal_tf_record.py \
    --label_map_path=object_detection/data/pascal_label_map.pbtxt \
    --data_dir=VOCdevkit --year=VOC2012 --set=val \
    --output_path=VOC2012/pascal_val.record

得到pascal_train.record和pascal_val.record。

如果需要用自己的数据，则参考create_pascal_tf_record.py编写处理数据生成TFRecord的脚本。可参考 https://github.com/tensorflow/models/blob/master/object_detection/g3doc/using_your_own_dataset.md

（可选）下载模型

官方提供了不少预训练模型（ https://github.com/tensorflow/models/blob/master/object_detection/g3doc/detection_model_zoo.md ），这里以ssd_mobilenet_v1_coco以例。
```
# From tensorflow/models

wget http://download.tensorflow.org/models/object_detection/ssd_mobilenet_v1_coco_11_06_2017.tar.gz
tar zxf ssd_mobilenet_v1_coco_11_06_2017.tar.gz
```

训练

如果使用现有模型进行预测则不需要训练。

文件结构

为了方便查看文件，使用以下文件结构。

models
├── object_detection
│   ├── VOC2012
│   │   ├── ssd_mobilenet_train_logs
│   │   ├── ssd_mobilenet_val_logs
│   │   ├── ssd_mobilenet_v1_voc2012.config
│   │   ├── pascal_label_map.pbtxt
│   │   ├── pascal_train.record
│   │   └── pascal_val.record
│   ├── infer.py
│   └── create_pascal_tf_record.py
├── eval_voc2012.sh
└── train_voc2012.sh

配置

参考 https://github.com/tensorflow/models/blob/master/object_detection/g3doc/configuring_jobs.md

这里使用SSD w/MobileNet，把object_detection/samples/configs/ssd_mobilenet_v1_pets.config复制到object_detection/VOC2012/ssd_mobilenet_v1_voc2012.config

修改第9行为num_classes: 20。

修改第158行为fine_tune_checkpoint: "object_detection/ssd_mobilenet_v1_coco_11_06_2017/model.ckpt"

修改第177行为input_path: "object_detection/VOC2012/pascal_train.record"

修改第179行和193行为label_map_path: "object_detection/data/pascal_label_map.pbtxt"

修改第191行为input_path: "object_detection/VOC2012/pascal_val.record"

训练

新建tensorflow/models/train_voc2012.sh，内容以下：

python object_detection/train.py \
    --logtostderr \
    --pipeline_config_path=object_detection/VOC2012/ssd_mobilenet_v1_voc2012.config \
    --train_dir=object_detection/VOC2012/ssd_mobilenet_train_logs \
    2>&1 | tee object_detection/VOC2012/ssd_mobilenet_train_logs.txt &

进入tensorflow/models/，运行./train_voc2012.sh即可训练。

验证

可一边训练一边验证，注意使用其它的GPU或合理分配显存。

新建tensorflow/models/eval_voc2012.sh，内容以下：

python object_detection/eval.py \
    --logtostderr \
    --pipeline_config_path=object_detection/VOC2012/ssd_mobilenet_v1_voc2012.config \
    --checkpoint_dir=object_detection/VOC2012/ssd_mobilenet_train_logs \
    --eval_dir=object_detection/VOC2012/ssd_mobilenet_val_logs &

进入tensorflow/models/，运行CUDA_VISIBLE_DEVICES="1" ./train_voc2012.sh即可验证（这里指定了第二个GPU）。

可视化log

可一边训练一边可视化训练的log，可看到Loss趋势。
```
tensorboard --logdir ssd_mobilenet_train_logs/
```
可视化验证的log，可看到Precision/mAP@0.5IOU的趋势以及具体image的预测结果。
```
tensorboard --logdir ssd_mobilenet_val_logs/ --port 6007
```

测试

导出模型

训练完成后得到一些checkpoint文件在ssd_mobilenet_train_logs中，如：
- graph.pbtxt
- model.ckpt-200000.data-00000-of-00001
- model.ckpt-200000.info
- model.ckpt-200000.meta
其中meta保存了graph和metadata，ckpt保存了网络的weights。

而进行预测时只需模型和权重，不需要metadata，故可使用官方提供的脚本生成推导图。
```
python object_detection/export_inference_graph.py \
    --input_type image_tensor \
    --pipeline_config_path object_detection/VOC2012/ssd_mobilenet_v1_voc2012.config \
    --trained_checkpoint_prefix object_detection/VOC2012/ssd_mobilenet_train_logs/model.ckpt-200000 \
    --output_directory object_detection/VOC2012
```

测试图片

运行object_detection_tutorial.ipynb并修改其中的各种路径即可。

或自写编译inference脚本，如tensorflow/models/object_detection/infer.py

import sys
sys.path.append('..')
import os
import time
import tensorflow as tf
import numpy as np
from PIL import Image
from matplotlib import pyplot as plt

from utils import label_map_util
from utils import visualization_utils as vis_util

PATH_TEST_IMAGE = sys.argv[1]
PATH_TO_CKPT = 'VOC2012/frozen_inference_graph.pb'
PATH_TO_LABELS = 'VOC2012/pascal_label_map.pbtxt'
NUM_CLASSES = 21
IMAGE_SIZE = (18, 12)

label_map = label_map_util.load_labelmap(PATH_TO_LABELS)
categories = label_map_util.convert_label_map_to_categories(
    label_map, max_num_classes=NUM_CLASSES, use_display_name=True)
category_index = label_map_util.create_category_index(categories)

detection_graph = tf.Graph()
with detection_graph.as_default():
    od_graph_def = tf.GraphDef()
    with tf.gfile.GFile(PATH_TO_CKPT, 'rb') as fid:
        serialized_graph = fid.read()
        od_graph_def.ParseFromString(serialized_graph)
        tf.import_graph_def(od_graph_def, name='')

config = tf.ConfigProto()
config.gpu_options.allow_growth = True

with detection_graph.as_default():
    with tf.Session(graph=detection_graph, config=config) as sess:
        start_time = time.time()
        print(time.ctime())
        image = Image.open(PATH_TEST_IMAGE)
        image_np = np.array(image).astype(np.uint8)
        image_np_expanded = np.expand_dims(image_np, axis=0)
        image_tensor = detection_graph.get_tensor_by_name('image_tensor:0')
        boxes = detection_graph.get_tensor_by_name('detection_boxes:0')
        scores = detection_graph.get_tensor_by_name('detection_scores:0')
        classes = detection_graph.get_tensor_by_name('detection_classes:0')
        num_detections = detection_graph.get_tensor_by_name('num_detections:0')
        (boxes, scores, classes, num_detections) = sess.run(
            [boxes, scores, classes, num_detections],
            feed_dict={image_tensor: image_np_expanded})
        print('{} elapsed time: {:.3f}s'.format(time.ctime(), time.time() - start_time))
        vis_util.visualize_boxes_and_labels_on_image_array(
            image_np, np.squeeze(boxes), np.squeeze(classes).astype(np.int32), np.squeeze(scores),
            category_index, use_normalized_coordinates=True, line_thickness=8)
        plt.figure(figsize=IMAGE_SIZE)
        plt.imshow(image_np)

运行infer.py test_images/image1.jpg即可

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

object

Detection

API

进行图像物体检测

使用TensorFlow Object Detection API进行图像物体检测的相关文章

在 Tensorflow 中使用 tf.while_loop 更新变量

我想更新 Tensorflow 中的变量因此我使用 tf while loop 例如 a tf Variable 0 0 0 0 0 0 dtype np int16 i tf constant 0 size tf size a def
谷歌地图的地址建议

有人知道是否有任何方法可以重现 ajax 建议框例如http maps google com http maps google com 我的网页中有使用 google 地图 api 的吗例如如果有人写下 15 Avenue 的建议列表
SQLAPI++ 的免费替代品？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有任何免费也许是开源的替代品SQLAPI http www sqlapi com 这个库看起来
具有不同尺寸图像的 Tensorflow 输入数据集

我正在尝试使用不同大小的输入图像来训练完全卷积神经网络我可以通过循环训练图像并在每次迭代时创建单个 numpy 输入来做到这一点即 for image input label in zip image data labels train
Laravel 5 通过外部 API 对用户进行身份验证

我想知道是否可以扩展内置身份验证以使用外部 API 来对用户进行身份验证我是 Laravel 新手非常感谢您的帮助我正在 Laravel 5 2 中为我的客户制作一个自定义应用程序但我无法直接访问他们的数据库服务器我只能调用他们的
Google 地图地理编码 API 为有效地址生成 ZERO_RESULTS

我们使用 google API 进行地理编码我们成功对大约 10K 个地址进行了地理编码由于某种原因 API 对以下地址返回地理编码错误状态 ZERO RESULTS 我们尝试了几次但仅对于这些地址我们仍然收到相同的 ZERO
如何使用 blazor 前端 http 请求附加令牌

我使用 blazor 作为前端 api 已完成 JWT 配置前端可以创建用户帐户并登录API 但现在我的前端httpclient没有设置JWT令牌所以如果我在Api控制器中设置授权前端将无法访问它 api程序代码如下 builder
从 array_map 匿名函数内部调用类方法

我正在尝试从一个对象中调用我的对象的方法之一array map匿名函数到目前为止我收到了预期的错误致命错误不在对象上下文中时使用 this 我知道为什么我会收到此错误我只是不知道如何实现我想要的目标有人有任何建议吗这是我当前的
让 TensorFlow 在 ARM Mac 上使用 GPU

我已经安装了TensorFlow在 M1 上 ARM Mac 根据这些说明 https github com apple tensorflow macos issues 153 一切正常然而模型训练正在进行CPU 如何将培训切换到GPU
在 Tensorflow 中使用迁移学习是否需要预定义图像大小？

我打算使用预先训练的模型例如fast rcnn resnet101 pets用于 Tensorflow 环境中的对象检测如所述here https tensorflow object detection api tutorial rea
REST api 可以通过两个 HTTP 方法公开吗？

问题是我们有一个复杂的搜索 api 查询字符串并且希望让用户可以方便地使用 body 所以我们希望同时允许 GET 和 POST 或 PUT 我知道对于搜索是否为只读操作存在争论并且根据 REST 标准它应该只能是 GET 据我了解
为什么这个对象的“forEach 不是函数”？

这可能真的很愚蠢但我不明白为什么这不起作用 var a cat large a forEach function value key map console log value 未捕获的类型错误 a forEach 不是函数 http j
Paypal Rest API - 来自批准 URL 的令牌生命周期

我使用 Paypal Rest API 我的问题是有多长token来自批准 URL 有效吗我想将此令牌也包含我的令牌存储到数据库并生成带有我的令牌的链接稍后如果我单击此链接将我的令牌替换为 paypal 令牌我想重定向到 p
比较一个类的两个实例

我有一堂这样的课 public class TestData public string Name get set public string type get set public List
如何修复 Tensorflow 中的“ValueError：操作数无法与形状 (2592,) (4,) 一起广播”？

我目前正在设计一个 NoisyNet 层如下所示探索嘈杂的网络 https arxiv org abs 1706 10295 在 Tensorflow 中并得到如标题所示的维度误差而两个张量的维度将在行中按元素相乘filtered o
请放心，如何在 POST 请求后从响应正文中提取生成的令牌并将其设置到标头

执行任何请求我需要执行身份验证POST请求正文 username somename password somepass 标头Content Type application json这给了我一个带有生成令牌的响应我需要将其粘贴为第二个标
Tensorflow 中使用 Adam Optimizer 时损失突然增加

I am using a CNN for a regression task I use Tensorflow and the optimizer is Adam The network seems to converge perfectl
提交用于 Tensorflow 对象检测的 Google Cloud ML 训练作业时出现错误消息

尝试提交 Tensorflow 对象检测任务的 Google Cloud ML 训练作业我正在遵循官方指南 https github com tensorflow models blob master research object de
创建动态对象

如何动态创建对象 string columnNames EmpName EmpID PhoneNo List
Tensorflow“feed_dict”：对键值对使用相同的符号得到“TypeError：无法将 feed_dict 键解释为张量”

我正在使用构建线性回归的 Tensorflow 示例我的代码如下 import numpy as np import tensorflow as tf train X np asarray 3 3 4 4 5 5 6 71 6 93 4

随机推荐

上传文件超过限制，造成长时间无响应的解决方案

在上传大文件 xff0c 造成长时间没有响应的情况的解决方案 xff1a 上传大文件时 xff0c 因为http协议的响应问题 xff0c 造成长时间不能向客户端发送响应请求头解决方案 xff1a 1 向服务器发送上传大文件的reques
checkbox的jsTree的一个调用

lt DOCTYPE HTML PUBLIC 34 W3C DTD HTML 4 01 Transitional EN 34 gt lt html gt lt head gt lt meta http equiv 61 34 Content
灵活使用递归算法，生成Excel文件中的复合表头

最近 xff0c 在开发中 xff0c 需要导出数据到excel文件 xff0c 文件的表头的格式是不一致的有复合表头 xff0c 也有单表头 xff0c 那么如何灵活地生成excel文件中的复合表头首先有一个JSON字符串格式的字段描
在 ibm http server 和 websphere 之间配置 ssl

在WebSphere的环境中 xff0c 配置SSL xff0c 有一些细节需要注意 xff1a 1 最好是先安装 ibm http server7 32bit xff0c websphere7 再安装插件 2 http server 需要
Ext4使用总结（二）简单的hbox布局

布局的合理利用 xff1a 如图 xff1a xtype 39 container 39 margins 39 5 0 0 0 39 layout align 39 stretch 39 type 39 hbox 39
软件开发者的精力管理(一)

精力管理对于软件开发者来讲是非常重要的不希望自己被长周期的项目拖垮 xff0c 不希望被连续的加班所累我个人认为泛义的时间管理是涉及到多个方面的而心理学精力管理则是非常重要的作为一名从事了多年软件开发的从业者 xff0c 我的一个
如何高效能地学习和使用"工具"?

在软件开发中 xff0c 应该注意工具的合理使用 xff0c 使得自己变得高效起来 1 工具也是产品 xff0c 有许多的工具是产品化的既然是产品 xff0c 就很多的服务 xff0c 例如帮助文档 xff0c 论坛 xff0c 咨询人员
Ext4使用总结（十二）采用 CellEditing 方式的Grid，如何取得修改的单元格数据值

使用cellediting方式编辑数据的grid在保存数据时 xff0c 需要进行数据的处理 xff0c 所以数据处理的方式需要特别注意 cellEditing 插件的事件 listeners edit function editor e
「Ubuntu」Ubuntu中的python终端配置（修改终端默认python配置，软连接，不同版本python环境配置）

前言通过这篇博客 xff08 Ubuntu安装Python xff09 安装完Python后 xff0c 想要在终端直接启动想启动的python版本此时直接在终端输入python2或者python3 xff0c 发现系统已经配置好了py
[解题报告] CSDN竞赛第15期

CSDN编程竞赛报名地址 xff1a https edu csdn net contest detail 29 1 求并集题目由小到大输出两个单向有序链表的并集如链表 A 1 gt 2 gt 5 gt 7 链表 B 3 gt 5 gt
JSP开发技术四——————EL表达式

EL xff08 Expression Language xff09 表达式 xff0c 即正则表达式用来操作字符串用一些特定的字符来表示一些代码操作 xff0c 这样简化代码书写学习正则表达式 xff0c 就是学习一些特殊符号的实用
[解题报告] CSDN竞赛第17期

CSDN编程竞赛报名地址 xff1a https edu csdn net contest detail 31 1 判断胜负题目已知两个字符串A B 连续进行读入n次每次读入的字符串都为A B 输出读入次数最多的字符串解题报告模拟
[解题报告] CSDN竞赛第18期

CSDN编程竞赛报名地址 xff1a https edu csdn net contest detail 32 1 单链表排序题目单链表的节点定义如下 xff08 C 43 43 xff09 xff1a class Node publi
[解题报告] CSDN竞赛第22期

CSDN编程竞赛报名地址 xff1a https edu csdn net contest detail 36 1 c 43 43 难题大数加法题目大数一直是一个c语言的一个难题现在我们需要你手动模拟出大数加法过程请你给出两个大整
[解题报告] CSDN竞赛第23期

CSDN编程竞赛报名地址 xff1a https edu csdn net contest detail 37 1 排查网络故障题目 A地跟B地的网络中间有n个节点 xff08 不包括A地和B地 xff09 xff0c 相邻的两个节点是通
CSDN竞赛第24期

CSDN编程竞赛报名地址 xff1a https edu csdn net contest detail 38 这次写完第一道题时遇到一个奇怪的情况 xff1a 一直在运行中 xff0c 然后发现每道题输入做任意代码都出现一直运行中跟小
[Python开发] 使用python读取图片的EXIF

使用python读取图片的EXIF 方法使用PIL Image读取图片的EXIF 使用https pypi python org pypi ExifRead 读取图片的EXIF xff0c 得到EXIF标签 xff08 dict类型 xf
Partial Least Squares Regression 偏最小二乘法回归

介绍定义偏最小二乘回归多元线性回归分析 43 典型相关分析 43 主成分分析输入 xff1a n m 的预测矩阵 X n p 的响应矩阵 Y 输出 X 和 Y 的投影分数矩阵 T U R n l 目标 xff1a 最大化 cor
使用TensorFlow-Slim进行图像分类

参考 https github com tensorflow models tree master slim 使用TensorFlow Slim进行图像分类准备安装TensorFlow 参考 https www tensorflow o
使用TensorFlow Object Detection API进行图像物体检测

参考 https github com tensorflow models tree master object detection 使用TensorFlow Object Detection API进行图像物体检测准备安装Tensor

使用TensorFlow Object Detection API进行图像物体检测

准备

训练

测试

使用TensorFlow Object Detection API进行图像物体检测 的相关文章

随机推荐

热门标签

使用TensorFlow Object Detection API进行图像物体检测的相关文章