（tensorflow学习）用Object Detection API实现摄像头实时物体检测

2023-10-31

对于物体识别，谷歌已经有训练好的模型供我们使用，图方便不想自己训练的可以直接使用。
说实话，装这个tensorflow真心麻烦，我建议用anaconda环境搭建，还要注意装的话装1.几的版本就可，用gpu跑的话注意显卡型号和版本是否兼容。真是踩无数坑啊。。建议找个细致一点的教程，一步一步来，至于这个我就不多写了。
要获取预训练模型，模型下载
在这里还要添加模型目录，就是把下载的解压到anaconda的库目录下，可以搜相关教程即可。
我的代码：

# coding: utf-8
# 可以放在任何文件夹下运行（前提正确配置API[环境变量]）
# 退出 按q键

import numpy as np
import tensorflow as tf
import cv2
import os

from object_detection.utils import visualization_utils as vis_util
from object_detection.utils import label_map_util

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
cv2.setUseOptimized(True)           # 加速cv

# 要改的内容
###############################################
PATH_TO_CKPT = 'C:/Users/POG/anaconda3/Lib/site-packages/tensorflow/models/research/object_detection/ssd_mobilenet_v1_coco_2018_01_28/frozen_inference_graph.pb'   # 模型及标签地址
PATH_TO_LABELS = 'C:/Users/POG/anaconda3/Lib/site-packages/tensorflow/models/research/object_detection/data/mscoco_label_map.pbtxt'

NUM_CLASSES = 90            # 检测对象个数

camera_num = 0                # 要打开的摄像头编号，可能是0或1
width, height = 1280,720    # 视频分辨率
###############################################

# Load a (frozen) Tensorflow model into memory.
detection_graph = tf.Graph()
with detection_graph.as_default():
    od_graph_def = tf.compat.v1.GraphDef()
    with tf.compat.v1.gfile.GFile(PATH_TO_CKPT, 'rb') as fid:
        serialized_graph = fid.read()
        od_graph_def.ParseFromString(serialized_graph)
        tf.import_graph_def(od_graph_def, name='')

# Loading label map
label_map = label_map_util.load_labelmap(PATH_TO_LABELS)
categories = label_map_util.convert_label_map_to_categories(label_map, max_num_classes=NUM_CLASSES, use_display_name=True)
category_index = label_map_util.create_category_index(categories)


mv = cv2.VideoCapture(camera_num)  # 打开摄像头

mv.set(3, width)     # 设置分辨率
mv.set(4, height)


config = tf.compat.v1.ConfigProto()
config.gpu_options.allow_growth = True
with detection_graph.as_default():
    with tf.compat.v1.Session(graph=detection_graph, config=config) as sess:
        image_tensor = detection_graph.get_tensor_by_name('image_tensor:0')
        detection_boxes = detection_graph.get_tensor_by_name('detection_boxes:0')
        detection_scores = detection_graph.get_tensor_by_name('detection_scores:0')
        detection_classes = detection_graph.get_tensor_by_name('detection_classes:0')
        num_detections = detection_graph.get_tensor_by_name('num_detections:0')

        while True:
            ret, image_source = mv.read()  # 读取视频帧
            image_source = cv2.cvtColor(image_source, cv2.COLOR_BGR2RGB)
            image_np = cv2.resize(image_source , (width, height), interpolation=cv2.INTER_CUBIC)
            image_np_expanded = np.expand_dims(image_np, axis=0)
            # Actual detection.
            (boxes, scores, classes, num) = sess.run(
                [detection_boxes, detection_scores, detection_classes, num_detections],
                feed_dict={image_tensor: image_np_expanded})
            # Visualization of the results of a detection.
            vis_util.visualize_boxes_and_labels_on_image_array(
                image_np,
                np.squeeze(boxes),
                np.squeeze(classes).astype(np.int32),
                np.squeeze(scores),
                category_index,
                use_normalized_coordinates=True,
                line_thickness=4)
            image_np = cv2.cvtColor(image_np, cv2.COLOR_RGB2BGR)
            cv2.imshow("video", image_np)
            if cv2.waitKey(1) & 0xFF == ord('q'):  # 按q退出
                break

我这里用的是tensorflow2的版本，代码会和1的有些不同。
结果：
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

opencv

（tensorflow学习）用Object Detection API实现摄像头实时物体检测的相关文章

OpenCV 2.4.3rc 和 CUDA 4.2：“OpenCV 错误：没有 GPU 支持”

我在这张专辑中上传了几张截图 https i stack imgur com TELST jpg https i stack imgur com TELST jpg 我正在尝试在 Visual Studio 2008 中的 OpenCV 中
如何使用文本和？

我一直在关注this https github com tensorflow models tree master textsum使用 textsum 的链接我已经使用提供的命令训练了模型但我在 textsum log root 目录中
在谷歌Colab中使用cv2.imshow()

我正在尝试通过输入视频来对视频进行对象检测 cap cv2 VideoCapture video3 mp4 在处理部分之后我想使用实时对象检测来显示视频 while True ret image np cap read Expand di
使用 Keras 和 fit_generator 绘制 TensorBoard 分布和直方图

我正在使用 Keras 使用 fit generator 函数训练 CNN 这似乎是一个已知问题 https github com fchollet keras issues 3358TensorBoard 在此设置中不显示直方图和分布有
安装 gstreamer 对 opencv python 包的支持

我已经从源代码构建了自己的 opencv python 包 import cv2 print cv2 version 打印 3 4 5 现在我面临的问题是关于 opencv 的 VideoCapture 类中的 gstreamer 的使用
从笔记本中提取文本

我正在尝试从图像中提取手写文本我使用 python 和 opencv 函数例如 find contours 当我使用像这样的图像时一切进展顺利它工作得很好因为我有一个简单的背景但后来我用这张图片测试了它由于背景中有笔记本的线条
我想知道对象检测 api 中边界框的大小

我已经用过API https github com tensorflow models tree master object detection https github com tensorflow models tree master
Google Colab 错误：无法获取卷积算法。这可能是因为 cuDNN 初始化失败

UnknownError 无法获取卷积算法这可能是因为 cuDNN 初始化失败因此请尝试查看上面是否打印了警告日志消息 node conv2d 1 convolution Conv2D T DT FLOAT data format NC
Tensorflow ctc_loss_calculator：找不到有效路径

当运行我的神经网络双向 LSTM 进行音频识别时我使用连接主义时间分类 CTC 但在某些时候训练网络时我几乎每批都会收到来自 Tensorflow 的警告 W tensorflow core util ctc ctc loss cal
从 PyCharm IDE 运行 Django 项目时出现“ImportError：没有名为 cv2 的模块”

我正在从 PyCharm 运行一个 Django 项目其配置设置为使用 virtualenv 中的 Python 解释器该解释器依赖于 opencv 当我运行时该网站在本地运行良好django admin py runserver 但
OpenCV 中更新窗口的 waitKey() 的替代方法

到目前为止我见过的所有示例和书籍都建议使用 waitKey 1 来强制重新绘制 OpenCV 窗口这看起来很奇怪而且太老套了不必要的时候为什么还要等待 1 毫秒呢还有其他选择吗我尝试了 cv updateWindow 但它似乎需要
如何使用 Python 3 在 OpenCV 3 上正确加载 cv2.KeyPoint 和描述符？

有一天我不得不恢复一个使用 OpenCV 3 和 Python 2 7 的旧项目在此代码中要加载 cv2 KeyPoint 我执行以下操作 import numpy as np import cPickle import cv2 ke
打印出网络架构中每一层的形状

在 Keras 中我们可以如下定义网络有什么办法可以输出每层之后的形状例如我想打印出以下形状inputs在定义行之后inputs 然后打印出形状conv1在定义行之后conv1 etc inputs Input 1 img rows
如何在没有 OpenCv Manager 的情况下运行 OpenCV 代码

我正在使用 OpenCV4Android 版本 2 4 10 并在 Samsung Galayx GT I9300 上测试我的代码我遇到的问题是我必须从 Play 商店下载 Opencv Manager 以便我的 opencv 代码运行
ECC 导致多光谱图像的图像对齐失败

我正在尝试将 RGB 图像与 IR 图像单通道对齐目标是创建 4 通道图像 R G B IR 为了做到这一点我正在使用cv2 findTransformECC如中所述这个非常简洁的指南 https learnopencv com i
如何在Keras模型中替换（或插入）中间层？

我有一个训练有素的 Keras 模型我想要 1 用相同但没有偏差的Con2D层替换Con2D层 2 在第一次激活之前添加 BatchNormalization 层我怎样才能做到这一点 def keras simple model fro
Keras，如何获取每一层的输出？

我已经用 CNN 训练了一个二元分类模型这是我的代码 model Sequential model add Convolution2D nb filters kernel size 0 kernel size 1 border mode
在 keras 中使用条件实现自定义损失函数

我需要一些有关 keras 损失函数的帮助我一直在使用 Tensorflow 后端在 keras 上实现自定义损失函数我已经在 numpy 中实现了自定义损失函数但如果它可以转换为 keras 损失函数那就太好了损失函数采用数据帧
监控培训课程如何运作？

我试图理解使用之间的区别tf Session and tf train MonitoredTrainingSession 以及我可能更喜欢其中之一似乎当我使用后者时我可以避免许多杂务例如初始化变量启动队列运行程序或设置文件编写器以
从索贝尔确定图像梯度方向？

我正在尝试使用 openCV 的 Sobel 方法的结果来确定图像梯度方向我知道这应该是一个非常简单的任务我从此处复制了许多资源和答案中的方法但无论我做什么所得方向始终在 0 57 度之间我希望范围为 0 360 我相信所有的深度

随机推荐

计算机视觉开发者的新伙伴：Python中的SAM

计算机视觉开发者的新伙伴 Python中的SAM 计算机视觉是人工智能领域的一个重要分支它涉及使用计算机和相应的算法来解析和理解图像和视频数据在计算机视觉开发中 Python是一种广泛使用的编程语言它提供了许多强大的库和工具帮助开发
react的状态提升

1 概念理解在react中是单向数据流的设计即只有父组件可以传递数据给子组件而没有子组件传递数据给父组件的概念以正确的技术说明是拥有者组件可以设置被拥有者组件中的资料也就是主人与仆人的关系那么子组件要传递数据给父组件
宝塔 + SSRPanel 前端安装教程

一安装宝塔及环境安装宝塔面板登录 SSH 后直接安装宝塔 yum install y wget wget O install sh http download bt cn install install sh sh install
数据库定义语言(DDL)详解

数据库定义预压 DDL 语言是重要的语言之一包含三个关键字 CREATE DROP ALTER 数据库语言都遵循巴科斯范式其语言规范如下所示 L利用CREATE关键字可以实现定义定义数据库定义表定义索引定义视图等常用的是建表
LOESS局部加权

参考资料 1 Matlab中fLOESS函数 https ww2 mathworks cn matlabcentral fileexchange 55407 loess regression smoothing s tid srchtitl
node.js 做反向代理

1 安装http proxy模块 npm install http proxy 2 使用http proxy模块启动代理服务器导入http模块 var http require http 导入http proxy模块 var httpPr
C++设计模式（二）（摘录）

C 设计模式二摘录装饰模式装饰模式动态地给一个对象添加一些额外的功能它是通过创建一个包装对象也就是装饰来包裹真实的对象新增加功能来说装饰器模式比生产子类更加灵活以下情形考虑使用装饰模式需要扩展一个类的功能或给一个类添
java之Thread类详细分析（全）

目录前言 1 属性值 1 1 线程属性方法 2 常用方法 3 使用方法前言 Thread是程序中的执行线程 jvm并发地运行多个执行线程 1 属性值通过查看Thread源码是继承Runnable接口的实现类无论使用Runnable
[Java]学习笔记

一些JAVA的学习笔记记录主要是和C的不同点 https www runoob com java java tutorial html 声明数组变量注意建议使用 dataType arrayRefVar 的声明风格声明数组变量 da
【多同步挤压变换】基于多同步挤压变换处理时变信号和噪声信号研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 算例1 2 2 算例2 2 3 算例3 2 4 算例4 2 5 算例5 3 参考文献
c++版本itk读取dicom序列

读取dicom序列 hablee void readDicomSeries const std string dicom dir itk Image
.NET MVC+EF CodeFirst+IOC+EasyUI 框架设计教程（概述）

一开发环境 Win7 VS2013 C SQL Server2008 R2 二总体源代码结构如下说明这个分层按个人理解不一定要照我的如果做过开发会三层架构之类的理解起来就容易 01 Infrastructure 基础构件 Ne
QGIS批量将分幅遥感影像合并

要在QGIS中编程实现批量将分幅遥感影像拼接成完整影像可以按照以下步骤进行操作 1 首先确保已经安装并正确配置了QGIS Python环境并导入所需的库以下是代码的导入部分 from qgis core import QgsProj
常见的金融术语——176个基础金融知识名词解释

基金类 1 开放式基金 open end funds 指基金规模不是固定不变的而是可以随时根据市场供求情况发行新份额或被投资人赎回的投资基金 2 封闭式基金 close end funds 指基金规模在发行前已确定在发行完毕后及规定的期
解决文字自动换行，字母、数字不换行问题

添加css属性word break break all
mysql修改root密码的语句

ALTER USER root localhost IDENTIFIED WITH mysql native password BY 新密码其中 localhost 字符有的小伙伴可能遇到过无法通过navicat连接Linux中的MyS
单点登录SSO：可一键运行的完整代码

单点登录方案不同于一个普通站点它的部署比较繁琐涉及到好几个站点要改host 安装证书配置HTTPS 看到的不少这方面示例都是基于HTTP的不认同这种简化 1 它体现不出混合HTTP HTTPS时单点注销要注意处理的问题 2 做单
【Node.js】下载安装及简单使用

说起Node js 它是当前市面上非常受欢迎的框架允许我们使用JavaScript搭建后端应用它有着种种优点诸如非阻塞I O 事件驱动跨平台高性能单线程等等等等不过现在我们不必执拗与关心这些优点的含义当务之急是先上手他
conda加速设置

Conda作为使用最为便捷的python环境管理工具可以协助我们很方便的下载安装第三方库软件包等操作但其在下载资源的过程中速度不言而喻尤其是在更换国内源的情况下下载速度没有实质性的改变是很令人头疼的一件事 Mamba 树眼镜蛇能
（tensorflow学习）用Object Detection API实现摄像头实时物体检测

对于物体识别谷歌已经有训练好的模型供我们使用图方便不想自己训练的可以直接使用说实话装这个tensorflow真心麻烦我建议用anaconda环境搭建还要注意装的话装1 几的版本就可用gpu跑的话注意显卡型号和版本是否兼容真是

（tensorflow学习）用Object Detection API实现摄像头实时物体检测

（tensorflow学习）用Object Detection API实现摄像头实时物体检测 的相关文章

随机推荐

热门标签

（tensorflow学习）用Object Detection API实现摄像头实时物体检测的相关文章