深度学习(9):Inception危险物品检测

2023-11-17

目标:基于Inception网络实现对危险物品检测,将危险物品图片或视频经过图像预处理后输入模型推理,最后将检测结果进行可视化输出。

一、原理

Google的Inception网络介绍

Inception为Google开源的CNN模型,至今已经公开四个版本,每一个版本都是基于大型图像数据库ImageNet中的数据训练而成。因此我们可以直接利用Google的Inception模型来实现图像分类。

二、过程

1.导入库

首先导入需要的组件包,包括tensorflow、keras、IPython等,代码如下:

# 安装完成需要重启kernel
!pip3 install pygame
!pip3 install opencv_python
# !pip3 install tensorflow==1.15.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

from PIL import Image
import numpy as np
import cv2
import time
import os
import sys
import logging as log
import pygame
from tensorflow.keras.applications.inception_v3 import decode_predictions
from keras.applications import InceptionV3
from keras.applications import imagenet_utils

from IPython.display import clear_output, Image, display, HTML

 

 2.导入数据

#准备数据,从OSS中获取数据并解压到当前目录:

import oss2
access_key_id = os.getenv('OSS_TEST_ACCESS_KEY_ID', 'LTAI4G1MuHTUeNrKdQEPnbph')
access_key_secret = os.getenv('OSS_TEST_ACCESS_KEY_SECRET', 'm1ILSoVqcPUxFFDqer4tKDxDkoP1ji')
bucket_name = os.getenv('OSS_TEST_BUCKET', 'mldemo')
endpoint = os.getenv('OSS_TEST_ENDPOINT', 'https://oss-cn-shanghai.aliyuncs.com')
# 创建Bucket对象,所有Object相关的接口都可以通过Bucket对象来进行
bucket = oss2.Bucket(oss2.Auth(access_key_id, access_key_secret), endpoint, bucket_name)
# 下载到本地文件
bucket.get_object_to_file('data/c12/danger_detect_data.zip', 'danger_detect_data.zip')
#解压数据
!unzip -o -q danger_detect_data.zip -d danger_detect_input 
!rm -rf __MACOSX
!ls danger_detect_input -ilht

3.定义工具方法

#数据预处理
def pre_process_image(image, img_height=299):
    n, c, h, w = [1, img_height, img_height,3]
    processedImg = image
    # 图像归一化处理
    processedImg = (np.array(processedImg) - 0) / 255.0

    # Change data layout from HWC to CHW
    processedImg = processedImg.transpose((2, 0, 1))
    processedImg = processedImg.reshape((n, c, h, w))

    return image, processedImg

# 视频显示
def arrayShow(imageArray):
    ret, png = cv2.imencode('.jpg', imageArray)
    return Image(png)

# 将dlib中rect对像转化为(top, right, bottom, left)形式
def _rect_to_css(rect):
    return rect.top(), rect.right(), rect.bottom(), rect.left()

# 确保(top, right, bottom, left)在图片内部
def _trim_css_to_bounds(css, image_shape):
    return max(css[0], 0), min(css[1], image_shape[1]), min(css[2], image_shape[0]), max(css[3], 0)

4.加载模型

print("[INFO] loading InceptionV3 model...")
model = InceptionV3(weights="imagenet")

Inception-v3:针对Inception-v2的升级,增加了以下内容:(1)RMSProp优化器。(2)分解为7*7卷积。(3)辅助分类BatchNorm。(4)标签平滑(Label Smoothing,添加到损失公式中的正则化组件类型,防止网络过于准确,防止过度拟合)。

5.查看模型信息

#查看模型信息
model.summary()

6.查看模型的输入要求

#查看模型的输入要求
model.input

 7.查看模型的输出
 

#查看模型的输出
model.output

8.初始化参数

#可视化字体颜色
textColor = (255, 0, 0)
#摄像头输入图像宽度
camera_width = 299*2
#摄像头输入图像高度
camera_height = 299*2
#定义模型输入
inputShape = (299, 299)

#图片地址
path = "danger_detect_input/"
#初始化声音报警
pygame.init()
alarm = None
try:
    pygame.mixer.init()
    pygame.mixer.pre_init(44100, -16, 2, 2048)
    alarm = pygame.mixer.music.load('alarm.mp3')
except:
    alarm = None

 9.危险物品检测

from pygame.locals import *

input_file = "danger_detect_input/input/out1.mov"
video_capture = cv2.VideoCapture(input_file)

video_capture.set(cv2.CAP_PROP_FPS, 10)
video_capture.set(cv2.CAP_PROP_FRAME_WIDTH, camera_width)
video_capture.set(cv2.CAP_PROP_FRAME_HEIGHT, camera_height)

ret, frame = video_capture.read()

elapsedTime = 0
fps = ""

danger_classes = ["assault_rifle","lighter"]
  
    
print("begin process..",ret)
while ret:
    t1 = time.time()

    ret, frame = video_capture.read()
    if not ret: break

    frame = cv2.resize(frame, inputShape)

    time.sleep(2)   
    _, image = pre_process_image(frame)


    #模型预测
    preds = model.predict(image)
    
    #解析识别结果
    P = imagenet_utils.decode_predictions(preds)

    
    result =  P[0][0]

    cv2.putText(frame, fps, (20, 15), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 255), 1, cv2.LINE_AA)
    cv2.putText(frame, str(result[1]+" prob:"+str(result[2])), (20, 35), cv2.FONT_HERSHEY_SIMPLEX, 0.5, textColor, 1, cv2.LINE_AA)
    if result[1] in danger_classes and alarm:
        pygame.mixer.music.play(0)
     # 清空绘图空间
    clear_output(wait=True)
    # 显示处理结果
    display(arrayShow(frame))
    

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
    elapsedTime = time.time() - t1
    fps = "{:.1f} FPS".format(1 / elapsedTime)

cv2.destroyAllWindows()

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习(9):Inception危险物品检测 的相关文章

随机推荐

  • 使用AVPlayer播放视频

    iOS里面视频播放用到的是AVPlayer 包含在AVFoundation框架内 与AVAudioplayer有点类似 但是AVPlayer得功能跟加强大 他可以用来播放音频也可以用来播放视频 而且在播放音频方面能直接播放网络音频 要使用A
  • 每天一道leetcode141-环形链表

    考试结束 班级平均分只拿到了年级第二 班主任于是问道 大家都知道世界第一高峰珠穆朗玛峰 有人知道世界第二高峰是什么吗 正当班主任要继续发话 只听到角落默默想起来一个声音 乔戈里峰 前言 2018 11 8号打卡明天的题目 https lee
  • py去除文件空行

    去除d0 txt中空行并保存在d1 txt 如果要删除带有空格的空行 可以考虑把判断条件换成正则 with open d0 txt r encoding utf 8 as f open d1 txt w encoding utf 8 as
  • cloudstack api调度流程

    cloudstackapi调度流程 我们发往cloudstack的api命令由management端的ApiServlet的processRequest req resp 进性处理 该函数开启一个线程进行处理 对于login和logout命
  • Qt将程序打包成.exe文件,并添加图标

    1 在工程中添加一个Qt Resource File 文件名任意 2 将 ico后缀的图片放到跟工程文件 pro 文件同目录下 并在Qt Resource File文件中添加该 ico文件 3 添加相关代码 设置窗口图标 4 双击打开 pr
  • CMake入门教程:使用target_include_directories指定头文件目录

    CMake入门教程 使用target include directories指定头文件目录 在进行软件开发时 我们经常需要引用一些外部库或模块的头文件以便使用其功能 CMake是一个强大的跨平台构建工具 能够帮助我们管理项目并生成相应的构建
  • WSL2 局域网访问以及hosts注意事项

    说明 WSL2用的是NAT方式 虚拟机有内部的ip 所以访问虚拟机可用代理访问方法 要点 根据微软文档 powershell 下做端口转发代理 netsh interface portproxy add v4tov4 listenport
  • 双引号后面要加句号吗_小学二年级老师容易疏忽的一个知识点:冒号和双引号...

    标点符号是特殊的文字 使用得当 会为文章增色不少 同时也是考试丢分的一个知识点 应引起师生重视 到了小学二年级 必须学会使用冒号和双引号 冒号 是常用的标点符号之一 通常表示提示语后的停顿或表示提示下文或总结上文 它用在提示语的后面 如果老
  • 用Python写一个比大小的小游戏(代码解释)

    代码解释 游戏 猜数字 玩法 程序会随机生成一个1 30的数字 玩家有无限次 机会去猜这个数字程序会告诉你是大了还是小了 在最后猜中的时候程序会告诉你猜中了 并且告诉你结束游戏以及猜中该数字所花费的次数 代码 Python import r
  • PyTorch的官方bug:torch.optim.lr_scheduler.CosineAnnealingWarmRestarts

    torch optim lr scheduler CosineAnnealingWarmRestarts 低版本 如torch1 7 1 指定last epoch参数时报错 已有人反馈指出 升级torch1 11 0可以解决该问题 升级之后
  • Python数据可视化——图型参数介绍

    前言 利用Python 绘制常见的统计图形 例如条形 图 饼图 直方图 折线图 散点图等 通过这些常用图形的展现 将 复杂的数据简单化 这些图形的绘制可以通过matplotlib 模块 pandas 模 块或者 seaborn 模块实现 饼
  • java 垃圾回收 sys_深入理解Java虚拟机学习笔记2.1-G1垃圾回收

    G1 GC是Jdk7的新特性之一 Jdk7 版本都可以自主配置G1作为JVM GC选项 作为JVM GC算法的一次重大升级 DK7u后G1已相对稳定 且未来计划替代CMS 所以有必要深入了解下 不同于其他的分代回收算法 G1将堆空间划分成了
  • springmvc中的resolveView(视图解析器)

    视图解析器接口只有一个方法 就是根据名称解析出视图信息 一个视图对象View 采用的是模板模式 抽象模板类 AbstractCachingViewResolver 主要处理缓存 如果视图对象在缓存中有 则从缓存中取 如果没有则创建 publ
  • 整理最全的图床集合——三千图床

    2021 09 25 更新 去除部分图床 添加新的图床 优化排版 引言 古有弱水三千 今有三千图床 勿埋我心 图床一般是指储存图片的服务器 有国内和国外之分 国外的图床由于有空间距离等因素决定访问速度很慢影响图片显示速度 国内也分为单线空间
  • remote: HTTP Basic: Access deniedfatal: Authentication failed for ‘xxxxx‘的问题解决

    在没有修改git密码的情况下 使用vs code推送代码 总是会报错 remote HTTP Basic Access denied fatal Authentication failed for xxxxxxxx git仓库地址 网上试了
  • YOLOV7开源代码讲解--训练参数解释

    目录 训练参数说明 weights cfg data hpy epoch batch size img size rect resume nosave notest noautoanchor evolve bucket cach image
  • 【Basis】狄利克雷分布

    初次看狄利克雷分布 比较懵 主要是它有很多先行知识 所以我先介绍狄利克雷分布用到的多项式分布 gamma 函数 beta分布 然后再介绍狄利克雷分布 参考文献见文章末 目录 一 多项式分布 multinomial distribution
  • 仅仅是一张照片就是不能刷脸支付的

    科技改变未来并不是一句口号 就拿买东西来讲 以前人们都是一手交钱一手交货 拿到大额的纸币 还要验真假 而现在移动支付成为主要付款方式 只要一部手机 扫一扫就能付款 一开始也有很多人不习惯手机支付 因为觉得没有现金实在 整天就是一堆数字转来转
  • 解决TypeError: 'function' object is not subscriptable

    一 解决问题 在tensorflow中使用零矩阵初始化变量的时候出现的该异常 TypeError function object is not subscriptable 二 解决方法 问题代码如下 bias tf Variable tf
  • 深度学习(9):Inception危险物品检测

    目标 基于Inception网络实现对危险物品检测 将危险物品图片或视频经过图像预处理后输入模型推理 最后将检测结果进行可视化输出 一 原理 Google的Inception网络介绍 Inception为Google开源的CNN模型 至今已