Faster Rcnn 代码解读之 blob.py

2023-10-27

# --------------------------------------------------------
# Fast R-CNN
# Copyright (c) 2015 Microsoft
# Licensed under The MIT License [see LICENSE for details]
# Written by Ross Girshick
# --------------------------------------------------------

"""Blob helper functions."""
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import numpy as np
import cv2


# ims是缩放后的图片列表
# 作用：将缩放后的图片信息存到blob中
def im_list_to_blob(ims):
    """Convert a list of images into a network input.

    Assumes images are already prepared (means subtracted, BGR order, ...).
    """
    # ims里不同图片的shape可能不一样，取出其最大值
    max_shape = np.array([im.shape for im in ims]).max(axis=0)
    num_images = len(ims)
    # 构建一个全0的array，3代表BGR通道
    blob = np.zeros((num_images, max_shape[0], max_shape[1], 3),
                    dtype=np.float32)
    # 然后把图片信息赋值到blob中
    for i in range(num_images):
        im = ims[i]
        blob[i, 0:im.shape[0], 0:im.shape[1], :] = im

    return blob


# 对图片进行缩放，返回缩放后的img和比例
def prep_im_for_blob(im, pixel_means, target_size, max_size):
    """Mean subtract and scale an image for use in a blob."""
    im = im.astype(np.float32, copy=False)
    # Pixel mean values (BGR order) as a (1, 1, 3) array
    # 减去3通道的平均值
    im -= pixel_means  # __C.PIXEL_MEANS = np.array([[[102.9801, 115.9465, 122.7717]]])
    im_shape = im.shape  # (w,h,3)
    # 比较长宽获得最大最小值
    im_size_min = np.min(im_shape[0:2])
    im_size_max = np.max(im_shape[0:2])
    # 缩放比例，距离目标尺寸的比例
    im_scale = float(target_size) / float(im_size_min)
    # Prevent the biggest axis from being more than MAX_SIZE
    # 防止最长的边超过max_size
    if np.round(im_scale * im_size_max) > max_size:  # __C.TRAIN.MAX_SIZE = 1200
        im_scale = float(max_size) / float(im_size_max)
    # 对im进行缩放,缩放比例为im_scale
    im = cv2.resize(im, None, None, fx=im_scale, fy=im_scale,
                    interpolation=cv2.INTER_LINEAR)

    return im, im_scale

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

FasterRcnn

faster rcnn

Faster Rcnn 代码解读之 blob.py 的相关文章

FasterRcnn在Jetson TX2上测速

博主测试了在不同模式精度下将FasterRCNN部署到Jetson TX2上的测速结果 xff0c 与大家分享讨论对于MaskRCNN的部署结果可参见 MaskRCNN在Jetson tx2上的测速结果使用的Caffe版本Faster
pytorch+FasterRCNN在Jetson Xavier上的测速

测速结果为原创 xff0c 转载需附带本文链接基本配置 xff1a ResNet50 43 FPN xff0c 输出尺寸600x1000 其它Jetson开发板测速结果 1 MaskRCNN 43 TensorRT在Jetson tx2上
pytorch+FasterRCNN在Jetson Xavier NX上的测速

测速结果为原创 xff0c 转载需附带链接基本配置 xff1a Jetpack 4 4 DP Pytorch 1 2 for DP 其它Jetson开发板测速结果 1 MaskRCNN 43 TensorRT在Jetson tx2上的测速
使用DOTA数据集训练Faster R-CNN模型

一所需文件下载链接二基础环境配置三训练及测试过程使用Faster R CNN算法在DOTA数据集上实现目标检测使用Faster R CNN算法在VOC2007数据集上实现目标检测的详细步骤 Windows10 Faster R
基于机器视觉的水果检测算法实现

一摘要这是一款基于卷积神经网络和数字图像处理的智能水果检测和分类系统由检测分类两个部分组成通过互联网下载和使用多媒体处理工具对水果拍摄视频剪辑处理得到大量水果图片对图片进行标定获得数据集并将数据集分成训练集和测试集检测部分使
Faster Rcnn 代码解读之 blob.py

Fast R CNN Copyright c 2015 Microsoft Licensed under The MIT License see LICENSE for details Written by Ross Girshick Bl
FasterRCNN（一）网络部分代码分析

一定义一个RCNN的类作为基础 1 self build network self sess is training True 函数构建网络框架 with tf variable scope RCNN initializer tf tr
重新审视Faster RCNN：优缺点与改进

重新审视Faster RCNN Faster RCNN优点 Faster RCNN缺点对于Faster RCNN的改进算法特征融合 HyperNet 实例分割 Mask RCNN 全卷机网络 R FCN 级联网络 Cascade RCN
VOC数据集mAP计算

检测出来的bbox包含score和bbox 按照score降序排序所以每添加一个样本就代表阈值降低一点真实情况下score降低 iou不一定降低这样就是可以有很多种阈值每个阈值情况下计算一个prec和recall d 对模型检测到
faster-rcnn（pytorch）参数配置修改

修改模型配置文件 train prototxt文件 input data层的num class数值由21改为类别数目 roi data层的num class数值由21改为类别数目 cls score层的num output数值由21改为类别
睿智的目标检测45——TF2搭建Faster R-CNN目标检测平台

睿智的目标检测45 TF2搭建Faster R CNN目标检测平台学习前言什么是FasterRCNN目标检测算法源码下载 Faster RCNN实现思路一预测部分 1 主干网络介绍 2 获得Proposal建议框 3 Propos
MATLAB2018B下用Faster-RCNN做目标检测的训练和测试步骤

近些年随着深度学习在计算机视觉领域中的蓬勃发展利用卷积神经网络对图像进行分类以及对图像中目标进行识别定位成为比较前沿的技术本文比较详尽的介绍了在MATLAB2018b环境下利用Faster RCNN对图像进行迁移学习从而使其能够
Faster RCNN 源码解读(1) -- 文件结构分析

基本介绍 Faster RCNN 在目标检测及其相关领域得到了广泛的运用其原型RCNN是将CNN引入到目标检测的开山之作此外基于region proposal是一种十分值得学习的思想因此将在后续的系列章节中基于源码对Faster
对faster rcnn的一些修改

在network py中修改anchor scales 第262行 def create architecture self sess mode num classes tag None anchor scales 8 16 32 anch
人工智能-目标识别：古典目标识别、R-CNN、SPP-NET、Fast-R-CNN、Faster-R-CNN、YOLO

古典目标识别第一部分训练集构造负样本使用 select search ss 方法对区域进行融合 gt 计算每个候选区域域真实标记区域 GRadeonTruts GT 之间的重合如果区域A与GT的重合度在20 50 之间而且A与其
Faster R-CNN算法

Faster R CNN算法是作者Ross Girshick对Fast R CNN算法的一种改进 Fast R CNN在速度和精度上都有了不错的结果但仍有一些不足之处 Faster R CNN算法同样使用VGG 16网络结构检测速度在G
详解目标检测Faster R-CNN

目标检测的一般结构背景 R CNN 是 Faster R CNN 的启发版本 R CNN 是采用 Selective Search算法来提取 propose 可能的 RoIs regions of interest 区域然后对每个提取区
深度学习之目标检测与目标识别

一目标识别分类及应用场景目前可以将现有的基于深度学习的目标检测与识别算法大致分为以下三大类基于区域建议的目标检测与识别算法如R CNN Fast R CNN Faster R CNN 基于回归的目标检测与识别算法如YOLO SSD
Faster R-CNN系列之MATLAB篇

我发现我是个懒人不对我一直是个懒人但是电光火石间不知怎么地我决定我写个博客吧我是废话的分割线最开始接触Faster R CNN 先尝试跑的其实是PYTHON版但是编译过程中出错了我又从来没接触过python 自己稍稍
为什么ssd和yolo没有roi池化层？

我们知道目标检测框架像faster rcnn and mask rcnn has an roi pooling layer or roi align layer 但是为什么ssd和yolo框架没有这样的层呢首先我们要明白这样做的目的是什么

随机推荐

形象讲解Android中dpi,dp和px之间的关系(设计师如何与程序员沟通)

屏幕尺寸指屏幕显示屏对角线的长度单位为英寸 dpi dots per inch 像素密度指每英寸中的像素数 1 在android中 160dpi设备下 1px 1dp 160dpi表示一英寸中包含160个像素点 px 即把一英寸平均
Linux中sudo ./xxx.sh找不到命令的真正原因——文件执行权限

执行脚本的时候报错经检查 sudo命令正常该脚本文件的确存在于该目录下遂使用 ls l 命令查看下该文件的权限 ps 代表没有权限 r为可读权限 w为可写权限 x为可执行权限共9个基本权限位其中每3个一组 r w x 共分为3组
Unix and perl primer for Biologists - Part1 : Unix - Learning the Essentials - Reading Notes(U1-U12)

Introduction to Unix Unix contains many hundred of commands but you will probably use just 10 or so to achieve most of w
XMind 2022 for Mac(思维导图软件)中文免费版

最近新发现的免费MAC站 macbv 站推荐 com Xmind 2022 是一款功能强大的思维导图软件他的界面经过重新设计变得非常清爽软件采用全新的内核内置多款优秀的字体 ZEN 模式隐藏页面内多余的元素融合艺术与创造力帮助
dnf跨几服务器比较稳定,2018DNF最新跨区表、dnf跨区合并表反应哪个跨区人最多...

2018DNF最新跨区有哪些游戏玩家非常的关心跨区的问题在这里我们先用表格的形式来告诉大家的跨区内容然后也分享文字跨区的内容希望玩家能喜欢废话不多说直接进入跨区内容 2018DNF最新跨区列表表格版 2018DNF最新跨区列表文
java swing的EventQueue解析

java swing是一个单线程的GUI框架且线程不安全的 swing要求所有对于控件的操作比如创建控件和设置属性只能在它的事件分发线程中进行否则就会出现线程安全问题这个事件分发线程就是AWT EventQueue线程 swing
crc16校验代码中多项式码明明是8005 为什么要用A001来异或，还有CRC16-REV=A001是什么意思

0x8005 1000 0000 0000 0101B 0xA001 1010 0000 0000 0001B 对比两个二进制高低bai位正好是完du全相反的 CRC校验分为zhi正向校验与反向校验正dao向校验高位在左反向校验低位在左
两种时间选择器的三种使用场景(带效果图)

前言顺便看一下效果图在Android 开发中时间选择器的使用场景还是很多的我这边也是常用的有两种方法根据不同是使用需求和场景来使用大家如果在开发中有这种需求的可以看一下本篇一 DatePickerDialog日期选择器这个我看
【STM32学习笔记】软件使用---win10下 keil5打开keil4工程的问题

环境操作系统 win10 keil版本 keil MDK5 24a 问题 1 keil5打开keil4 工程卡死 2 keil5 编译图标变为保存解决 1 keil5打开keil4卡死安装 MDK V4 Legacy Support
AndroidManifest.xml中一些常用的属性

一关于AndroidManifest xml AndroidManifest xml 是每个android程序中必须的文件它位于整个项目的根目录描述了package中暴露的组件 activities services 等等他们各自的
十行 Python 代码实现酷炫功能

一生成二维码二维码又称二维条码常见的二维码为QR Code QR全称Quick Response 是一个近几年来移动设备上超流行的一种编码方式而生成一个二维码也非常简单在Python中我们可以通过MyQR模块了生成二维码而生成一
【JAVA】JSP中通过Get和Post方式传递页面参数（三种方式）。

一通过FORM 表单 Get request getParameter方式实现页面传参 1 Login jsp 登录页
基于elementUI和vue做的简单界面

今天学习了elementUI和vue 做了一个简单的学生列表界面
判断点是否在对角线两点构成的矩形中

已知一个矩形的对角线的两个点坐标分别为 A 0 123456789 0 523456789 B 0 423456789 0 323456789 判断C 0 223456789 0 423456789 点是否在A和B构成的矩形中一 Java
可编程渲染管线与着色器语言

可编程渲染管线与着色器语言 Programming pipeline shading language Sampler Direct3D 9 asm ps A sampler is a input pseudo register for a
JavaWeb基础1——MySQL

导航黑马Java笔记踩坑汇总 JavaSE JavaWeb SSM SpringBoot 瑞吉外卖 SpringCloud SpringCloudAlibaba 黑马旅游谷粒商城目录一概念二下载安装配置卸载三关系型数据库
php svg写入文字转png,php如何实现svg转化png

php实现svg转化png的方法首先通过 drawInlineSVG 方法将svg转为canvas 然后使用 base64 image content 方法将canvas转为png即可推荐 PHP视频教程 svg转png实现 1 php
2021年3月最新的山东大学网络认证的网址

http 202 194 15 87 srun portal pc ac id 9 srun wait 1 theme basic
共创开发闭环，轻流CEO薄智元：让无代码回归本质

以无代码的开发形式为基础以业务人员为用户定位奔向无代码的路径为企业提供个性化解决方案和产品使开展业务各个环节的负责人深入地参与到系统开发中去形成圆桌闭环这是轻流的答案作者斗斗出品产业家数字化需求迫切人员成本高研发
Faster Rcnn 代码解读之 blob.py

Fast R CNN Copyright c 2015 Microsoft Licensed under The MIT License see LICENSE for details Written by Ross Girshick Bl

Faster Rcnn 代码解读之 blob.py

Faster Rcnn 代码解读之 blob.py 的相关文章

随机推荐

热门标签