INRIA数据集

2023-05-16

INRIA数据集

HOG+SVM是经典的行人检测方法，论文作者同时搞了一个INRIA数据集。

INRIA数据集官方页面：http://pascal.inrialpes.fr/data/human/，不过说真的，数据集搞的挺乱的。

首先，INRIA数据集的原始图片，来自GRAZ 01数据集和网络上的一些图片。这些图片相比于MIT行人数据集，人的姿态和光照条件啥的都更加全面，适合做行人检测。每张图片中都进行了行人区域的标定，也就是画了一个矩形框，把矩形框的左上定点坐标和矩形长度、宽度记录下来。
但是，第一次使用INRIA数据集的人，是要重现论文中的效果的！而论文中使用的图片，是归一化后的图片。怎么归一化的咱不细究，反正效果就是，相当于原有的标定矩形框放大了一圈，然后裁剪出行人区域，然后区域缩放（通常是缩小，缩放后到一个固定尺寸）。那，就用这个归一化后的图片做重现实验吧！

但是，问题又来了。这些归一化的图像在哪里？INRIA数据集里面放了原始数据和标定信息，以及归一化后的图像，按官网上的说法先找到train_64x128_H96目录，说里面有pos和neg两个子目录，以及找到test_64x128_H96目录，里面也有pos和neg两个子目录。然后说，在train/pos下的是96x160的图片，test/pos下的是70x134的图片。我倒要问，train目录是哪个？不是train_64x128_H96吗？INRIA数据集根目录下本身有一个Train目录好么，你这么讲我很容易搞混的！而实际上，应当是train_64x128_H96而不是train，test目录也是一样的情况。

还有几个混乱的地方。
我在windows下解压了INRIA数据集，在train_64x128_H96目录下没找到neg目录。这是因为用了软链接，是在linux下做的数据集。我想说，没有必要装这个逼的。把数据集放到Linux下解压，我用的是fedora23系统，进入到train_64x128_H96/neg目录，把里面图片都拷到windows上，拷贝到train_64x128_H96/neg目录下。
另外就是test_64x128_H96目录下的neg目录的问题。这个目录下的图片有用么？反正，看官网的说明，鸟用没有。So,忽略这个目录吧。

然后在Linux下查看整个数据集目录，发现最外层96X160H96和70x134H96两个目录。实际上归一化的图像都存在这两个目录下。那你搞train_64x128_H96和test_64x128_H96两个目录做什么？软链接装逼？

同时有个问题，为什么会有归一化的测试图像呢？test_64x128_H96/pos目录下的图像都是70x134大小，实际中的图像都是尺寸不一的，还要考虑多尺度的问题呢。这个目录下的图片并没有用。直接用原始的测试图片就可以了。

还有，原始图像的命名。为什么以crop_作为前缀？有用么？以及，目录命名怎么一会儿大写开头，一会儿小写开头，train和Train都有？另外对于原始数据的标定我也很无语，为什么有标错的地方？坐标怎么出现负数的，嗯？
算了，原始图像我就用

OK，讲了这么多，目的是整理出一个合理的数据集来，以后自己用也好用。经过整理后的INRIA数据集，目录结构和说明：

INRIADATA{
    normalized_images{
        train{
            pos:96x160大小，训练正样本，需要crop中间的64x128大小。已经做过flip，即包含左右对称的图
            neg:大小不一，通常是几百乘几百，训练负样本，需要从每张图中随机crop 10个区域作为训练负样本
        }
    }
    original_images{
        train{
            pos:训练正样本，大小不一
            neg:训练负样本，大小不一
            annotations:标注信息
        }
        test{
            pos:大小不一
            neg:大小不一
            annotations:标注信息
        }
    }
}

训练和测试的时候有几种选择方式：
用normalized_images目录下的图片做训练，或者用original_images目录下的图片+annotations获取行人区域做训练；测试则都在original_images/test/pos上测试。

整理后的数据集有点大，上传百度网盘了:http://pan.baidu.com/s/1eSdlw7g

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

INRIA

INRIA数据集的相关文章

约束非线性优化：几何意义&对偶形式

借助老师的PPT对约束非线性优化问题的几何意义和对偶形式进行阐述一几何意义 xff08 1 xff09 等式约束考虑只有等式约束h x 的非线性优化问题 xff0c 形式为 xff1a 可视化结果如下图所示 xff0c 红色曲线为
转载篇：优秀博文汇总

1 Pytorch中堆网络语法 xff1a nn moduleList 和Sequential由来用法和实例写网络模型 https blog csdn net e01528 article details 84397174 2 CNN中
批量归一化：Batch Normalization层原理+Pytorch实现

一 BN层概念明晰 BN层存在的意义 xff1a 让较深的神经网络的训练变得更加容易 BN层的工作内容 xff1a 利用小批量数据样本的均值和标准差 xff0c 不断调整神经网络中间输出 xff0c 使整个神经网络在各层的中间输出的数值更加
模型量化——基础知识 & LSQ论文阅读

感谢陈老师给的机会 xff0c 有幸能够参加2020年的DAC比赛我在其中负责目标检测器的调试和量化自己第一次接触量化这个任务 xff0c 很多东西都是一点一点学一量化基础对于一个全精度的值 v v v xff0c 若量化步长为
python3安装tensorflow遇到的问题

1 使用命令 xff1a sudo pip3 install upgrade https storage googleapis com tensorflow linux cpu tensorflow 1 1 0rc2 cp35 cp35m
argparse模块使用说明

深度学习的工程中 xff0c py文件中的main函数一开始总会有大量的参数传入 xff0c 而通常使用的方法就是使用argparse通过命令行传入 xff0c 这篇博文旨在记录argparse的常用方法一语句简介 1 载入argpar
Tensorboard在网络训练中的Logger使用方法

做为神经网络训练中最常用的可视化工具 xff0c Tensorboard经常在Pytorch和Tensorflow框架中做为可视化工具但是其使用的确是有点繁琐 xff0c 所以开设了一个这样的专题 xff0c 用于总结见过的工程里面的数据
Pytorch训练流程

调试了很久YOLO的标准Pytorch实现 xff0c 将Train代码进行了重新整理 xff0c 抽出了标准的Pytorch训练框架现在整理下来 xff0c 以备后用整理后的代码分为三个大部分 xff0c 每个大部分分为三个小部分 x
初识Vulkan渲染管线

目前参考 Vulkan规范和 Vulkan开发实战详解对渲染管线有了一个初步的认识现结合中英文的渲染管线图进行笔记整理中英文的渲染管线图分别如下所示 xff1a 绘制命令送入设备队列执行后 xff0c Vulkan将原始的物体顶点坐
Vulkan着色器的GLSL创建、编译、加载、创建流程

Vulkan没有指定官方的着色器编程语言 xff0c 而是采用SPIR V二进制中间格式进行表示开发人员一般需要基于某种着色器编程语言开发着色器 xff0c 之后再编译为SPIR V格式可以选用GLSL着色器编程语言进行开发大型游戏场
神经网络运算量&参数量估计——FLOPS和FLOPs辨析

一概念明晰首先要明确运算量和参数量两个概念 xff1a 参数量 xff1a 这个比较好理解 xff0c 例如卷积层中的卷积核c i k k n o xff0c 其参数量就是相乘的结果而且 xff0c 无论输入图像的尺寸怎么变
机器学习基础——彻底搞懂Precision\Recall\F1\P-R\ROC

一直以为自己理解这些概念 xff0c 但是其实只是听说过而已这些概念的释义来自于周志华教授的机器学习 xff0c 都属于对机器学习算法的性能度量一错误率与精度还是使用书上的定义写的明确 xff0c test set中所有样本预测对
[交叉熵损失函数的由来：KL散度] & [softmax+交叉熵损失函数求梯度推导]
SSH基础操作

这里写自定义目录标题 SSH基础操作SSH免密登录客户端快捷登录服务器端 sshd配置配置完成后重启服务器端sshd服务 SSH基础操作 span class token function ssh span span class toke
Linux下screen的使用

关掉xshell之后网站也随着关闭 xff0c 我们可以使用screen命令 xff0c 来让保证退出ssh之后程序继续在后台跑利用SSH远程连接服务器 xff0c 运行程序需要保证在此期间窗口不能关闭并且连接不能断开 xff0c 否则当
SAI 串行音频接口学习

SAI 简介串行音频接口 xff08 SAI xff09 xff0c SAI具有灵活性高配置多样的特点 SAI 通过两个完全独立的音频子模块来实现这种灵活性与可配置型 xff0c 每个音频子模块与多达4个引脚 xff08 SD SCK
Tensorflow笔记1：Graph

参考内容都出自于官方API教程tf Graph 一 Graph类调用这里使用的是1 15版本 xff0c TF官方为了能够在2 0 43 版本中保持兼容 xff0c 因此调用时使用了tf compat v1 Graph 若安装的就是1 1
Tensorflow笔记2：Session

参考内容都出自于官方API教程tf Session 一 Session类基本使用方法这里使用的是1 15版本 xff0c TF官方为了能够在2 0 43 版本中保持兼容 xff0c 因此调用时使用了tf compat v1 Session

随机推荐

Tensorflow笔记3：Variable

调用Variable类即可向Graph中添加变量 Variable在创建之后需要给定初始值 xff0c 可以是任意type shape的Tensor 一旦使用初始值完成了初始化 xff0c type和shape都固定 xff0c 除非使用a
TensorFlow-Slim API 官方教程

https blog csdn net u014061630 article details 80632736 TF Slim 模块是 TensorFlow 中最好用的 API 之一尤其是里面引入的 arg scope model var
Tensorflow笔记4：Saver

Saver类位于tf train中 xff0c 属于训练过程中要用到的方法 xff0c 主要作用就是保存和加载save amp restore ckpt 最简单的保存应用举例 xff1a saver span class token pun
Tensorflow笔记4：学习率衰减策略tf.train.cosine_decay_restarts

TF在learning rate decay py中提供了几种非常骚气的学习率下降方法 xff0c 今天就来玩一玩只需要简单的参数设定 xff0c 就能够产生神奇的lr衰减效果首先简介lr的一般使用方法 xff1a lr span cl
ffmpeg使用笔记

视频压缩 ffmpeg i lt input gt vcodec libx264 crf 25 lt output gt 分辨率调整 ffmpeg i 123 mp4 s 960x540 1 mp4 视频截取截取 xff08 t1 43
Pytorch 入门

1 加载模型 seg model 61 torchvision models detection maskrcnn resnet50 fpn pretrained 61 True seg model 61 seg model cuda 1
小白之通俗易懂的贝叶斯定理

原文链接 xff1a https zhuanlan zhihu com p 37768413 概率论与数理统计 xff0c 在生活中实在是太有用了 xff0c 但由于大学课堂理解不够深入 xff0c 不能很好地将这些理论具象化并应用到实际生
tf.variable_scope中的reuse

一两种scope xff1a variable与name tf variable scope 是对变量进行命名管理 xff0c 而tf name scope 是对算子 op 进行命名管理 xff0c 二者相互不影响见下例 xff1a i
HTML+CSS 简易搜索框

搜索框是页面中很常见的一种 xff0c 下面分享一段简单搜索框案例 xff0c 直接上代码 HTML部分 lt DOCTYPE html gt lt html gt lt head gt lt meta charset 61 34 UTF
frp内网穿刺/反向代理教程

文章目录前言一明确基本概念二 frp下载与使用1 云服务器做为Server端2 GPU服务器做为Client端3 远程访问三云服务器防火墙端口开启前言 frp 是一个高性能的反向代理应用 xff0c 可以帮助开发者轻松地进行内网穿
Keras模型基本流程

文章目录前言一 Keras流程二 Keras中的模型定义1 基于Sequential 类2 基于函数式API 前言目前打算看tensorflow probability模块 xff0c 但是发现整个都是适配Keras的 xff0c 很多
pytorch自动混合精度训练

from torch cuda amp import autocast GradScaler Init Step 1 Create Model model device start epoch 61 create model opt if
Linux系统查看CPU个数&超线程&线程数

小命令 xff1a Linux查看CPU详细信息简书 jianshu com Intel CPU产品规范 xff1a 英特尔产品 xff1a 处理器 xff0c 英特尔 NUC 迷你电脑 xff0c 内存和存储 xff0c 芯片组 in
Tensorflow学习笔记（1）——Tensorflow-CPU版安装躺坑实录

从今天开始就要出品自己的Tensorflow系列啦 xff01 由于是第一篇关于Python的博文 xff0c 所以先把接触Python以来的感想和心得都放了进来 xff0c 想看Tensorflow的博友请直接跳到标题三一 Python
Tensorflow学习笔记（3）——图、会话基本语法

前言 xff1a Tensorflow xff0c 与我们之前熟悉的C C 43 43 Python的确不太一样 xff0c 建议初学者当作一门新的语言来学如果看的过程中忽然有一种的确不太一样的感觉 xff0c 并且明白了哪里不一样
Tensorflow学习笔记（2）——Tensorflow-GPU版安装总结

经历了N多次的失败 xff0c TF GPU的环境终于搭建好了 xff0c 全程连着弄了三天现在把安装中的注意事项总结一下 xff0c 希望大家少走弯路 xff01 先把自己的配置列表说一下 xff1a Windows7 x64 VS20
深度学习基础——彻底掌握卷积层的计算

机器学习也是刚刚入门 xff0c 虽然对卷积池化等过程很熟悉 xff0c 但是一直不太清楚具体的计算 xff0c 幸好在博文上看到了讲解过程 xff0c 看完以后受益匪浅 xff0c 然后自己又重新写了一遍有这个表格 xff0c 再也不
Mask R-CNN 简介与论文笔记

本篇文章是面向Mask R CNN的初学者 xff0c 旨在梳理大体思路 xff0c 认识框架基础概念由于自己现在大四 xff0c 也是刚刚入足深度学习领域 xff0c 所以文章中免不了有错误之处 xff0c 欢迎各位博友批评指正本博文
Detect-and-Track论文：3D Mask R-CNN Caffe2源代码解析——1.模型构建梳理

这篇博文的内容是对Detect and Track的源代码进行解析 xff0c 由于是第一篇 xff0c 所以展示的是代码的脉络 xff0c 以及如何寻找到3D Mask R CNN的构建过程博文的目录是按照文件来的 xff1a 参考内容
INRIA数据集

INRIA数据集 HOG 43 SVM是经典的行人检测方法 xff0c 论文作者同时搞了一个INRIA数据集 INRIA数据集官方页面 xff1a http pascal inrialpes fr data human xff0c 不过说真

INRIA数据集

INRIA数据集

INRIA数据集 的相关文章

随机推荐

热门标签

INRIA数据集的相关文章