【数据集】目标检测常用数据集

2023-11-07

        一个性能优良,极度完美的数据集,具有较小偏差的大数据集,对于计算机视觉领域算法的研究是很重要的,具体非常重要的作用!

         在目标检测中,知名的数据集一个接着一个的被发布,被公开,被广大研究者使用,本文是总结目标检测领域的权威数据集,既总结也供有需要的人使用。【后期会将数据集链接加上,方便下载】

下图显示了一些样本及其标注:

其中(a)PASCAL-VOC07,(b)ILSVRC,(c)MS-COCO,and(d)OpenImages。

权威的目标检测数据集主要包括:

        1、【Pascal VOC】ASCALVOCChallenges(VOC2007,VOC2012)

        在早期的计算机视觉社区,PASCALViSualObjectClasses(VOC)挑战赛(从2005年到2012)是最重要的竞赛之一。在PASCALVOC中是多任务的,包括图像分类,目标检测,语义分割和行为检测。

        VOC数据集是目标检测经常用的一个数据集,自2005年起每年举办一次比赛,最开始只有4类,到2007年扩充为20个类,共有两个常用的版本:2007和2012。学术界常用5k的train/val 2007和16k的train/val 2012作为训练集,test 2007作为测试集,用10k的train/val 2007+test 2007和16k的train/val 2012作为训练集,test2012作为测试集,分别汇报结果。

        2、【ILSVRC】

        ImageNetLargeScaleVisualRecognitionChallenge(ILSVRC)已经将一般的目标检测向前推进了一大步。ILSVRC从2010到2017年每年被组织比赛,其中就包含了用ImageNet图像进行检测。ILSVRC中包含了200类视觉目标,图像和目标实例的数量比VOC大两个数量级。例如,ILSVRC-14就包含了517K张图像和534k被标注的目标

        3、【MS-COCO】

        MS-COCO是目前最具有挑战性的目标检测,从2015年开始,每年都会举办基于MS-COCO数据集的竞赛,其包含的目标种类要少于ILSVRC,但其有更多的目标实例。例如,MS-COCO-17中包含了164k张图像和897K个被标注来自80个类别的目标。相比于VOC和ILSVRC,MS-COCO最大的进步,除了boundingbox的标注,还有单个实例分割的标注,帮助更准确的定位。另外,MS-COCO包含了更多小目标(其面积小于图像的1%)和更加密集的定位目标比VOC和ILSVRC。MS-COCO的这些特征让其目标分布更接近于真实的世界。MS-COCO已经在目标检测社区变为了实际的标杆。

        4、【Open Images】

        2018年,OpenImagesDetection(OID)竞赛紧随MS-COCO被引进。在OpenImages中有两个重要的任务:1)标准的目标检测;2)视觉关系检测,即检测具有特定关系的成对目标。对于目标检测任务,此数据集包含了1910k张图像,其中在600多个目标种类上有15440k个标注的boundingbox。

        Open Images是google推出的大型数据集。其中图像detection部分包含600个类别框。

id 英文名称 中文名称
1 Tortoise 乌龟
2 Container 集装箱
3 Magpie 喜鹊

...

... ...

        5、【DOTA】
        DOTA是遥感航空图像检测的常用数据集,包含2806张航空图像,尺寸大约为4kx4k,包含15个类别共计188282个实例,其中14个主类,small vehicle 和 large vehicle都是vehicle的子类。其标注方式为四点确定的任意形状和方向的四边形。航空图像区别于传统数据集,有其自己的特点,如:尺度变化性更大;密集的小物体检测;检测目标的不确定性。数据划分为1/6验证集,1/3测试集,1/2训练集。目前发布了训练集和验证集,图像尺寸从800x800到4000x4000不等。
        6、【ImageNet】

        ImageNet是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。ImageNet是美国斯坦福的计算机科学家,模拟人类的识别系统建立的。能够从图片识别物体。Imagenet数据集文档详细,有专门的团队维护,使用非常方便,在计算机视觉领域研究论文中应用非常广,几乎成为了目前深度学习图像领域算法性能检验的“标准”数据集。Imagenet数据集有1400多万幅图片,涵盖2万多个类别;其中有超过百万的图片有明确的类别标注和图像中物体位置的标注。
原文链接:https://blog.csdn.net/weixin_45074568/article/details/114951516

        除了一般的目标检测,在过去的20年也见证了在特定领域内检测应用的繁荣,例如行人检测,人脸识别,文本检测,交通信号检测和遥感目标检测。

(1)行人检测数据集

(2)人脸检测数据集

(3)文本检测数据集

(4)交通信号灯检测数据集

(5)遥感目标检测数据集

参考总结自:目标检测之公开图像数据集、                      https://blog.csdn.net/weixin_45074568/article/details/114951516

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【数据集】目标检测常用数据集 的相关文章

随机推荐

  • 【缓存】一种新的缓存 Caffeine Cach 介绍

    1 概述 转载 真正的缓存之王 Google Guava 只是弟弟 Guava Cache 他的优点是封装了get put操作 提供线程安全的缓存操作 提供过期策略 提供回收策略 缓存监控 当缓存的数据超过最大值时 使用LRU算法替换 这一
  • upload-labs通关秘籍和安装环境

    upload labs通关 一 什么是upload labs 二 漏洞 三 安装环境 四 小试牛刀 第一关 pass 01 客户端检测绕过 js检测 第二关 pass 02 content type 服务器端检测 MIME 类型 第三关 上
  • element-ui组件学习

    element ui组件的大致分类 element ui的组件大致分为以下几类 Basic Form Data Notice Navigation Other 组件分类的大致意思 basic组件类型 是一些关于页面布局 按钮和icon等相关
  • 后台数据转换成json数组字符串到前端方法

    1 将结果集ResultSet转化为List集合 对结果集转换成list集合 public List
  • window丢失msvcp90.dll怎么办

    今天在使用py2exe生成编译的时候出现了 No such file or directory msvcp90 dll 下面是解决的方法 1 首先把msvcp90 dll下载到本机 这个就要去网上自己找一下了 2 将下载好的 msvcp90
  • 界面组件Qt Widgets入门指南,让跨平台嵌入式界面开发更简单!

    Qt 是目前最先进 最完整的跨平台C 开发工具 它不仅完全实现了一次编写 所有平台无差别运行 更提供了几乎所有开发过程中需要用到的工具 如今 Qt已被运用于超过70个行业 数千家企业 支持数百万设备及应用 点击获取Qt Widget组件下载
  • php编译问题Cannot find OpenSSL's evp.h

    在php redis的遇到 Cannot find OpenSSL s
  • 树的遍历方式

    树的三种遍历 一棵树的三种遍历方式 先序遍历 中序遍历 后序遍历 前中后三种顺序其实指的是根的顺序 具体看后文 先序遍历 访问顺序 1 根节点 2 左子树 3 右子树 这里根节点是最优先级 因为是先序 根节点放最前 1 中序遍历 访问顺序
  • CSRF 漏洞原理详解及防御方法

    跨站请求伪造 攻击者可以劫持其他用户进行的一些请求 利用用户身份进行恶意操作 例如 请求http x com del php id 1 是一个删除ID为1的账号 但是只有管理员才可以操作 如果攻击者把这个页面嵌套到其他网站中 img src
  • 各种操作系统支持的磁盘格式对比

    各种操作系统支持的磁盘格式对比 操作系统 支持的磁盘格式 Windows FAT32 exFAT NTFS macOS HFS APFS Linux EXT2 EXT3 EXT4 XFS Btrfs BSD UFS Solaris ZFS
  • MacOS搭建Flutter 环境

    流程 第一步 官网下载对应版本的flutter SDK MacOS有两个版本 x64和 arm64 查看命令 uname a 官网链接 Flutter SDK archive Flutter 下载成功后会自动解压 把Flutter文件放到自
  • 【4】Docker容器相关命令

    1 查看 容器 1 查看正在运行的容器 docker ps 2 查看所有容器 包括 运行中的容器 和 没有运行的容器 docker ps a a 是 all 缩写 3 查看最后一次运行的容器 docker ps l l 是 last 的缩写
  • easyexcel功能扩展:读取excel日期格式(包括日期格式和文本格式)

    实体类属性 ExcelProperty value 时间 index 11 private String time 调用DateUtil DateUtil setParams yyyy MM dd yyyy MM dd DateUtil f
  • 两台计算机如何组成局域网,教你两台电脑如何建立局域网,win10系统为例

    虽然我们可以通过第三方的工具来传输文件 但是如果我们的电脑无法上网怎么办 想要两台电脑建立局域网发送大文件怎么操作呢 今天就这个两台电脑建立局域网的方法给大家讲解一下 希望可以帮助到有需要的朋友们 两台电脑建立局域网步骤 1 点击网络图标
  • 2.1 zio入门——把函数作用作为工作蓝图

    ZIO标准库的核心数据类型是ZIO R E A 这种类型的值被称为函数式作用 函数式作用是并发工作流的一种蓝图 如图1所示 该蓝图本质上是纯描述性的 必须执行才能观察到任何副作用 例如与数据库的交互 日志记录 流传输 网络中的数据 或接受请
  • js MediaSource h264

    https stackoverflow com questions 24102075 mediasource error this sourcebuffer has been removed from the parent media so
  • Topaz DeNoise AI for Mac(AI智能图像降噪工具)

    Topaz DeNoise AI for Mac是最好用的AI智能图像降噪工具 DeNoise AI通过消除噪点的同时恢复原始图像细节 帮助您获得100 的最佳质量 Topaz DeNoise AI for Mac AI智能图像降噪工具
  • Python xml 读取之 ET.parse

    Python xml 读取之 ET parse 前一篇写到了xml 读取方法 一 dom minidom 本次再介绍一种方法 ET parse 常用操作 tree ET parse xml path root tree getroot 获取
  • 刷脸支付赋予日常场景更多的功能和应用

    刷脸支付推出将近一年 已广泛应用于餐饮零售等商业场景 据预测 2019年POS机总保有量约为5000万台 这也意味着刷脸支付至少有500亿的市场空间 不少连锁餐饮品牌相继引入刷脸支付收银机 除了可以提升收银效率 还可以通过打通线上线下 平台
  • 【数据集】目标检测常用数据集

    一个性能优良 极度完美的数据集 具有较小偏差的大数据集 对于计算机视觉领域算法的研究是很重要的 具体非常重要的作用 在目标检测中 知名的数据集一个接着一个的被发布 被公开 被广大研究者使用 本文是总结目标检测领域的权威数据集 既总结也供有需