MS COCO数据集介绍

2023-11-10

本文直接从实用型角度介绍下coco数据集。

以coco2014为例,下载资源以后,得到以下目录:

annotations中存放的是一大堆json文件:

(注,带person和face的是我自己制作的json文件,截图时懒得删除,可以忽略,想了解如何制作的,请看我的下一篇博客)

train2014和val2014中保存的是jpg图片,就不放截图了,点开比较卡,图片太多了,加载比较慢。

接下来着重讲一下json中保存的东西,老规矩,先上图:

这是用来train的json中保存的东西,首先json保存的是一个大的字典:

info这个key指向的字典是一些基本信息,包括时间,版本,贡献者,网址链接等不重要,可以忽略。

images这个key指向的列表(注意是列表,上面info指向的是字典)是图片信息,列表中的每一个字典下存储一张图片的信息,license、coco_url、data_captured和flickr_url这几个key指向的信息大概了解下就行,在你已经下载到原图jpg文件的情况下,这些信息基本没用。接下来就是比较重要的几个信息了,首先是file_name,指向的是一个字符串,是jpg的文件名;其次是height和width指向的是该图片的高和宽,id指向的数字可能让大家比较迷惑,这个信息非常至关键,这一串数字是每张图片特有的一个标志,数字不重复,可以看作是图片的身份信息,就像身份证那一串数字一样。

(注:接下来的图是images这个字典下面的一个字典。所以继续上图,乖乖,找到这个结合部真不容易,这个json实在是太大了,哭哭)

下一个License这个key指向的信息也可以忽略不计,就是途中被我选中标黑的那个部分。

再下一个annotations这个key是本json中最最最最最重要的一个部分了。该key指向的是一个list,然后包含多个字典,每个字典包含一个物体分割的信息。看该列表中第一个字典,segmentation指向是的一个套着两个list的东西,里面一堆数字的含义是像素级分割得到的物体边缘坐标(有心的同学会发现这里面的数字个数都是偶数,因为坐标是成对出现的);area指向该segmentation的面积,iscrowd目前来看都指向0,表示没有重叠吧,有重叠指向1(我的理解是这样,可能有偏差,不过影响不大);image_id就是前面images中存储的id !读取json信息的时候会用到;bbox指向的就是物体的框;category_id指向的数字代表类别(这里说一下,有些博客说是有90类,但是从coco2014上来看,只是category_id标定到了90这个数字而已,但是实际类数只有80类,因为,1-90这数字中有一些是跳过的,即有些数字没有);id不同于images中的id,images中的id是每幅图片的身份编号,而此处的id是每个框的身份编号,注意区分。

最后一部分依然上图:

最后categories这个key指向的是每个类别的名称和编号。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

MS COCO数据集介绍 的相关文章

  • opencv学习--图像处理基础

    将图片处理为灰度图 import os import re import cv2 from PIL import Image import numpy as np import matplotlib pylab as pylab img c
  • css公共样式总结(持续总结)

    flex display flex align center align items center justify between justify content space between justify center justify c
  • java基础(一)-虚拟机和第一个命令

    虚拟机 用 Java 语言编写的程序由 Java 虚拟机 JVM 来执行 JVM 是一个特殊的程序 它知道如何执行用 Java 语言编写的程序 并且它的命令列表涵盖范围很大 比如 System out println 你以为我会说虚拟机是由
  • WebGL简介

    WebGL简介 前言 1 WebGL简介 1 1 WebGL概述 1 2 WebGL程序的结构 1 3 WebGL和OpenGL 2 着色器语言 2 1 顶点着色器 2 2 片元着色器 3 webGL绘制一个点 4 webGL渲染过程 前言
  • 模板类的特例化(具体化)

    模板的基础知识 模板的实例化 模板并不是真正的函数或类 它仅仅是编译器用来生成函数或类的一张 图纸 模板不会占用内存 最终生成的函数或者类才会占用内存 由模板生成函数或类的过程叫做模板的实例化 相应地 针对某个类型生成的特定版本的函数或类叫
  • 【Flask学习】2.1模板之渲染

    1 模板概念 观察之前的demo程序 1个视图函数的响应是诸如 h1 Hello everyone h1 的html文本 但是常规的视图函数一般经过业务逻辑处理 再生成响应返回给客户端 这两个过程叫做业务逻辑和表现逻辑 目前来看 demo中
  • 压力测试脚本,并发发送请求

    import base64 import os import urllib import numpy as np import requests time json threading random class Presstest obje
  • Java实现五子棋对战小游戏【完整版】

    个人简介 个人主页 陈橘又青 博客记录心情 代码编写人生 如果文章对你有用 麻烦关注点赞收藏走一波 感谢支持 欢迎订阅我的专栏 Java进阶之路 带你入门Java 从0到1 Java全栈编程 带你项目实战 掌握核心 前言 大家好 今天用sw
  • ios 设备的移动端页面 光标错位

    1 这个问题遇到好多次了 经常是上下错位 原因是在input 获取焦点以后 键盘弹出后 页面网上移动 但是光标停留在了以前的位置 如果页面不复杂 可以在body上添加 position fixed 但是这样会引起页面失去滚动能力 目前只能是
  • iOS开发实战-仿小红书App开发-1-App创建与Git

    1 新建项目 2 添加Git仓库 添加自己的gitHub账号 3 Token获取方式 Settings Developer Settings 获取个人Token 填写相关内容 得到Token后复制它 拿到Xcode中登录 填写相关信息 创建
  • Qt次线程向主程序发送信号收不到的问题

    问题的提出 Qt次线程向主程序发送信号收不到 信号槽connect返回也是true 排查原因如下 信号或槽函数中的参数用到了自定义类型 如果要在Qt信号槽中使用自定义类型 需要注意使用qRegisterMetaType对自定义类型进行注册
  • 【Python】用xpath爬取网页文字保存到txt中(含有文字解码代码)

    本文收录于 python学习笔记 专栏 这个专栏主要是我学习Python中遇到的问题 学习的新知识 或总结的一些知识点 我也是初学者 可能遇到的问题和大部分新人差不多 在这篇专栏里 我尽可能的分享出我学习的内容 专栏在持续更新中 hello
  • xctf php2

    好久没打CTF了 随便做一道练练手 知识点总结 phps可查看网页源代码 对于url编码服务器会自动解码一次 试着访问一下index php页面 回显正常 访问index phps可以查看页面源码 下面分析一下 参数id不能等于admin
  • JS逆向-常见反调试之“无限Debugger”,怎么解决?

    前言 本文是该专栏的第34篇 后面会持续分享python爬虫干货知识 记得关注 首先来说下反调试 一般将反调试理解为 影响正常调试的都属于反调试 其大致包括压缩混淆加密 无限debugger 控制台状态检测 蜜罐以及内存爆破 而无限debu
  • 智能合约之短地址攻击

    在了解以太坊智能合约短地址攻击之前 先要简单了解一下以太坊代币ERC 20 TOKEN 的一些基础知识 ERC EthereumRequest for Comment 即以太坊通用征求意见协议 开发者可以通过提交EIP Ethereum I
  • OpenMV(四)--STM32实现特征检测

    引 OpenMV 一 基础介绍与硬件架构OpenMV 二 IDE安装与固件下载OpenMV 三 实时获取摄像头图片 前言 本专栏基于以STM32H743为MCU的OpenMV H7基板 结合OV7725卷帘快门摄像头进行相关机器视觉应用的开
  • 页面整体变为灰色 -- CSS3 filter(滤镜) 属性

    需要将网页整体变为灰色基调 若是一个一个的去修改样式的工作量是很大的 此时使用 CSS3 filter 滤镜 属性可非常简便的实现整体页面变灰的需求 修改所有图片的颜色为黑白 100 灰度 img webkit filter graysca
  • Citavi下载及使用

    Citavi下载及使用 Citavi可用于研究过程中的每一个环节 用户可以在Citavi中搜索资源 分析内容 组织想法 撰写论文 下载及安装 百度搜索Citavi找到官网 进入官网后选择 下载 在下载页面点击 直接下载 下载完成后找到安装程
  • 两种图片引用的方式background-image和img的区别

    1 是否占位 background image是背景图片 是css的一个样式 不占位 img 是一个块状元素 它是一个图片 是html的一个标签 占位 2 是否可操作 1 background image是只能看的 只能设置如下属性 bac
  • 【MySQL基础4】DML详解

    目录 一 DML概述 二 DML添加数据语法 给指定字段添加数据 2 给全部字段添加数据 给表中所有字段都要插入数据 且数据要与字段名一致 3 批量添加数据 二 DML修改数据语法 三 DML删除数据语法 四 DML小结 作者一名平平无奇的

随机推荐

  • 学习笔记(02):go快速入门-iota用法

    立即学习 https edu csdn net course play 26897 344142 utm source blogtoedu
  • 【Python】ime series:时间序列

    time series 时间序列 目录 文章目录 toc 一 时间序列总览 二 日期和时间数据类型及工具 1 日期和时间数据类型 2 字符串和datetime的相互转换 三 时间序列基础 1 索引 选取 子集构造 2 带有重复索引的时间序列
  • Flutter your app isn't using androidx.

    报错 your app isn t using androidx 解决 在项目gradle properties文件里添加支持即可 在项目创建时会提示是否使用AndroidX 如果没有勾选就添加支持 android enableJetifi
  • FAT: utf8 is not a recommended IO charset for FAT filesystems, filesystem will be case sensitive!

    mount t vfat dev sda1 mnt FAT utf8 is not a recommended IO charset for FAT filesystems filesystem will be case sensitive
  • JAVA图书管理系统详细代码

    JAVA图书管理系统详细代码 图书管理系统 主函数 图书相关操作 operation包 操作接口 增加图书 借阅图书 删除书籍 显示书籍 退出系统 查找图书 归还书籍 图书及 书架 book包 图书 书架 使用人群 user包 user父类
  • Mac os安装SEAL

    cmake的选项可以参考 https github com microsoft SEAL optional debug and release modes 视频参考 https www youtube com watch v 7vJJMU2
  • Mqtt客户端多种配置可设

    基于QTmqtt客户端多种配置 效果图 主要功能 配置功能 网络检测 调试功能 发布主题 移植本客户端 前提条件 编译前的修改确认 编译 移植mqtt客户端到你的工程 源码方式 库的方式 接口说明 互动实例 最近项目上要用到mqtt 当然了
  • 常见元件、封装、尺寸、表面处理等

    参考 https www bilibili com read cv11024927 from search spm id from 333 337 0 0 参考 https www bilibili com read cv18413169
  • LLVM IR / LLVM指令集入门

    本文基于LLVM 12官方文档的LLVM Language Reference Manual 以学习笔记为主 所以本文会摘录一些常见 常用的指令 对于一些更加深层次的指令属性 特性 待我对LLVM有更深的理解再单独写文章记录 1 LLVM
  • wxWidgets编程指南

    这是关于wxWidgets的C 编程指南 wxWidgets是一个跨平台的GUI开发工具包或开发框架 当然它也可开发非GUI应用程序 学习完本指南 你就会使用wxWidgets编写一些小程序了 目录 目录 wxWidgets简介 wxWid
  • c语言窗口内鼠标位置,Gtk获取窗口内光标

    获取指针绝对坐标和窗口内的相对坐标 方法一 直接调用函数获得 int ax ay absolutely postition int wx wy The absolutely position of the left up corner of
  • React-路由懒加载

    路由的懒加载 将路由组件进行分包 可以提升首页的加载速度 提高用户的转化率 引入 import React lazy Suspense from react import BrowserRouter as Router NavLink Ro
  • dataframe中分行

    dataframe中对某一个cell进行分行 在工作中遇到类似下面的数据 index names 0 延 t诞 t蜒 1 奄 t掩 t淹 t俺 2 彦 t颜 t谚 3 央 t秧 t映 t殃 4 扬 t杨 t汤 t场 t肠 任务 需要对每个c
  • Sql语句整理(一)

    1 WHERE 子句用来筛选 FROM 子句中指定的操作所产生的行 2 GROUP BY 子句用来分组 WHERE 子句的输出 3 HAVING 子句用来从分组的结果中筛选行 对于可以在分组操作之前或之后应用的任何搜索条件 在 WHERE
  • 关于智慧城市的中对智慧的理解

    自2010年IBM提出智慧城市概念以来 国内许多单位 政府 企业 纷纷提出建设 智慧 XX 口号 到底什么才能成为智慧 相比智能 区别在哪 有一类人认为智慧城市是运用信息和通信技术手段感测 分析 整合城市运行核心系统的各项关键信息 从而对包
  • tf.truncated_normal的用法

    tf truncated normal shape mean stddev shape表示生成张量的维度 mean是均值 stddev是标准差 这个函数产生正太分布 均值和标准差自己设定 这是一个截断的产生正太分布的函数 就是说产生正太分布
  • [JavaSE]变量与类型

    来到新的篇章 最近开始从C语言的学习跳转到JAVA了 以后大概都是更新java的篇章 本文章我们讲述java中的变量与类型 目录 1 整型变量 2 长整型变量 3 双精度浮点型变量 4 单精度浮点型变量 5 字符类型变量 6 字节类型变量
  • Python多行注释/取消注释快捷键

    step1 选中需要注释注释的所有代码 step2 按快捷键 系统 快捷键 Mac command Windows Linux Ctrl 取消注释同理 选中所有代码按快捷键 如果选中的代码中有注释有无注释 则会全部当做无注释加上注释
  • 必须要学的SQL Server 的常用语句(满满的干货),拿走不谢~~~

    文章目录 前言 一 基本常用语句 二 连接和分组 三 进阶级语句 函数 1 CASE WHEN 2 DATEDIFF 3 select嵌套 4 CAST 转换类型 5 GETDATE 函数 6 DISTINCT 总结 前言 前几天做项目的时
  • MS COCO数据集介绍

    本文直接从实用型角度介绍下coco数据集 以coco2014为例 下载资源以后 得到以下目录 annotations中存放的是一大堆json文件 注 带person和face的是我自己制作的json文件 截图时懒得删除 可以忽略 想了解如何