超经典!分割任务数据集介绍。

2023-11-06


前言

在探索网络的过程中,比较基础和重要的工作是了解数据,今天来总结下我目前使用过的分割任务数据集。本博文将详细介绍基础数据集 : IRSTD-1k(Infrared Small Target Detection,最大的真实红外弱小目标单帧检测数据集,支持二分类语义分割);
Pascal VOC2012(TPattern Analysis, Statical Modeling and Computational Learning 一个世界级的计算机视觉挑战赛数据集,支持多分类语义分割和多分类实例分割);
iSAID(A Large-scale Dataset for Instance Segmentation in Aerial Images,航空图像分割的第一个基准数据集)。


一、IRSTD-1k

IRSTD-1k 来源于论文 2022CVPR《ISNet: Shape Matters for Infrared Small Target Detection》,作者Mingjing Zhang,附上论文链接paper,数据链接dataset
红外弱小目标检测和分割数据集会呈现“弱”与“小”的特点,其中“弱”指的是目标信噪比低、与背景之间的对比度差、红外辐射强度弱;而“小”指的是目标像素少,检测时难以获得纹理信息。IRSTD-Ik数据集提供了1,000个具有各种目标形状、不同目标大小和丰富杂波背景的真实图像,该背景具有精确的像素级注释。该数据集分为两个文件夹,IRSTD1k_Img存放真实图像,IRSTD1k_Label存放标签mask。如图,

IMAGES-XDU9
MASK-XDU9
该数据集可用于深度学习图像分割任务,也可以研究基于滤波的检测算法,基于人类视觉系统的检测算法,基于图像数据结构的检测算法,基于深度学习目标检测算法等红外弱小目标检测算法。


二、Pascal VOC2012

1.数据简介

Pascal VOC2012数据集出自PASCAL VOC挑战赛 (The PASCAL Visual Object Classes )是一个世界级的计算机视觉挑战赛,PASCAL全称:Pattern Analysis, Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。PASCAL VOC挑战赛主要包括以下几类:图像分类(Object Classification),目标检测(Object Detection),目标分割(Object Segmentation),行为识别(Action Classification) 等。一个数据集可以完成4个任务。paperdatasetintroduction

  1. 图像分类与目标检测任务
    在这里插入图片描述

  2. 分割任务,注意,图像分割一般包括语义分割、实例分割和全景分割,实例分割是要把每个单独的目标用一种颜色表示(下图中间的图像),而语义分割只是把同一类别的所有目标用同一颜色表示(下图右侧的图片)。
    在这里插入图片描述

  3. 行为识别任务

  4. 人体布局检测任务
    在这里插入图片描述

2.分割任务数据集介绍

  • 数据集下载所得文件夹目录如下
VOCdevkit
    └── VOC2012
         ├── Annotations               所有的图像标注信息(XML文件)
         ├── ImageSets    
         │   ├── Action                人的行为动作图像信息
         │   ├── Layout                人的各个部位图像信息
         │   │
         │   ├── Main                  目标检测分类图像信息
         │   │     ├── train.txt       训练集(5717)
         │   │     ├── val.txt         验证集(5823)
         │   │     └── trainval.txt    训练集+验证集(11540)
         │   │
         │   └── Segmentation          目标分割图像信息
         │         ├── train.txt       训练集(1464)
         │         ├── val.txt         验证集(1449)
         │         └── trainval.txt    训练集+验证集(2913)
         │ 
         ├── JPEGImages                所有图像文件
         ├── SegmentationClass         语义分割png图(基于类别)
         └── SegmentationObject        实例分割png图(基于目标)

  • 语义分割任务
    首先在Segmentarion文件中,读取对应的txt文件。比如使用train.txt中的数据进行训练,那么读取该txt文件,解析每一行,每一行对应一个图像的索引。用到Segmentation和SegmentationClass文件夹。
    注意,在语义分割中各类别对应颜色不同,例如人对应的目标索引是15,所以目标区域的像素值用(192,128,128)填充。共有21类。边界不算类别。

在这里插入图片描述

  • 实例分割任务
    用到Segmentation和SegmentationObject 文件夹。
    实例分割的标签顺序与检测标签一一对应,具体颜色变化为:

在这里插入图片描述

  • 备注:此处内容一部分为转载,更多详情请戳原文链接:https://blog.csdn.net/qq_37541097/article/details/115787033

三、iSAID

iSAID数据集与著名的遥感旋转框目标检测数据集同由武汉大学夏桂松团队维护,官网地址:iSAID。iSAID包含15类,共655,451个目标实例,图像数量达到2,806张,单张图像中实例数量最高可达8,000个,平均为239个,是遥感领域第一个大型实例分割数据集。

iSAID使用DOTA数据集中的图片进行像素级标注,改正了DOTA数据集中存在标注错误,相比于DOTA中188,282个目标实例,iSAID所提供的样本量和标注精细程度大大增加,数据集中的目标类别包括:plane, ship, storage tank, baseball diamond, tennis court, basketball court, ground track field, harbor, bridge, large vehicle, small vehicle, helicopter, roundabount, swimming pool, soccer ball field,基本涵盖了城市遥感解译的关键目标。所标注图片的1/2被作为训练集,1/6用于验证集,1/3用于测试集,其中训练和验证集同时放出图片和gt标注,测试集只有图片可以下载。官方已设置测评服务器,可用于在线评测算法在测试集上的性能。

iSAID充分体现了遥感图像中常见的特征和尺度分布差异。作者规定10到144像素为小目标,144到1024像素为中目标,1024及以上像素为大目标,这三类尺寸的目标占比为52.0:33.7:9.7。数据集中最大和最小的物体面积差异可以达到20,000倍。此外,数据集中还存在大量极端长宽比的物体,最大可达90,平均为2.4。
在这里插入图片描述
该数据集格式较为简单,就不仔细展开了。

  • 备注:此处内容一部分为转载,更多详情请戳原文链接:https://zhuanlan.zhihu.com/p/461021557

总结

总之对数据集的了解是十分有必要的,如有问题请留言。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

超经典!分割任务数据集介绍。 的相关文章

随机推荐

  • React18的useEffect会执行两次

    React18的useEffect会执行两次 一 执行两次的useEffect 二 React18 useEffect 新特性 如何应对 1 首先先了解一下 React 中 useEffect 执行的时机 2 怎么样才能让 Effect 执
  • 0101日志-运维-mysql

    1 错误日志 错误日志 Error Log 错误日志记录了MySQL引擎在运行过程中出现的错误和异常情况 这些错误可能包括启动和关闭问题 数据库崩溃 权限问题等 错误日志对于排查和解决MySQL引擎问题非常有帮助 改日志默认开启 默认存放目
  • 知识科普:什么是AGI?

    原文链接 最近ChatGPT大火 火到原来卖酒卖保险的人也都开始直播聊ChatGPT了 其中大家或多或少会提到一个词 AGI 看清楚不是GAI也不是AIGC 今天就和大家聊聊AGI是什么 AGI最近经常被提到 主要是因为ChatGPT的开发
  • 网络编程——TCP

    网络编程 TCP TCP编程 TCP是一种可靠的 基于连接的网络协议 它是面向字节流的 即从一个进程到另一个进程的二进制序列 一条TCP连接需要两个端点 这两个端点需要分别建立各自的套接字 通常一方用于发送请求和数据 称为客户端 另一方用于
  • Pickle 详解

    那么为什么需要序列化和反序列化这一操作呢 1 便于存储 序列化过程将文本信息转变为二进制数据流 这样就信息就容易存储在硬盘之中 当需要读取文件的时候 从硬盘中读取数据 然后再将其反序列化便可以得到原始的数据 在Python程序运行中得到了一
  • STM32开发(十九)STM32F103 数据手册 —— 低功耗模式解析

    上一篇 主目录 下一篇 文章目录 低功耗介绍 stm32 供电框图 低功耗模式 睡眠模式 停止模式 待机模式 低功耗模式汇总 低功耗介绍 系统复位或上电复位后 微控制器进入运行模式 在运行模式下 CPU通过HCLK提供时钟 并执行程序代码
  • Apollo学习笔记(21)图的深度优先遍历(DFS)和广度优先遍历(BFS)算法分析

    首先奉上大神链接 https www cnblogs com qzhc p 10291430 html 由于最近在看轨迹规划的资料 图遍历是基础 故拜读了大神的一些文章 在此记录 深度优先遍历 深度优先遍历 Depth First Sear
  • Vim常用操作快捷键记录

    经常忘记vim的一些操作快捷键 现在将其记录起来 方便以后查阅 这里定义以文本右方向为前 文本左方向为后 上下左右方向键 k j h l 以 字 为步长向前跳动 到达字首 w 以 字 为步长向后跳动 到达字首 b 以 字 为步长向前跳动 到
  • 共享计算机的网络凭证,win10设置共享文件夹时显示要网络凭证

    一 共享文件夹所在电脑设置 1 右键我的电脑 管理 系统工具 本地用户和组 用户 中间空白区域右键 新用户 2 输入自设的用户名和密码 如图勾选 创建 3 右键需要共享的文件见 安全 编辑 4 点击添加 5 输入新建的用户名 test 检查
  • 失业的程序员(九):正文篇:创业就是一场戏

    http www shenyisyn org 2013 04 23 tjp 2 htm 一 正文 跨入电商 说到我家人 我父母都是小学教师 对我从小管教无比严厉 他们希望我将来也能子承父业或者母业 并且更希望将来我的子女也能如此继承着 用句
  • 【1002】写出这个数

    题目链接 写出这个数 算法 include
  • 【数据集处理】WiderPerson介绍以及转YOLO格式(图片教程及代码----超详细)

    WiderPerson转YOLO格式 WiderPerson介绍 原论文中数据信息 下载后的文件样式 Annotations WiderPerson转YOLO 数据集下载地址 转格式以及选取类别 关于txt文件的处理 直接运行 生成yolo
  • 【网络安全】黑客自学笔记

    1 前言 作为一个合格的网络安全工程师 应该做到攻守兼备 毕竟知己知彼 才能百战百胜 计算机各领域的知识水平决定你渗透水平的上限 1 比如 你编程水平高 那你在代码审计的时候就会比别人强 写出的漏洞利用工具就会比别人的好用 2 比如 你数据
  • Feign远程调用注意事项

    Feign 远程查询失败 不需要回滚 CPU密集型和 IO密集型 CPU涉及的是计算能力 IO是文件读取类型的这种
  • 共识算法 --- PBFT、Raft和Paxos

    目录 一 Raft共识算法 1 什么是Raft 2 Raft的工作流程 3 Raft的相关应用 4 Raft的缺陷 5 Raft中三个子问题 5 1 Leader选举 Election 5 1 1 节点的三种角色 5 1 2 选举过程 5
  • 字节是真的难进,测开4面终上岸,压抑5个月,终于可以放声呐喊

    这次字节的面试 给我的感触很深 意识到基础的重要性 一共经历了五轮面试 技术4面 HR面 下面看正文 本人自动专业毕业 压抑了五个多月 终于鼓起勇气 去字节面试 下面是我的面试过程 很多面试题 都是靠记忆写的 希望能帮助到大家 致那些努力的
  • http各个版本的区别

    http进化史 http0 9 只有GET请求 也不支持请求头信息 请求信息只有下面一行 GET www baidu com http1 0 在请求中指定版本号 支持GET POST HEAD http1 1 http1 1新增了 OPTI
  • 进制压缩加密_token参数

    进制压缩加密 token参数 网址 https sh meituan com meishi c17 进入抓包 查看要获取的数据 可以在请求地址 找到 getPoiList 的请求链接 请求参数有多个 但是多次请求对比发现只有 token 参
  • LeetCode:118(Python)—— 杨辉三角(简单)

    杨辉三角 概述 给定一个非负整数 numRows 生成 杨辉三角 的前 numRows 行 在 杨辉三角 中 每个数是它左上方和右上方的数的和 输入 numRows 5 输出 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 输入
  • 超经典!分割任务数据集介绍。

    文章目录 前言 一 IRSTD 1k 二 Pascal VOC2012 1 数据简介 2 分割任务数据集介绍 三 iSAID 总结 前言 在探索网络的过程中 比较基础和重要的工作是了解数据 今天来总结下我目前使用过的分割任务数据集 本博文将