Dataset - DeepFashion 服装数据集

2023-11-04

Dataset - DeepFashion 服装数据集

[Dataset - DeepFashion]

[Project - DeepFashion]

对于数据集有学习科研等需求的,请在 AIUAI-Dataset - DeepFashion 服装数据集 中联系.

1. 服装类别和属性预测集

[Category - Attribute 下载]

[百度网盘]

这里写图片描述

  • 289,222 张服装图片 clothes images;
  • 50 个服装类别 clothing categories
  • 1,000 个服装属性 clothing attributes;
  • 每张图片都标注了 bounding box 和服装类型 clothing type.

1.1 数据文件说明

下载文件包括:

  • Img - 服装图片文件夹

    共 289,222 张图片,JPG 格式.

    图片的最长边 resize 到 300,保持原始图片的长宽比 aspect ratios.

  • list_bbox.txt - 服装 bbox 标注

    bbox 标注: [x1, y1, x2, y2],[x1, y1] 左上角位置,[x2, y2] 右下角坐标.

  • list_category_cloth.txt - 服装类别 Category (50 类)

    分为上身服装、下身服装、全身服装三类,其 ID 分别为 1,2,3.

    服装类别根据其顺序依次表示.

    服装类别Category预测问题可以看做是 1-of-K 分类问题.

  • list_category_img.txt - 服装类别 Category 标注

  • list_attr_cloth.txt - 服装属性 Attribute (1000 种)

    服装属性Attribute类型包括五类:纹理-Texture,面料-Fabric,形状-Shape,部分-Part 和风格-Style,其 ID 分别为 1,2,3,4,5.

  • list_attr_img.txt - 服装属性 Attribute 标注

    服装属性标注信息,是 1000 维的向量,每维分别表示是否存在某服装属性Attribute,1 表示存在,-1 表示不存在,0 表示未知Unknown.

    服装属性Attribute预测问题可以看做是多标签标注 Multi-label Tagging问题.

  • list_eval_partition.txt - 服装图片数据集的划分

    train - 训练图片集;val - 验证Validation图片集;test - 测试图片集.

1.1 服装类别Category

50
category_name category_type
Anorak 1 带风帽的厚茄克;防水布;滑雪衫
Blazer 1 运动夹克,运动上衣
Blouse 1 短上衣;女衬衫;宽松的上衣;工装
Bomber 1 Bomber Jacket 飞行员夹克
Button-Down 1 (衬衫)领尖有纽扣的,纽扣领的
Cardigan 1 开襟羊毛衫
Flannel 1 法兰绒衣服;法兰绒,绒布;毛巾;
Halter 1 吊带
Henley 1 亨利
Hoodie 1 连帽衫;带帽夹克;
Jacket 1 短上衣,夹克
Jersey 1 针织
Parka 1 风雪大衣;派克大衣
Peacoat 1 水手穿的厚呢短大衣
Poncho 1 斗篷
Sweater 1 毛衣,运动衫
Tank 1 tank top 背心装
Tee 1 T恤;短袖圆领运动衫(等于T-shirt)
Top 1 上衣
Turtleneck 1 高领绒衣;高翻领,圆翻领
Capris 2 女用紧身裤
Chinos 2 斜纹棉布裤
Culottes 2 女裙裤
Cutoffs 2 拼接款
Gauchos 2 南美牛仔
Jeans 2 牛仔裤;粗斜纹棉布裤
Jeggings 2 牛仔样式打底紧身裤;是jeans(牛仔裤)和leggings(打底紧身裤)两个词的合成词;
Jodhpurs 2 骑马裤,短马靴
Joggers 2 慢跑裤
Leggings 2 (女式)紧身裤
Sarong 2 马来群岛土人所穿的围裙,布裙
Shorts 2 短裤
Skirt 2 裙子;边缘;(连衣裙、外衣等的)下摆
Sweatpants 2 运动裤
Sweatshorts 2
Trunks 2 (男式)游泳裤
Caftan 3 有腰带的长袖衣服
Cape 3 披肩;斗篷
Coat 3 上衣,外套
Coverup 3
Dress 3 连衣裙
Jumpsuit 3 连衣裤,(尤指女式)连衣裤
Kaftan 3 土耳其式长衫
Kimono 3 (日本的)和服;和服式女晨衣
Nightdress 3 (妇女或孩子穿的)睡衣,睡袍
Onesie 3 连身衣
Robe 3 长袍;罩袍; 浴袍;睡袍
Romper 3 背心连裤子的衣服
Shirtdress 3 (上身像衬衫的)衬衣式连衣裙
Sundress 3 太阳裙,背心裙

实际上应该只有 46 类服装类别:

[ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 46, 47, 48]

每类服装有的图片数:

[160, 7495, 24557, 309, 330, 13311, 324, 17, 716, 4048, 10467, 748, 676, 97, 791, 13123, 15429, 36887, 10078, 146, 77, 527, 486, 1669, 49, 7076, 594, 45, 4416, 5013, 32, 19666, 14773, 3048, 1106, 386, 54, 2120, 17, 72158, 6153, 126, 2294, 70, 150, 7408]

可视化:

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

datas = open('list_category_img.txt').readlines()[2:]
print 'Num of DeepFashion Category Images: ', len(datas)

ann_labels = [eval(data.split(' ')[-1].strip()) for data in datas]
category_labels = np.unique(ann_labels)
print 'Num of DeepFashion Category: ', len(category_labels)

label_counts = [ann_labels.count(label_temp) for label_temp in category_labels]
print 'Num of DeepFashion Each Category Images: ', label_counts


plt.figure(figsize = (12,6))                                      
sns.barplot(category_labels, label_counts, alpha = 0.9)
plt.xticks(rotation = 'vertical')
plt.xlabel('Image Labels', fontsize =12)
plt.ylabel('Counts', fontsize = 12)
plt.show()

这里写图片描述

2. 服装关键点检测数据集

[Fashion Landmark 下载]

[百度网盘]

这里写图片描述

  • 123,016clothes images;
  • 每张服装图片标注了8个服装关键点 fashion landmarks,包括关键点位置location 和可见性visibility;
  • 每张图片也标注了 bounding box, 服装类型clothing typevariation type.

2.1 数据文件说明

下载文件包括:

  • Img - 服装图片文件夹

    共 123,016 张图片,JPG 格式.

    图片的最长边 resize 到 512,保持原始图片的长宽比 aspect ratios.

  • list_bbox.txt - 服装 bbox 标注

    bbox 标注: [x1, y1, x2, y2],[x1, y1] 左上角位置,[x2, y2] 右下角坐标.

  • list_landmarks.txt - 服装关键点标注

    每一行的标注内容格式:

    image name clothes type variation type [landmark visibility 1 landmark location x_1 landmark location y_1, … landmark visibility 8 landmark location x_8 landmark location y_8]

    服装类型有三类:上身服装、下身服装、全身服装,其 ID 分别为 1,2,3.

    上身服装共 6 个关键点,依次为:[“left collar”, “right collar”, “left sleeve”, “right sleeve”, “left hem”, “right hem”];

    下身服装共 4 个关键点,依次为:[“left waistline”, “right waistline”, “left hem”, “right hem”];

    全身服装共 8 个关键点,依次为:[“left collar”, “right collar”, “left sleeve”, “right sleeve”, “left waistline”, “right waistline”, “left hem”, “right hem”].

  • list_eval_partition.txt - 服装图片数据集的划分

    train - 训练图片集;val - 验证Validation图片集;test - 测试图片集

Related

[1] - DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations

[2] - Fashion Landmark Detection in the Wild

[3] - 论文阅读理解 - DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Dataset - DeepFashion 服装数据集 的相关文章

  • Deep Fashion衣服时尚数据集

    数据集简介 官方介绍 xff1a http mmlab ie cuhk edu hk projects DeepFashion html DeepFashion数据库 xff0c 这是一个大型服装数据库 xff0c 它有几个吸引人的特性 x
  • 按步长对遥感数据进行批量裁剪

    该代码支持多图像裁剪 先将tif格式的图片转为png 再对多个png图片进行批量裁剪 批量裁剪 import os import gdal makeData import numpy as np from osgeo import gdal
  • 深度学习之强调一下数据的重要性

    在深度学习模型的测试过程中 数据集的选择很重要 在构造数据集的时候 要注意做好数据的清洗和标注 一个高质量的数据集往往能够提高模型训练的质量和预测的准确率 在缺乏数据的情况下 可以尝试寻找一些公开数据集 特别是得到公认的被普遍使用的数据集
  • lsun数据集下载、转换、使用

    最近复现SAGAN用到了lsun数据集 1 下载地址 http dl yf io lsun scenes 我下载了church outdoor train lmdb zip 中间还安装了lmdb库 2 转换 一般下载的data py 转换代
  • 网络安全公开数据集

    DARPA入侵检测数据集 DARPA 1998数据集 收集了9周的 TCPDUMP网络连接和系统审计数据 7周的训练数据 2周的测试数据 包含了Probe DoS R2L U2R四大类攻击 DARPA 1999数据集 DARPA 1999覆
  • 目标识别数据集互相转换——xml、txt、json数据格式互转

    VOC数据格式与YOLO数据格式互转 1 VOC数据格式 VOC Visual Object Classes 是一个常用的计算机视觉数据集 它主要用于对象检测 分类和分割任务 VOC的标注格式 也被许多其他的数据集采用 因此理解这个数据格式
  • 声灭火器火灾数据集-Acoustic Extinguisher Fire Dataset

    Acoustic Extinguisher Fire Dataset The dataset was obtained as a result of the extinguishing tests of four different fue
  • 垃圾分类图片数据集分享-约10w张数据集

    1 获取方式 点赞本博客 评论区留邮箱 博主在会发送 私信博主 访问的人太多了 需要私信联系 截至到2021 03 30评论区所有邮箱已无偿发送 图片数据集直接留邮箱即可 2 问题描述 最近在做一个相关项目 从网上整理了许许多多的有关于垃圾
  • widerface的voc格式数据分享——百度网盘

    链接 https pan baidu com s 1V9E DspbNNNJaie2xwaS1A 提取码 zybp 复制这段内容后打开百度网盘手机App 操作更方便哦 来自百度网盘超级会员V2的分享
  • 2017 Uri Shalit & Fredrik D. Johansson:Jobs

    1986年 Lalonde公开的一个数据集 被因果推理社区作为了基准数据集 在该数据集中 干预 即Treatment 为是否接受就业培训 结果 Outcomes 是收入和就业状况 2005年 Smith Todd结合了国家对工作工程统计的观
  • 数据集【NO.10】天池布匹瑕疵检测

    写在前面 数据集对应应用场景 不同的应用场景有不同的检测难点以及对应改进方法 本系列整理汇总领域内的数据集 方便大家下载数据集 若无法下载可关注后私信领取 关注免费领取整理好的数据集资料 今天分享一个非常好的非常小众的研究方向 有应用创新
  • COCO数据集的使用笔记

    一 简介 官方网站 http cocodataset org 全称 Microsoft Common Objects in Context MS COCO 支持任务 Detection Keypoints Stuff Panoptic Ca
  • 【计算机视觉

    文章目录 一 CBC Complete Blood Count 二 CURE TSD CURE Traffic Sign Detection 三 DUO Detecting Underwater Objects 四 Duke Breast
  • 人工智能目标检测数据集:飞机(3)

    本数据集为飞机卫星图 包括J用 民用 以及通用飞机 图片数量1000张 图片尺寸为1024x1024 RGB彩图 仅包含一类目标 飞机 数据集已经打好标签 标签格式为常用的pascal voc格式 xml 可以直接用于目标检测模型的训练 Y
  • 16个车辆信息检测数据集收集汇总(简介及链接)

    16个车辆信息检测数据集收集汇总 简介及链接 目录 1 UA DETRAC 2 BDD100K 自动驾驶数据集 3 综合汽车 CompCars 数据集 4 Stanford Cars Dataset 5 OpenData V11 0 车辆重
  • Object365数据/论文说明

    总览 1 目标检测数据 365类 约600k训练图片 超过一千万的bboxes 迄今为止最大的目标检测数据集 全注释的 2 服务于更好的未来研究 局部敏感类型的任务 如目标检测 语义分割 3 在COCO测试下 Objects365上预训练的
  • 划分训练集、验证集和测试集代码

    输入需要划分的数据所在的文件夹 返回一个划分好的包含train val和test的文件夹 val ratio 和test ratio分别为验证集和测试集所占的比例 test ratio 0表示不划分测试集 import os import
  • 数据集笔记:杭州 & 上海 地铁客流数据

    数据集地址 PVCGN data at master liuwj2000 PVCGN github com 1 数据集介绍 从5 15到23 30的地铁乘客流量预测 使用前四个时间间隔 15分钟 x 4 60分钟 的地铁乘客流量 进 出流量
  • 个人整理的数据集(手写中文数据、发票数据、快递单数据、车牌数据)

    本人在工作生活中收集了各个方面比较多的真实的数据集如下 一 手写中文数据集 1 档案类数据 此数据集为手写档案数据 数量较大 大约128G 图像均未标注 ex 2 手写作文数据 此数据集为手写作文数据 是大约800M左右 图像按行提供位置和
  • 模型训练 -- 数据集的获取(如何筛选想要数据)

    目录 一 前言 二 数据平台 三 数据处理 1 MaixHub平台使用 2 ZIP格式整理与上传平台 3 数据处理 使用平台删除标注 四 参考 一 前言 对于图像数据集的获取 一直是一个麻烦点 自己不想去标注数据 太繁琐了 所以 我分享出一

随机推荐

  • Redis主从复制出现错误:master_link_status:down

    因为主机设置了密码 我的解决方案是切换到主机redis config中 注销密码 最后重新启动80端口 美滋滋又能的变成up了 root localhost redis 7 0 2 src redis server redis80 conf
  • lua判断字符不为空或空格_Lua - 空值判断的几种情况

    小宅按 在安全领域 lua编程语言因为其小巧在众多工具上都作为插件开发语言 常见的有openresty nmap等 因此笔者将会开辟一个Lua相关的系列文章 主要记录工作过程中一些领悟或者是一些踩过的坑 希望能够借此平台帮助到读者们 0x0
  • 上限、下限、上上限和下下限都是什么区别!

    http bbs gkong com archive aspx id 437896
  • QT5.9.8 update()源码剖析

    1 update调用 在QT中 所有的GUI最终都继承自QWidget 因此所的调用update 都是基类QWidget的update 在QWidget中 路径 Qt Qt5 9 8 5 9 8 Src qtbase src widgets
  • 蓝牙mesh组网-JDY-24M初步探索

    操作步骤如下 这款JDY 24M蓝牙功能强大 我主要应用其中mesh组网这个功能 mesh组网简单来说 就是组网的这几个蓝牙是可以互相通信 一一通信是通过蓝牙地址来确定的 一 配置组网 需要用到两根USB转TTL的线 JDY 24M蓝牙2个
  • LaTex目录管理

    LaTex生成章节 图片 表格目录 章节目录 在latex中 每个章节都由特定的关键字命令定义 如 section subsection subsubsection 等 利用这些关键字 我们可以生成文章的章节结构 并根据这些章节的结构和标题
  • 抖音爆火李峋同款爱心代码,简单附带教程,还有烟花代码,手残党也能学会!!

    最近看到抖音爆火的一些HTML代码 有人找 极客G 更新 今天用了几个小时给大家整理出来了下面几个代码 最简单的就是第一个爱心代码 第二个烟花代码可自定义文本 具体看下面 代码是HTML语言 前面是使用教程 只需要代码的请划到下方进行下载
  • Linux基础——运维 (operation)

    1 什么是运维 1 1 技术人员之间 会对运维有个开玩笑的认知 运维就是修电脑的 装网线的其实不然 运维是一个非常广泛的定义 1 2 基础运维 申请域名 购买 租用服务器 上架 调整网络设备的设置 部署操作系统和运行环境 部署代码 设计和部
  • 数学建模——Matlab中rem与mod区别

    求余函数和求模函数有相同的地方但又不完全一致 主要的区别在于对负整数进行除法运算的操作不同 对于整数a b来说 求余运算或求模运算的方法都是先求整数商c a b 再求余数或模r a c b 求余运算在取c的值时 向0方向取整 fix函数 而
  • 985的分数,却毅然选择了普本

    这两天看到一个问题 如果分数只是擦边进985211院校 那是保住985211的学历还是选普通本科大学自己喜欢的专业读 今天来聊一下我的看法 首先针对这个问题说一下我的看法 能够进入985 就不要选择211 能够进入211就不要选择普通一本
  • VirtualBox安装出现严重错误

    H3C是我们学习很好用的软件 H3C虚拟平台的运行需要VirtualBox虚拟机之上 简单来说 要想使用H3C就必须要正确安装VirtualBox 如果有的小伙伴在卸载VirtualBox的时候 卸载方式不得当 导致VirtualBox残余
  • JNI调用native方法出现 java.lang.UnsatisfiedLinkError: XXXclass.XXXmethod()异常的解决办法

    JNI调用native方法出现 java lang UnsatisfiedLinkError XXXclass XXXmethod 异常的解决办法 参考文章 1 JNI调用native方法出现 java lang UnsatisfiedLi
  • Servlet——文件上传

    文件上传 文章目录 文件上传 1 Form表单形式实现 1 1 前端 1 2 后端 1 3 实现文件的上传然后保存到本地 2 Js Ajax实现 1 Form表单形式实现 1 1 前端 更改表单提交方式 form enctype multi
  • 功能测试在软件开发周期中的作用是什么?

    功能测试是软件开发周期中不可或缺的一个环节 其作用在于保证软件交付给用户之后满足用户需求和预期 在本文中 我们将详细解析软件开发周期中功能测试的作用 首先 功能测试是软件开发周期中质量保证的重要环节 在开发阶段 开发人员会编写代码 并使用不
  • 技术岗/算法岗面试如何准备?5000字长文、6个角度以2023秋招经历分享面试经验

    技术岗 算法岗面试流程是什么样的 技术面都干什么 Coding 机试如何准备 技术面考察哪些知识 如何准备 项目八股如何准备 简历要注意什么 怎么做 大家好 我是卷了又没卷 薛定谔的卷的大厂算法工程师 陈城南 本文会从以上6个问题 全方位
  • jdbc处理时间问题

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 遇到的问题如下 数据库中对应的字段属性为TIMESTAMP 6 java中类属性对应的字段为java util Date 虽然数据库中保存的是 2014 05 12 10
  • 一文带你精通Burp(附下载)

    添加链接描述 一文带你精通Burp 附下载
  • spring @EventListener 事件与监听

    1 自定义Application Event public class MyEvent extends ApplicationEvent private static final long serialVersionUID 1L priva
  • 1206. 设计跳表

    1206 设计跳表 不使用任何库函数 设计一个 跳表 跳表 是在 O log n 时间内完成增加 删除 搜索操作的数据结构 跳表相比于树堆与红黑树 其功能与性能相当 并且跳表的代码长度相较下更短 其设计思想与链表相似 例如 一个跳表包含 3
  • Dataset - DeepFashion 服装数据集

    Dataset DeepFashion 服装数据集 Dataset DeepFashion Project DeepFashion 对于数据集有学习科研等需求的 请在 AIUAI Dataset DeepFashion 服装数据集 中联系