目录
一 前言
二 数据平台
三 数据处理
1. MaixHub平台使用
2. ZIP格式整理与上传平台
3. 数据处理(使用平台删除标注)
四 参考
一 前言
对于图像数据集的获取,一直是一个麻烦点,自己不想去标注数据,太繁琐了,所以,我分享出一个可以筛选数据集的方法,也算个自己以后做个备忘,防止以后忘记咯
二 数据平台
两个平台,也是看其他人的博客获取到的
PASCAL
http://host.robots.ox.ac.uk/pascal/VOC/
COCO
https://cocodataset.org/#home
三 数据处理
我这里使用 PASVAL获取的数据集 作为一个参照,平台的话使用的是 MaixHub 在线训练平台
MaixHub
https://maixhub.com/
1. MaixHub平台使用
看图使用,注册好平台账号以后,直接点击开始训练模型
看图使用,点击新建训练,自己个自己的项目取个名字
看图,我们点击新建的项目之后,点击数据集的选项
看图,点击创建数据集,名字还是自己取一个
创建好了,点击查看,给我们的数据集添加数据
看图,先选择导入数据,然后点击选择压缩包
2. ZIP格式整理与上传平台
我们下载下来的格式如下,我们需要用到我框中的数据,然后新建一个文件夹,去存放数据,格式如下
整理好了格式就如下,我们添加压缩包然后再返回平台 ,选择我们的压缩包就行了,平台会主动识别和标注,最后上传就行。
3. 数据处理(使用平台删除标注)
这里有20个类别,保留我们需要的识别标注就行
这里我只留了 瓶子的标注数据
看图,我们可以直接到处这个100个瓶子标注数据
直接批量删除没有标记的图片
导出之后的目录,也就是100个数据
四 参考
深度学习常用的训练数据集介绍以及下载
https://blog.csdn.net/qq_27825451/article/details/89309175?ops_request_misc=&request_id=&biz_id=102&utm_term=%E4%BA%BA%E5%83%8F%E8%AF%86%E5%88%AB%E6%95%B0%E6%8D%AE%E9%9B%86&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-1-89309175.nonecase&spm=1018.2226.3001.4187
人脸检测和人体检测
https://blog.csdn.net/guyuealian/article/details/128821763
END