深度学习——制作自己的VOC图像分割数据集

2023-11-18

1、数据集介绍
COCO数据集有80个类别，VOC数据集有20个类别。当这些数据集类别中没有自己需要的时候，就需要自己动手做自己的数据集了。

我自己在做数据集的时候主要使用到了labelme和labelImg两个工具。labelme主要是制作语义分割数据集(ImageSets,JPEGImages,SegmentationClass,SegmentationObject几个文件夹)，labelImg主要是制作目标检测数据集(主要是Annoations中的xml文件)，最后把两个合在一起就可以使用maskR-CNN来训练了。文件结构如下图所示：
在这里插入图片描述
2、安装labelme

参考：Windows下使用labelme标注图像
在这里插入图片描述

3、开始数据集制作
点击OpenDir打开要制作数据集图片的文件夹。点击CreatePolygons标记图片就可以了，最后每张图片标记好之后，别忘记点击save保存。此时的会保存问json格式的文件，如图所示：
在这里插入图片描述
接下来就要转换这些json格式为轮廓图片。
将图片和json文件放在同一个文件夹，命名为data_annotated

在data_annotated文件的目录下启动cmd,命令conda activate labelme切换至labelme环境下。

编辑labelme2voc.py文件

#!/usr/bin/env python

from __future__ import print_function

import argparse
import glob
import os
import os.path as osp
import sys

import imgviz
import numpy as np

import labelme


def main():
    parser = argparse.ArgumentParser(
        formatter_class=argparse.ArgumentDefaultsHelpFormatter
    )
    parser.add_argument("input_dir", help="input annotated directory")
    parser.add_argument("output_dir", help="output dataset directory")
    parser.add_argument("--labels", help="labels file", required=True)
    parser.add_argument(
        "--noviz", help="no visualization", action="store_true"
    )
    args = parser.parse_args()

    if osp.exists(args.output_dir):
        print("Output directory already exists:", args.output_dir)
        sys.exit(1)
    os.makedirs(args.output_dir)
    os.makedirs(osp.join(args.output_dir, "JPEGImages"))
    os.makedirs(osp.join(args.output_dir, "SegmentationClass"))
    os.makedirs(osp.join(args.output_dir, "SegmentationClassPNG"))
    if not args.noviz:
        os.makedirs(
            osp.join(args.output_dir, "SegmentationClassVisualization")
        )
    os.makedirs(osp.join(args.output_dir, "SegmentationObject"))
    os.makedirs(osp.join(args.output_dir, "SegmentationObjectPNG"))
    if not args.noviz:
        os.makedirs(
            osp.join(args.output_dir, "SegmentationObjectVisualization")
        )
    print("Creating dataset:", args.output_dir)

    class_names = []
    class_name_to_id = {}
    for i, line in enumerate(open(args.labels).readlines()):
        class_id = i - 1  # starts with -1
        class_name = line.strip()
        class_name_to_id[class_name] = class_id
        if class_id == -1:
            assert class_name == "__ignore__"
            continue
        elif class_id == 0:
            assert class_name == "_background_"
        class_names.append(class_name)
    class_names = tuple(class_names)
    print("class_names:", class_names)
    out_class_names_file = osp.join(args.output_dir, "class_names.txt")
    with open(out_class_names_file, "w") as f:
        f.writelines("\n".join(class_names))
    print("Saved class_names:", out_class_names_file)

    for filename in glob.glob(osp.join(args.input_dir, "*.json")):
        print("Generating dataset from:", filename)

        label_file = labelme.LabelFile(filename=filename)

        base = osp.splitext(osp.basename(filename))[0]
        out_img_file = osp.join(args.output_dir, "JPEGImages", base + ".jpg")
        out_cls_file = osp.join(
            args.output_dir, "SegmentationClass", base + ".npy"
        )
        out_clsp_file = osp.join(
            args.output_dir, "SegmentationClassPNG", base + ".png"
        )
        if not args.noviz:
            out_clsv_file = osp.join(
                args.output_dir,
                "SegmentationClassVisualization",
                base + ".jpg",
            )
        out_ins_file = osp.join(
            args.output_dir, "SegmentationObject", base + ".npy"
        )
        out_insp_file = osp.join(
            args.output_dir, "SegmentationObjectPNG", base + ".png"
        )
        if not args.noviz:
            out_insv_file = osp.join(
                args.output_dir,
                "SegmentationObjectVisualization",
                base + ".jpg",
            )

        img = labelme.utils.img_data_to_arr(label_file.imageData)
        imgviz.io.imsave(out_img_file, img)

        cls, ins = labelme.utils.shapes_to_label(
            img_shape=img.shape,
            shapes=label_file.shapes,
            label_name_to_value=class_name_to_id,
        )
        ins[cls == -1] = 0  # ignore it.

        # class label
        labelme.utils.lblsave(out_clsp_file, cls)
        np.save(out_cls_file, cls)
        if not args.noviz:
            clsv = imgviz.label2rgb(
                cls,
                imgviz.rgb2gray(img),
                label_names=class_names,
                font_size=15,
                loc="rb",
            )
            imgviz.io.imsave(out_clsv_file, clsv)

        # instance label
        labelme.utils.lblsave(out_insp_file, ins)
        np.save(out_ins_file, ins)
        if not args.noviz:
            instance_ids = np.unique(ins)
            instance_names = [str(i) for i in range(max(instance_ids) + 1)]
            insv = imgviz.label2rgb(
                ins,
                imgviz.rgb2gray(img),
                label_names=instance_names,
                font_size=15,
                loc="rb",
            )
            imgviz.io.imsave(out_insv_file, insv)


if __name__ == "__main__":
    main()

编辑labels.txt文件
内容是数据集的各个类别
在这里插入图片描述
运行指令：

python labelme2voc.py data_annotated data_dataset_voc --labels labels.txt

在这里插入图片描述
即生成如下文件夹

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习——制作自己的VOC图像分割数据集的相关文章

在 python 中 pickling 数据时出现内存错误

我正在尝试使用 python 中提供的 dump 命令将字典转储为 pickle 格式字典的文件大小约为 150 mb 但仅转储 115 mb 的文件时会出现异常例外情况是 Traceback most recent call last
解析lxml.etree._Element内容

我从以下元素中解析出 table td align center valign top a href ConfigGroups aspx cfgID 451161 amp prjID 11778 amp grpID DTST target
使用 scipy.signal.spectrogram 在 pyqtgraph 中绘制 wavfile 的频谱

我有一个用于音乐和语音分析的 PyQt 加 pyqtgraph 程序我想绘制 wav 文件的频谱使用 scipy python 包计算我可以在 matplotlib 中完成但由于 matplotlib 的性能我需要切换到 pyqt
扭曲的日志记录到屏幕（标准输出）不起作用

我有这个小程序取自这里 https twistedmatrix com documents 16 3 0 core howto logger html usage for emitting applications from twisted
Django 视图集没有属性“get_extra_actions”

我第一次使用 Django 我正在尝试构建一个 API 我正在遵循一些教程和示例它工作正常但在安装所有要求和项目后我现在正在 Raspberry Pi 中运行该项目失败并出现以下错误 Performing system checks
如何将魔杖图像对象转换为 numpy 数组（不使用 OpenCV）？

我正在使用将 pdf 文件转换为图像Wand http docs wand py org en 0 4 4 然后我使用 ndimage 进行进一步的图像处理我想直接将 Wand 图像转换为 ndarray 我已经看到答案here htt
python解释器自动重启而不返回答案

调用递归函数时 python解释器会自动重新启动吗我正在编写一个快速排序算法并尝试对一个大的数字数组顺序 10 4 进行排序但是当我尝试对整个数组进行排序时 python 正在重新启动即给我重新启动并且存储在内存中的所有值函
无法启动 Windows 快捷方式

我正在尝试使用 python 启动 Windows 我已经尝试了 os system subprocess call os startfile 等多种方法但总是收到错误消息指出路径不存在我知道路径是正确的因为我尝试在 CMD EXE
Python Twisted 与 Cmd 模块集成

我喜欢Python的Twisted http twistedmatrix com and Cmd http docs python org library cmd html 我想一起使用它们我已经完成了一些工作但到目前为止我还没有弄清楚
增加 sigmoid 预测输出值？

我创建了一个用于文本分类的 Conv1D 模型当在最后一个密集处使用 softmax sigmoid 时它产生的结果为 softmax gt 0 98502016 0 0149798 sigmoid gt 0 03902826 0 00
张量流 - 向量中的前 k 个值到二进制向量

假设我有一个带有值的向量 0 4 1 2 8 7 0 2 如何获得前 k 个值的二进制向量 k 3 0 1 0 0 1 1 0 0 in 张量流 TensorFlow 的tf math top k https www tensorflow
如何通过不规则索引获取子张量？

我想通过不规则索引获得子张量这是我的问题 Input tensor 2x8x10x1 Batch x Height x Width x Channel index Height 0 1 4 5 index Width 0 1 4 5 8
setUp() 中的 if 条件忽略测试

在unittest python库中存在函数setUp and tearDown用于设置变量和其他测试前后的事情如何运行或忽略 setUp 中条件的测试您可以致电if cond self skipTest reason in setU
在Python中将数组的元素从科学记数法转换为十进制记数法

我有一个 numpy 数组其元素采用科学格式我想将它们转换为十进制格式我的 numpy 数组如下所示 array 93495052 96955582 98555123 06146193 array 1 00097681e 09 9 9
Spyder 内联绘图

设置 Anaconda 2 0 0 Win 64 Spyder Anaconda 附带的 2 3 0rc 我配置图形工具 gt 首选项 gt iPython 控制台 gt 图形 gt 图形后端 gt 内联但无论我做什么图形总是在单独的
在未运行 python 中的函数的情况下检查了非本地语句[重复]

这个问题在这里已经有答案了以前我认为当我们定义一个函数时该函数可能是错误的但python在执行之前不会检查它 x 100 def f x 1 0 return x print x gt gt gt 100 然而当我学习的时候nonl
Django Rest框架Json解析

我想解析传入的POSTdjangoviews py 文件中的数据发布数据 number 17386372 data banana apple grapes 这是我尝试读取上述传入数据的方法request views py class Fr
带有远程解释器的 Python 控制台无法在 PyCharm 中接受输入

我是使用 PyCharm 进行远程开发的新手我设置了一个远程环境除了一个例外之外它工作正常无法在控制台中接受用户输入在控制台中运行以下语句时控制台被阻塞提示上一个命令仍在运行请等待或按控制台中的 Control C 来中断
使用 Pandas 来“applymap”来访问索引/列？

解决以下 pandas 问题的最有效方法是什么这是一个简化的示例其中包含数据框中的一些数据 import pandas as pd import numpy as np df pd DataFrame np random randint
评估 df 每行中的日期时间函数是否落在另一个 df 中的日期时间范围内

我是 python 新手需要一些帮助来解决有关日期时间函数的问题 I have df a其中有一列标题为time 我正在尝试创建一个新专栏id在这个df a 我想要id根据时间是否包含在某个时间范围内来确定的列df b date 和 da

随机推荐

【H5】 svg动画旋转属性与虚线属性

svg 动画旋转 transform rotate angle x y 不要写在style里面 angle 旋转角度 x y旋转中心绘制虚线 stroke dasharray a b a b c d 旋转属性 transform rot
立陶宛央行抢跑数字货币背后：前瞻的区块链战略中国已有企业布局

7月2日据路透社报道立陶宛将在下周开始预售2 4万枚由央行发行的数字货币该名为LBCoin的数字货币基于区块链技术生产立陶宛成为是欧盟国家中第一家正式发行央行数字货币的地区不是2015年就开始研究央行数字货币的英国不是今年2月试
人工智能芯片未来发展前景如何？

随着深度学习技术的快速发展以及互联网和云计算时代海量数据和高效计算能力的支撑计算机视觉技术语音技术自然语言理解技术等人工智能技术取得了突破性进展并解锁多个行业的人工智能场景产生了巨大的商业价值驱动了人工智能行业的发展同时伴
TEA系列加解密算法详解

文章目录 TEA系列概述 TEA算法介绍 TEA加密过程 C语言实现 XTEA算法介绍 XTEA加密过程 C语言实现 XTEA算法介绍 XXTEA加密过程 C语言实现参考 TEA系列概述 TEA算法是由剑桥大学计算机实验室的David W
python 序列化_python怎么序列化

pickle模块 json模块 1 把变量从内存中变成可存储或传输的过程称之为序列化 Python中叫pickling 其他语言中也被称为serialization marshalling flattening等都是相同的意思 2 序列
XSS安全漏洞的防范

XSS安全漏洞通过URL带入的这种带入主要是前端解析url中的参数并对数参数执行了innerHTML 或者 html 或者 append 操作在将参数html 或者append 到html文件中时会执行其中的js代码被错误用户获
HBase Split 过程

看了下hbase split的代码记录一下学习心得 Java代码 private void split final HRegion parent final byte midKey throws IOException final lon
chat gpt 常见角色及对应的提示词汇总

提示词的存在让ChatGPT能够扮演特定的角色对用户的回答更加专业对口以下是一些常见的ChatGPT角色及对应的提示词目录 ChatGPT 市场推广提示 ChatGPT 业务提示 ChatGPT 内容提示 Web 开发的 ChatGP
Ubuntu系统中防火墙的使用和开放端口

Ubuntu系统中防火墙的使用和开放端口目录 1 Ubuntu查看防火墙的状态 2 2 Ubuntu开启防火墙 2 3 Ubuntu添加开放SSH端口 3 4 Ubuntu防火墙常用命令 5 4 1 查看ufw防火墙的状态 5 4 2 启
ARM汇编之APCS规则

APCS规则简述寄存器使用规则寄存器r0 r3用于函数调用过程中传递函数形参各有一个别名 a1 a4 使用前后可以不用恢复原来的值 R4 r11用于保存函数内部局部变量的值每个函数使用前必须要保存被调用函数的值使用完毕必须恢复
在Linux远程服务器上搭建JavaWeb开发环境

配置远程linux服务器版本为CentOS7 6 使用的是阿里云服务器目录 1 安装JDK 1 1 查看yum源中JDK版本 1 2 使用yum安装JDK1 8 1 3 查看是否安装成功 2 安装MySQL 2 1 查看是否已安装mys
C++ 循环

有时候程序需要多次执行同一块代码一般情况下语句是顺序执行的函数中的第一个语句先执行接着是第二个语句依此类推循环语句允许多次执行一个语句或语句组大多数编程语言中循环语句的一般形式循环类型 C 编程语言提供了以下几种循环类型
Anaconda环境的创建、激活、删除和管理

1 Anaconda环境的创建 conda create n 环境的名字自定义 python 3 7 其中环境的名字自定义表示创建环境的名字可以自定义建议为英文后面python 3 7表示创建的解释器的版本 conda crea
这里有141个创业公司的死亡案例，看鸡汤不如听教训

今天我们打算跟大家聊聊失败关于成功的方法论有着趋同性多半与天时地利人和有关而关于失败却很少有人愿意公开谈起也许因为野兽总是不想将伤口暴露在外探讨失败的意义可能远远大于成功因为面对挫折即使自认为最无畏的人也会有这样的时刻
PicGo安装与配置-Gitee图床

PicGo安装与配置 Gitee图床文章目录 PicGo安装与配置 Gitee图床 1 前言 2 下载 3 安装 4 Gitee 5 Node js 6 配置PicGo 6 1 PicGo界面配置 6 2 npm安装PicGo插件Gite
空格的正则表达式

在正则表达式想使用空格的时候不能采用 s的方法因为 s指的是空白就是所有空白如果想表示单纯的空格的话可以采用方括号本身就是匹配其中的字符那么其中放空格就是匹配空格如果有其他正则表达式问题可以查看 https blog csdn
GCP reliable google cloud infrastructure, devops lab

最后更新2022 03 13 先到menu source repository里建立repository 还是不很好找 source repository在CI CD分类里面点右上角的add repository按钮输名字devops
uniapp集成unipush2.0

unipush3 0集成 unipush推出2 0服务之前一直用的1 0 现在项目推荐使用2 0 最近也是对2 0这个推送做了测试下面就主要对华为这个来总结一下其余的厂商大同小异 1 push1 0和2 0对比个人理解 2 0比1
深入浅出 RPC - 深入篇

深入篇我们主要围绕 RPC 的功能目标和实现考量去展开一个基本的 RPC 框架应该提供什么功能满足什么要求以及如何去实现它 RPC 功能目标 RPC 的主要功能目标是让构建分布式计算应用更容易在提供强大的远程调用能力时不损失本地
深度学习——制作自己的VOC图像分割数据集

1 数据集介绍 COCO数据集有80个类别 VOC数据集有20个类别当这些数据集类别中没有自己需要的时候就需要自己动手做自己的数据集了我自己在做数据集的时候主要使用到了labelme和labelImg两个工具 labelme主要是制作

深度学习——制作自己的VOC图像分割数据集

深度学习——制作自己的VOC图像分割数据集 的相关文章

随机推荐

热门标签

深度学习——制作自己的VOC图像分割数据集的相关文章