bdd100k数据标签格式转到VOC2007格式

2023-05-16

需要修改的部分：

1、BDD_FOLDER：修改成自己的bdd数据集root路径

2、如果训练的为 traffic light 类，且类别为[‘red’,‘green’,‘yellow’,‘none’]，这些属性属于
label[‘attributes’][“trafficLightColor”]，而不属于大类label[‘category’]
因此，如果要训练大类，例如训练’traffic light’类，而不是细分的[‘red’,‘green’,‘yellow’,‘none’]，则需修改.

59行把traffic light改为自己要训练的类
注释63行
解注释72行
注释73行
解注释77行
注释78行

3、训练细分类

59行把traffic light改为自己要训练的类
63行把trafficLightColor改成自己大类下面的细分属性

转换代码如下, 此处的代码的只把 traffic light 类转换, 不区别red, green, yellow等：

import os
import os.path as osp

import json
import shutil

from xml.etree.ElementTree import Element, SubElement
from xml.etree import ElementTree
from xml.dom import minidom
from PIL import Image
from tqdm import tqdm

DEBUG = False

# bdd100k数据的根目录
BDD_FOLDER = "/home/wsy/data/06_dataset_transform/01_trafficlight/bdd100k_kaggle"
# 保存转换后筛选出的VOC的图片目录
img_dir = "/home/wsy/data/06_dataset_transform/01_trafficlight/bdd100ktovoc2007/images"

if DEBUG:
    XML_PATH = "./xml"
else:
    # 保存转换后筛选出的VOC的标签目录
    XML_PATH = "/home/wsy/data/06_dataset_transform/01_trafficlight/bdd100ktovoc2007/xml"

def mkr(path):
    if os.path.exists(path):
        shutil.rmtree(path)
        os.mkdir(path)
    else:
        os.makedirs(path, exist_ok=True)     # os.makedirs() 递归创建文件夹

def bdd_to_voc(bdd_folder, xml_folder):
    image_path = bdd_folder + "/images/100k/%s"
    label_path = bdd_folder + "/labels/bdd100k_labels_images_%s.json"

    classes = set()

    for trainval in ['train', 'val']:
        image_folder = image_path % trainval
        json_path = label_path % trainval
        xml_folder_ = osp.join(xml_folder, trainval)

        mkr(osp.join(img_dir, trainval))  # 创建筛选出要保存的图片的文件夹

        if not os.path.exists(xml_folder_):
            os.makedirs(xml_folder_)

        with open(json_path) as f:
            j = f.read()
        data = json.loads(j)
        for datum in tqdm(data):
            tmp_list = []
            annotation = Element('annotation')
            SubElement(annotation, 'folder').text ='VOC2007'
            SubElement(annotation, 'filename').text = datum['name']
            source = get_source()
            owner = get_owner()
            annotation.append(source)
            annotation.append(owner)
            size = get_size(osp.join(image_folder, datum['name']))
            annotation.append(size)
            SubElement(annotation, 'segmented').text ='0'
            # additional information
            #for key, item in datum['attributes'].items():
            #    SubElement(annotation, key).text = item

            # bounding box
            for label in datum['labels']:
                if label['category'] != "traffic light":
                    continue
                else:
                    tmp_list.append(1)
                # color = label['attributes']["trafficLightColor"]
                try:
                    box2d = label['box2d']
                except KeyError:
                    continue
                else:
                    bndbox = get_bbox(box2d)

                object_ = Element('object')
                SubElement(object_, 'name').text = label['category']
                # SubElement(object_, 'name').text = color
                SubElement(object_, 'pose').text = "Unspecified"
                SubElement(object_, 'truncated').text = '0'
                SubElement(object_, 'difficult').text = '0'
                classes.add(label['category'])
                # classes.add(color)

                object_.append(bndbox)
                annotation.append(object_)
            if len(tmp_list) == 0:
                continue
            xml_filename = osp.splitext(datum['name'])[0] + '.xml'
            with open(osp.join(xml_folder_, xml_filename), 'w') as f:
                f.write(prettify(annotation))
            # save selects image to another folder.
            img_path = osp.join(image_folder, osp.splitext(datum['name'])[0] + '.jpg')
            dst_imgpath = osp.join(img_dir, trainval)
            shutil.copy(img_path, dst_imgpath)
    print("all of classes are ", classes)

def get_owner():
    owner = Element('owner')
    SubElement(owner, 'flickrid').text ='NULL'
    SubElement(owner, 'name').text ='lijing'
    return owner

def get_source():
    source = Element('source')
    SubElement(source, 'database').text ='voc_bdd'
    SubElement(source, 'annotation').text ='VOC2007'
    SubElement(source, 'image').text ='flickr'
    SubElement(source, 'flickrid').text ='NULL'
    return source




def get_size(image_path):
    i = Image.open(image_path)
    sz = Element('size')
    SubElement(sz, 'width').text = str(i.width)
    SubElement(sz, 'height').text = str(i.height)
    SubElement(sz, 'depth').text = str(3)
    return sz


def get_bbox(box2d):
    bndbox = Element('bndbox')
    SubElement(bndbox, 'xmin').text = str(int(round(box2d['x1'])))
    SubElement(bndbox, 'ymin').text = str(int(round(box2d['y1'])))
    SubElement(bndbox, 'xmax').text = str(int(round(box2d['x2'])))
    SubElement(bndbox, 'ymax').text = str(int(round(box2d['y2'])))
    return bndbox


def prettify(elem):
    rough_string = ElementTree.tostring(elem, 'utf-8')
    reparsed = minidom.parseString(rough_string)
    return reparsed.toprettyxml(indent="\t")


if __name__ == "__main__":
    bdd_to_voc(BDD_FOLDER, XML_PATH)

成功运行后会生成:
XML_PATH目录，在该目录下有,xml文件的train和val两个目录，里面存放的为VOC数据集所需xml注释文件。
img_dir目录下, 会有筛选出的与xml文件对应的train和val图片.

借鉴文章: https://blog.csdn.net/l297969586/article/details/89248108

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

bdd100k数据标签格式转到VOC2007格式的相关文章

完整的前端项目开发流程

一个项目从一开始的计划到最后的上线大概要经过以下的流程产品设计原型审评项目分工项目开发项目测试项目构建项目上线 1产品设计主要负责人产品经理产品经理前期负责收集销售客户领导的零散需求然后做需求分析完成产品设计需求分析需
debian11 sid

编辑 etc apt sources list xff0c 增加下面二行 xff1a deb http ftp us debian org debian sid main contrib non free deb src http ftp
单片机学习——定时器/计数器

单片机必学系列单片机学习中断系统单片机学习存储器详解 xff08 程序存储器片内RAM 拓展RAM EEPROM xff09 单片机学习定时器计数器单片机学习 A D转换更新ing 单片机学习定时器计数器单片机必学系
ros bag包转mp4视频

先在 rosbag2video py 脚本中修改相关配置参数或者在终端命令改也行如果使用脚本里的默认参数则可直接运行 python rosbag2video py 2022 02 02 10 41 38 bag 代码如下 span c
零基础入门Jetson Nano——通过OpenCV调用CSI和USB摄像头

Jetson Nano学习摄像头调用前言一 CSI摄像头的调用1 安装v4l2 utils协助工具2 查看摄像头挂载情况3 查看挂载的摄像头详细参数情况4 检测摄像头能否正常工作5 使用OpenCV调用CSI摄像头方式一利用Gstre
HTML搜索框的制作过程

1 搜索框的构成 input标签和button标签我的理解应该就类似于行内块元素 xff0c 可以设置宽高 xff0c 但同时又不独占一行placeholder 占位文本就是输入框一开始默认显示的文本 span class token t
Linux

Linux 文件管理创建目录创建文件复制剪切重命名删除归档 xff08 解压压缩 xff09 文件查看帮助文档查看信息文件显示当前工作目录切换目录请屏显示文件内容文件内容搜索文件搜索链接文件搜索命令所在位置 Linux系统查看进程终止进
isalpha()库函数

C C 43 43 isalpha 库函数 isalpha 函数用来检测一个字符是否是字母 xff0c 包括大写字母和小写字母头文件 xff1a 属于ctype h头文件 xff1b 但也包含在iostream头文件下语法原型 xff1
计算机网络（谢希仁-第八版）第四章习题全解

4 01 网络层向上提供的服务有哪两种 xff1f 试比较其优缺点 xff1f 虚电路服务和数据报服务虚电路优点 xff1a 1 可以提供可靠的通信服务 2 因为数据是沿着建立的虚电路进行传输的 xff0c 因此分组的首部不需要携带完整
Linux下线程池（ThreadPool)

目录一线程池相关概念及其优点二线程池的实现一线程池相关概念及其优点线程池一种线程使用模式 xff0c 线程过多会带来这个调度的开销进而影响整体的性能 xff0c 而线程池是提前准备好了线程等待着管理者进行分配任务 1 线程池的
Golang协程常见面试题

协程面试题交替打印奇数和偶数N个协程打印1到maxVal交替打印字符和数字交替打印字符串三个协程打印ABCChannel练习交替打印奇数和偶数下面让我们一起来看看golang当中常见的算法面试题使用两个goroutine交替打印1
JS 几种常见的遍历方式

JS 几种常见的遍历方式目录 JS 几种常见的遍历方式for循环for in 循环for of 循环forEach循环map方法参考资料 for循环普通的写法let arr 61 1 2 3 for let i 61 0 i lt ar
mp4 转 jpg 图片

先在 rosbag2video py 脚本中修改相关配置参数然后运行脚本 python mp4 2 jpg py 代码如下 span class token keyword import span span class token mod

随机推荐

C# WinForm界面设计教程

WinForm 是 Windows Form 的简称 xff0c 是基于 NET Framework 平台的客户端 xff08 PC软件 xff09 开发技术 xff0c 一般使用 C 编程 C WinForm 编程需要创建 Windows
2021 山东大学软件学院软件工程应用与实践--YOLOV5项目代码分析——（5）

2021SC 64 SDUSC detection class Detections detections class for yolov5 inference results def init self imgs pred files n
Centos7更改ssh端口报错解决

Centos7 ssh 端口问题解决报错如下 xff1a failed to start openssh server daemonssh failed to start openssh server daemon 问题总结 xff1a
Python 列表的常见操作

Python 列表的常见操作从形式上看 xff0c 列表会将所有元素都放在一对中括号里面 xff0c 相邻元素之间用逗号分隔 xff0c 如下所示 xff1a element1 element2 element3 elementn x
TortoiseGit的安装教程以及用法

TortoiseGit的安装教程以及用法 TortoiseGit 是基于 TortoiseSVN 的 Git 版本的 Windows Shell 界面它是开源的 xff0c 可以完全使用免费软件构建 TortoiseGit 支持你执行常规
在idea中向Maven项目添加插件时出现的“找不到插件”错误解决

大家用idea在pom xml中添加插件时 xff0c 一开始可能都会遇见添加的插件全报红的时候现在我们把鼠标移到报红的地方 xff0c 他给了我们一个not found错误 xff0c 也就是找不到插件那么解决方法也非常简单 xff0
安装Ubuntu双系统

制作U盘启动盘 1 电脑插入U盘 xff0c 格式化U盘 2 下载解压好安装包链接 xff1a https pan baidu com s 1my5JrSz QRPwRxIOdU4JJQ 提取码 xff1a 1234 解压完成打开文件夹
纯C+纯手写+手动编译一个windows 窗体应用（过程记录）

xff08 纯C 43 纯手写 43 手动编译 xff09 一个Windows 窗体应用本篇文章仅仅是作者的一个类似笔记一样的东西 xff0c 作为记录所以请勿出现如下不友善评论啊 xff0c 这不是某某IDE直接就可以生成的吗搞这
STM32寄存器的简介、地址查找，与直接操作寄存器

1 STM32寄存器的简介 2 STM32寄存器地址查找 3 直接操作STM32寄存器 1 STM32寄存器的简介 1 寄存器映射在存储器 Block2 这块区域 xff0c 设计的是片上外设 xff0c 它们以四个字节为一个单元 xff
python对目录下所有图片重命名

执行下列代码程序即可创建一个python文件 file rename py 然后执行 python file rename py span class token operator span span class token operat
word文档的公式编号方法（笔记）

所谓制表位 xff0c 可以简单理解为在word中插入一个无形的表格 xff0c 制表位后的文本就按照他前面的制表位对齐比如我们可以把公式行设置成这样 xff1a 制表位1 xff0c 位置在20字符处 xff0c 格式居中对齐公式制
error: src refspec master does not match any. 错误的解决办法

我们在使用git bash指令将项目上传到github时 xff0c 总是遇到一些错误无法解决下面是我遇到的一个问题 error src refspec master does not match any error failed to
（学习笔记）机器人自主导航从零开始第四步———Rviz、Gazebo、Meshlab的安装

前言本文参考资料 xff1a rviz ROS 维基 http wiki ros org rviz Gazebo Tutorial Ubuntu gazebosim org http gazebosim org tutorials tut
蜂鸣器及其实验

蜂鸣器电路图蜂鸣器按驱动方式可分为有源蜂鸣器 xff08 内含驱动线路 xff09 和无源蜂鸣器 xff08 外部驱动 xff09 这里的源指的是激励源无源蜂鸣器内部没有激励源 xff0c 只有给它一定频率的方波信号 xff0c
有一些软件包无法被安装。如果您用的是 unstable 发行版，这也许是因为系统无法达到您要求的状态造成的。E: 无法修正错误，因为您要求某些软件包保持现状，就是它们破坏了软件包间的依赖关系。

在Ubuntu中使用apt get命令安装编译所需要的库和工具时遇到 xff1a 有一些软件包无法被安装如果您用的是 unstable 发行版 xff0c 这也许是因为系统无法达到您要求的状态造成的该版本中可能会有一些您需要的软件包
MapReduce详细解析完整流程

MapReduce框架结构及核心运行机制 MRAppMaster 负责整个程序的运行过程的调度和状态协调MapTask 负责map阶段的整个数据处理流程ReduceTask 负责reduce阶段的整个数据处理流程整体流程图 MapRedu
如何配置路由器接口IP，手把手教你配置DHCP

目录配置命令 DHCP xff1a 动态主机配置协议路由器网线 xff1a RJ 45双绞线 xff08 家用最常用 xff09 非屏蔽线最佳距离100m xff1b 民用1000M S 商用100000M S 数字信号二进制光
1.C语言0基础自学-从第一行代码开始

目录声明 h头文件代码的开始大括号变量局部变量 xff08 scpoe xff09 全局变量变量的生命周期定义一个变量声明 include lt stdio h gt 声明这个源文件里需要包含一个名为stdio h的头文件
LXC是什么、什么是docker、docker产生的背景

LXC LXC是什么 LXC xff0c 其名称来自Linux软件容器 xff08 Linux Containers xff09 的缩写 xff0c 一种操作系统层虚拟化 xff08 Operating system level virtu
bdd100k数据标签格式转到VOC2007格式

需要修改的部分 xff1a 1 BDD FOLDER xff1a 修改成自己的bdd数据集root路径 2 如果训练的为 traffic light 类 xff0c 且类别为 red green yellow none xff0c 这些属性

bdd100k数据标签格式转到VOC2007格式

bdd100k数据标签格式转到VOC2007格式 的相关文章

随机推荐

热门标签

bdd100k数据标签格式转到VOC2007格式的相关文章