目标检测: 数据集转换txt转为xml格式

2023-05-16

1.txt数据集格式

2.xml数据集格式

3.转换代码

4.根据xml标签分割出图像中的目标物体

5.效果展示

1.txt数据集格式

第1元素代表类别，第2，3表示目标框的中心位置，第4，5表示目标框的大小。

请注意: xml 格式文件目标物体是xmin ymin xmax ymax 描述位置信息，表示目标框的左上角和右下角的坐标，因此在写脚本的时候要注意转换。

3. 转换代码

注意：提供txt_path img_path 两个文件夹路径，且两者的文件数量和名称要对应。

# .txt-->.xml
# ! /usr/bin/python
# -*- coding:UTF-8 -*-
import os
import cv2
 
def txt_to_xml(txt_path,img_path,xml_path):
    #1.字典对标签中的类别进行转换
    dict = {'0': "organoid",  
                '1': "car",
                '2': "bus",
                '3': "ufo",
                '4': "robot",
                '5': "virus",
                '6': "trunk",
                '7': "plash",
                '8': "biycle"}
    #2.找到txt标签文件夹
    files = os.listdir(txt_path)
    #用于存储 "老图"
    pre_img_name = '' 
    #3.遍历文件夹
    for i, name in enumerate(files):
        #许多人文件夹里有该文件，默认的也删不掉，那就直接pass
        if name == "desktop.ini":
            continue
        print(name)
        #4.打开txt
        txtFile=open(txt_path+name)
        #读取所有内容
        txtList = txtFile.readlines()
        #读取图片名称
        img_name = name.split(".")[0]
        pic = cv2.imread(img_path+img_name+".jpg")
        #获取图像大小信息
        Pheight,Pwidth,Pdepth=pic.shape
        #5.遍历txt文件中每行内容
        for row in txtList:
            #按' '分割txt的一行的内容
            oneline = row.strip().split(" ") 
            #遇到的是一张新图片
            if img_name != pre_img_name: 
                #6.新建xml文件
                xml_file = open((xml_path + img_name + '.xml'), 'w')
                xml_file.write('<annotation>\n')
                xml_file.write('    <folder>VOC2007</folder>\n')
                xml_file.write('    <filename>' + img_name + '.jpg' + '</filename>\n')
                xml_file.write('<source>\n')
                xml_file.write('<database>orgaquant</database>\n')
                xml_file.write('<annotation>organoids</annotation>\n')
                xml_file.write('</source>\n')
                xml_file.write('    <size>\n')
                xml_file.write('        <width>' + str(Pwidth) + '</width>\n')
                xml_file.write('        <height>' + str(Pheight) + '</height>\n')
                xml_file.write('        <depth>' + str(Pdepth) + '</depth>\n')
                xml_file.write('    </size>\n')
                xml_file.write('    <object>\n')
                xml_file.write('<name>' + dict[oneline[0]] + '</name>\n')
                xml_file.write('        <bndbox>\n')
                xml_file.write('            <xmin>' + str(int(((float(oneline[1]))*Pwidth+1)-(float(oneline[3]))*0.5*Pwidth)) + '</xmin>\n')
                xml_file.write('            <ymin>' + str(int(((float(oneline[2]))*Pheight+1)-(float(oneline[4]))*0.5*Pheight)) + '</ymin>\n')
                xml_file.write('            <xmax>' + str(int(((float(oneline[1]))*Pwidth+1)+(float(oneline[3]))*0.5*Pwidth)) + '</xmax>\n')
                xml_file.write('            <ymax>' + str(int(((float(oneline[2]))*Pheight+1)+(float(oneline[4]))*0.5*Pheight)) + '</ymax>\n')
                xml_file.write('        </bndbox>\n')
                xml_file.write('    </object>\n')
                xml_file.close()
                pre_img_name = img_name #将其设为"老"图
            else: #不是新图而是"老图"
                #7.同一张图片，只需要追加写入object
                xml_file = open((xml_path + img_name + '.xml'), 'a')
                xml_file.write('    <object>\n')
                xml_file.write('<name>'+dict[oneline[0]]+'</name>\n')
                '''  按需添加这里和上面
                xml_file.write('        <pose>Unspecified</pose>\n')
                xml_file.write('        <truncated>0</truncated>\n')
                xml_file.write('        <difficult>0</difficult>\n')
                '''
                xml_file.write('        <bndbox>\n')
                xml_file.write('            <xmin>' + str(int(((float(oneline[1]))*Pwidth+1)-(float(oneline[3]))*0.5*Pwidth)) + '</xmin>\n')
                xml_file.write('            <ymin>' + str(int(((float(oneline[2]))*Pheight+1)-(float(oneline[4]))*0.5*Pheight)) + '</ymin>\n')
                xml_file.write('            <xmax>' + str(int(((float(oneline[1]))*Pwidth+1)+(float(oneline[3]))*0.5*Pwidth)) + '</xmax>\n')
                xml_file.write('            <ymax>' + str(int(((float(oneline[2]))*Pheight+1)+(float(oneline[4]))*0.5*Pheight)) + '</ymax>\n')
                xml_file.write('        </bndbox>\n')
                xml_file.write('    </object>\n')
                xml_file.close()
 
        #8.读完txt文件最后写入</annotation>
        xml_file1 = open((xml_path + pre_img_name + '.xml'), 'a')
        xml_file1.write('</annotation>')
        xml_file1.close()
    print("Done !")
#修改成自己的文件夹 注意文件夹最后要加上/  
txt_to_xml("txt_path/","img_path/","xml_path/")

4. 根据xml标签分割出图像中的目标物体

 
import cv2
import xml.etree.ElementTree as ET
import numpy as np
 
import xml.dom.minidom
import os
import argparse
 
 
def main():
    # JPG文件的地址
    img_path = '1/'
    # XML文件的地址
    anno_path = '3/'
    # 存结果的文件夹
    cut_path = 'crops/'
 
    if not os.path.exists(cut_path):
        os.makedirs(cut_path)
    # 获取文件夹中的文件
    imagelist = os.listdir(img_path)
    # print(imagelist
    for image in imagelist:
        image_pre, ext = os.path.splitext(image)
 
        img_file = img_path + image
        img = cv2.imread(img_file)
        xml_file = anno_path + image_pre + '.xml'
        # DOMTree = xml.dom.minidom.parse(xml_file)
        # collection = DOMTree.documentElement
        # objects = collection.getElementsByTagName("object")
        print(xml_file)
        tree = ET.parse(xml_file)
        root = tree.getroot()
        # if root.find('object') == None:
        #     return
        obj_i = 0
        for obj in root.iter('object'):
            obj_i += 1
            print(obj_i)
            cls = obj.find('name').text
            xmlbox = obj.find('bndbox')
            b = [int(float(xmlbox.find('xmin').text)), int(float(xmlbox.find('ymin').text)),
                 int(float(xmlbox.find('xmax').text)),
                 int(float(xmlbox.find('ymax').text))]
            img_cut = img[b[1]:b[3], b[0]:b[2], :]
            path = os.path.join(cut_path, cls)
            # 目录是否存在,不存在则创建
            mkdirlambda = lambda x: os.makedirs(x) if not os.path.exists(x) else True
            mkdirlambda(path)
            try:
                cv2.imwrite(os.path.join(cut_path, cls, '{}_{:0>2d}.jpg'.format(image_pre, obj_i)), img_cut)
            except:
                continue
 
            print("&&&&")
 
 
if __name__ == '__main__':
    main()

5.效果展示

原图:

分割后的图像:

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

目标检测: 数据集转换txt转为xml格式的相关文章

如何使用命令行检查 KylinOS-Desktop 版本

在本指南中 xff0c 我们将向您展示如何轻松检查系统上的KylinOS Desktop 版本有两种主要方法可以实现这一目标使用终端使用图形用户界面因此 xff0c 让我们深入了解如何使用上述方法来检查系统上的 KylinOS De
Linux 中的 20 大网络监控工具

在本教程中 xff0c 让我们讨论可用于 linux 系统的最佳网络监控工具有很多可用的工具 xff0c 如 nethogs ntopng nload iftop iptraf bmon slurm tcptrack cbm netwat
将KylinOS-desktop的英文语言环境切换为中文的3种方式

如果你在英语环境下安装了系统那么默认语言可能会被设置为英语所以你最好知道你的安装器使用的是什么语言如果对语言有要求而又设置错误了你可以自己进行修改 strong locale strong 命令显示当前配置 locale 命令会列出
如何在 Ubuntu 22.04 上安装最新版本Wine

过渡到 Linux 的用户的担忧之一是他们是否可以在 Linux 上运行自己喜欢的应用程序这些范围可以从 Windows 游戏和简单的应用程序软件值得庆幸的是 Wine 允许用户在 Linux Unix 系统上运行和执行 Windows
内网搭建Ubuntu（银河麒麟）的apt本地源服务器

很多项目要求内网环境导致服务器不能使用公网的apt源所以需要在内网中搭建一个本地的apt源本教程将指导你如何利用apt mirror建立局域网内的Debian Ubuntu源镜像如果你需要在局域网内安装多套系统那么建立一个本地的D
linux分区parted工具的用法详解

一概述通常我们用的比较多的分区工具是fdisk命令 xff0c 但由于fdisk只支持MBR分区 xff0c MBR分区表最大支撑2T的磁盘 xff0c 所以无法划分大于2T的分区而parted工具可以划分单个分区大于2T的GPT格式
Kylin-Desktop 提示sudo: /usr/bin/sudo 必须属于用户 ID 0(的用户)并且设置 setuid 位

问题 sudo usr bin sudo 必须属于用户 ID 0 的用户并且设置 setuid 位解决方案经过原因排查是 usr bin的权限修改了使用了命令 sudo chmod R 777 nbsp usr bin 导致需要将
Extjs6 下动态生成grid表头

前端使用Extjs6j技术遇到动态生成gird的需求这里记录下 xff0c 便于以后使用首先定义表格 xtype 39 grid 39 region 39 center 39 reference 39 salaryGrid 39 co
Git Clone错误解决【GnuTLS recv error (-110): The TLS connection was non-properly terminated.】

报错信息如下 xff1a Cloning into 39 gramine 39 fatal unable to access 39 https github com gramineproject gramine git 39 GnuTLS
redhat 5.4下设置回收站简介

1 简介使用rm rf时有时会误删数据 xff0c 可以在系统中添加一个回收站 xff0c 防止误删数据完全找不到 2 方式在下 bashrc或者 bash profile加入 mkdir p trash alias rm 61 tr
在CentOS 6.6 64bit上编译安装LLVM3.7，Clang，Libc++和libc++abi

一简介 LLVM LLVM xff08 之前称为低级虚拟机Low Level Virtual Machine xff09 是一种非常强大的编译器基础架构框架 xff0c 专门为使用您喜爱的编程语言编写的程序的编译时链接时和运行时优化而设
免费，好用的天气预报API

不多说直接上 xff01 一 API服务 xff0c 天气API 网站 xff1a http api help bj cn api 怎么使用网站有很详细的解释 ajax type 34 GET 34 请求方式 url 34 http api
Ubuntu 远程桌面连接Window的几种方法

Window远程桌面连接Ubuntu 的几种方法 Window远程连接Ubuntu有如下几种方案一 TeamViewer 在Window与Ubuntu上安装相同版本的TeamViewer xff0c Window下有安装程序 xff0c
基于CAS实现单点登录（SSO）：分享过程中遇到的问题及解决方案，让你少走弯路

在做单点登录过程中 xff0c 经历了一些问题及解决方案 xff0c 分享出来 xff0c 可以让你少走弯路主要分为两方面内容 xff1a 基于CAS实现单点登录 xff08 SSO xff09 实例讲解 CAS和Shiro集成基于C
两个实体类的属性值直接比较，判断两个实体对象是否是同一个

span class token keyword public span span class token keyword class span span class token class name ClassCompareUtil sp
kvm启动虚拟机流程

启动虚拟机 virDomainCreate 0 virDomainCreate domain 61 0x697990 at libvirt c 8133 1 0x000000000042261f in cmdStart ctl 61 0x7
webpack使用(4)之引入第三方JS库

一 script引入第三方库lodash 不建议使用 span class hljs tag lt span class hljs title script span span class hljs attribute src span 6
如何打包自己的NerdFont

前言众所周知 xff0c 在使用Poweshell的美化工具oh my posh的时候都是需要特定字体支持的 xff0c 否则就会因为一些图标无法显示而出现乱码 xff0c 常用的字体自然是NerdFont系列字体 xff0c 但有时也会
SQL Server存储过程事物控制（为一个折腾好久的异常记录）

USE DBName GO SET ANSI NULLS ON GO SET QUOTED IDENTIFIER ON GO ALTER PROC dbo CreateDept 64 Name NVARCHAR 100 61 N 39 39
Java设计模式之行为型：观察者模式

一什么是观察者模式 xff1a 观察者模式又称为发布订阅模式 xff0c 定义了对象之间一对多依赖关系 xff0c 当目标对象被观察者的状态发生改变时 xff0c 它的所有依赖者观察者都会收到通知一个观察目标可以对应多个观察

随机推荐

AAC编码原理

AAC编码原理转自 xff1a http www hellotongtong com avcodecbase avcodecbase aaccodec intro html 一 AAC编码概述 AAC是高级音频编码 xff08 Advan
FFmpeg入门详解之19：音视频封装原理简介

什么是数据封装和解封装数据封装 xff08 baiData Encapsulation xff09 xff0c 笼统地讲 xff0c 就是把业务数据映射到du某个封装协议zhi的净dao荷中 xff0c 然后填充对应协议的包头 xff0c
FFmpeg入门详解之35：FFplay播放器

ffplay的初体验及快捷键 ffplay是ffmpeg工程中提供的播放器 xff0c 功能相当的强大 xff0c 凡是ffmpeg支持的视音频格式它基本上都支持甚至连VLC不支持的一些流媒体都可以播放 xff08 比如说RTMP xff
达梦数据库入门：管理实例（Linux）

达梦数据库管理实例 xff08 Linux xff09 1 xff1a 创建数据库实例一使用数据库助手 xff08 GUI xff09 创建数据库实例 xff08 安装用户 xff1a dmdba 安装路径 dm8 xff09 1 登录
Win11 WSL2 启用 systemd 及设置静态 / 固定 IP

一以管理员身份打开 Windows 终端默认情况下 xff0c 鼠标右击桌面弹出的快捷菜单上有一项在终端中打开 xff0c 点击它后就会启动 Windows 终端此时的终端并不是以管理员身份运行的点击 Windows 终端标题栏上
VSCode点击“Open In Default Browser”提示错误信息“Open browser failed!! ...”

运行html文件点击 Open In Default Browser 时 xff0c 提示报错信息 Open browser failed Please check if you have installed the browser chr
用VScode运行Vue项目（node.js环境的配置，如何以管理员身份运行cmd）

用VScode运行Vue项目详细全过程 xff08 node js环境的配置 xff09 D gloria的博客 CSDN博客基本按上面博主的步骤来的 xff0c 只是中间一些步骤记一下笔记上面文章中运行cmd时 xff0c 要根据博主
全世界最强的算法平台codeforces究竟有什么魅力？

大家好 xff0c 之前说过由于和LeetCode结了梁子 xff0c 所以周末的LeetCode专题取消了 xff0c 给大家写点其他专题的算法问题目前选择的是国外著名的编程竞赛平台 codeforces 它在竞赛圈名气比较大 xff0
四步利用docker搭建samba服务器

我的系统是centos7 打算共享 home目录供windows用故快速利用docker搭建samba服务本教程利用dperson samba镜像作为容器 xff1a 步骤 xff1a 第一步 xff1a yum span class h
2-6 链表逆序及其C++实现

更多系列博文请点击 xff1a 0 数据结构与算法链接目录 2 6 链表逆序我只介绍两种常用方法吧 xff0c 非递归方法和递归方法我觉得够用就行 1 非递归方法 xff1a 将第二个元素后面的元素依次插入到头结点后面 xff0c
SQL Server 通过SQL生成Java代码（为了省事写的生成实体类中属性）

SELECT 字段名 61 a name 类型 61 b name 字段说明 61 isnull g value 39 39 CONVERT VARCHAR 100 a name AS colname CONVERT VARCHAR 100
C++编译器VS2019和MinGW的问题

C 43 43 编译器VS2019和MinGW的问题 xff1a 最近在啃C 43 43 Primer这本书 xff0c 在学习到第14章重载运算符时 xff0c 准备为自定义的类String重载一个输入运算符 gt gt xff0c 代码
物理机debian环境搭建

装系统全程ob腾哥配置 xff0c 记录一下 1 首先需要一个刻录u盘 xff0c 格式化 2 下载u盘刻录软件 xff0c refus 3 到镜像站或官网下载debian iso 4 插入u盘 xff0c 进行刻录 5 到电脑插入u盘 x
PYTHON简单代码去除TXT文档重复行内容去重复

PYTHON简单代码去除TXT文档重复行内容去重复 fi span class token operator 61 span span class token builtin open span span class token punct
c语言嵌套结构体内存对齐

结构体内存对齐规则 xff1a 1 第一个成员在结构体变量偏移量为0 的地址处 2 其他成员变量要对齐到某个数字 xff08 对齐数 xff09 的整数倍的地址处对齐数 61 编译器默认的一个对齐数与该成员大小中的较小值 vs中默认值是8
ubuntu简单设置代理的办法

直接输入命令 span class token builtin class name export span span class token assign left variable http proxy span span class
DockerFile集成mysql，nginx，zookeeper，redis，tomcat为一个镜像

将mysql nginx zookeeper redis tomcat集成为一个docker镜像实现运行一个镜像 xff0c 便全部自动化安装启动mysql nginx zookeeper redis tomcat 1 在CentOS7上
Squid反向手动编译--Debian10.x

Squid反向手动编译 Debian10 x 实验环境 xff1a server01 xff1a 192 168 10 10 CA证书 DNS服务器 server02 xff1a 192 168 10 20 squid服务器需要做ssl
Ubuntu18.04 intel wifi6 ax201无线网卡驱动安装

Ubuntu18 04 intel wifi6 ax201无线网卡驱动安装前言新买的笔记本电脑装Ubuntu系统 xff0c 发现没有无线网卡 xff0c 经查阅资料发现由于网卡刚没多久 xff0c Ubuntu没有集成网卡驱动 xff
目标检测: 数据集转换txt转为xml格式

目录 1 txt数据集格式 2 xml数据集格式 3 转换代码 4 根据xml标签分割出图像中的目标物体 5 效果展示 1 txt数据集格式第1元素代表类别 xff0c 第2 xff0c 3表示目标框的中心位置 xff0c 第4 xff0

目标检测: 数据集转换txt转为xml格式

1.txt数据集格式

3. 转换代码

4. 根据xml标签分割出图像中的目标物体

5.效果展示

目标检测: 数据集转换txt转为xml格式 的相关文章

随机推荐

热门标签

目标检测: 数据集转换txt转为xml格式的相关文章