DOTA数据集标签txt文件转为xml文件

2023-10-27

文章目录

1.txt文件格式

DOTA数据集的txt文件格式如下：
在这里插入图片描述
其中，每一行的前8个数字代表目标物体四个顶点的坐标。

2.xml文件格式

使用labimg手动标注得到的xml文件：
在这里插入图片描述
从txt转换到xml有两种选择：
1.将原有的8坐标转换为4坐标的最小外界矩形，即hbb形式 xmin，ymin，xmax，ymax
2.保留原有坐标，即obb形式x0,y0,x1,y1,x2,y2,x3,y3

3.一般的txt到xml的转换思路

sourcetxtfile=fopen('p0000.txt')
all_img_name=os.listdir('./')  #找到图片的全部文件名写入一个列表
img_num=len(all_img) #图片数量

#以下是遍历txt的写法×××××××××××××××××××××××××××××××××××××××××××××××××××××××
for i in range(len(img_num)):
    current_img_name=all_img_name[i]  #当前图片名字
    current_img_name_xml=str(current_img_name)+'.xml' #转为str型并改为xml全名
    f=fopen(current_img_name_xml)   #新建一个上面生成的xml文件
#读取txt坐标
    sourcettxtfile.readlines()
    然后按照一定规律读就行，写成列表，比如过有八个框，就写成一个32维度的矩阵
#读取完写入一个location[32个数字]的列表

    fwrite('<annotation>'+'\n')  #第一行加换行符
    fwrite('工程的文件夹目录 +换行符)
    fwrite(current_img_name=all_img_name[i] )
    `````
    `````
    fwrite(<segmented>0</segmented>)#第一步结束

    #循环len(location)/4次，也就是8次，写xml文件
    fwrite('<object>'+'\n)
    fwrite(<name>你的标签</name>+\n)
    `````
    `````
    fwrite(xmin+\n)
    fwrite(ymin+\n)
    fwrite(xmax+\n)
    fwrite(ymax+\n)
    `````
    `````
    fwrite('<object>'+'\n)
    #循环完就基本就结束，最后一部分对应上面的
    fwrite('<annotation>'+'\n') 
f.close()关闭所有打开的文件
#××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××

####这样p0000.txt就转为了第一张图片对应的xml文件
#如果txt文件也遍历就用××××××××××××之内的办法

4.最终使用的txt到xml转换的脚本

import os
import cv2
from xml.dom.minidom import Document

category_set = ['ship']

def custombasename(fullname):
    return os.path.basename(os.path.splitext(fullname)[0]) #只返回文件名
    
def limit_value(a, b):
    if a < 1:
        a = 1
    if a >= b:
        a = b - 1
    return a

def readlabeltxt(txtpath, height, width, hbb=True):
    print(txtpath)
    with open(txtpath, 'r') as f_in:  # 打开txt文件
        lines = f_in.readlines()
        splitlines = [x.strip().split(' ') for x in lines]  # 根据空格分割
        boxes = []
        for i, splitline in enumerate(splitlines):  #splitline按照行分隔，返回一个包含各行作为元素的列表
            if i in [0, 1]:  # DOTA数据集前两行对于我们来说是无用的
                continue
            label = splitline[8]
            if label not in category_set:  # 只书写制定的类别 #最后可print出不含ship的
                continue
            x1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

深度学习

xml

DOTA数据集标签txt文件转为xml文件的相关文章

Pandas ParserError：标记数据时出错。 C 错误：字符串内有 EOF

我的数据超过 400 000 行运行此代码时 f pd read csv filename error bad lines False 我收到以下错误 pandas errors ParserError Error tokenizing
setColumnStretch 和 setRowStretch 如何工作

我有一个使用构建的应用程序PySide2它使用setColumnStretch用于柱拉伸和setRowStretch用于行拉伸它工作得很好但我无法理解它是如何工作的我参考了 qt 文档但它对我没有帮助我被困在括号内的两个值上例如
使用python编辑html，但是lxml将漂亮的html实体转换为奇怪的编码

我正在尝试使用 python 带有 pyquery 和 lxml 来更改和清理一些 html Eg html div p It 146 s a spicy meatball p div lxml html clean 函数 clean ht
为什么 XSD 中的“maxLength”属性不限制返回的字符数？

我有一个 XSD 元素定义如下
从 XML 获取 viewCount [重复]

这个问题在这里已经有答案了我目前正在使用YouTube API https developers google com youtube 来自 Google 我正在尝试获取 viewCount 数组我已经尝试过这个但一点运气都没有 He
TemplateSyntaxError：“settings_tags”不是有效的标签库

当我尝试运行此测试用例时出现此错误这是在我的 django 应用程序的tests py 中编写的 def test accounts register self self url http royalflag com pk accoun
在Python中，如何通过去掉括号和大括号来打印Json

我想以一种很好的方式打印 Json 我想去掉方括号引号和大括号只使用缩进和行尾来显示 json 的结构例如如果我有一个像这样的 Json A A1 1 A2 2 B B1 B11 B111 1 B112 2 B12 B121 1
matplotlib - 将文本包装在图例中

我目前正在尝试绘制一些pandas数据通过matplotlib seaborn 然而我的一个专栏标题特别长拉长了情节考虑以下示例 import random import pandas as pd import matplotlib p
pandas DataFrame 中行的高效成对比较

我目前正在处理一个较小的数据集大约 900 万行不幸的是大多数条目都是字符串即使强制类别框架在内存中也只有几 GB 我想做的是将每一行与其他行进行比较并对内容进行直接比较例如给定 A B C D 0 cat blue old
Python正则表达式替换引号中的文本（引号本身除外）

例如我有一个测试字符串 content I opened my mouth Good morning I said cheerfully 我想使用正则表达式删除双语音标记之间的文本但不删除语音标记本身所以它会返回 I opened m
Python：处理图像并保存到文件流

我需要使用 python 处理图像应用过滤器和其他转换然后使用 HTTP 将其提供给用户现在我正在使用 BaseHTTPServer 和 PIL 问题是 PIL 无法直接写入文件流因此我必须写入临时文件然后读取该文件以便将其发
python 硒按名称查找元素

查找电子邮件输入的正确代码是什么https accounts google com ServiceLogin html 是
在 Python 中引发异常的正确方法是什么？ [复制]

这个问题在这里已经有答案了这是简单的代码 import sys class EmptyArgs StandardError pass if name main The first way to raise an exception if
类型错误：无法连接“str”和“int”对象有人可以帮助新手使用他们的代码吗？

感谢任何帮助还有任何重大缺陷或您在格式或基本方面看到的任何重大缺陷请指出谢谢 day raw input How many days locations raw input Where to days str day location
numpy 向量化而不是 for 循环

我用 Python 写了一些代码运行良好但速度很慢我认为是由于 for 循环我希望可以使用 numpy 命令加速以下操作让我定义目标假设我有一个 2D numpy 数组all CMs尺寸row x col 例如考虑一个6x11数
如何读取多个文件并将它们合并到一个 pandas 数据框中？

我想读取位于同一目录中的多个文件然后将它们合并到一个 pandas 数据框中如果我这样做的话它会起作用 import pandas as pd df1 pd read csv data 12015 csv df2 pd read csv
为什么我的 Python 散点图不起作用？

我使用 pylab 创建了一个非常简单的散点图 pylab scatter engineSize fuelMile pylab show 该程序的其余部分不值得发布因为正是该行给我带来了问题当我将散点更改为绘图时它会绘制数据图
基于 Web 请求在 Airflow 上运行作业

我想知道是否可以在通过 HTTP 收到请求时执行气流任务我对 Airflow 的调度部分不感兴趣我只是想用它来代替芹菜因此示例操作如下所示用户提交一份表格请求某些报告后端接收请求并向用户发送请求已收到的通知然后后端使用 Ai
Python 子进程：无法转义引号

我知道以前曾问过类似的问题但它们似乎都是通过重新设计参数的传递方式即使用列表等来解决的但是我这里有一个问题因为我没有这个选项有一个特定的命令行程序我使用的是 Bash shell 我必须向其传递带引号的字符串它不能不被引用
如何从 Pandas 数据框函数调用中回顾之前的行？

我正在研究回测交易系统我有一个包含 OHLC 数据的 Pandas 数据框并添加了几个计算列 https stackoverflow com questions 12376863 adding calculated columns t

随机推荐

在矩池云使用Llama2-7B的具体方法

今天给大家分享如何在矩池云服务器使用 Llama2 7b模型硬件要求矩池云已经配置好了 Llama 2 Web UI 环境显存需要大于 8G 可以选择 A4000 P100 3090 以及更高配置的等显卡租用机器在矩池云主机市场
图像对比度，亮度

很多时候一张图像被过度曝光显得很白或者光线不足显得很暗这个时候可以通过调节图像的这两个基本属性亮度与对比度来获得整体效果的提升从而获得质量更高的图片 1 算子operator 首先我们给出算子的概念一般的图像处理算子都是一个
电源学习总结（五）——开关电源基本原理

前面讲了一些线性稳压的原理和设计的基本方法事实上除了一些功率较大或者对精度要求较高的电源设计使用集成的线性稳压芯片很少出现翻车事故一般只需关注输入输出范围即可此外需注意由于集成的开关电源芯片尤其是贴片封装的如SOT 22
【CUDA】初步了解PageLocked host memory的mapped memory功能使用

导言大家都知道CUDA 中PageLocked memory 相比portable memory 有着多种优势在有front side bus的系统中 pagelocked memory 所提供的host 与device之间的数据传送速
硬盘突然提示没有初始化_分享一下固态硬盘不认盘的修复方法

写在开头固态硬盘比较害怕突然停电如果里面有重要数据请勿用此方法尝试修复即便可以成功里面的数据也已经被抹除需要恢复数据的话还是需要找专业的数据恢复公司来做切勿自己折腾进入正题前段时间淘了一块威刚的SP550 120G SA
常用脚本（九）Unity_Input

1 输出鼠标位置在Update方法中 Debug Log Input mouseposition 2 判断鼠标是否点击返回 True 和 false 每帧都输出在Update方法中 Debug Log Input anykey 3 I
run()方法和start()方法的区别

run 方法和start 方法的区别文章目录 run 方法和start 方法的区别一 start 是什么二 run 是什么三具体代码实例四 start 和run 方法的区别参考一 start 是什么用 start方法来启动
安全并正确地重启Elasticsearch集群

文章目录前言问题原因其本质提前准备准备重启集群更新集群前言 elasticsearch本身具有高可用性可以做到停机不停服务在重启elasticsearch后可能存在数据丢失或者是启动ES后怎么一直有大量的数据在迁移问
快速创建一个spring boot项目

写了两年还在创建spring boot 项目最近想自己尝试开发一个项目所以随便记录一下吧平常工作都是现成的项目开发在项目上加新功能之类的除了工作平常回去也没琢磨现在想多思考为了国庆之后辞职找工作做一个铺垫分割线选择一些
linux内核vmlinux生成过程简要分析

最近工作不太忙研究了一下Linux内核的编译过程在此简要记录一下 obj zImage obj compressed vmlinux FORCE call if changed objcopy linux的内核 zImage 的生成依赖
第二天(七）osg::Object* readObjectFile_const std::string& filename_const ReaderWriter::Options* options

目前流程是 osgViewer viewBase frame viewerInit 创建帧事件并将漫游器与事件和视口相关联 gt osgViewer Viewer ViewerInit gt osgViewer View Init gt
电脑老是安装一些来路不明的软件（如何解决）？

目录先解决自身可能出现的问题上四大方法先解决自身可能出现的问题 1 自行百度下载软件没有到官网那去下载进入一些假官网下载软件会附带一些流氓软件看好官网地址再下载或者用安全软件那去下载 2 电脑的浏览器被劫持了浏览器会有小广告
智能指针与引用计数详解（二）

在智能指针与引用计数详解一当中讲了智能指针还有改进的地方下面具体问题具体分析一智能指针的赋值方法改进上一章的赋值方法中只要是赋值都是右操作数引用计数加一左操作数引用计数减一没有考虑过引用计数对象自赋值的情况比如按照上一章代
Windows键盘对应苹果的Option键

用mini mac的用户如果用的是windows的键盘那么开发时功能键或多或少会有一些不适应特别是在xCode4中我就一直没有找到option对应的windows键苹果有介绍 http support apple com kb H
Matlab学习——求解微分方程(组)

介绍 1 在 Matlab 中用大写字母 D 表示导数 Dy 表示 y 关于自变量的一阶导数 D2y 表示 y 关于自变量的二阶导数依此类推函数 dsolve 用来解决常微分方程组的求解问题调用格式为 X dsolve eqn1
自定义指令 v-loading

1 在src下创建directive文件夹 2 在directive文件夹下创建loading文件夹 3 loading文件夹内创建index js和loading vue 目录图 4 index js src directive load
QtCreator 快捷键问题记录

我目前用的QtCreator Mac版8 0 0 具体信息如下一般来说QtCreator的快捷键和设置项在windows下也是一样的在QtCreator gt Options gt Environment gt Keyboard中可以找
SpringBoot整合office转换与预览

文章目录一介绍 1 简介 2 aspose简介 3 jodconverter简介二 springboot整合aspose实战 1 前期依赖准备 1 1 介绍 1 2 项目直接引入jar包 1 3 maven添加本地包 2 office
使用Retrofit上传实体类到服务端（笔记）

一服务端 1 需要对参数用 RequestBody这个注解进行修饰 SpringBoot会自动将前端传过来的JSON数据反序列化成Java对象登录 param requestVo return PostMapping value log
DOTA数据集标签txt文件转为xml文件

文章目录 1 txt文件格式 2 xml文件格式 3 一般的txt到xml的转换思路 4 最终使用的txt到xml转换的脚本 5 之后可能用到的xml转换到txt的脚本 1 txt文件格式 DOTA数据集的txt文件格式如下其中每一行的