yolo格式数据转换为coco格式

2023-11-10

只需要有图片和yolo格式的标签就可以转换为coco格式的标签
第一步：将yolo格式的标签：classId, xCenter, yCenter, w, h转换为coco格式：classId, xMin, yMim, xMax, yMax格式。coco的id编号从1开始计算，所以这里classId应该从1开始计算。最终annos.txt中每行为imageName, classId, xMin, yMim, xMax, yMax, 一个bbox对应一行

import os
import cv2
 
# 原始标签路径
originLabelsDir = r'G:\data\cell_phone_samples\correct_images_and_labels' \
                  r'\cellphone_labels_cut_person_and_cellphone_total\labels\val'
# 转换后的文件保存路径
saveDir = r'G:\data\cell_phone_samples\correct_images_and_labels' \
          r'\cellphone_labels_cut_person_and_cellphone_total\labels_coco_format\annos.txt'                                                                           
# 原始标签对应的图片路径
originImagesDir = r'G:\data\cell_phone_samples\correct_images_and_labels' \
                  r'\cellphone_labels_cut_person_and_cellphone_total\images\val'
 
txtFileList = os.listdir(originLabelsDir)
with open(saveDir, 'w') as fw:
    for txtFile in txtFileList:
        with open(os.path.join(originLabelsDir, txtFile), 'r') as fr:
            labelList = fr.readlines()
            for label in labelList:
                label = label.strip().split()
                x = float(label[1])
                y = float(label[2])
                w = float(label[3])
                h = float(label[4])
 
                # convert x,y,w,h to x1,y1,x2,y2
                imagePath = os.path.join(originImagesDir,
                                         txtFile.replace('txt', 'jpg'))
                image = cv2.imread(imagePath)
                H, W, _ = image.shape
                x1 = (x - w / 2) * W
                y1 = (y - h / 2) * H
                x2 = (x + w / 2) * W
                y2 = (y + h / 2) * H
                # 为了与coco标签方式对，标签序号从1开始计算
                fw.write(txtFile.replace('txt', 'jpg') + ' {} {} {} {} {}\n'.format(int(label[0]) + 1, x1, y1, x2, y2))
 
        print('{} done'.format(txtFile))

第二步：将标签转换为coco格式并以json格式保存，代码如下。根路径root_path中，包含images(图片文件夹)，annos.txt(bbox标注)，classes.txt(一行对应一种类别名字), 以及annotations文件夹(如果没有则会自动创建，用于保存最后的json)

import json
import os
import cv2
 
# ------------用os提取images文件夹中的图片名称，并且将BBox都读进去------------
# 根路径，里面包含images(图片文件夹)，annos.txt(bbox标注)，classes.txt(类别标签),
# 以及annotations文件夹(如果没有则会自动创建，用于保存最后的json)
root_path = r'G:\data\cell_phone_samples\correct_images_and_labels\cellphone_labels_cut_person_and_cellphone_total\labels_coco_format'
# 用于创建训练集或验证集
phase = 'train'    # 需要修正
 
# dataset用于保存所有数据的图片信息和标注信息
dataset = {'categories': [], 'annotations': [], 'images': []}
 
# 打开类别标签
with open(os.path.join(root_path, 'classes.txt')) as f:
    classes = f.read().strip().split()
 
# 建立类别标签和数字id的对应关系
for i, cls in enumerate(classes, 1):
    dataset['categories'].append({'id': i, 'name': cls, 'supercategory': 'mark'})
 
# 读取images文件夹的图片名称
indexes = os.listdir(os.path.join(root_path, 'images'))
 
# 统计处理图片的数量
global count
count = 0
 
# 读取Bbox信息
with open(os.path.join(root_path, 'annos.txt')) as tr:
    annos = tr.readlines()
 
    # ---------------接着将，以上数据转换为COCO所需要的格式---------------
    for k, index in enumerate(indexes):
        count += 1
        # 用opencv读取图片，得到图像的宽和高
        im = cv2.imread(os.path.join(root_path, 'images/') + index)
        height, width, _ = im.shape
 
        # 添加图像的信息到dataset中
        dataset['images'].append({'file_name': index,
                                  'id': k,
                                  'width': width,
                                  'height': height})
 
        for ii, anno in enumerate(annos):
            parts = anno.strip().split()
 
            # 如果图像的名称和标记的名称对上，则添加标记
            if parts[0] == index:
                # 类别
                cls_id = parts[1]
                # x_min
                x1 = float(parts[2])
                # y_min
                y1 = float(parts[3])
                # x_max
                x2 = float(parts[4])
                # y_max
                y2 = float(parts[5])
                width = max(0, x2 - x1)
                height = max(0, y2 - y1)
                dataset['annotations'].append({
                    'area': width * height,
                    'bbox': [x1, y1, width, height],
                    'category_id': int(cls_id),
                    'id': i,
                    'image_id': k,
                    'iscrowd': 0,
                    # mask, 矩形是从左上角点按顺时针的四个顶点
                    'segmentation': [[x1, y1, x2, y1, x2, y2, x1, y2]]
                })
 
        print('{} images handled'.format(count))
 
# 保存结果的文件夹
folder = os.path.join(root_path, 'annotations')
if not os.path.exists(folder):
  os.makedirs(folder)
json_name = os.path.join(root_path, 'annotations/{}.json'.format(phase))
with open(json_name, 'w') as f:
  json.dump(dataset, f)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

yolo格式数据转换为coco格式的相关文章

如何向 django 中的用户模型添加自定义权限？

默认情况下在 django 中当安装了 django contrib auth 的情况下运行syncdb时它会在每个模型上创建默认权限如 foo can change foo can delete 和 foo can add 要向模
窗口多维 Tensorflow 数据集

我有形状的二维数据m by n我想要的窗口大小w沿着第一个轴进入数据集m w许多二维数组每个数组的大小w by n 例如如果数据是 0 1 2 3 4 5 6 7 8 9 10 11 然后我想将其窗口化 0 1 2 3 4 5 6 7 8
对于 `mouseMoveEvent()` 来说鼠标移动太快

以下是 Python 3 版本 UI XML 代码显示 4QProgessBar对于每个鼠标方向标记为 X X Y Y 快速移动鼠标以圆圈形式将使 4QProgessBar上升到 99 然后是一些QProgessBar休息一下直到鼠
Python子进程：cmd退出时的回调

我目前正在使用启动一个程序subprocess Popen cmd shell TRUE 我对 Python 相当陌生但感觉应该有一些 api 可以让我做类似的事情 subprocess Popen cmd shell TRUE po
如何创建自定义颜色图并将其用于不同范围的数据？

假设我有这样的数据 import numpy as np import matplotlib pyplot as plt import matplotlib colors for reproducibility purposes np ra
在 cherokee 和 uwsgi 上部署 Flask [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我正在尝试部署一个使用 cherokee 和 uwsgi 开发的 Flask Web 应用程序我安装了 cherokee 和 uwsgi 并正在工作
Python 比编译的 Haskell 更快？

我有一个用 Python 和 Haskell 编写的简单脚本它读取包含 1 000 000 个换行符分隔的整数的文件将该文件解析为整数列表对其进行快速排序然后将其写入已排序的不同文件中该文件与未排序的文件具有相同的格式简单的这
给定一个正整数 n，如何打印高度为 n-1 的数字三角形？

HackerRank 三角任务 https www hackerrank com challenges python quest 1 problem 仅使用算术运算单个for loop 和一个单一的print陈述不允许进行字符串操作约
Python 中的参数命名约定

对于形式参数密切相关的函数例如 def add two numbers n1 n2 return n1 n2 def multiply two numbers n1 n2 return n1 n2 如上所示为两个函数中的参数指定相同的名
Scikit-learn：如何获得 True Positive、True Negative、False Positive 和 False Negative

我的问题我有一个数据集它是一个很大的 JSON 文件我读取它并将其存储在trainList多变的接下来我对其进行预处理以便能够使用它完成后我开始分类我用kfold交叉验证方法以获得平均值准确性并训练分类器我做出预测并获
检查空查询集

我想确认这是否是检查空查询集的正确方法如果这就是为什么我会遇到 UNIQUE 约束错误 syn check Synonym objects filter MD objects get filter dict synonym type St
在 Django 视图中访问其他项目中的模型导致“表不存在”错误

基地项目结构 baseproject baseapp models py class BaseModel models Model 其他项目结构 project app views py urls py 项目 app views py im
如何使用包含 \n 的 .txt 创建一维列表？

我想读取一个文本文件并将文件的每个元素放入一个列表中而不是为文件中的每一行都有一个单独的列表例如如果文件是你好我的名字 Is Joe 我希望列表是你好我的名字是 Joe 而不是你好我的名字是乔这是我到目前为止所拥有的 d
在Python中，如何将“datetime”对象转换为秒？

我有一堆日期时间对象我想计算每个对象自过去固定时间以来的秒数例如自 1970 年 1 月 1 日以来 import datetime t datetime datetime 2009 10 21 0 0 这似乎只是区分具有不同日期的日期
django 创建多类型用户的最佳方法

我想在 django 中创建多个用户我想知道哪种方法是最好的 class Teachers models Model user models ForeignKey User is teacher models BooleanField d
标记 pandas 系列中连续的 True 元素组

我有一系列的 pandas 布尔值我想标记连续的 True 值组怎么可能做到这一点是否可以以矢量化的方式做到这一点任何帮助将不胜感激 Data A 0 False 1 True 2 True 3 True 4 False 5 Fal
需要帮助编写扭曲的代理

我想编写一个简单的代理可以对请求页面正文中的文本进行打乱我已经阅读了 stackoverflow 上的部分扭曲文档和其他一些类似的问题但我有点菜鸟所以我仍然不明白我现在就是这样不知道如何访问和修改页面 from twisted
python散景中的反转轴

我正在尝试反转 y 轴并在散景散点图中设置 x 和 y 的范围我在用 BokehPlot bokeh scatter data df x range min utc max utc y range min val max val 我收到错
在 jupyter 笔记本中运行 pytest 测试函数

我正在制作有关 python 测试选项的演示我想要演示的技术之一是 pytest 我计划使用 jupyter ipython 笔记本进行演示理想情况下我希望能够在单元格中定义一个测试函数然后使用 pytest 运行该函数这样我就可
无法让我的脚本自动生成一些值以在有效负载中使用

我创建了一个脚本通过随后发送两个 https 请求来从目标页面获取 html 元素我的脚本可以完美地完成这件事但是我必须从 chrome 开发工具复制四个值来填充其中的四个键payload为了发送最终的http请求到达目标页面这是

随机推荐

互联网生活中的隐私保护：用隐私换便利还是花钱护隐私？

近日某高校毕业生在校期间窃取学校内网数据收集全校学生个人隐私信息的新闻引发了人们对互联网生活中个人信息安全问题的再度关注在大数据时代算法分发带来了隐私侵犯在享受消费生活等便捷权利的同时似乎又有不少个人信息泄露的担忧用隐私换便利
【华为OD统一考试A卷

华为OD统一考试A卷 B卷新题库说明 2023年5月份华为官方已经将的 2022 0223Q 1 2 3 4 统一修改为OD统一考试 A卷和OD统一考试 B卷你收到的链接上面会标注A卷还是B卷请注意根据反馈目前大部分收到的都是
Python 函数的说明文档

视频版教程 Python3零基础7天入门实战视频教程用备注说明然后我们调用函数的地方鼠标移动上去就能看到函数的说明提供代码的可读性 def add x y 两数相加函数 param x 两数相加数x param y 两数相加数y
matlab中Img(:,:,n)函数的说明

Img n 中 n可以取1 2 3分别代表img图像的第1 2 3通道即对应着R G B三种颜色也就是说 Img 1 是红色分量图像 Img 2 是绿色分量图像 Img 3 是蓝色分量图像具体也可通过如下一段函数定义可以看出 img
zabbix使用手册

1 添加主机组将多个主机合并在一个逻辑组件内即为主机组分组的目的是将同一属性的主机归类方便以后管理例如以业务指标划分组以系统版本划分组以应用程序划分组等主机组中可以包含主机也可以包含模板进入zabbix管理界面单击配
手把手教你运行yolov6 （小白版教程）

一 yolov6的介绍二 yolov6的吐槽三 yolov6运行详解前言自己运行yolov6的完整教程一 yolov6的介绍我在此应用美团视觉部官方的说法叙述一下yolov6 YOLOv6 是美团视觉智能部研发的一款目标检测框架
【Linux】VMware安装unbuntu18.04虚拟机-超详细步骤(附镜像文件）

这次为大家带来的是在VMware创建的虚拟机上安装ubuntu18 04桌面版系统 ubuntu18 04也是目前比较流行的一个linux系统版本接下来就一起来实操吧文章目录一环境准备二创建虚拟机三安装虚拟机一环境准备
包、模块、函数

包模块函数一 while循环与使用场景 1 while循环 counter 1 while counter lt 10 counter 1 print counter else print EOF 运行结果 2 3 4 5 6 7 8
邮件发送原理和实现

邮件发送拓展 MIME 多用途互联网邮件扩展类型就是附件 1 准备工作获取QQ邮箱权限测试代码 package com jyw import com sun mail util MailSSLSocketFactory import
wifi名称可以有空格吗_是真的吗？WiFi名称后面带“5G”，网速会更快？

要想体验快到飞起的千兆网速感受全屋覆盖的满分信号移动全千兆你值得拥有千兆5G 无论是旅途中紧急处理工作文件图片秒传秒下还是在外时与家人视频问候无卡顿低延迟用千兆5G 网速始终快人一步千兆宽带品质生活从品质宽带开始用千
AcWing--756. 蛇形矩阵

输入两个整数 n 和 m 输出一个 n 行 m 列的矩阵将数字 1 到 n m 按照回字蛇形填充至矩阵中具体矩阵形式可参考样例输入格式输入共一行包含两个整数 n 和 m 输出格式输出满足要求的矩阵矩阵占 n 行每行包含 m
Linux——使用第三方库链接的方式——动态式

回顾上文 122条消息 Linux使用第三方库链接的使用方式静态式橙予清的zzz 的博客 CSDN博客https blog csdn net weixin 69283129 article details 131414804 spm 1
【qiankun】微前端在项目中的具体使用

1 安装qiankun npm install qiankun save 2 主应用中注册和配置qiankun 在主应用的入口文件main ts中引入qiankun的注册方法 import registerMicroApps start
java/php/net/python健身房管理系统设计

本系统带文档lw万字以上答辩PPT 查重如果这个题目不合适可以去我上传的资源里面找题目找不到的话评论留下题目或者站内私信我有时间看到机会给您发系统设计 4 1 系统体系结构健身房管理系统的结构图4 1所示
mysql localhost值_jdbc:mysql://localhost:3306/mysql这句话中localhost具体指什么的localhost？能修改么？在哪里配置的？...

展开全部 jdbc mysql 是指JDBC连接方式 localhost 是指你的本机地址 3306 SQL数据库的端口 jdbc 就是你要连接的32313133353236313431303231363533e59b9ee7ad94313
Mysql 8.0修改密码

1 mysql u root p 原来的密码进入数据库中 2 show databases 3 use mysql 4 使用下面的语句修改密码 ALTER USER root localhost IDENTIFIED WITH mysql
驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接

驱动程序无法通过使用安全套接字层 SSL 加密与 SQL Server 建立安全连接错误 The server selected protocol version TLS10 is not accepted by client prefe
STM32初始化结构体变量时成员排序的问题

平台 STM32F103RCT6 MDK 笔者在调试时发现结构体不同类型成员的定义顺序对于程序运行过程中的取值可能会产生很大的BUG 开始时定义输入参数结构体 typedef struct u8 TempRange 温度最大值 floa
日期格式‘YYYY-MM-DD’中的BUG

1 日期格式先来看一下日期格式主要有下面三种 US style Euro style RFC 3389 Layout Format string Example US style Dec 29 2019 MM DD YYYY 12 29
yolo格式数据转换为coco格式

只需要有图片和yolo格式的标签就可以转换为coco格式的标签第一步将yolo格式的标签 classId xCenter yCenter w h转换为coco格式 classId xMin yMim xMax yMax格式 coco的i

yolo格式数据转换为coco格式

yolo格式数据转换为coco格式 的相关文章

随机推荐

热门标签

yolo格式数据转换为coco格式的相关文章