目标检测可视化gt

2023-11-13

xml格式可视化

这里分了两类

（1）目标被标注为正矩形，即（xmin，ymin），（xmax，ymax)，一般的voc数据类型都是这种标注形式

（2）目标被标注为具有一定旋转角度的矩形，即（x1，y1），（x2，y2），（x3，y3），（x4，y4），DOTA数据集就是这样的标注形式

import cv2 
import os
import numpy as np
import xml.dom.minidom
from xml.dom.minidom import Document

import sys  
stdi, stdo, stde = sys.stdin, sys.stdout, sys.stderr
reload(sys)
sys.setdefaultencoding('utf-8')
sys.stdin, sys.stdout, sys.stderr = stdi, stdo, stde


def custombasename(fullname):  
    return os.path.basename(os.path.splitext(fullname)[0])  
  
def GetFileFromThisRootDir(dir,ext = None):  
  allfiles = []  
  needExtFilter = (ext != None)  
  for root,dirs,files in os.walk(dir):  
    for filespath in files:  
      filepath = os.path.join(root, filespath)  
      extension = os.path.splitext(filepath)[1][1:]  
      if needExtFilter and extension in ext:  
        allfiles.append(filepath)  
      elif not needExtFilter:  
        allfiles.append(filepath)  
  return allfiles  


def readXml(xmlfile, hbb = True):
    DomTree = xml.dom.minidom.parse(xmlfile)  
    annotation = DomTree.documentElement  
    imgnamelist = annotation.getElementsByTagName('filename')  
    img_name = imgnamelist[0].childNodes[0].data #图片的名称
    
    sizelist = annotation.getElementsByTagName('size') #[<DOM Element: filename at 0x381f788>]  
    heights = sizelist[0].getElementsByTagName('height')
    height = int(heights[0].childNodes[0].data)
    widths =sizelist[0].getElementsByTagName('width')
    width = int(widths[0].childNodes[0].data)
    depths = sizelist[0].getElementsByTagName('depth')
    depth = int(depths[0].childNodes[0].data)
    objectlist = annotation.getElementsByTagName('object')        
    bboxes = []
    for objects in objectlist:  
        namelist = objects.getElementsByTagName('name')  
        class_label = namelist[0].childNodes[0].data  
        bndbox = objects.getElementsByTagName('bndbox')[0]  
        
        if hbb:
            xmin_list = bndbox.getElementsByTagName('xmin')  
            xmin = int(float(xmin_list[0].childNodes[0].data))  
            ymin_list = bndbox.getElementsByTagName('ymin') 
            ymin = int(float(ymin_list[0].childNodes[0].data)) 
               
            xmax_list = bndbox.getElementsByTagName('xmax')  
            xmax = int(float(xmax_list[0].childNodes[0].data))  
            ymax_list = bndbox.getElementsByTagName('ymax') 
            ymax = int(float(ymax_list[0].childNodes[0].data)) 
            
            bbox = [xmin, ymin, xmax, ymax,class_label]
            bboxes.append(bbox)
        else:            
            x0_list = bndbox.getElementsByTagName('x0')  
            x0 = int(float(x0_list[0].childNodes[0].data))  
            y0_list = bndbox.getElementsByTagName('y0') 
            y0 = int(float(y0_list[0].childNodes[0].data)) 
                   
            x1_list = bndbox.getElementsByTagName('x1')  
            x1 = int(float(x1_list[0].childNodes[0].data))  
            y1_list = bndbox.getElementsByTagName('y1') 
            y1 = int(float(y1_list[0].childNodes[0].data)) 
    
            x2_list = bndbox.getElementsByTagName('x2')  
            x2 = int(float(x2_list[0].childNodes[0].data))  
            y2_list = bndbox.getElementsByTagName('y2')  
            y2 = int(float(y2_list[0].childNodes[0].data))
            
            x3_list = bndbox.getElementsByTagName('x3')  
            x3 = int(float(x3_list[0].childNodes[0].data))  
            y3_list = bndbox.getElementsByTagName('y3')  
            y3 = int(float(y3_list[0].childNodes[0].data))

            bbox = [x0,y0,x1,y1,x2,y2,x3,y3,class_label]
            bboxes.append(bbox)
    return bboxes,width,height,depth,img_name
    
    
def visualise_gt(label_path, pic_path, newpic_path, hbb = True):
    results =  GetFileFromThisRootDir(label_path)
    font = cv2.FONT_HERSHEY_SIMPLEX                    #字体
    for result in results:
        [boxes, w, h, d, imgname] = readXml(result, hbb)
        filepath=os.path.join(pic_path, imgname)
        im=cv2.imread(filepath)

        for i in range(len(boxes)):
            if hbb:         
                cv2.rectangle(im,(boxes[i][0],boxes[i][1]),(boxes[i][2],boxes[i][3]), (0,255,255), 2)
            else:
                box =np.array( [[boxes[i][0],boxes[i][1]],[boxes[i][2],boxes[i][3]], \
                                [boxes[i][4],boxes[i][5]],[boxes[i][6],boxes[i][7]]],np.int32)
                cv2.polylines(im,[box], True, (0,255,255),2) #true表示闭合
            #书写标签 
            cv2.rectangle(im, (boxes[i][0], boxes[i][1]-15), (boxes[i][0] +65 ,boxes[i][1] -2), (255, 0, 0), thickness=-1) # thickness表示线的粗细，等于-1表示填充，颜色为(255, 0, 0)
            cv2.putText(im, boxes[i][-1], (boxes[i][0], boxes[i][1]-2), font, 0.7, (255, 255, 255), 1) #0.5是字体大小，2是字体的粗细
        
        cv2.imwrite(os.path.join(newpic_path,imgname),im)
        print('已完成',result)

if __name__ == '__main__':
    root='/home/yantianwang/clone/haha'
    pic_path = os.path.join(root, 'images') #样本图片路径
    label_path = os.path.join(root, 'xml') #xml文件所在路径    
    newpic_path=os.path.join(root,'visgt')    #可视化结果的保存路径
    if not os.path.isdir(newpic_path):
        os.makedirs(newpic_path)
    visualise_gt(label_path, pic_path, newpic_path, hbb = True)  #默认是hbb

可视化结果：

DOTA数据格式可视化

import cv2 
import os
import numpy as np


thr=0.95
def custombasename(fullname):  
    return os.path.basename(os.path.splitext(fullname)[0])  
  
def GetFileFromThisRootDir(dir,ext = None):  
  allfiles = []  
  needExtFilter = (ext != None)  
  for root,dirs,files in os.walk(dir):  
    for filespath in files:  
      filepath = os.path.join(root, filespath)  
      extension = os.path.splitext(filepath)[1][1:]  
      if needExtFilter and extension in ext:  
        allfiles.append(filepath)  
      elif not needExtFilter:  
        allfiles.append(filepath)  
  return allfiles  

def visualise_gt(label_path, pic_path, newpic_path):
    results =  GetFileFromThisRootDir(label_path)
    for result in results:
        f = open(result,'r')
        lines = f.readlines()
        if len(lines)==0:  #如果为空
            print('文件为空',result)
            continue
        boxes = []
        for i,line in enumerate(lines):
            #score = float(line.strip().split(' ')[8])
            if i in [0,1]:   #前两行不需要
                continue
            name = result.split('/')[-1]
            box=line.strip().split(' ')[0:8]
            box = np.array(box,dtype = np.float)
            #if float(score)>thr:
            boxes.append(box)
        boxes = np.array(boxes,np.float)
        f.close()   
        filepath=os.path.join(pic_path, name.split('.')[0]+'.tif')
        im=cv2.imread(filepath)
        #print line3
        for i in range(boxes.shape[0]):
            box =np.array( [[boxes[i][0],boxes[i][1]],[boxes[i][2],boxes[i][3]], \
                            [boxes[i][4],boxes[i][5]],[boxes[i][6],boxes[i][7]]],np.int32)
            box = box.reshape((-1,1,2))
            cv2.polylines(im,[box],True,(0,255,255),2)
        cv2.imwrite(os.path.join(newpic_path,result.split('/')[-1].split('.')[0]+'.tif'),im)
        #下面是有score的        
        #        x,y,w,h,score=box.split('_')#
        #        score=float(score)
        #        cv2.rectangle(im,(int(x),int(y)),(int(x)+int(w),int(y)+int(h)),(0,0,255),1)
        #        cv2.putText(im,'%3f'%score, (int(x)+int(w),int(y)+int(h)+5),cv2.FONT_HERSHEY_SIMPLEX,0.5,(0,255,0),1)
        #        cv2.imwrite(newpic_path+filename,im)

if __name__ == '__main__':
    root='/home/yantianwang/lala/ship/train/'
    pic_path = os.path.join(root, 'images') #样本图片路径
    label_path = os.path.join(root, 'labelTxt') #DOTA标签的所在路径    
    newpic_path=os.path.join(root,'hbbshow')   #可视化保存路径
    if not os.path.isdir(newpic_path):
        os.makedirs(newpic_path)
    visualise_gt(label_path, pic_path, newpic_path)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

可视化

opencv

目标检测可视化gt 的相关文章

Matlab 中 interp2 的类似 OpenCV Api

有没有类似的功能其工作原理与 interp2 x y frame z xd yd linear 0 在 OpenCV 中功能cv remap 几乎可以满足您的要求请参阅文档here http docs opencv org modul
为 Visual Studio 安装 openCV 2.4 for C/C++

我一整天都在尝试在 Windows 7 上的 C C 上安装 Visual Studio 2010 的 OpenCV 版本 2 4 1 和 2 4 2 我一直在关注这个教程 http docs opencv org trunk doc tu
Python 函数前的星号[重复]

这个问题在这里已经有答案了我正在关注这个教程 http www pyimagesearch com 2015 04 20 sorting contours using python and opencv comment 405768 ht
C++ OpenCV imread 无法在 Android 中工作

我正在尝试读取 C 代码中的图像 LOGD Loading image s n inFile c str Mat img imread inFile CV LOAD IMAGE GRAYSCALE CV Assert img data 0
屏幕截图中低分辨率文本的 OCR

我正在编写一个 OCR 应用程序来从屏幕截图图像中读取字符目前我只关注数字我的方法部分基于这篇博文 http blog damiles com 2008 11 basic ocr in opencv http blog damiles
编译使用Basler相机的程序

我正在尝试使用 Basler 相机捕获图像的 C 程序来工作我拿到来自制造商的代码它应该非常容易使用但是链接它有成为一场噩梦我的 C 时代已经过去了最近只使用 Matlab 所以我可能会犯一些愚蠢的错误但请赐教代码如下
opencv 视频上的颜色阈值

I am thresholding for a color range in an opencv video The goal is to seperate the B mode black and white information on
bitblt 在 Windows 10 版本 1703 上失败 (15063.138)

使用 Visual Studio 2017 vc141 以下代码应该从前游戏窗口获取屏幕截图但现在它返回黑色和空白图像唯一的游戏问题尝试过 OpenGL 和 Vulkan ogl 返回黑色 vulkan 返回白色在升级到 Windo
CvMat 和 Imread 与 IpImage 和 CvLoadImage

使用 OpenCv 2 4 我有两个选项来加载图像 1 CvMat and Imread 2 IpImage and CvLoadImage 使用哪一个更好我尝试将两者混合并最终出现段错误 imread返回一个Mat not CvMat
为什么这些双精度数的返回值为-1.#IND？

I have double score cvMatchContourTrees CT1 CT2 CV CONTOUR TREES MATCH I1 0 0 cout lt
brew 链接 jpeg 问题

我正在尝试安装opencv在 Mac OSX Lion 上 brew install opencv 我收到以下错误以及其他一些类似的错误 Error The linking step did not complete successful
如何在给定目标大小的情况下在 python 中调整图像大小，同时保留纵横比？

首先我觉得这是一个愚蠢的问题对此感到抱歉目前我发现计算最佳缩放因子目标像素数的最佳宽度和高度同时保留纵横比的最准确方法是迭代并选择最佳缩放因子但是必须有更好的方法来做到这一点一个例子 import cv2 numpy as
我是否必须使用我的数据库训练 Viola-Jones 算法才能获得准确的结果？

我尝试提取面部数据库的面部特征但我认识到 Viola Jones 算法在两种情况下效果不佳当我尝试单独检测眼睛时当我尝试检测嘴巴时运作不佳检测图像的不同部分例如眼睛或嘴巴或者有时会检测到其中几个这是不可能的情况我使用的图像
如何计算图像中的 RGB 或 HSV 通道组合？

我使用 python opencv 加载形状为 30 100 3 的图像现在想要按颜色计算所有颜色的频率我不是指单个通道而是指通道组合含义 3 个频道列表例如 255 0 0 表示红色 255 255 0 表示黄色 100 100
在 QtCreator 中将 OpenCV 2.3 与 Qt 结合使用

随着 OpenCV 2 3 版本终于发布我想在我的系统上编译并安装这个最新版本由于我经常使用 Qt 和 QtCreator 我当然希望能够在我的 Qt 项目中使用它我已经尝试了几种方法几个小时但总是出现错误第一次尝试使用WITH
我可以使用 openCV 比较两张不同图像上的两张脸吗？

我对 openCV 很陌生我看到它可以计算出脸部并返回一个矩形来指示脸部我想知道 openCV 是否可以访问两张包含一张脸的图像并且我希望 openCV 返回这两个人是否相同的可能性 Thanks OpenCV 不提供完整的人脸识别引
如何在 OpenCV 中从 YUV 文件读取帧？

如何在 OpenCV 中从 YUV 文件读取帧我编写了一个非常简单的 python 代码来从二进制文件读取 YUV NV21 流 import cv2 import numpy as np class VideoCaptureYUV de
使用 ffmpeg 或 OpenCV 处理原始图像

看完之后维基百科页面 http en wikipedia org wiki Raw image format原始图像格式是任何图像的数字负片为了查看或打印相机图像传感器的输出具有进行处理即转换为照片渲染场景然后以标准光栅图形格
OpenCV 2.3 与 VS 2008 - 鼠标事件

强制性我是新手有一份涉及编程的工作并且我一边工作一边自学不用说作为一名老师我经常犯彻底的错误我现在所处的位置我创建了 Graph 类它令人惊讶的是制作了图表但现在我想通过单击鼠标来修改图形但我似乎无法让鼠标处理程序
OpenCV IP 相机应用程序崩溃 [h264 @ 0xxxxx] 访问单元中缺少图片

我在 cpp 中有一个 opencv 应用程序它使用 opencv 的简单结构捕获视频流并将其保存到视频文件中它与我的网络摄像头完美配合但是当我运行它从 IP 摄像机捕获流时它可能会在大约十秒后崩溃我的编译命令是 g O3 IP

随机推荐

SAP HANA Studio管理工具管理视图

本文主要介绍SAP HANA Studio管理工具管理视图相关操作步骤方法以及使用说明文档原文地址 SAP HANA Studio管理工具管理视图
插值算法 —— Lerp, NLerp, SLerp

一 Lerp Linear interpolation 线性插值记为 L e r p v 0
cuobjdump的使用

n n desktop nvcc stack overflow cu n n desktop cuobjdump sass a out Fatbin elf code arch sm 20 code version 1 7 producer
聊一聊DDR3中的ODT（On-die termination）

聊一聊DDR3中的ODT On die termination
实现提示框可拖拽（针对antd vue中的a-modal提示框）

在 utils 中新建 directives js 文件 import Vue from vue v drag modal 弹窗拖拽 Vue directive drag modal el bindings vnode gt Vue nex
Nakagami-m 信道

Nakagami m 分布是日本学者Nakagami 在1960年的一篇论文中提出的快衰落模型 Nakagami m 的表达式我们遵照参考文献 1 的说法1 假设接收信号表示如下 r n g
Pytorch — LSTM (nn.LSTM & nn.LSTMCell)

nn LSTM 在LSTM中 c和h的size是一样的 torch nn LSTM 参数 input size hidden size num layers bias batch first dropout bidirectional 输入
OpenGL ES着色器语言之变量和数据类型和着色器流程

感谢原创转至 http www cnblogs com yiyezhai archive 2012 09 21 2697461 html http blog csdn net kesalin article details 8223649
C++ 设计技巧 Pimpl模式

什么是Pimpl Pimpl Pointer to implementation 是一种隐藏实现的小技巧尤其是我们在对外提供API时通常需要将头文件给出这样很明显的将头文件中的私有成员暴漏给外部另外Pimpl还可以少代码依赖和编译时
uniapp写小程序，在一个方法内调用另外一个函数总是告诉我undefined ?如何解决？

说一下情景写的一个小程序商城项目购物车界面为 tabBar中的一项在删除购物车中的一项之后 Delete 函数进行页面刷新页面的刷新一般的做法在非tabBar界面中通过redirectTo重新定向到本页面也可以达到数据的刷
1.一个人赶着鸭子去每个村庄卖，每经过一个村子卖去所赶鸭子的一半又一只。这样他经过了七个村子后还剩两只鸭子，问他出发时共赶多少只鸭子？经过每个村子卖出多少只鸭子？2.角谷定理。

递归程序设计题目分析 1 一个人赶着鸭子去每个村庄卖每经过一个村子卖去所赶鸭子的一半又一只这样他经过了七个村子后还剩两只鸭子问他出发时共赶多少只鸭子经过每个村子卖出多少只鸭子递归出口经过的村子数为0 递归体剩余的鸭子数目加以
quartz的分布式调度

https segmentfault com a 1190000015492260 quartz 数据库表含义解释彻底拆分一切可控 CSDN博客 Spring整合Quartz分布式调度 Java烂猪皮 CSDN博客 java quart
点积、内积、外积、叉积、张量积——概念区分

找张量积概念的时候被各种野路子博客引入的各种积搞混了下面仅以Wikipedia为标准记录各种积的概念点积 Dot product https en wikipedia org wiki Dot product 在数学中点积 Do
【linux】常用shell指令 [不断补充中...]

前言 shell是一种脚本语言需要有编译器执行即应用程序 gt shell gt 操作系统 gt 硬件 bash是linux下默认的shell sh是unix下默认的shell 多命令执行 xx xx 前面执行成功才会执行后面的命令
springboot怎么使用

Spring Boot是一个用于快速构建企业级应用程序的框架提供了许多方便使用的功能使用Spring Boot需要具备一定的Java编程基础以下是使用Spring Boot的一般步骤安装Java开发环境和任意一个IDE 如Intel
VUE实现token登录验证

实现这个登录功能的过程真是一波三折中途出现了bug 整了两三天才解决了问题心力交瘁简直一个头两个大感觉自己的毅力和耐心又提升了一个层次ORZ 好在最终在同学的帮助下解决了bug 不过我又再次感受到了作为一个菜鸟的浅薄大佬的问题屡次
Ubuntu与Windows下的Firefox账号不能同步解决方式【内附Ubuntu桌面图标制作方法】

Ubuntu下的Firefox是国际版属于全球服务而Windows下的Firefox是本地服务的两个系统下默认的存储服务器不是一个无法同步解决办法卸载掉Ubuntu系统下原来的Firefox 安装Firefox中国版安装方法
Mac如何找到从AppStore下载的正版Xcode安装包

前言本文介绍在Mac下如何找到AppStore下载的安装包路径以及如何提取出来供以后使用希望对大家有所帮助前提想要提取某个安装包前提是你正在从AppStore安装这个程序比如你想提取imovie的安装包前提是你必须正在从Ap
Cocos2d-x JSB 自动绑定bindings-generator (以下简称B-G) 使用心得

文章转载自 http www cocoachina com bbs read php tid 177904 B G 是什么当使用JSB的时候如果你想要使用的C 的类或者方法没有在已有JSB中被绑定这时候就可以使用B G 它可以生成相
目标检测可视化gt

xml格式可视化这里分了两类 1 目标被标注为正矩形即 xmin ymin xmax ymax 一般的voc数据类型都是这种标注形式 2 目标被标注为具有一定旋转角度的矩形即 x1 y1 x2 y2 x3 y3 x4 y4 DOTA数

目标检测可视化gt

xml格式可视化

DOTA数据格式可视化

目标检测可视化gt 的相关文章

随机推荐

热门标签