【python】小目标检测中对一幅高分辨率图分块且改变目标bounding box的坐标

2023-11-04

很多时候，在小目标检测中，对于一副高分辨率图像，我们很难直接输入一整幅大图来进行目标检测，特别是对于one-stage的方法，如SSD的输入尺寸是300和512， YOLO的输入尺寸是416，而高分辨率图像通常有几千×几千像素。所以我在此分享将一副高分辨率图像分块同时写入对应目标的boundingbox改变后的坐标到xml文件中。

import torch
import pickle
import sys
import os
import cv2
import numpy as np
import os.path
import torch.utils.data as data
import torchvision.transforms as transforms
from PIL import Image
from xml.dom.minidom import Document
from tqdm import tqdm
if sys.version_info[0] ==2:
    import xml.etree.cElementTree as ET
else:
    import xml.etree.ElementTree as ET
origin_dir = '原图像存放地址'
target_dir1 = '分块图像存放地址'
annota_dir = '原boundingbox的xml文件存放地址'
target_dir2 = '分块boundingbox的xml文件存放地址'
def clip_img(No, oriname):
    from_name = os.path.join(origin_dir, oriname+'.jpg')
    img = cv2.imread(from_name)
    h_ori,w_ori, _ =img.shape#保存原图的大小
    img = cv2.resize(img, (2048, 2048))#可以resize也可以不resize，看情况而定
    h, w, _ = img.shape
    xml_name = os.path.join(annota_dir, oriname+'.xml')#读取每个原图像的xml文件
    xml_ori = ET.parse(xml_name).getroot()
    res = np.empty((0,5))#存放坐标的四个值和类别
    for obj in xml_ori.iter('object'):
        difficult = int(obj.find('difficult').text) == 1
        if difficult:
            continue
        name = obj.find('name').text.lower().strip()
        bbox = obj.find('bndbox')
        pts = ['xmin', 'ymin', 'xmax', 'ymax']
        bndbox = []
        for i, pt in enumerate(pts):
            cur_pt = int(bbox.find(pt).text) - 1
            cur_pt = int(cur_pt*h/h_ori) if i%2==1 else int(cur_pt * w / w_ori)
            bndbox.append(cur_pt)
        #label_idx = self.class_to_ind[name]
        bndbox.append(name)
        res = np.vstack((res, bndbox))
    i = 0
    win_size = 256#分块的大小
    stride = 128#重叠的大小，设置这个可以使分块有重叠
    for r in range(0, h - win_size, stride):
        for c in range(0, w - win_size, stride):
            flag = np.zeros([1,10])
            youwu = False
            xiefou = True
            tmp = img[r: r+win_size, c: c+win_size]
            for re in range(res.shape[0]):
                xmin,ymin,xmax,ymax,label = res[re]
                if int(xmin)>=c and int(xmax) <=c+win_size and int(ymin)>=r and int(ymax)<=r+win_size:
                    flag[0][re] = 1
                    youwu = True
                elif int(xmin)<c or int(xmax) >c+win_size or int(ymin) < r or int(ymax) > r+win_size:
                    pass
                else:
                    xiefou = False
                    break;
            if xiefou:#如果物体被分割了，则忽略不写入
                if youwu:#有物体则写入xml文件
                    doc = Document()
                    annotation = doc.createElement('annotation')
                    doc.appendChild(annotation)
                    for re in range(res.shape[0]):
                        xmin,ymin,xmax,ymax,label = res[re]
                        xmin=int(xmin)
                        ymin=int(ymin)
                        xmax=int(xmax)
                        ymax=int(ymax)
                        if flag[0][re] == 1:
                            xmin=str(xmin-c)
                            ymin=str(ymin-r)
                            xmax=str(xmax-c)
                            ymax=str(ymax-r)
                            object_charu = doc.createElement('object')
                            annotation.appendChild(object_charu)
                            name_charu = doc.createElement('name')
                            name_charu_text = doc.createTextNode(label)
                            name_charu.appendChild(name_charu_text)
                            object_charu.appendChild(name_charu)
                            dif = doc.createElement('difficult')
                            dif_text = doc.createTextNode('0')
                            dif.appendChild(dif_text)
                            object_charu.appendChild(dif)
                            bndbox = doc.createElement('bndbox')
                            object_charu.appendChild(bndbox)
                            xmin1 = doc.createElement('xmin')
                            xmin_text = doc.createTextNode(xmin)
                            xmin1.appendChild(xmin_text)
                            bndbox.appendChild(xmin1)
                            ymin1 = doc.createElement('ymin')
                            ymin_text = doc.createTextNode(ymin)
                            ymin1.appendChild(ymin_text)
                            bndbox.appendChild(ymin1)
                            xmax1 = doc.createElement('xmax')
                            xmax_text = doc.createTextNode(xmax)
                            xmax1.appendChild(xmax_text)
                            bndbox.appendChild(xmax1)
                            ymax1 = doc.createElement('ymax')
                            ymax_text = doc.createTextNode(ymax)
                            ymax1.appendChild(ymax_text)
                            bndbox.appendChild(ymax1)
                        else:
                            continue
                    xml_name = oriname+'_%3d.xml' % (i)
                    to_xml_name = os.path.join(target_dir2, xml_name)
                    with open(to_xml_name, 'wb+') as f:
                        f.write(doc.toprettyxml(indent="\t", encoding='utf-8'))
                    #name = '%02d_%02d_%02d_.bmp' % (No, int(r/win_size), int(c/win_size))
                    img_name = oriname+'_%3d.jpg' %(i)
                    to_name = os.path.join(target_dir1, img_name)
                    i = i+1
                    cv2.imwrite(to_name, tmp)
for No, name in tqdm(enumerate(os.listdir(origin_dir))):
    clip_img(No, name.rstrip('.jpg'))

这样就将一个大图分块且保存了坐标xml文件。
注意xml文件的key视情况而定，不是通用的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

小目标检测

bounding box

分块

【python】小目标检测中对一幅高分辨率图分块且改变目标bounding box的坐标的相关文章

如何在Python中选择要写入(.csv)的列

import csv f csv reader open lmt csv r open input file for reading Date Open Hihh mLow Close Volume zip f s plit it into
pandas Wide_to_long 后缀参数

我对在 pandas 中使用 Wide to long 时的参数有疑问有一个参数叫suffix我不明白在文档中它说后缀 str 默认 d 捕获所需后缀的正则表达式 d 捕获数字后缀没有数字的后缀可以用否定字符类 D 指定您还可以进
如何在 Google App Engine 的 Python 中获取 StringProperty 的值？

如何获取 nbd Model 的值我想返回由多个字段组成的描述但我无法让它工作这是我的班级代码 class User ndb Model name ndb StringProperty email ndb StringProperty
如何使用 Python 裁剪图像中的矩形

谁能给我关于如何裁剪两个矩形框并保存它的建议我已经尝试过这段代码但效果不佳 import cv2 import numpy as np Run the code with the image name keep pressing spa
Python 的 mysqldb 晦涩文档

Python 模块 mysqldb 中有许多转义函数我不理解它们的文档而且我努力查找它们也没有发现任何结果 gt gt gt print mysql escape doc escape obj dict escape any speci
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
如何在Python代码中查找列号

简短问题当按上述方式调用函数时我可以找到行号here https stackoverflow com questions 3056048 filename and line number of python script 同样如何找到
reStructuredText：README.rst 未在 PyPI 上解析

我有一个托管在 Github 和 PyPI 上的 Python 项目在 Github 上 https github com sloria TextBlob blob master README rst https github com s
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
Pandas groupby apply 执行缓慢

我正在开发一个涉及大量数据的程序我正在使用 python pandas 模块来查找数据中的错误这通常工作得非常快然而我当前编写的这段代码似乎比应有的速度慢得多我正在寻找一种方法来加快速度为了让你们正确测试它我上传了一段相当大的
pandas 中连续数据的平行坐标图

pandas 的 parallel coordinates 函数非常有用 import pandas import matplotlib pyplot as plt from pandas tools plotting import par
将列表中的 None 替换为最左边的非 none 值

Given a None 1 2 3 None 4 None None I d like a None 1 2 3 3 4 4 4 目前我已经用以下方法强制它 def replaceNoneWithLeftmost val last Non
Jupyter Notebook 中的深色模式绘图 - Python

我正在使用 Jupyter Notebook 目前正在使用 JupyterThemes 的深色日光主题我注意到我的绘图不是处于黑暗模式并且文本仍然是黑色并且在日光照射的背景上无法读取 JupyterThemes 的自述文件建议在 ipy
在seaborn中对箱线图x轴进行排序

我的数据框round data看起来像这样 error username task path 0 0 02 n49vq14uhvy93i5uw33tf7s1ei07vngozrzlsr6q6cnh8w 39 png 1 0 10 n49vq
Selenium 不会在新选项卡中打开新 URL（Python 和 Chrome）

我想使用 Selenium WebDriver 和 Python 在不同的选项卡中打开相当多的 URL 我不确定出了什么问题 driver webdriver Chrome driver get url1 time sleep 5 driv
线性同余生成器 - 如何选择种子和统计检验

我需要做一个线性同余生成器它将成功通过所选的统计测试我的问题是如何正确选择发电机的数字以及我应该选择哪些统计检验我想均匀性的卡方频率测试每代收集10 000个号码的方法将 0 1 细分为10个相等的细分柯尔莫哥洛夫斯米尔
在 Python 中访问 argparse 的参数值

我正在尝试为我的程序设置一些简单的标志参数但无法弄清楚如何访问它们我有 argparser parser argparse ArgumentParser description Simple PostScript Interpreter
沿轴 0 重复 scipy csr 稀疏矩阵

我想重复 scipy csr 稀疏矩阵的行但是当我尝试调用 numpy 的重复方法时它只是将稀疏矩阵视为对象并且只会将其作为 ndarray 中的对象重复我浏览了文档但找不到任何实用程序来重复 scipy csr 稀疏矩阵的行我
如何使用 Pandas Series 绘制两个不同长度/开始日期的时间序列？

我正在绘制每周总事件的几个熊猫系列对象系列中的数据events per week看起来像这样 Datetime 1995 10 09 45 1995 10 16 63 1995 10 23 83 1995 10 30 91 1995
如何使用 Python 3 正确显示倒计时日期

我正在尝试获取将显示的倒计时基本上就像一个世界末日时钟哈哈有人可以帮忙吗 import os import sys import time import datetime def timer endTime datetime datet

随机推荐

DocArray 0.20.0 发布！新增 Milvus 后端支持，更好地嵌套数据搜索，新增 RGB-D 格式的 3D 模型表示

DocArray 是一个用于处理传输和存储多模态数据的 Python 工具包 DocArray 提供便捷的多模态数据处理功能具备基于 Protobuf 提供高性能的网络传输性能同时也为多种向量存储方案提供统一的 API 接口 GitH
CTFShow-Web入门

目录爆破 web21 web22 web23 web24 web25 web26 web27 web28 爆破 web21 解题思路考察burp的intruder模块访问发现是前端验证随便输入账号密码抓包发现是Basic认证 Bas
【splishsplash】splishsplash入门使用

本文的目地为总结splishsplash的入门使用方法 splishsplash是一个C 开源流体引擎主要用于产生流体动画它的核心算法是SPH法资源汇总 github https github com InteractiveCompu
数据挖掘之关联规则挖掘的一些定义

一算法定义关联规则挖掘用于发现隐藏在大型数据集中的令人感兴趣的联系所发现的模式通常用关联规则或频繁项集的形式表示关联规则反映了一个事物与其他事物之间的相互依存性和关联性如果两个或多个事物之间存在一定的关联关系那么其中一个事物发
c++ STL map简介

首先头文件 include
深入JS内存模型

前言什么是JS的内存模型看过了很多资料都是千篇一律的栈内存堆内存基本数据类型存储在栈内存引用数据类型存储在堆内存等等之类的看过这些之后对于我们去理解整个JS内存之中复杂的关系本文会从JavaScript语法之中的各个语言特
DHCP攻击与防范实践

1 DHCP工作原理 DHCP客户端从服务端申请到IP地址等网络配置信息需要经过四个步骤每个步骤需要发送相应类型的数据报文如下图所示首先由客户端以广播方式发出 DHCP Discover 报文来寻找网络中的DHCP服务端当服务端接收
go localhost 的简单使用

首先在文件夹增加文件web go package main import net http func main http Handle http FileServer http Dir http ListenAndServe 8080 ni
DirectShow资源共享

前段时间为了公司内部培训写了两个DirectShow的PPT 共享如下 https skydrive live com cid 0E1C9F572B6A2D19 id E1C9F572B6A2D19 211790 另外我的几本书的源代码
VS2022 LNK1104无法打开文件“libboost_filesystem-vc143-mt-gd-x64-1_78.lib”

VS发布了最新版2022 刚好最近我要用到VS我就下载了最新版配置了一个PCL环境尝试运行一段代码结果报错找了半天问题才找到记录一下错误 LNK1104 无法打开文件 libboost filesystem vc143 mt g
qt5开发及实例_Qt 5.14版本正式发布(带下载链接)

摘录并翻译自Qt官网内容快来看看新版本更新了些什么东西吧我们今天 2019 12 12 发布了Qt 5 14 该版本以及明年的Qt 5 15 LTS开始为通向Qt 6铺平道路尽管我们正在努力通过标记不推荐使用的功能使将来尽可能平稳地移
git bash 不支持中文处理

1 打开git bash后对窗口右键 gt Options gt Text gt Locale改为zh CN Character set改为UTF 8 关闭git bash 再打开可以显示中文了 2 如果前一种方法不行则在git ba
解决org.springframework.amqp.AmqpException: No method found for class [B

spring boot在集成rabbitmq时如果使用 amqp client 发送消息 RabbitListener会一直循环报错 org springframework amqp rabbit listener exception L
为何学linux及用处

目前企业使用的操作系统无非就是国产类的 windows和linux类我们要提升自己的技能需要学习这两款我记得在大学时期学习过windows以及linux 但当时觉得又不常用就学的模棱两可毕业之后你会发现其实这两种操作系统是很
nginx热部署的原理：nginx -s reload

我们执行这条命令的原因是希望 nginx 不停止服务始终在处理新的请求的同时把 nginx 的配置文件平滑的把旧的 nginx conf 配置更新为新的 nginx conf 配置这样一个功能对于 nginx 非常有必要但是有时候我们会
几本适合嵌入式软件工程师阅读的电子入门书

导读周末了下面这些书是我作为一个计算机科学与技术出身的嵌入式软件工程师出于自身的兴趣爱好且为了更好和硬件工程师们协作从自身的角度出发而搜集到的信息仅供参考不构成专业建议同时也希望有经验的嵌入式硬件工程师能给我和其他对
mysql的replace字符串的替换

PLACE str from str to str 例 REPLACE 4 568 23 把逗号改为空结果为 4568 23
mysql查看执行计划EXPLAIN

一 EXPLAIN语法语法 EXPLAIN SELECT 1 EXPLAIN EXTENDED SELECT 将执行计划反编译成SELECT语句运行SHOW WARNINGS 可得到被MySQL优化器优化后的查询语句 2 EXPLA
运用自回归滑动平均模型、灰色预测模型、BP神经网络三种模型分别预测全球平均气温，并进行预测精度对比（附代码、数据）

大家好我是带我去滑雪每天教你一个小技巧全球变暖是近十年来人们关注度最高的话题 2022年夏天蔓延全球40 以上的极端天气不断刷新人们对于高温的认知人们再也不会像从前那样认为全球变暖离我们遥不可及在此背景下基于1880年 20
【python】小目标检测中对一幅高分辨率图分块且改变目标bounding box的坐标

很多时候在小目标检测中对于一副高分辨率图像我们很难直接输入一整幅大图来进行目标检测特别是对于one stage的方法如SSD的输入尺寸是300和512 YOLO的输入尺寸是416 而高分辨率图像通常有几千几千像素所以我在此分享

【python】小目标检测中对一幅高分辨率图分块且改变目标bounding box的坐标

【python】小目标检测中对一幅高分辨率图分块且改变目标bounding box的坐标 的相关文章

随机推荐

热门标签

【python】小目标检测中对一幅高分辨率图分块且改变目标bounding box的坐标的相关文章