如何将 [xmin ymin xmax ymax] 形式转换为图像中标准化的 [x y width height]？

2023-12-02

我正在与 Microsoft 一起构建自定义视觉应用程序定制视觉.ai.

我在用本教程.

当您在对象检测项目中标记图像时，您需要使用标准化坐标指定每个标记对象的区域。

我有一个 XML 文件，其中包含有关图像的注释，例如命名的sample_1.jpg:

<annotation>
        <filename>sample_1.jpg</filename>
    <size>
        <width>410</width>
        <height>400</height>
        <depth>3</depth>
    </size>
    <object>
        <bndbox>
            <xmin>159</xmin>
            <ymin>15</ymin>
            <xmax>396</xmax>
            <ymax>302</ymax>
        </bndbox>
    </object>
</annotation>

我必须根据提供的教程将边界框坐标从 xmin,xmax,ymin,ymax 转换为标准化的 x,y,w,h 坐标。

谁能给我一个转换函数吗？

假设 x/ymin 和 x/ymax 分别是你的边界角，左上角和右下角。然后：

x = xmin
y = ymin
w = xmax - xmin
h = ymax - ymin

然后，您需要对它们进行标准化，这意味着将它们作为整个图像的比例，因此简单地将每个值除以上面值中各自的大小：

x = xmin / width
y = ymin / height
w = (xmax - xmin) / width
h = (ymax - ymin) / height

这假设原点是左上角，如果不是这种情况，您将必须应用移位因子。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

objectdetection

microsoftcustomvision

如何将 [xmin ymin xmax ymax] 形式转换为图像中标准化的 [x y width height]？的相关文章

Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
填充两个函数之间的区域

import matplotlib pyplot as plt import numpy as np def domain x np arange 0 10 0 001 f1 lambda x 2 x x 2 0 5 plt plot x
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
从 python 发起 SSH 隧道时出现问题

目标是在卫星服务器和集中式注册数据库之间建立 n 个 ssh 隧道我已经在我的服务器之间设置了公钥身份验证因此它们只需直接登录而无需密码提示怎么办我试过帕拉米科它看起来不错但仅仅建立一个基本的隧道就变得相当复杂尽管代码示例将受
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
从 Twitter API 2.0 获取 user.fields 时出现问题

我想从 Twitter API 2 0 端点加载推文并尝试获取标准字段作者文本和一些扩展字段尤其是用户字段端点和参数的定义工作没有错误在生成的 json 中我只找到标准字段但没有找到所需的 user fields 用户

随机推荐

计算 Eloquent 中两条记录之间的值差异

我想用雄辩的方式计算两条记录之间的差异例如我有下表 Id value type 1 100 FOO 2 500 FOO 3 800 FOO 4 200 BAR 5 600 BAR 6 1000 FOO
用 Swift 修改数组中的对象？

我有数组 var arrDicContact udContact valueForKey arrDicContact as NSDictionary 我想更改数组中的一个联系人 for let dicx NSDictionary in ar
SPRequestContext缓存SPSites导致的RPC_E_ATTEMPTED_MULTITHREAD错误的解决方案？

我正在为 SharePoint 2007 开发一个解决方案并且经常使用 SPSecurity RunWithElevatedPrivileges 并传入 SystemAccount 的 UserToken 看完之后http hristop
如何使用 WCF Ria 服务跟踪实体更改？

我需要将对客户端上发生的实体所做的更改记录到数据库表中但是当我进行更改并检查 ChangeTracker 属性时它声称没有发生任何更改服务 private static readonly ISomeDao someDao DataA
如何生成所需的 SQL 语句来更新、插入、删除 GridView 中的数据？

我在用着GridView随着SqlDataSource for 选择 updating and deleting and DetailsView for 插入问题是当我单击这些按钮之一时我收到此错误Delete订单和同样的错误Ins
如何根据第一个下拉列表的选择来过滤第二个下拉列表？ - 角

我有两个如下所示的下拉菜单所以我的计划是加载所有子类别但我想在下拉列表中仅显示与所选类别相关的子类别包含 ParentId 作为所选类别 ID 的子类别这是我的代码 div class form group div
如何使用 Web API 处理 JSON？ [复制]

这个问题在这里已经有答案了可能的重复 JSONP 与 MVC 4 WebApi 我的 WebAPI 有一个 get 方法如下所示 private T Get
LINQ 到 SQL 外部映射

我不知道如何为 LINQ to SQL 设置外部映射文件我读过 Ivan Latunov 的博客文章这引起了我对它的兴趣问题是我不明白事情应该如何发展主要问题是如果我只想修改 xml 映射文件操作方法是什么我是否首先创建 db
更新 EF4 实体上的单个属性，而无需隐藏字段

我正在使用 EF4 Db First 并且我有一个具有许多不可为空属性的实体在编辑表单 Razor MVC3 中我希望仅允许编辑其中一个属性而不允许编辑其他属性为了让它发挥作用我必须把 Html HiddenFor 我的每个其他属
使用 par 设置 png 绘图设备的绘图边距

我创建了巴西的分区统计图将绘图保存为 png 时绘图的上部和下部会丢失被覆盖这是保存情节的线条 plot new par omi c 0 0 0 0 mgp c 0 0 0 mar c 0 0 0 0 family D par mf
在滚动导航栏中显示动画

您好我正在尝试实现此导航栏效果 http kettlenyc com 这样当我向下滚动时导航栏就会跟随并动画到固定位置我已经开始在这里编写代码但无法让动画工作 http theturning co uk NOAH 我的 Jquery
SAS 中合并的工作（使用 IN=）

我有两个dataset数据1和数据2 data data1 input sn id datalines 1 a 2 a 3 a run data data2 input id sales x datalines a 10 x a 20 y
我怎样才能在Android中解析这个JSON？

我想拉出用户封锁 JSON结果总是会改变有时会返回4个用户有时会返回10个等 results user avatar url thumb http avatars stocktwits com production 9998 thumb
Bash 从文件读取并存储到 MATLAB 中的变量

我正在尝试从 Bash 中一个非常简单的 1 行文件中读取 2 个浮点数我想将这两个数字存储到变量中我从谷歌搜索中看到的所有例子都是这样的 while read VAR1 VAR2 do
使用 Python 从仅包含基本名称的 tarfile 中提取文件

我有一个 tafile 其中包含具有完整路径 home usr path to file 的文件当我将文件提取到当前文件夹时它会递归地创建完整路径有没有一种方法可以仅使用基本名称来提取文件 Use TarFile extractfil
ArrayList 与数组和列表的比较

我已经编程了相当多的时间最近开始学习更多纯粹的计算机科学主题用于工作面试我知道数组和 LinkedList 数据结构之间的区别但现在我已经开始使用 Java 我看到了这个 ArrayList 但我很难概念化它网络搜索只真正向我展示
类型错误：在 python 中调用多重处理时，“元组”对象不可调用

我正在尝试使用多处理和队列执行以下脚本 from googlefinance import getQuotes from yahoo finance import Share import multiprocessing class Sto
使用 exe pyinstaller 包含一个 json 文件

我一直在读pyinstaller 的文档用了几个小时我无法理解如何使用该选项 resource RESOURCE It says r RESOURCE resource RESOURCE 将资源添加或更新到 Windows 可执行文件这
Kotlin 调试无法在 Visual Studio 代码中启动

我是 Kotlin 编程语言的新手所以我已经下载了一些扩展例如 Kotlin Kotlin 语言 Kotlin Formatter 当我按 F5 时它给出了一个错误只是一个重要的问题那就是我应该使用另一个像 intellij
如何将 [xmin ymin xmax ymax] 形式转换为图像中标准化的 [x y width height]？

我正在与 Microsoft 一起构建自定义视觉应用程序定制视觉 ai 我在用本教程当您在对象检测项目中标记图像时您需要使用标准化坐标指定每个标记对象的区域我有一个 XML 文件其中包含有关图像的注释例如命名的sample 1 j

如何将 [xmin ymin xmax ymax] 形式转换为图像中标准化的 [x y width height]？

如何将 [xmin ymin xmax ymax] 形式转换为图像中标准化的 [x y width height]？ 的相关文章

随机推荐

热门标签

如何将 [xmin ymin xmax ymax] 形式转换为图像中标准化的 [x y width height]？的相关文章