yolo算法的坐标输出代表什么？

2024-02-27

我的问题与这个主题类似。当我开始思考 yolo 算法的输出时，我正在观看 Andrew Ng 的关于边界框预测的讲座。让我们考虑这个例子，我们使用 19x19 网格和只有一个具有 2 个类的感受野，所以我们的输出将是 => 19x19x1x5。最后一个维度（大小为 5 的数组）表示以下内容：

1) The class (0 or 1)  
2) X-coordinate  
3) Y-coordinate  
4) height of the bounding box  
5) Width of the bounding box

我不明白 X,Y 坐标是否代表相对于整个图像大小的边界框或仅代表感受野（滤波器）。在视频中，边界框被表示为感受野的一部分，但逻辑上感受野比边界框小得多，而且人们可能会修改过滤器的大小，因此相对于过滤器定位边界框是没有意义的。

那么，图像边界框的坐标基本上代表什么？

From 了解 YOLO https://hackernoon.com/understanding-yolo-f5a74bbc7967发帖@黑客中午：

每个网格单元预测 B 边界框以及 C 类概率。边界框预测有 5 个组成部分：（x、y、w、 h，信心）. The (x, y)坐标表示中心框，相对于网格单元位置（请记住，如果中心盒子的does not落在网格单元内，而不是该单元格对此负责）。这些坐标被标准化为介于 0 和 1。(w, h)盒子尺寸也标准化为 [0, 1]，相对于图像大小。让我们看一个例子：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

yolo算法的坐标输出代表什么？的相关文章

Google Cloud ML：输出的外部尺寸必须未知

我们在本地得到了一个工作的导出模型正在创建一个新的模型版本谷歌云机器学习如下 Create Version failed Model validation failed Outer dimension for outputs must b
如何制作 U 矩阵？

为了可视化一个 U 矩阵到底是如何构建的自组织映射 http en wikipedia org wiki Self organizing map 更具体地说假设我有一个 3x3 节点的输出网格已经经过训练我如何从中构造一个 U 矩阵
Scikit-learn 具有使用“特征”的自定义评分函数

我正在尝试使用一种名为 SERA 平方误差相关区域的新指标作为本文中提到的不平衡回归的自定义评分函数 https link springer com article 10 1007 s10994 020 05900 9 https lin
从 keras 模型中将特征提取到数据集中

我使用以下代码由here https github com keras team keras blob master examples mnist cnn py 运行 CNN 来训练 MNIST 图像 from future import
opencv createsamples没有错误，但是没有找到样本

我在用着this http coding robin de 2013 07 22 train your own opencv haar classifier html教程我正在根据我的正面图像创建大量样本我正在使用 Windows 这是
TensorFlow - 为什么这个 softmax 回归没有学到任何东西？

我的目标是用 TensorFlow 做大事但我正在尝试从小事做起我有一些小的灰度方块有一点噪音我想根据它们的颜色对它们进行分类例如 3 个类别黑色灰色白色我编写了一个小 Python 类来生成正方形和 1 hot 向量并
当我想在电脑中加载该模型时，我可以在 colab bu 中加载我的深度模型，但我不能

我在colab中通过keras 2 3 1和tensorflow 2 1 0训练了一个深度模型我用JSON和Keras保存了我的模型 saveWeightPath content drive My Drive model info mod
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
ValueError：“连接”层需要具有匹配形状的输入（连接轴除外）

我正在尝试为我的项目构建 Pix2Pix 并收到错误值错误 Concatenate层需要具有匹配形状的输入除了连接轴之外获得输入形状 None 64 64 128 None 63 63 128 生成器是一个 U 网模型我的输入高度
在tensorflow .ckpt文件中使用预训练模型

我有一个 ckpt 文件我只想得到 cnn 的权重我已经从 ckpt 检查点文件中进行了训练 inception resnet v2 2016 08 30 import tensorflow as tf saver tf train S
如何在 Caffe 的网络中出现多次损失？

如果我在网络中定义多个损失层从这些末端到网络的开头是否会发生多个反向传播我的意思是他们真的是这样工作的吗假设我有这样的事情 Layer1 Layer2 Layer n Layer cls1 bottom layer n top cl
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
如何组织循环神经网络？

我想模拟以下内容 y t F x t 1 x t 2 x t k 或者说一个函数其当前输出取决于最后 k 个输入 1 我知道一种方法是使用一个经典的神经网络其中 k 个输入为 x t 1 x t 2 x t k 对于每个y t 并训练它
mlflow 如何使用自定义转换器保存 sklearn 管道？

我正在尝试使用 mlflow 保存 sklearn 机器学习模型这是一个包含我定义的自定义转换器的管道并将其加载到另一个项目中我的自定义转换器继承自 BaseEstimator 和 TransformerMixin 假设我有 2 个项
检查图像中是否有太薄的区域

我正在尝试验证雕刻机的黑白图像更多的是剪贴画图像不是照片我需要考虑的主要事情之一是区域的大小或线条的宽度因为机器无法处理太细的线条所以我需要找到比给定阈值更细的区域以此图为例竖琴的琴弦可能太细而无法雕刻我正在阅读有关 Ma
Matlab颜色检测

我试图一致地检测同一场景的图像之间的某种颜色这个想法是根据颜色配置文件识别一组对象因此例如如果给我一个带有绿色球的场景并且我选择绿色作为我的调色板的一部分我想要一个具有反映它检测到球的矩阵的函数任何人都可以为这个项目推荐一些
梯度下降有哪些替代方案？

梯度下降存在局部极小值问题我们需要运行梯度下降指数次来找到全局最小值谁能告诉我梯度下降的任何替代方案及其优缺点 Thanks See 我的硕士论文 https arxiv org pdf 1707 09725 pdf page 96对于
从图像坐标获取对象的世界坐标

I have been following this http docs opencv org modules calib3d doc camera calibration and 3d reconstruction html docume
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过

随机推荐

如何在.NET 4.5 Core中计算HMAC-SHA1身份验证代码

我目前面临一个大问题环境 NET 4 5 Core 我们需要使用 HMAC SHA1 算法通过密钥来保护消息问题是命名空间的 HMACSHA1 类System Security Cryptography并且命名空间本身并不存在于 NET
当涉及高度动画的用户界面时，openGL ES 是否比 Core Animation 和 UIKit 具有更好的性能？

目前我有一个用户界面它大量使用了核心动画我想知道是否值得再花两个月的时间来学习openGL ES 这真的能提高 2D 表面的绘图性能吗我没有 3D 对象而是高度动画的 2D 对象有时会出现 3D 扭曲大量旋转和缩放特别是我
C# Azure AD Graph 获取超过 20 人的组的所有成员

我正在尝试从 Azure AD 获取特定组中的所有用户目前有480名用户当我获取它们时我只得到 20 我认为这是默认设置 var users await gsc Groups GROUP ID Request Expand membe
我是否仍然需要将 data-ng 与 AngularJS 一起使用，或者我可以删除 data- 吗？

在我的应用程序中 data ng 随处可见有人可以告诉我为什么需要数据吗我读过一些有关 HTML5 验证的内容但是如果我不关心它是否经过完全验证并且如果我使用 IE8 及更高版本的浏览器那么我是否仍然需要使用 data data
无法从 fetch PUT 访问 Express 服务器的正文数据

我对 Web 开发相当陌生我正在尝试将一些 JSON 数据发送到运行 Express 的 Node js 服务器但我收到此错误加载失败http 本地主机 8888 http localhost 8888 方法 PUT 不被允许预检响
可以使用初始或终端 malloc 缓冲区吗？

假设我做了如下事情 size t length 1000 char p malloc length 然后我想循环遍历元素所以最基本的是 for size t i 0 i lt length i p i or p length 1 i 但也
我可以在 JpaRepository 的 saveAll 中混合更新和插入吗

我使用 Spring Boot Spring Data JPA 和 Hibernate 作为持久性提供程序我已经延长了我的Repository与接口JPARepository 我有一个表的实体 Bean 列表其中一些已经存在一些则不存
在 Datomic 中使用事件时间而不是事务时间？

背景我使用 Datomic 来存储其他系统生成的事件的投影在这种情况下投影可以被视为 Datomic 中的实体这些事件有一个与之关联的时间戳用于说明事件的创建时间例如这显然与 Datomic 在投影中存储新属性基于事件时分
如何在R中将for循环输出保存为data.frame？

我想知道如何保存 a 的输出for loop as data frame 假设使用mtcars数据集我有以下内容for loop script for i in seq len nrow mtcars if i lt 30 next pri
jquery - 禁用父元素上的单击功能

我有这样的结构 table tr td td td td tr table
在 Java 中，对泛型参数类型的错误转换不会引发 ClassCastException

所以我有一个相当深奥的问题我正在尝试创建一个有点通用但类型化的属性收集系统它依赖于一个似乎是错误的核心假设代码说明了这个问题 import java lang Integer public class Test private st
java套接字全双工

是否可以让服务器和客户端拥有 1 个套接字连接并同时双向发送数据我的意思是服务器和客户端同时读写每个进程中有2个线程编辑我需要真正的双向通信而不是请求响应类型的通信客户端和服务器必须能够同时写入编辑2 天哪有用愚蠢的
需要使用 gae python 装饰器登录。传递参数？

我正在尝试使用 python gae 制作所需的登录装饰器 import utils def login required func def check login self args kw user cookie self request
连接“qt_sql_default_connection”仍在使用中，所有查询将停止工作

我已经为打开和关闭连接创建了单独的函数但它不允许我在新表单上添加新记录这是登录头文件 public QSqlDatabase mydb void connClose QString connection connection mydb
使用自动布局缩放 UIImageView 的 UIScrollView

考虑一个UIScrollView有一个子视图子视图是一个UIImageView具有以下尺寸限制它的高度必须等于UIScrollView 它的宽度必须是与图像的高度成比例缩放的图像的宽度UIImageView 预计宽度UIImageVie
地图控制器中的 ui-gmap-marker 的标记单击事件未触发

我有一个带有 Google 地图控制器的应用程序当我在手机上运行点击事件时它不会触发但是当我在波纹模拟器上测试它时会触发单击事件下面是地图页面和对应的Controller
如何为 Arm Cortex M4 交叉编译 GSL？

我正在使用带有arm cortex m4的STM32 MCU 并且想要使用gsl 2 7 1 但是我已经尝试过例如命令 configure prefix home user name gsl arm target arm none eab
jquery 砖石图像重叠，直到页面调整大小完成

我发现这个模板演示了我遇到的问题jquery 砌体 http masonry desandro com 和图像布局看看这个 Twitter 引导模板page http wbpreview com previews WB0F35928 ga
计算数据帧列中事件组合发生的次数

我有一个数据框我想计算两列中每个事件组合发生的次数以任何顺序例如说我有 df lt data frame x c a a b c c c y c b c c a a b So x y a b a c b c c a c a c a c
yolo算法的坐标输出代表什么？

我的问题与这个主题类似当我开始思考 yolo 算法的输出时我正在观看 Andrew Ng 的关于边界框预测的讲座让我们考虑这个例子我们使用 19x19 网格和只有一个具有 2 个类的感受野所以我们的输出将是 gt 19x19x1x

yolo算法的坐标输出代表什么？

yolo算法的坐标输出代表什么？ 的相关文章

随机推荐

热门标签

yolo算法的坐标输出代表什么？的相关文章