YOLO 目标检测：算法如何预测大于网格单元的边界框？

2024-04-10

我试图更好地理解 YOLO2 和 3 算法的工作原理。该算法处理一系列卷积，直到达到13x13网格。然后它能够对每个网格单元内的对象以及这些对象的边界框进行分类。

如果您查看这张图片，您会发现红色边框比任何单个网格单元都大。边界框也以对象的中心为中心。

我的问题是，当网络激活基于单个网格单元时，预测的边界框如何超出网格单元的大小。我的意思是，对于预测在该单元中检测到的对象的边界框的神经元来说，网格单元之外的所有内容都应该是未知的。

更准确地说，这是我的问题：

1. 算法如何预测大于网格单元的边界框？

2. 算法如何知道物体的中心位于哪个单元格中？

网格单元之外的所有内容对于预测在该单元中检测到的物体的边界框的神经元来说应该是未知的。

这不太正确。这些细胞对应于图像的一个分区，如果物体的中心位于其中，神经元就学会了做出响应。

但是，那感受野这些输出神经元的数量比细胞大得多，并且实际上覆盖了整个图像。因此，它能够识别并在比指定的“中心单元”大得多的对象周围绘制边界框。

因此，一个细胞以输出神经元感受野的中心为中心，但它的部分要小得多。它也有些任意，例如，人们可以想象有重叠的细胞——在这种情况下，当一个物体位于其细胞重叠区域的中心时，你会期望相邻的神经元同时放电。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

deeplearning

ComputerVision

convneuralnetwork

YOLO

YOLO 目标检测：算法如何预测大于网格单元的边界框？的相关文章

TensorFlow - 为什么这个 softmax 回归没有学到任何东西？

我的目标是用 TensorFlow 做大事但我正在尝试从小事做起我有一些小的灰度方块有一点噪音我想根据它们的颜色对它们进行分类例如 3 个类别黑色灰色白色我编写了一个小 Python 类来生成正方形和 1 hot 向量并
Keras 获取中间层的输出

what my model looks like defining the model archictecture model Sequential 1st conv layer model add Conv2D 32 5 5 activa
无法满足显式设备规范“/device:GPU:0”，因为没有匹配的设备

我想在我的 Ubuntu 14 04 机器上使用 TensorFlow 0 12 作为 GPU 但是当将设备分配给节点时我收到以下错误 InvalidArgumentError see above for traceback Canno
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
ValueError：“连接”层需要具有匹配形状的输入（连接轴除外）

我正在尝试为我的项目构建 Pix2Pix 并收到错误值错误 Concatenate层需要具有匹配形状的输入除了连接轴之外获得输入形状 None 64 64 128 None 63 63 128 生成器是一个 U 网模型我的输入高度
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
在 keras 中使用自定义张量流操作

我在张量流中有一个脚本其中包含自定义张量流操作我想将代码移植到 keras 但我不确定如何在 keras 代码中调用自定义操作我想在 keras 中使用tensorflow 所以到目前为止我发现的教程描述了与我想要的相反的内容 htt
模块“tensorflow”没有属性“random_uniform”

我尝试执行一些深度学习应用程序并收到模块 tensorflow 没有属性 random uniform 错误在 CPU 上代码运行良好但速度非常慢为了在 GPU 上运行代码我需要更改一些定义下面是我的代码有任何想法吗 def
在 Tensorflow 2.0 中的简单 LSTM 层之上添加 Attention

我有一个由一个 LSTM 和两个 Dense 层组成的简单网络如下所示 model tf keras Sequential model add layers LSTM 20 input shape train X shape 1 trai
Keras 序列模型中的数据增强层

我正在尝试将数据增强作为一个层添加到模型中但我遇到了我认为是形状问题我也尝试在增强层中指定输入形状当我取出data augmentation模型中的图层运行良好 preprocessing RandomFlip horizontal
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
张量流急切模块错误

我的操作系统是 Ubuntu 16 04 Python版本是3 5 张量流版本是14 0 当我尝试为 TF Eager 模块编写简单代码时 import tensorflow as tf import tensorflow contrib
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
TensorFlow：在输入处获取梯度时性能缓慢

我正在使用 TensorFlow 构建一个简单的多层感知器并且我还需要获取神经网络输入损失的梯度或误差信号这是我的代码它有效 cost tf reduce mean tf nn softmax cross entropy with
在不丢失基数信息的情况下对 TensorFlow 数据集进行窗口处理？

tf data Dataset window返回一个新的数据集其元素是数据集这些嵌套数据集的元素是所需大小的窗口如果您有一个数据集例如 Dataset range 10 并想要一个像这样的窗口数据集 0 1 2 1 2 3 7 8
如何使用 pytorch 同时迭代两个数据加载器？

我正在尝试实现一个接收两张图像的暹罗网络我加载这些图像并创建两个单独的数据加载器在我的循环中我想同时遍历两个数据加载器以便我可以在两个图像上训练网络 for i data in enumerate zip dataloaders1
用于分布式计算的 Tensorflow 设置

任何人都可以提供有关如何设置张量流以在网络上的许多CPU上工作的指导吗到目前为止我发现的所有示例最多只使用一个本地盒子和多个 GPU 我发现我可以在 session opts 中传递目标列表但我不确定如何在每个盒子上设置张量流来侦听网
从tensorflow_cc和tensorflow_framework生成静态库

据我了解使用 bazel 我只能生产libtensorflow cc so and libtensorflow framework so 我需要生产静态库与位置无关 fPIC 因为稍后我会将它们链接到我自己的动态库 I found 这个答
Caffe 的 LSTM 模块

有谁知道 Caffe 是否有一个不错的 LSTM 模块我从 russel91 的 github 帐户中找到了一个但显然包含示例和解释的网页消失了以前是http apollo deepmatter io http apollo deep
使用 Numpy 进行多维批量图像卷积

在图像处理和分类网络中一个常见的任务是输入图像与一些固定滤波器的卷积或互相关例如在卷积神经网络 CNN 中这是一种极其常见的操作我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W

随机推荐

TypeScript 编译器参数“skipLibCheck”的用法

我一直在研究进一步的解释跳过库检查TypeScript 编译器参数来确定将此设置为的安全性true 我找到的最深入的解释如下新 skipLibCheck TypeScript 2 0 添加了一个新的 skipLibCheck 编译器选项
检查向量索引是否为空

在我的代码中我需要这样做 if edges j ConnectedToNode i problem line edges push back Edge i j nodes i Position nodes j Position dista
Google 开发者控制台：“指定的项目 ID 不可用。请选择另一个。这些标识符必须是唯一的。”

我从 Google Developers Console 中删除了一个项目并尝试创建另一个具有相同名称 id 的项目但没有成功指定的项目 ID 不可用请选择另一个这些标识符必须是唯一的但现在无论我选择什么名称或 ID 我都会遇
如何使用 linq 进行 LIKE 查询？ [复制]

这个问题在这里已经有答案了如何在 Linq 中执行 LIKE 查询我有以下查询要执行 var results from c in db costumers where c FullName LIKE FirstName LastName
测试预期会出现异常，但抛出了异常（它显示在输出中），但测试还是失败了

您好这里有一个针对车辆构造函数的测试该测试用没有驾驶执照的驾驶员初始化车辆并且应该抛出异常代码构造函数 public Voertuig String Merk Datum datumEersteIngebruikname int A
React Hooks：如何向服务器发出 POST 请求

我是初学者我试图以简单的形式从 React js 实现 POST 请求但我不知道如何将 POST 请求发送到数据库我想我需要
如何将猴子补丁应用到 GAE？

你能告诉我如何将此补丁应用到谷歌应用程序引擎以及将其放在哪里吗谢谢 def user init self email None auth domain None user id None federated identity None f
关于使用 Saxon 使用默认命名空间对 xml 进行 xpath 解析

我想要一些与使用 saxon 解析默认名称空间的 xpath 相关的信息我正在使用 Saxon HE 9 5 1 3 jar 在我的代码中使用 xpath 2 功能在类路径中包含 saxon 库后我在解析具有默认命名空间的 XML 文
使用 Junit5 在 Spring Boot 应用程序中测试服务层时如何避免数据库连接

我正在尝试对内部调用存储库方法的服务方法进行单元测试我的测试方法如下 SpringBootTest public class EmployeeServiceImplTest MockBean private EmployeeReposit
使用 Qt，有哪些好方法可以分解包含 GUI 逻辑的大型源文件？

我正在使用 Qt 5 开发一个 C 项目它有一个包含大量 UI 元素的复杂窗口该窗口是使用 Qt Designer 设计的并从 UI 文件加载我发现 Qt 的典型模式是在其主类中编写窗口 UI 的所有逻辑即他们文档中的单一继承方
WPF MVVMLight：根据另一个 DataGrid 的 SelectedItem 更新 DataGrid

开发一个WPF应用程序使用MVVMLight My Model由一个Attribute类和一个DataSet类与ObservableCollection
Checkmarx Java 修复 Log Forging - 清理用户输入

任何人都可以建议以下 getCourses 方法中的 courseType 变量所需的正确清理验证过程我正在使用该变量写入日志文件我尝试过 HtmlUtils HtmlEscape 但没有得到预期的结果 Thanks RequestM
获取iPhone照片库的图像名称

我正在做一个项目从 iPhone 照片库或以其他方式从相机胶卷中获取图像我已经做到了没有任何问题但我需要从照片库中检索名称有没有办法做到这一点任何帮助表示赞赏 Thanks 查看 ALAssetsLibrary 它在 iOS 4
可以从 Http 请求主体发布 ODataQueryOptions 吗？

我正在实现一个 Web API 接口来支持一些相当复杂的查询来运行它并且遇到了最大请求 URI 长度的问题我的 Web API 方法的定义如下所示使用 Automapper 执行 DTO 投影 public IQueryable
使一个协议符合另一个协议

我有两个协议 Pen and 专业仪器我想做任何Pen成为一个专业仪器 protocol Pen var title String get var color UIColor get protocol Watch Also Instrum
如何从容器内部获取 YARN ContainerId？

我正在 YARN 上运行 Spark 作业并且希望获取 YARN 容器 ID 作为在一组 Spark 作业中生成唯一 ID 的要求的一部分我可以看到容器 getId https hadoop apache org docs r2 6 0
windows下docker的vm.max_map_count问题

我正在尝试在我的 windows10 上运行 ELK docker 镜像如下所示 C WINDOWS system32 gt docker run p 5601 5601 p 9200 9200 p 9300 9300 p 5044 50
插入带有扭曲问题的选择

我想将一个表当然具有某个ID 的所有数据复制到同一个表中但略有不同我有这个表产品数量 id groupId productId quantity 1 2 2 5 我想要做的是复制 groupId 2 的所有数据将其插入到 grou
Xcode 4 中的静态库

我太喜欢 Xcode 4 X 中的静态库了以下是我通常做的步骤 1 为了制作静态库我打开Xcode new 静态库然后在项目中添加一些类然后构建阶段 gt 复制标头 gt 在这里一一添加所有标头然后我构建该项目当在 ios 模拟
YOLO 目标检测：算法如何预测大于网格单元的边界框？

我试图更好地理解 YOLO2 和 3 算法的工作原理该算法处理一系列卷积直到达到13x13网格然后它能够对每个网格单元内的对象以及这些对象的边界框进行分类如果您查看这张图片您会发现红色边框比任何单个网格单元都大边界框也以对象的

YOLO 目标检测：算法如何预测大于网格单元的边界框？

YOLO 目标检测：算法如何预测大于网格单元的边界框？ 的相关文章

随机推荐

热门标签

YOLO 目标检测：算法如何预测大于网格单元的边界框？的相关文章