如何在同一张图片中定位多个物体？

2024-02-08

我是 TensorFlow 的新手。

目前，我正在TensorFlow网站上测试一些分类示例“卷积神经网络”，它解释了如何将输入图像分类到预定义的类中，但问题是：我不知道如何在相同的图像。例如，我有一个带有猫和狗的输入图像，我希望我的图形在输出中显示图像中都有“猫和狗”。

很好的问题。检测同一图像中的多个对象本质上是一个“分割问题”。两种不错且流行的算法是 YOLO（你只看一次）和SSD（单次多盒检测器）。我在底部添加了它们的链接。

我会观看一些有关 YOLO 如何工作的视频，看看你是否掌握了这个想法。然后阅读有关 SSD 的论文，看看您是否明白为什么该算法更快、更精确。

这两种算法都是单通道的：它们只查看图像“一次”并预测它们发现的类别的边界框。有更精确的算法，但它们速度较慢（它们首先选择许多想要查看的点，然后仅在该点上运行分类器。结果是它们在每个图像上运行该分类器多次，这很慢）。

正如您所说，您是 Tensorflow 的新手，您可以尝试其他人编写的代码：https://github.com/thtrieu/darkflow https://github.com/thtrieu/darkflow。非常广泛的自述文件向您展示了如何开始使用您自己的数据集。

祝你好运，如果您还有其他问题，或者这些算法不适合您的用例，请告诉我们。

优洛 9000（https://pjreddie.com/darknet/yolo/ https://pjreddie.com/darknet/yolo/)
SSD（单发多盒检测器）（https://arxiv.org/abs/1512.02325 https://arxiv.org/abs/1512.02325)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在同一张图片中定位多个物体？的相关文章

Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我
异常：加载数据时 URL 获取失败

我正在尝试设置我的机器来运行 Tensorflow 2 我从未使用过 Tensorflow 只是下载了 Python 3 7 我不确定这是否是我的机器的问题我按照上面列出的安装说明进行操作TensorFlow 的网站 https www
TensorFlow：在训练时更改变量

如果我将输入管道从 feed dict 更改为 tf data dataset 如何在每次迭代后的训练期间更改网络内参数的值澄清一下旧代码看起来像这样 Define Training Step model is some class t
randomForest 包在删除一个预测类时的奇怪行为

我正在运行一个随机森林模型它产生的结果从统计角度来看对我来说完全没有意义因此我确信有些东西mustrandomForest 包的代码出现错误至少在模型的本次迭代中预测左侧变量是具有 3 种可能结果的政党 ID 民主党独立党共和
如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？

我正在尝试使用 tf contrib seq2seq 模块对某些数据仅 float32 向量进行预测但我使用 TensorFlow 中的 seq2seq 模块找到的所有示例都用于翻译因此用于嵌入我正在努力准确理解 tf contr
我可以在我的机器上同时安装 python 2.7 和 3.5 的tensorflow吗？

目前我通过 Anaconda 在我的机器 MAC OX 上安装了 Python 2 7 Python 3 5 Tensorflow for Python 3 5 我也想在我的机器上安装 Tensorflow for Python 2 7 当
在张量流中向卷积神经网络提供可变大小的输入

我正在尝试使用 feed dict 参数将不同大小的 2d numpy 数组列表传递给卷积神经网络 x tf placeholder tf float32 batch size None None None y tf placeholder
在 Keras 中连接两个目录迭代器

假设我有类似以下内容 image data generator ImageDataGenerator rescale 1 255 train generator image data generator flow from director
合并张量流数据集批次

请考虑下面的代码 import tensorflow as tf import numpy as np simple features np array 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 simple labels
错误：分配具有形状的张量时出现 OOM

在使用 Apache JMeter 进行性能测试期间我面临着初始模型的问题错误分配形状为 800 1280 3 和类型的张量时出现 OOM 通过分配器浮动在 job localhost replica 0 task 0 device
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
TensorFlow HVX 加速支持

我成功构建并运行了测试应用程序https github com tensorflow tensorflow tree master tensorflow contrib hvx https github com tensorflow ten
在张量流的卷积层中使用自定义过滤器

我一直在从各种教程中学习 Tensorflow 并且想知道是否可以定义一个自定义过滤器供卷积网络使用例如如果我知道特征中有有意义的结构使得每个其他特征都是相关的我想定义一个看起来像 0 1 0 1 0 1 的过滤器 tf nn co
Tensorflow 与 Keras 的兼容性

我正在使用 Python 3 6 和 Tensorflow 2 0 并且有一些 Keras 代码 import keras from keras models import Sequential from keras layers impo
无法使用 Keras 中的 multi_gpu_model 后的 model.save 保存模型

升级到 Keras 2 0 9 后我一直在使用multi gpu model实用程序但我无法使用保存我的模型或最佳权重 model save path 我得到的错误是类型错误无法pickle模块对象我怀疑访问模型对象时存在一些问题
tensorflow：检查标量布尔张量是否为 True

我想使用占位符控制函数的执行但不断收到错误不允许使用 tf Tensor 作为 Python bool 这是产生此错误的代码 import tensorflow as tf def foo c if c print This is tr
TensorFlow 2.0：在自定义训练循环中显示进度条

我正在为音频分类任务训练 CNN 并且使用带有自定义训练循环的 TensorFlow 2 0 RC 如中所述本指南 https www tensorflow org beta guide keras training and evaluat
类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
移动设备上的 TensorFlow（Android、iOS、Windows Phone）

我目前正在寻找不同的深度学习框架特别是用于训练和部署卷积神经网络要求是它可以在带有 GPU 的普通 PC 上进行训练但训练后的模型必须部署在三个主要的移动操作系统上即 Android iOS 和 Windows Phone Ten
具有不同尺寸图像的 Tensorflow 输入数据集

我正在尝试使用不同大小的输入图像来训练完全卷积神经网络我可以通过循环训练图像并在每次迭代时创建单个 numpy 输入来做到这一点即 for image input label in zip image data labels train

随机推荐

iOS 10.0 语音识别错误 kAFAssistantErrorDomain

我尝试使用语音识别如下 let urlpath Bundle main pathForResource myvoice2 ofType m4a let url URL URL init fileURLWithPath urlpath let
.NET 多线程、易失性和内存模型

假设我们有以下代码 class Program static volatile bool flag1 static volatile bool flag2 static volatile int val static void Main s
关于全局/范围的 Ruby 方法查找

我试图完全理解 Ruby 如何定位方法符号但当它涉及多个级别时尤其是全局文件范围我感到很困难当在类上显式调用方法时有很多关于搜索类及其包含的模块的顺序的说明因此确切地说是什么super每种情况下都会调用但是当没有显式调用方
如何在循环中命名和创建文件

在 C 中我想创建并打开文本文件以写入数据但问题是我想即时命名文件例如 FILE ptr for i 0 i lt 1000 i fopen s ptr i txt w operations to fill data into fil
JSHint 选项默认值的完整列表？

我在哪里可以获得 JSHint 默认选项的完整列表我尝试在网上搜索但找不到任何东西编辑我的意思是默认列表values for all选项以防不清楚你可以看看boolOptions valOptions and invertedOp
HQL 错误：连接所需的路径

我一直在尝试这个查询的变体但似乎无法实现这一点我还参考了这篇文章预计加入路径休眠错误 https stackoverflow com questions 5759707 path expected for join nhiberna
C# 发送带有附件的电子邮件（图片）

我的方法使用 SMTP 中继服务器发送电子邮件一切正常电子邮件已发送除了附件图像以某种方式压缩不存在并且无法从电子邮件中检索之外该方法如下所示 public static bool SendEmail HttpPostedFi
GitHub API - 如何确定文件是否实际上是符号链接？

通过 GitHub API 查询符号链接时如果符号链接指向文件而不是目录我会得到不同的结果后者表现得更好因为它会返回 type symlink 作为其 JSON 的一部分而前者返回 type file 例子文件符号链接 https
动态插入 3 个图像到水平滚动视图或 Viewpager

下面显示了我正在寻找的图像目前我正在使用视图寻呼机和圆圈指示器在视图页面中它仅显示单个图像我想要在一个viewpager中显示三张图像如图所示当我滑动该页面时再次从服务器加载三个不同的图像并在下面显示文本这个怎么做对此有
使用已知和未知字段反序列化 json

给出以下 json 结果默认的 json 结果有一组已知的字段 id 7908 name product name 但可以使用其他字段进行扩展在本例中 unknown field name 1 and unknown field nam
jQuery - 选择具有特定样式的子项

我不知道如何在以下示例中选择第一个跨度 div class sp span abc span span xyz span div 我尝试过使用这个但没有成功 div sp span visibility hidden not work t
使用 XCode 4.5 运行 iOS 5.1 模拟器时出现问题

我最近将 XCode 升级到了 4 5 版本现在当我尝试开发 iOS 5 0 5 1 的应用程序时遇到了问题我开发了一个简单的 iPad 游戏用户需要将图像与相应的单词进行匹配所有这些项目都存储在 UIImageView 中如果相
适用于 iOS 8 和 iOS 9 的自定义 Unwind Segue

我的问题是如何让以下自定义展开转场在 iOS 9 之前版本的设备以及运行 iOS 9 的设备上工作我有一个显示视图控制器的自定义 Segue 然后有一个相应的自定义展开 Segue 这段代码在 iOS 8 中运行良好是通过创建 UIS
将 jzy3d.canvas 转换为 awt.component

我需要将 jzy3d 画布转换为 java awt component 我想使用 JCombobox 和按钮在框架中显示图表但是当我想将画布转换为组件时程序被删除谢谢您的回答我已经尝试过this https stackoverflo
Spring 5 WebFlux 中的缓存

有没有办法在 Spring 5 中缓存来自 WebClient 的 Flux 我尝试过这个但没有缓存任何东西 RestController SpringBootApplication EnableCaching public class
如何标记相同的熊猫数据框行？

我有一个像这样的大熊猫数据框 log apple watermelon orange lemon grapes 1 1 1 yes 0 0 1 2 0 1 0 0 1 True 0 0 0 2 2 0 0 0 0 2 2 1 1 yes 0
gcc 对 alloca 的处理是怎么回事？

在大多数平台上 alloca只是归结为堆栈指针的内联调整例如从rsp在 x64 上加上一些维护堆栈对齐的逻辑 I was looking at the code that gcc generates for alloca and it
paypal.HostedFields.isEligible() 始终返回 False ：Paypal 借记卡/信用卡付款

我想在我的网站上添加由 PayPal 提供支持的借记卡信用卡付款我正在按照指南进行操作 https developer paypal com docs business checkout advanced card payments h
Gdb - 打印数组或数组元素，具有各种大小的元素

汇编代码 yasm section data src db 1 2 3 的每个元素src数组是1个字节 In GDB 如何打印整个数组或指定索引处的元素例如打印值为 2 的元素好的在 Michael Petch 的许可下我想自己给出
如何在同一张图片中定位多个物体？

我是 TensorFlow 的新手目前我正在TensorFlow网站上测试一些分类示例卷积神经网络它解释了如何将输入图像分类到预定义的类中但问题是我不知道如何在相同的图像例如我有一个带有猫和狗的输入图像我希望我的图形在输出

如何在同一张图片中定位多个物体？

如何在同一张图片中定位多个物体？ 的相关文章

随机推荐

热门标签

如何在同一张图片中定位多个物体？的相关文章