tensorflow的物体检测api是否支持多类多标签检测？

2023-11-22

经过几个小时的研究，我找不到任何使用对象检测 API 进行多标签预测的示例。基本上我想预测图像中每个实例的多个标签。如下图所示：

我想预测服装类别，还有颜色和图案等属性。

根据我的理解，我需要将每个属性的更多分类头附加到第二阶段 ROI 特征图，并对每个属性的损失求和？但是，我在对象检测代码中实现此功能时遇到困难。有人可以给我一些关于我应该开始修改哪些功能的提示吗？谢谢。

根据性能要求和平台，一种方法可能是通过在管道中使用多个分类器来简化问题。例如，您可以使用多类对象检测器（示例中的“tee”和“pant”）来捕获感兴趣的区域；然后根据边界框裁剪这些区域，并将这些裁剪区域输入到另一个模型中，在这种情况下，该模型没有局部性要求（“颜色”和“图案”）。

对于多类对象检测指南，我可能会推荐Eager Few Shot 物体检测 Colab来自Tensorflow Git 存储库。在里面 '准备训练数据' 单元格注释：

num_classes = 1

category_index = {duck_class_id: {'id': duck_class_id, 'name': 'rubber_ducky'}}

更新它可以在不改变模型的情况下实现多类检测。例如，以下将创建两个类：

num_classes = 2

category_index = {
    1: {'id': 1, 
        'name': 'tee'},
    2: {'id': 2, 
        'name': 'pant'}
}

然后根据此输出，将这些裁剪区域输入到另一个分类器中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

objectdetectionapi

tensorflow的物体检测api是否支持多类多标签检测？的相关文章

Tensorflow：docker 镜像和 -gpu 后缀

在具有 GPU 支持的 Tensorflow 的 Docker 映像中例如 tensorflow tensorflow 2 2 0 gpu 安装的python包是tensorflow gpu 如图所示pip freeze 安装任何依赖于的
Keras Maxpooling2d 层给出 ValueError

我正在尝试在 keras 中复制 VGG16 模型以下是我的代码 model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224 model add Convoluti
随机梯度下降可以与 TensorFlow 一起使用吗？

我设计了一个全连接 MLP 具有 2 个隐藏层和 1 个输出层如果我使用批量或小批量梯度下降我会得到一个很好的学习曲线 But a straight line while performing Stochastic Gradient D
使用基于 ConvLSTM2D 的 Keras 模型从较低分辨率图像估计高分辨率图像

我正在尝试使用以下内容ConvLSTM2D从低分辨率图像序列估计高分辨率图像序列的架构 import numpy as np scipy ndimage matplotlib pyplot as plt from keras models
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
Tensorflow：logits 和标签必须具有相同的第一维

我是张量流新手我想改编 MNIST 教程https www tensorflow org tutorials layers https www tensorflow org tutorials layers用我自己的数据 40x40 的图
如何在Pycharm中运行Tensorflow GPU？

我想在 Linux Mint 上的 Pycharm 中运行 Tensorflow GPU 我尝试了一些像这样的指南 https medium com p venkata kishore install anaconda tenserflow
使用批量乘法的tensorflow的tensordot中的障碍

我正在张量流中实现 RBM 使用小批量实现参数更新存在障碍有2个张量第一个张量的形状是 100 3 1 第二个张量的形状是 100 1 4 数字 100 是批次大小所以我想将这些张量相乘得到 100 3 4 张量但是当我实现这样的
OutOfRangeError（请参阅上面的回溯）：FIFOQueue '_1_batch/fifo_queue' 已关闭并且元素不足（请求 32，当前大小 0）

我在使用队列中张量流读取图像时遇到问题请让我知道我犯了什么错误下面是代码 import tensorflow as tf slim tf contrib slim from tensorflow python framework imp
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
从tensorflow_cc和tensorflow_framework生成静态库

据我了解使用 bazel 我只能生产libtensorflow cc so and libtensorflow framework so 我需要生产静态库与位置无关 fPIC 因为稍后我会将它们链接到我自己的动态库 I found 这个答
Keras ZeroDivisionError：整数除法或以零为模

我正在尝试使用 Keras 和 Tensorflow 实现卷积神经网络我有以下代码 from keras models import Sequential from keras layers import Conv2D MaxPoolin
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
无法加载动态库“libcudart.so.11.0”；

我尝试将 Tensorflow 2 7 0 与 GPU 结合使用但我不断遇到同样的问题 2022 02 03 08 32 31 822484 W tensorflow stream executor platform default ds
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？

我正在尝试使用 tf contrib seq2seq 模块对某些数据仅 float32 向量进行预测但我使用 TensorFlow 中的 seq2seq 模块找到的所有示例都用于翻译因此用于嵌入我正在努力准确理解 tf contr
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm

随机推荐

在水平分割或垂直分割中打开窗口

我希望同时打开 NERDTree 和 TagList 但我不需要它们具有屏幕的整个高度相反我想让它们在单个垂直分割中水平分割更具体地说我希望能够打开一个 NERDTree 并让它占据屏幕的整个高度然后当我打开 TagList 时
Python编程：仅在命令提示符下获取“名称'Tk'未定义”，在IDLE中有效[重复]

这个问题在这里已经有答案了刚开始使用 Tkinter 的初学者的问题我下载了并写了教程Hello World程序并且在 IDLE 下运行良好但是当我保存程序并使用命令提示符运行它时它们都返回NameError name tk i
如何将 scrapy.log 模块与自定义日志处理程序一起使用？

我一直在研究一个Scrapy项目到目前为止一切都进展顺利然而我对 Scrapy 的日志配置可能性并不满意此刻我已设定LOG FILE my spider log in the settings py我的项目当我执行时scrapy
System.FormatException：在将字符串转换为十进制时，输入字符串的格式不正确。

我在 ASP NET 和 C 方面遇到了一些问题这是我的错误代码 mscorlib dll 中发生 System FormatException 类型的异常但未在 gt 用户代码中处理附加信息输入字符串的格式不正确 protecte
识别图表上升趋势或下降趋势

我正在尝试读取数据并使用 python 标准线图将它们绘制到图表上有人可以建议我如何以编程方式对图表中的某些点是上升趋势还是下降趋势进行分类吗哪种方法是实现这一目标的最佳方法这肯定是一个已解决的问题并且存在一个数学方程来识别这个问
在Matlab中绘制多色线

我想用两种颜色的破折号绘制一条垂直线我更喜欢任何方向但我现在只对垂直感到满意比如红蓝红蓝我知道我可以这样做 plot 1 1 0 1 r hold on plot 1 1 0 1 b 但是由于我需要能够移动线等因此它应该只
如何评估以素数为模的指数塔

我想找到一种快速算法来评估如下所示的表达式其中P是素数 A B C D E mod P Example 9 3 15 3 15 mod 65537 16134 问题是中间结果可能会变得太大而无法处理基本上问题归结为计算a T mod m
如何从 WinForms 应用程序中用户控件的子控件中获取事件？

主窗体是否有任何方法能够拦截用户控件上的子控件上触发的事件我的应用程序的主窗体中嵌入了一个自定义用户控件该控件包含各种操作数据的子控件数据本身由主窗体上的其他控件显示我想要的是当用户更改子控件时是否可以以某种方式通知主窗体这样
使用 JAVA 和 C++ 通过 Socket 发送结构

我有一个套接字其中服务器是 JAVA 语言但客户端是 C 语言 Struct float length char name myStruct 如何将结构体转换为服务器发送的字节流并能被客户端正确解析任何示例代码都会有帮助我听说 XM
http.FileServer 缓存文件并在编辑后提供旧版本

go 核心中的 http 包有问题尽管响应正文中的内容长度是正确的但文件内容似乎已被缓存这里演示的是我正在编写的应用程序的简化版本 package main import fmt net http func main http Han
仅对子视图启用 UserInteraction

我有一个视图和 view UserInteractionenabled no 并且一个按钮被添加到视图中我只需要点击按钮是否可以仅启用按钮交互视图无法接收触摸除非userInteractionEnabled is YES对于视图及其
GitLab (SSH) 通过公共 WIFI，端口 22 被阻止

我使用星巴克 wifi 在尝试推送到 gitlab com 存储库时收到以下信息 git push origin master ssh connect to host gitlab com port 22 Connection refuse
在 C# 中计算文件内容的哈希值？ [复制]

这个问题在这里已经有答案了我需要在 C 中计算文件内容的哈希值因此我可以比较我的应用程序中的两个文件哈希值我有搜索但没有找到你可以使用MD5CryptoServiceProvider 它将适用于基于文本的文件以及二进制文件 byt
FirebaseError：预期类型“Tc”，但它是：自定义 Ac 对象

我正在尝试访问我的 firestore 集合中的所有文档 const app initializeApp firebaseConfig const db getFirestore app async function getTodos tr
确定事件是否已附加

我有两个对象一个包含一些将触发事件的代码另一个包含该事件的处理程序我无法在第一个对象的加载中 AddHandler 因为第二个对象的实例尚不存在当我引发事件时我想检查是否已实例化 object2 的副本很容易做到以及处理程序是
javascript中链接逻辑运算符的简写？

有没有更好的方法在 JavaScript 中编写以下条件 if value 1 value 16 value 500 value 42 42 value something blah blah blah 我讨厌将所有这些逻辑或串在一起
在闭包之间共享弧

我正在尝试编写一个简单的 TCP 服务器来读取和广播消息我正在使用 Tokio 但我认为这更像是一个普遍的 Rust 问题我有一个具有共享状态的弧 let state Arc new Mutex new Shared new serve
如何在使用 GAE Maven 插件时在 IDEA 中调试 Java Google App Engine 应用程序？

我已经设置了我的 pom xmllike so 并且它似乎在大部分情况下都可以工作我可以启动开发服务器并更新应用程序我的问题是我似乎无法调试开发服务器我尝试从 IDEA 内以调试模式启动 devserver maven 目标但是当我
如何仅设置左下角、右下角和左上角的图层cornerRadius？

如何仅设置文本视图的左下角右下角和左上角的角半径 let rectShape CAShapeLayer rectShape backgroundColor UIColor redColor CGColor rectShape bounds
tensorflow的物体检测api是否支持多类多标签检测？

经过几个小时的研究我找不到任何使用对象检测 API 进行多标签预测的示例基本上我想预测图像中每个实例的多个标签如下图所示我想预测服装类别还有颜色和图案等属性根据我的理解我需要将每个属性的更多分类头附加到第二阶段 ROI 特征图

tensorflow的物体检测api是否支持多类多标签检测？

tensorflow的物体检测api是否支持多类多标签检测？ 的相关文章

随机推荐

热门标签

tensorflow的物体检测api是否支持多类多标签检测？的相关文章