tensorflow的物体检测api是否支持多类多标签检测?

2023-11-22

经过几个小时的研究,我找不到任何使用对象检测 API 进行多标签预测的示例。基本上我想预测图像中每个实例的多个标签。如下图所示:

enter image description here

我想预测服装类别,还有颜色和图案等属性。

根据我的理解,我需要将每个属性的更多分类头附加到第二阶段 ROI 特征图,并对每个属性的损失求和?但是,我在对象检测代码中实现此功能时遇到困难。有人可以给我一些关于我应该开始修改哪些功能的提示吗?谢谢。


根据性能要求和平台,一种方法可能是通过在管道中使用多个分类器来简化问题。例如,您可以使用多类对象检测器(示例中的“tee”和“pant”)来捕获感兴趣的区域;然后根据边界框裁剪这些区域,并将这些裁剪区域输入到另一个模型中,在这种情况下,该模型没有局部性要求(“颜色”和“图案”)。

对于多类对象检测指南,我可能会推荐Eager Few Shot 物体检测 Colab来自Tensorflow Git 存储库。在里面 '准备训练数据' 单元格注释:

num_classes = 1

category_index = {duck_class_id: {'id': duck_class_id, 'name': 'rubber_ducky'}}

更新它可以在不改变模型的情况下实现多类检测。例如,以下将创建两个类:

num_classes = 2

category_index = {
    1: {'id': 1, 
        'name': 'tee'},
    2: {'id': 2, 
        'name': 'pant'}
}

然后根据此输出,将这些裁剪区域输入到另一个分类器中。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow的物体检测api是否支持多类多标签检测? 的相关文章

随机推荐

  • 在水平分割或垂直分割中打开窗口

    我希望同时打开 NERDTree 和 TagList 但我不需要它们具有屏幕的整个高度 相反 我想让它们在单个垂直分割中水平分割 更具体地说 我希望能够打开一个 NERDTree 并让它占据屏幕的整个高度 然后 当我打开 TagList 时
  • Python编程:仅在命令提示符下获取“名称'Tk'未定义”,在IDLE中有效[重复]

    这个问题在这里已经有答案了 刚开始使用 Tkinter 的初学者的问题 我下载了并写了教程Hello World程序 并且在 IDLE 下运行良好 但是 当我保存程序并使用命令提示符运行它时 它们都返回NameError name tk i
  • 如何将 scrapy.log 模块与自定义日志处理程序一起使用?

    我一直在研究一个Scrapy项目 到目前为止一切都进展顺利 然而 我对 Scrapy 的日志配置可能性并不满意 此刻 我已设定LOG FILE my spider log in the settings py我的项目 当我执行时scrapy
  • System.FormatException:在将字符串转换为十进制时,输入字符串的格式不正确。

    我在 ASP NET 和 C 方面遇到了一些问题 这是我的错误代码 mscorlib dll 中发生 System FormatException 类型的异常 但未在 gt 用户代码中处理 附加信息 输入字符串的格式不正确 protecte
  • 识别图表上升趋势或下降趋势

    我正在尝试读取数据并使用 python 标准线图 将它们绘制到图表上 有人可以建议我如何以编程方式对图表中的某些点是上升趋势还是下降趋势进行分类吗 哪种方法是实现这一目标的最佳方法 这肯定是一个已解决的问题 并且存在一个数学方程来识别这个问
  • 在Matlab中绘制多色线

    我想用两种颜色的破折号绘制一条垂直线 我更喜欢任何方向 但我现在只对垂直感到满意 比如红 蓝 红 蓝 我知道我可以这样做 plot 1 1 0 1 r hold on plot 1 1 0 1 b 但是 由于我需要能够移动线等 因此它应该只
  • 如何评估以素数为模的指数塔

    我想找到一种快速算法来评估如下所示的表达式 其中P是素数 A B C D E mod P Example 9 3 15 3 15 mod 65537 16134 问题是中间结果可能会变得太大而无法处理 基本上问题归结为计算a T mod m
  • 如何从 WinForms 应用程序中用户控件的子控件中获取事件?

    主窗体是否有任何方法能够拦截用户控件上的子控件上触发的事件 我的应用程序的主窗体中嵌入了一个自定义用户控件 该控件包含各种操作数据的子控件 数据本身由主窗体上的其他控件显示 我想要的是 当用户更改子控件时 是否可以以某种方式通知主窗体 这样
  • 使用 JAVA 和 C++ 通过 Socket 发送结构

    我有一个套接字 其中服务器是 JAVA 语言 但客户端是 C 语言 Struct float length char name myStruct 如何将结构体转换为服务器发送的字节流并能被客户端正确解析 任何示例代码都会有帮助 我听说 XM
  • http.FileServer 缓存文件并在编辑后提供旧版本

    go 核心中的 http 包有问题 尽管响应正文中的内容长度是正确的 但文件内容似乎已被缓存 这里演示的是我正在编写的应用程序的简化版本 package main import fmt net http func main http Han
  • 仅对子视图启用 UserInteraction

    我有一个视图和 view UserInteractionenabled no 并且一个按钮被添加到视图中 我只需要点击按钮 是否可以仅启用按钮交互 视图无法接收触摸 除非userInteractionEnabled is YES对于视图及其
  • GitLab (SSH) 通过公共 WIFI,端口 22 被阻止

    我使用星巴克 wifi 在尝试推送到 gitlab com 存储库时收到以下信息 git push origin master ssh connect to host gitlab com port 22 Connection refuse
  • 在 C# 中计算文件内容的哈希值? [复制]

    这个问题在这里已经有答案了 我需要在 C 中计算文件内容的哈希值 因此 我可以比较我的应用程序中的两个文件哈希值 我有搜索但没有找到 你可以使用MD5CryptoServiceProvider 它将适用于基于文本的文件以及二进制文件 byt
  • FirebaseError:预期类型“Tc”,但它是:自定义 Ac 对象

    我正在尝试访问我的 firestore 集合中的所有文档 const app initializeApp firebaseConfig const db getFirestore app async function getTodos tr
  • 确定事件是否已附加

    我有两个对象 一个包含一些将触发事件的代码 另一个包含该事件的处理程序 我无法在第一个对象的加载中 AddHandler 因为第二个对象的实例尚不存在 当我引发事件时 我想检查是否已实例化 object2 的副本 很容易做到 以及处理程序是
  • javascript中链接逻辑运算符的简写?

    有没有更好的方法在 JavaScript 中编写以下条件 if value 1 value 16 value 500 value 42 42 value something blah blah blah 我讨厌将所有这些逻辑 或 串在一起
  • 在闭包之间共享弧

    我正在尝试编写一个简单的 TCP 服务器来读取和广播消息 我正在使用 Tokio 但我认为这更像是一个普遍的 Rust 问题 我有一个具有共享状态的弧 let state Arc new Mutex new Shared new serve
  • 如何在使用 GAE Maven 插件时在 IDEA 中调试 Java Google App Engine 应用程序?

    我已经设置了我的 pom xmllike so 并且它似乎在大部分情况下都可以工作 我可以启动开发服务器并更新应用程序 我的问题是我似乎无法调试开发服务器 我尝试从 IDEA 内以调试模式启动 devserver maven 目标 但是当我
  • 如何仅设置左下角、右下角和左上角的图层cornerRadius?

    如何仅设置文本视图的左下角 右下角和左上角的角半径 let rectShape CAShapeLayer rectShape backgroundColor UIColor redColor CGColor rectShape bounds
  • tensorflow的物体检测api是否支持多类多标签检测?

    经过几个小时的研究 我找不到任何使用对象检测 API 进行多标签预测的示例 基本上我想预测图像中每个实例的多个标签 如下图所示 我想预测服装类别 还有颜色和图案等属性 根据我的理解 我需要将每个属性的更多分类头附加到第二阶段 ROI 特征图