Tensorflow 检测 API 中的 SSD 锚点

2024-01-11

我想训练一个SSD https://arxiv.org/pdf/1512.02325.pdf检测器在 N × N 图像的自定义数据集上。所以我深入研究Tensorflow 对象检测 API https://github.com/tensorflow/models/tree/master/research/object_detection并在COCO上基于MobileNet v2找到了SSD300x300的预训练模型。

查看用于训练的配置文件时：字段anchor_generator如下所示：（在论文后面）

anchor_generator {
  ssd_anchor_generator {
    num_layers: 6
    min_scale: 0.2
    max_scale: 0.9
    aspect_ratios: 1.0
    aspect_ratios: 2.0
    aspect_ratios: 0.5
    aspect_ratios: 3.0
    aspect_ratios: 0.33
    }
}

当看着SSD锚点生成器原型 https://github.com/tensorflow/models/blob/master/research/object_detection/protos/ssd_anchor_generator.proto因此我的假设是否正确：base_anchor_height=base_anchor_width=1 ?

如果是的话，我假设人们通过阅读获得的结果锚点多个网格锚点生成器 https://github.com/tensorflow/models/blob/master/research/object_detection/anchor_generators/multiple_grid_anchor_generator.py（如果图像是 300x300 的正方形）是：大小范围为 0.2300=6060 像素至 0.9300=270270 像素（具有不同的长宽比） ?

因此，如果想通过固定字段来训练 NxN 图像：

fixed_shape_resizer {
  height: N
  width: N
}

他将使用相同的配置文件锚点，范围从 (0.2N,0.2N) 像素到 (0.9N,0.9N) 像素（具有不同的长宽比）？

我做了很多假设，因为代码很难理解，而且似乎还没有文档。我对么？有没有一种简单的方法可以在不训练模型的情况下可视化所使用的锚点？

以下是一些可用于生成和可视化锚框坐标而无需训练模型的函数。我们在这里所做的就是调用训练/推理期间图中使用的相关操作。

首先，我们需要知道构成给定大小的输入图像的对象检测层的特征图的分辨率（形状）是多少。

import tensorflow as tf 
from object_detection.anchor_generators.multiple_grid_anchor_generator import create_ssd_anchors
from object_detection.models.ssd_mobilenet_v2_feature_extractor_test import SsdMobilenetV2FeatureExtractorTest

def get_feature_map_shapes(image_height, image_width):
    """
    :param image_height: height in pixels
    :param image_width: width in pixels
    :returns: list of tuples containing feature map resolutions
    """
    feature_extractor = SsdMobilenetV2FeatureExtractorTest()._create_feature_extractor(
        depth_multiplier=1,
        pad_to_multiple=1,
    )
    image_batch_tensor = tf.zeros([1, image_height, image_width, 1])
    
    return [tuple(feature_map.get_shape().as_list()[1:3])
            for feature_map in feature_extractor.extract_features(image_batch_tensor)]

例如，这将返回特征图形状的列表[(19,19), (10,10), (5,5), (3,3), (2,2), (1,1)]您可以将其传递给第二个函数，该函数返回锚框的坐标。

def get_feature_map_anchor_boxes(feature_map_shape_list, **anchor_kwargs):
    """
    :param feature_map_shape_list: list of tuples containing feature map resolutions
    :returns: dict with feature map shape tuple as key and list of [ymin, xmin, ymax, xmax] box co-ordinates
    """
    anchor_generator = create_ssd_anchors(**anchor_kwargs)

    anchor_box_lists = anchor_generator.generate(feature_map_shape_list)
    
    feature_map_boxes = {}

    with tf.Session() as sess:
        for shape, box_list in zip(feature_map_shape_list, anchor_box_lists):
            feature_map_boxes[shape] = sess.run(box_list.data['boxes'])
            
    return feature_map_boxes

在您的示例中，您可以这样称呼它：

boxes = get_feature_map_boxes(
    min_scale=0.2,
    max_scale=0.9,
    feature_map_shape_list=get_feature_map_shapes(300, 300)
)

您不需要指定纵横比，因为配置中的纵横比与默认值相同create_ssd_anchors.

最后，我们将锚框绘制在反映给定层分辨率的网格上。请注意，模型中的锚框和预测框的坐标在 0 和 1 之间标准化。

def draw_boxes(boxes, figsize, nrows, ncols, grid=(0,0)):

    fig, axes = plt.subplots(nrows=nrows, ncols=ncols, figsize=figsize) 

    for ax, box in zip(axes.flat, boxes):
        ymin, xmin, ymax, xmax = box
        ax.add_patch(patches.Rectangle((xmin, ymin), xmax-xmin, ymax-ymin, 
                                fill=False, edgecolor='red', lw=2))

        # add gridlines to represent feature map cells
        ax.set_xticks(np.linspace(0, 1, grid[0] + 1), minor=True)
        ax.set_yticks(np.linspace(0, 1, grid[1] + 1), minor=True)
        ax.grid(True, which='minor', axis='both')
              
    fig.tight_layout()
    
    return fig

如果我们以具有 3x3 特征图的第四层为例

draw_boxes(feature_map_boxes[(3,3)], figsize=(12,16), nrows=9, ncols=6, grid=(3,3))

在上图中，每一行代表 3x3 特征图中的不同单元格，而每一列代表特定的长宽比。

您最初的假设是正确的，例如，最高层中宽高比为 1.0 的锚框（具有最低分辨率的特征图）的高度/宽度将等于输入图像大小的 0.9，而最低层中的锚框将具有高度/宽度等于输入图像尺寸的 0.2。中间层的锚尺寸在这些限制之间线性插值。

然而，关于 TensorFlow 锚点生成，有一些微妙之处值得注意：

请注意，在图像示例中，每个网格单元有 6 个锚点，但我们仅指定 5 个长宽比。这是因为为每个层添加了一个额外的锚点，其大小介于当前层的锚点大小和下一层的锚点大小之间。可以使用以下命令修改（或删除）interpolated_scale_aspect_ratio上面的anchor_kwargs参数，或者同样在你的配置中。
默认情况下，在对象检测特征图的最低层（具有最高分辨率）中，预先指定的长宽比列表将被忽略，并仅替换为 3 个长宽比。这可以被覆盖reduce_boxes_in_lowest_layer布尔参数。
正如您正确指出的那样，默认情况下base_anchor_height = base_anchor_width = 1。但是，如果您的输入图像不是正方形并且在预处理过程中被重新整形，那么纵横比 1.0 的“正方形”锚点实际上不会针对锚定原始图像中正方形的对象进行优化（当然，它可以学习在训练期间预测这些形状）。

完整的要点可以找到here https://gist.github.com/david-macleod/60cb2b00616562b9b613bea618f9956b.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow 检测 API 中的 SSD 锚点的相关文章

在Python中不断寻找用户输入

我将如何编写一个始终寻找用户输入的 Python 程序我想我希望有一个等于输入的变量然后根据该变量的等于值会发生不同的情况因此如果变量是 w 那么它将执行某个命令并继续执行直到收到另一个输入例如 d 然后会发生不同的情况但直到
Pygame 让精灵按照给定的旋转行走

很久以前我做了一个Scratch脚本我想用Pygame将其转换为Python 有很多示例显示图像的旋转但我想知道如何更改精灵的旋转以使其沿给定方向移动而不更改图像这是我的暂存代码这是我的 Pygame 精灵类 class Star
从 Django 基于类的视图的 form_valid 方法调用特殊（非 HTTP）URL

如果你这样做的话有一个 HTML 技巧 a href New SMS Message a 点击新短信打开手机的本机短信应用程序并预先填写To包含所提供号码的字段在本例中为 1 408 555 1212 以及body与提供的消息 Hel
从 Python 将分层 JSON 数据写入 Excel xls？

我想将一些数据从 python 写入 xlsx 我目前将其存储为 JSON 但它从 Python 中输出什么并不重要单个文章的 JSON 如下所示 Word Count 50 Key Words Blah blah blah Foo Fr
Colab 的使用限制持续多久？

当我对同一帐户的两个笔记本同时使用两个 GPU 约半小时后 Colab 已 12 小时未运行此消息不断弹出由于 Colab 中的使用限制您当前无法连接到 GPU 自从我上次使用 colab 以来已经过去了大约两个小时但该消息仍然弹出
更改 numpy 数组的结构强制给定值

如何缩小栅格数据的比例4 X 6大小成2 X 3如果 2 2 像素内的任何元素包含 1 则大小强制选择 1 否则选择 0 import numpy as np data np array 0 0 1 1 0 0 1 0 0 1 0 0 1
Scrapy Splash，如何处理onclick？

我正在尝试抓取以下内容我能够收到响应但我不知道如何访问以下项目的内部数据以抓取它我注意到访问这些项目实际上是由 JavaScript 和分页处理的这种情况我该怎么办下面是我的代码 import scrapy from scrapy
Django 说“id 可能不为 NULL”，但为什么会这样呢？

我今天要疯了我只是尝试插入一条新记录但它返回了 post blogpost id 可能不为 NULL 错误这是我的模型 class BlogPost models Model title models CharField max le
为什么在 __init__ 函数中声明描述符类会破坏描述符功能？

在下面的 B 类中我想要 set 每当您赋值给 A 类中的函数时就会调用该函数B a 相反将值设置为B a覆盖B a与价值 C类分配给C a工作正常但我想为每个用户类都有一个单独的 A 实例即我不想在 C 的一个实例中更改 a 来
python lxml 使用iterparse编辑并输出xml

我已经在 lxml 库上摆弄了一段时间了也许我没有正确理解它或者我错过了一些东西但我似乎无法弄清楚在捕获某个 xpath 后如何编辑文件并且然后能够在逐个元素解析时将其写回到 xml 中假设我们有这个 xml 作为示例
TypeError：“NoneType”对象不可下标[重复]

这个问题在这里已经有答案了错误 names curfetchone 0 TypeError NoneType object is not subscriptable 我尝试检查缩进但仍然有错误我读到如果数据库中没有文件名记录变量名
Django - 使 ModelForm（ImageField 的）仅接受某些类型的图像

我将 Pillow 2 3 0 与 Django 一起使用并且在 models py 中有一个 ImageField 如下所示 class UserImages models Model user models ForeignKey Us
使用 os.forkpty() 创建一个伪终端以 ssh 到远程服务器并与其通信

我正在尝试编写一个 python 脚本它可以 ssh 到远程服务器并可以从 python 客户端执行 ls cd 等简单命令但是在成功 ssh 到服务器后我无法读取伪终端的输出任何人都可以在这里帮助我以便我可以在服务器上执行一
Python Tkinter 网格复选框

我想知道是否有一种简单的方法可以使用 Tkinter 创建复选框网格我正在尝试制作一个由 10 行和 10 列即 100 个复选框组成的网格以便每行只能选择两个复选框编辑我正在使用带有spyder的python 2 7 到目前为
如何在python中访问矩阵每个元素的相邻单元格？

这里如果两个单元共享边界则它们被认为是相邻的例如 A 5 6 4 2 1 3 7 9 8 这里索引 0 0 的相邻元素位于索引 0 1 和 1 0 处索引 1 1 的相邻元素位于索引 0 1 1 0 2 1 处和 1 2 假设你
给定一个字符串，如何删除所有重复的连续字母？

如何从字符串中删除两个连续的字母例如 a str hii thherre 应该成为 hi there 我尝试这样做 a str join sorted set a str key a str index 但是我得到 hi ter 是的
python：xml.etree.ElementTree，删除“命名空间”

我喜欢 ElementTree 解析 xml 的方式特别是 Xpath 功能我有一个带有嵌套标签的应用程序的 xml 输出我想按名称访问此标签而不指定名称空间这可能吗例如 root findall molpro job 代替 ro
如何正确将 tflite_graph.pb 转换为 detector.tflite

我正在使用tensorflow对象检测API使用tensorflow中的ssdlite mobilenet v2 coco 2018 05 09来训练自定义模型模型动物园 https github com tensorflow models
如何对每一行进行 value_counts 并创建一些列，其值是每个值的计数

我得到一个数据框如下 df c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12 r1 0 1 1 1 1 0 0 0 0 0 0 0 r2 1 2 2 2 2 1 1 1 1 0 0 0 r3 1 0 2 0 0
使用 python/scipy 进行 voronoi 和 lloyd 松弛

如何使用 Qhull 确定哪些 voronoi 单元按索引是正确的由现有顶点组成我正在尝试使用 LLoyds 算法和 scipy spatial Voronoi 它是 Qhull 的包装器生成的输入来执行约束松弛就代码而言

随机推荐

如何在迁移触发器中设置 Cognito 组

我目前正在使用 Cognito 触发器用户迁移构建从 AWS 用户池到另一个用户池的迁移解决方案我想在迁移期间设置一个组但我无法执行此操作因为在整个上下文完成之前尚未创建用户我该如何解决这个问题我不想创建 PostAuth l
如何在 ASP.NET Core 2.0 中实现 machineKey

在 ASP NET 非核心中我通常会在 web config 中添加一个 machineKey 以便我可以在本地计算机而不是服务器上执行一些功能以便数据库回调操作将使用相同的密钥例如
查找仅在 R 中的一行中出现的变量

使用 BASE R 我想知道如何回答以下问题有没有什么价值X or Y仅发生在一行中而不发生在其他行中如果是请出示我的期望的输出 below f lt data frame id c rep AA 4 rep BB 2 rep CC
(Symfony 4) 如何从 PHP 代码中访问 Liip Imagine 包？

我希望能够上传一个文件并从中创建 3 个缩略图并将所有内容存储在 S3 服务器上我的 liip LiipImagineBundle 设置如下 liip 想象 configure resolvers resolvers setup th
CMake 中的 Makefile 等效项

我刚刚开始使用CMake 已经不到一周了我已经编写了一个 Makefile 并且正在尝试在 CMake 中编写其等效项我不知道应该在 CMake 中为给定 Makefile 中的每个语句使用哪些命令我该如何开始有什么地方可以找到这方
Django 结合 __unaccent 和 __search 查找

所以我正在尝试使用 unaccent and search在同一模型过滤器中但这样做时收到错误我正在尝试使用术语 Pokemon 与术语 Pok mon 匹配来创建一个过滤器注意 Game objects filter title u
JPA 2.1 中的 @ConstructorResult 映射无法与 Hibernate 4.3.5.Final 一起正常工作

我尝试将本机查询映射到非实体类我有以下实体 Entity Table name Groups SqlResultSetMapping name groupList classes ConstructorResult targetClass
使用节点实现重新填充堆栈

在我把它全部取下来打印出来后我很难重新填充堆栈我正在使用节点实现所以我认为这个事实让我感到困惑任何建议将不胜感激谢谢这是我原来的 stack print Function to print Gumball info field
使用隐式/显式转换运算符是否违反单一职责模式而支持 DRY？

我需要在这两个类之间进行转换并且想要保持 DRY 但不违反单一职责模式 public class Person public string Name get set public int ID get set public class P
模块内部的参考控制器

我在模块内定义了一个控制器 angular module myModule controller MyCtrl function scope scope property myproperty 部分内容包含在主 html 中如下所示 di
詹金斯第一次访问时非常慢

清晨第一次访问詹金斯非常慢如果我们重新启动 Jenkins 服务器也会发生这种情况因此第一个访问 jenkins 的开发人员有时需要等待长达 3 分钟我们认为这是构建负载的问题因此我们将所有构建工作转移给詹金斯奴隶但问题并没有
与多个项目共享 nlog 配置以及正确的线程安全方式来全部写入同一日志文件？

我的程序由一个 EXE 和 6 个 DLL 组成当然每个人都引用每个人我目前有一个粗略的静态日志记录类 Logger 它位于它自己的 DLL Logger dll 中我将其添加为每个的引用我的项目并使用但我没有重新发明轮子而是希望
从 Angular 表达式访问窗口

根据开发者指南 http docs angularjs org guide expression我应该能够从 Angular 表达式内部访问浏览器窗口 window 与 JavaScript 不同 JavaScript 的名称默认为全局窗口
使用 PDO 准备和绑定语句的条件查询

我正在将所有查询从 mysql 转换为 PDO 在这个过程中我发现了一个条件查询如下所示 if isset parameters searchTerm where And title LIKE parameters searchTerm
如何以编程方式从开始到结束缓慢滚动 UIScrollView

我有一个水平 UIScrollview 显示大约 10 张图像我知道我们必须使用scrollRectToVisible 方法以编程方式移动滚动视图但我正在寻找的是从滚动视图的开始到结束缓慢滚动滚动视图 1 秒内 5 个像素我看过一些页
将数组定义为类的属性时出现语法错误

public aSettings array BindHost gt 127 0 0 1 Port gt 9123 MaxFileSize gt 5 1024 1024 unexpected here UploadedURL gt http
System.out.println(object) 的输出

我想知道当我执行以下操作时输出到底是什么 class Data int a 5 class Main public static void main String args data dObj new data System out pr
VS2010 中的 JavaScript Intellisense 速度极慢且占用内存

我在 VS2010 中的 Intellisense 中遇到两个问题我们的项目非常大它由数百个 js 文件组成其中包含数十万行代码使用 VS2010 只需 5 10 分钟后内存使用量就可以轻松攀升到 1GB 以上这会导致速度显着减
HAProxy 关闭长期存在的 TCP 连接，忽略 TCP keepalive

我已经配置了 HAProxy 1 5 4 但我也尝试了 1 5 14 以在 TCP 模式下平衡两台在 5672 端口上公开 AMQP 协议 WSO2 消息代理的服务器客户端通过 HAProxy 创建并使用与 AMQP 服务器的永久连接
Tensorflow 检测 API 中的 SSD 锚点

我想训练一个SSD https arxiv org pdf 1512 02325 pdf检测器在 N N 图像的自定义数据集上所以我深入研究Tensorflow 对象检测 API https github com tensorflow m

Tensorflow 检测 API 中的 SSD 锚点

Tensorflow 检测 API 中的 SSD 锚点 的相关文章

随机推荐

热门标签

Tensorflow 检测 API 中的 SSD 锚点的相关文章