如何实现固定长度的空间金字塔池化层？

2024-04-20

我想实现所介绍的空间金字塔池层在本文中 https://arxiv.org/pdf/1406.4729v4.pdf.

正如论文设置，关键点是定义 max_pooling 层的变体内核大小和步幅大小，即：

kernel_size = ceil(a/n)
stride_size = floor(a/n)

where a是输入张量的空间大小，并且n是金字塔级别，即池化输出的空间仓。

我尝试用张量流实现这一层：

import numpy as np
import tensorflow as tf


def spp_layer(input_, name='SPP_layer'):
    """
    4 level SPP layer.

    spatial bins: [6_6, 3_3, 2_2, 1_1]

    Parameters
    ----------
    input_ : tensor
    name : str

    Returns
    -------
    tensor
    """
    shape = input_.get_shape().as_list()

    with tf.variable_scope(name):

        spp_6_6_pool = tf.nn.max_pool(input_,
                                      ksize=[1,
                                             np.ceil(shape[1]/6).astype(np.int32),
                                             np.ceil(shape[2]/6).astype(np.int32),
                                             1],
                                      strides=[1, shape[1]//6, shape[2]//6, 1],
                                      padding='SAME')
        print('SPP layer level 6:', spp_6_6_pool.get_shape().as_list())

        spp_3_3_pool = tf.nn.max_pool(input_,
                                      ksize=[1,
                                             np.ceil(shape[1]/3).astype(np.int32),
                                             np.ceil(shape[2]/3).astype(np.int32),
                                             1],
                                      strides=[1, shape[1]//3, shape[2]//3, 1],
                                      padding='SAME')
        print('SPP layer level 3:', spp_3_3_pool.get_shape().as_list())

        spp_2_2_pool = tf.nn.max_pool(input_,
                                      ksize=[1,
                                             np.ceil(shape[1]/2).astype(np.int32),
                                             np.ceil(shape[2]/2).astype(np.int32),
                                             1],
                                      strides=[1, shape[1]//2, shape[2]//2, 1],
                                      padding='SAME')
        print('SPP layer level 2:', spp_2_2_pool.get_shape().as_list())

        spp_1_1_pool = tf.nn.max_pool(input_,
                                      ksize=[1,
                                             np.ceil(shape[1]/1).astype(np.int32),
                                             np.ceil(shape[2]/1).astype(np.int32),
                                             1],
                                      strides=[1, shape[1]//1, shape[2]//1, 1],
                                      padding='SAME')
        print('SPP layer level 1:', spp_1_1_pool.get_shape().as_list())

        spp_6_6_pool_flat = tf.reshape(spp_6_6_pool, [shape[0], -1])
        spp_3_3_pool_flat = tf.reshape(spp_3_3_pool, [shape[0], -1])
        spp_2_2_pool_flat = tf.reshape(spp_2_2_pool, [shape[0], -1])
        spp_1_1_pool_flat = tf.reshape(spp_1_1_pool, [shape[0], -1])

        spp_pool = tf.concat(1, [spp_6_6_pool_flat,
                                 spp_3_3_pool_flat,
                                 spp_2_2_pool_flat,
                                 spp_1_1_pool_flat])

    return spp_pool

但当输入大小不同时，它不能保证相同长度的池化输出。

如何解决这个问题呢？

我认为该论文的作者是错误的，公式应该是：

stride_size = floor(a/n)
kernel_size = floor(a/n) + (a mod n)

请注意，当 n

我修改了我找到的代码https://github.com/tensorflow/tensorflow/issues/6011 https://github.com/tensorflow/tensorflow/issues/6011这是：

def spp_layer(input_, levels=(6, 3, 2, 1), name='SPP_layer'):
    shape = input_.get_shape().as_list()
    with tf.variable_scope(name):
        pyramid = []
        for n in levels:

            stride_1 = np.floor(float(shape[1] / n)).astype(np.int32)
            stride_2 = np.floor(float(shape[2] / n)).astype(np.int32)
            ksize_1 = stride_1 + (shape[1] % n)
            ksize_2 = stride_2 + (shape[2] % n)
            pool = tf.nn.max_pool(input_,
                                  ksize=[1, ksize_1, ksize_2, 1],
                                  strides=[1, stride_1, stride_2, 1],
                                  padding='VALID')

            # print("Pool Level {}: shape {}".format(n, pool.get_shape().as_list()))
            pyramid.append(tf.reshape(pool, [shape[0], -1]))
        spp_pool = tf.concat(1, pyramid)
    return spp_pool

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

deeplearning

如何实现固定长度的空间金字塔池化层？的相关文章

Python lambda 函数没有在 for 循环中正确调用[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 中的 Tkinter 制作一个计算器我使用 for 循环来绘制按钮并且尝试使用 lambda 函数以便仅在按下按钮时调用按钮的操作而不是在程序启动时立即调用然而当我尝试这
箱线图与箱线图有何不同？

我想知道当我们在海生图书馆中有箱线图时为什么会有箱线图我知道一件事是箱线图优化了表示数据的方式特别是对于大型数据集但我不知道为什么除此之外我没有任何充分的理由使用箱线图箱线图将中位数显示为中心线第 50 个百分位数然后将第
通过 Python 在 PostgreSQL 中的 unicode 字符串中是否允许空字节？

unicode 字符串中是否允许空字节我不问 utf8 我的意思是 unicode 字符串的高级对象表示背景我们通过 Python 在 PostgreSQL 中存储包含空字节的 unicode 字符串如果我们再次读取字符串字符串会
将带有非字符串关键字的 dict 传递给 kwargs 中的函数

我使用具有签名功能的库f args kwargs 我需要在 kwargs 参数中传递 python dict 但 dict 不包含关键字中的字符串 f 1 2 3 4 Traceback most recent call last File
Python - 使用 win32com.client 将 Excel 单元格范围格式化为表格

我正在尝试编写一个函数该函数选择工作表中的所有非空单元格根据内容调整列宽并将其格式化为表格我被困在最后一点这是我当前的代码 import win32com client from win32com client import co
VSCode Jupyter Notebook - 恢复缓存版本

我正在使用在 Ubuntu 19 10 上运行的 VSCode v 1 48 0 创建一个 Jupyter Notebook VSCode 崩溃了不幸的是我没有保存笔记本当我重新启动时它是空的我已经能够在 config Code Us
Python 中 Goto 标签的替代方案？

我知道我不能使用 Goto 我也知道 Goto 不是答案我读过类似的问题但我只是想不出解决我的问题的方法所以我正在编写一个程序你必须在其中猜测一个数字这是我遇到问题的部分的摘录 x random randint 0 100 I
“分页文件太小，无法完成此操作”尝试训练 YOLOv5 对象检测模型时出错

我有大约 50000 个图像和注释文件用于训练 YOLOv5 对象检测模型我在另一台计算机上仅使用 CPU 训练模型没有问题但需要太长时间因此我需要 GPU 训练我的问题是当我尝试使用 GPU 进行训练时我不断收到此错误 OSE
Emacs：调试Python的方法

我把这个贴在程序员 stackexchange com https softwareengineering stackexchange com questions 29844 emacs methods for debugging pyth
使用 Beautifulsoup 解析时保持 XML 文件的缩进

我正在使用 BS4 解析 XML 文件并尝试将其写回新的 XML 文件输入文件
使用 pythons strftime 显示日期，例如“5 月 5 日”？ [复制]

这个问题在这里已经有答案了可能的重复 Python 日期顺序输出 https stackoverflow com questions 739241 python date ordinal output 在Python中 time strf
pip：证书失败，但curl 有效

我们在客户端安装了根证书 https 连接适用于curl 但如果我们尝试使用pip 它失败 Could not fetch URL https installserver 40443 pypi simple pep8 There was a
带回溯的 Dijkstra 算法？

In a 相关主题 https stackoverflow com questions 28333756 finding most efficient path between two nodes in an interval graph
如何点击 Google Trends 中的“加载更多”按钮并通过 Selenium 和 Python 打印所有标题

这次我想单击一个按钮来加载更多实时搜索这是网站的链接该按钮位于页面末尾代码如下 div class feed load more button Load more div 由于涉及到一些 AngularJS 我不知道该怎么做有什么提
NumPy 数组不可 JSON 序列化

创建 NumPy 数组并将其保存为 Django 上下文变量后加载网页时收到以下错误 array 0 239 479 717 952 1192 1432 1667 dtype int64 is not JSON serializable
使用 PIL 合并图像时模式不匹配

我正在传递 jpg 文件的名称 def split image into bands filename img Image open filename data img getdata red d 0 0 0 for d in data L
在Python中计算矩阵乘以其转置（AA^T）的最快方法

在Python中将矩阵与其转置 AA T 相乘的最快方法是什么我认为 NumPy SciPy 没有考虑使用例如时涉及的对称性 np dot or np matmul 得到的矩阵总是对称的所以我可以想象有一个更快的解决方案 None
使用 PuLP 进行线性优化，变量附加条件

我必须用 Pull 解决 Python 中的整数线性优化问题我解决了基本问题现在我必须添加额外的约束有人可以帮助我用逻辑指示器添加条件吗逻辑限制是如果 A gt 20 则 B gt 5 这是我的代码 from pulp impor
矩阵求逆 (3,3) python - 硬编码与 numpy.linalg.inv

对于大量矩阵我需要计算定义为的距离度量尽管我确实知道强烈建议不要使用矩阵求逆但我没有找到解决方法因此我尝试通过对矩阵求逆进行硬编码来提高性能因为所有矩阵的大小均为 3 3 我预计这至少会是一个微小的改进但事实并非如此为什么
继承自 NumPy 数组的类如何更改其自身的值？

我有一个继承自 NumPy n 维数组的简单类我想要该类的两个方法可以更改该类实例的数组值其中一种方法应将类实例的数组设置为类实例的列表数据属性的值另一种方法应将一些列表值附加到类实例的数组中我不确定如何实现这一点但我的尝试如下

随机推荐

如何获取计算样式以及该规则的来源？ [复制]

这个问题在这里已经有答案了我想获取元素计算样式和应用该规则的 css 文件和行类似于 Chrome 开发工具在使用计算选项卡并单击值旁边的箭头时所做的操作简而言之我希望能够使用 javascript 找出这两件事实际应用于该元
为什么网络开发人员仍然使用元关键字和元描述标签？

谷歌根本不使用元关键字标签因为关键字主要用于垃圾邮件搜索引擎 Google 不使用元描述标签进行排名有时如果部分内容不适合元描述标签会用于搜索结果中的网站片段但大多数元描述是根据页面内容自动生成的并且元描述与页面内容的开头相同谷
为什么这个函数被应用于一个没有作为参数调用的变量？

我尝试编写的一些代码遇到了问题我正在尝试获取坐标列表列表表示 3D 中形状的可能位置并形成一个列表其中包含原始列表中的所有元素以及原始列表中旋转的元素以便 x y z 坐标也被移动以包括 z x y 和 y z x 我认为用一个例
有没有撤消 git flow init 的命令？

After git flow init 如何去掉git flow模型如何从中删除所有相关配置 git config file git flow init force reset git flow init f 如何从以下内容中删除 git
PHP使用RSA私钥解密数据

我有一个程序使用 C rsa 公钥加密密码输出字节数组为了让我轻松传输它并维护数据我将字节直接转换为十六进制字符串现在这就是我遇到问题的地方我将发布数据发送到我的脚本现在不确定将其转换为什么以及如何解密它我正在尝试使用htt
在 CKEditor 4.x 中，有没有办法在初始化后获取允许的标签列表？

有没有办法获取 CKEditor 4 x 准确地说是 4 4 7 中所有允许标签的列表after编辑器已使用所有插件进行初始化并且所有allowedContentRules and disallowedContentRules或已应用任何
模拟 Windows 8 开始菜单平铺布局引擎

那么有人知道完美模拟 Windows 8 开始菜单平铺布局引擎的示例代码或控件吗它应该支持混合的方形和矩形瓷砖并正确地将方形瓷砖重新包装在矩形瓷砖上方或下方注意如果所有瓷砖都是正方形 WrapPanel 就可以工作但是一旦您混合
AirGoogleMaps 目录必须添加到您的 xCode 项目中才能支持 iOS RN48 上的 GoogleMaps

我在Android项目中安装了react native maps 效果很好但我总是出现错误编译良好但在ios中执行时出现错误 console error react native maps 必须将 AirGoogleMaps 目录添加
如何在docker镜像中运行signalr blazor客户端的StartAsync连接？

我创建了默认的 blazor 服务器端应用程序然后添加Microsoft AspNetCore SignalR Client and ChatHub班级然后编辑startup cs文件添加services AddSignalR and
在 MongoDB 中执行搜索/投影时如何重命名字段？

是否可以重命名查找查询中返回的字段名称我想用类似的东西 rename 但是我不想更改我正在访问的文档我只想以不同的方式检索它们其工作原理如下SELECT COORINATES AS COORDS in SQL 我现在应该做什么 db
在 Inno Setup 中添加 4 个许可证页面

我遵循了马丁的回答here https stackoverflow com questions 34592002 how to create two licensefile pages in inno setup在我的 Inno Setup
递归函数：检查 Java 中的回文数

我有一个类检查字符串是否是回文我有两个问题 1 这是检查回文的最有效方法吗 2 这可以递归实现吗 public class Words public static boolean isPalindrome String word Stri
在 Python 中继承方法的文档字符串

我有一个带有文档字符串的面向对象层次结构需要与代码本身一样多的维护例如 class Swallow object def airspeed self Returns the airspeed unladen raise NotImple
Swift Firebase 访问子快照数据

我目前正在尝试从 Swift 中的子快照访问数据这是我的代码在 Swift 3 Firebase 更新之前有效 if let achievements snapshot1 childSnapshotForPath Achievement
如何动态地将 OR 运算符添加到 LINQ 中的 WHERE 子句

我有一个可变大小的字符串数组我试图以编程方式循环遍历该数组并匹配表中的所有行其中 Tags 列至少包含数组中的一个字符串这是一些伪代码 IQueryable
在 Google Compute Engine 虚拟机之间共享永久性磁盘

来自谷歌的文档可以将永久磁盘附加到多个实例但是如果您将永久磁盘附加到多个实例则所有实例都必须以只读模式附加永久磁盘无法以读写模式将永久磁盘附加到多个实例如果您以读写模式附加永久磁盘然后尝试将该磁盘附加到后续实例 Google
FileOutputStream (Apache POI) 保存时间过长

当我使用 Apache poi 编辑 xlsx 文件时保存时间太长 xlsx 文件包含公式格式设置和冻结窗格我正在使用以下代码 try FileInputStream file new FileInputStream new File
确定 Base64 字符串或缓冲区是否包含没有元数据的 JPEG 或 PNG？可能的？

有没有办法使用节点来做到这一点无论是本机还是通过插件我想要完成的是根据输入类型选择无损或有损图像压缩对大型 JPEG 进行无损存储是一场存储灾难 PNG 文件的前八个字节始终包含以下值请参阅PNG规格 http www libpng
Subversion (svn + tortoiseSvn) 提交未锁定文件

我经历过颠覆的奇怪功能我们使用最新的 1 6 Svn 服务器 Visualsvn 和 tortoisesvn 1 6 6 我们已经为文件定义了属性 svn needs lock 那么如果您从不同位置复制文件它会显示本地更改如果您尝试提
如何实现固定长度的空间金字塔池化层？

我想实现所介绍的空间金字塔池层在本文中 https arxiv org pdf 1406 4729v4 pdf 正如论文设置关键点是定义 max pooling 层的变体内核大小和步幅大小即 kernel size ceil a n s

如何实现固定长度的空间金字塔池化层？

如何实现固定长度的空间金字塔池化层？ 的相关文章

随机推荐

热门标签

如何实现固定长度的空间金字塔池化层？的相关文章