tensorflow py_func 很方便，但使我的训练步骤非常慢。

2024-01-03

我在使用张量流函数 py_func 时遇到一些效率问题。

Context

在我的项目中，我有一批张量input_features大小的[? max_items m]。第一个维度设置为?因为它是动态形状（为自定义张量流读取器读取批次，并使用 tf.train.shuffle_batch_join() 进行混洗）。第二个维度对应于上限（我的示例中可以采用的最大项目数），第三个维度对应于特征维度空间。我也有一个张量num_items具有批量大小的尺寸（因此形状是(?,)），表示示例中的项数，其他设置为0（采用numpy的写法input_feature[k, num_items[k]:, :] = 0)

Issue

我的工作流程需要一些自定义 python 操作（特别是为了处理索引，我需要或实例对某些示例块执行聚类操作），并且我使用了一些包装在其中的 numpy 函数py_func功能。这效果很好，但是训练变得非常非常慢（比没有这个 py_func 的模型慢大约 50 倍），而且函数本身并不耗时。

问题

1 - 计算时间增加正常吗？该函数包裹在py_func给我一个新的张量，该张量在此过程中进一步相乘。它能解释计算时间吗？（我的意思是用这样的函数计算梯度可能更困难）。

2 - 我正在尝试修改我的处理并避免使用py_func功能。然而，使用 numpy 索引提取数据非常方便（尤其是我的数据格式化），并且我在以 TF 方式传递它时遇到一些困难。例如，如果我有一个张量t1有形状[-1, n_max, m]（第一个维度是batch_size，它是动态的）并且t2有形状[-1,2]包含整数。有没有一种简单的方法可以在张量流中执行平均运算，从而导致t_mean_chunk有形状(-1, m)其中（在 numpy 公式中）：t_mean_chunk[i,:] = np.mean(t1[i, t2[i,0]:t2[i,1], :], axis=0)？这是（以及其他操作）我在包装函数中所做的事情。

如果没有确切的 py_func，问题 1 很难回答，但正如 hpaulj 在他的评论中提到的那样，它减慢了速度也就不足为奇了。作为最坏情况的后备方案，tf.scan or tf.while_loop with a TensorArray可能会快一些。然而，最好的情况是使用 TensorFlow 操作提供矢量化解决方案，我认为在这种情况下这是可能的。

至于问题 2，我不确定它是否算简单，但这里有一个计算索引表达式的函数：

import tensorflow as tf

def range_mean(index_ranges, values):
  """Take the mean of `values` along ranges specified by `index_ranges`.

  return[i, ...] = tf.reduce_mean(
    values[i, index_ranges[i, 0]:index_ranges[i, 1], ...], axis=0)

  Args:
    index_ranges: An integer Tensor with shape [N x 2]
    values: A Tensor with shape [N x M x ...].
  Returns:
    A Tensor with shape [N x ...] containing the means of `values` having
    indices in the ranges specified.
  """
  m_indices = tf.range(tf.shape(values)[1])[None]
  # Determine which parts of `values` will be in the result
  selected = tf.logical_and(tf.greater_equal(m_indices, index_ranges[:, :1]),
                            tf.less(m_indices, index_ranges[:, 1:]))
  n_indices = tf.tile(tf.range(tf.shape(values)[0])[..., None],
                      [1, tf.shape(values)[1]])
  segments = tf.where(selected, n_indices + 1, tf.zeros_like(n_indices))
  # Throw out segment 0, since that's our "not included" segment
  segment_sums = tf.unsorted_segment_sum(
      data=values,
      segment_ids=segments, 
      num_segments=tf.shape(values)[0] + 1)[1:]
  divisor = tf.cast(index_ranges[:, 1] - index_ranges[:, 0],
                    dtype=values.dtype)
  # Pad the shape of `divisor` so that it broadcasts against `segment_sums`.
  divisor_shape_padded = tf.reshape(
      divisor,
      tf.concat([tf.shape(divisor), 
                 tf.ones([tf.rank(values) - 2], dtype=tf.int32)], axis=0))
  return segment_sums / divisor_shape_padded

用法示例：

index_range_tensor = tf.constant([[2, 4], [1, 6], [0, 3], [0, 9]])
values_tensor = tf.reshape(tf.range(4 * 10 * 5, dtype=tf.float32), [4, 10, 5])
with tf.Session():
  tf_result = range_mean(index_range_tensor, values_tensor).eval()
  index_range_np = index_range_tensor.eval()
  values_np = values_tensor.eval()

for i in range(values_np.shape[0]):
  print("Slice {}: ".format(i),
        tf_result[i],
        numpy.mean(values_np[i, index_range_np[i, 0]:index_range_np[i, 1], :],
                   axis=0))

Prints:

Slice 0:  [ 12.5  13.5  14.5  15.5  16.5] [ 12.5  13.5  14.5  15.5  16.5]
Slice 1:  [ 65.  66.  67.  68.  69.] [ 65.  66.  67.  68.  69.]
Slice 2:  [ 105.  106.  107.  108.  109.] [ 105.  106.  107.  108.  109.]
Slice 3:  [ 170.  171.  172.  173.  174.] [ 170.  171.  172.  173.  174.]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow py_func 很方便，但使我的训练步骤非常慢。的相关文章

sphinx 中的分组方法文档字符串

是否可以使用 sphinx 的 autodoc 功能将多个方法文档字符串分组以便将它们列在一起 class Test object def a self A method of group foo def b self A method
HoughLinesP后如何合并线？

My task is to find coordinates of lines startX startY endX endY and rectangles 4 lines Here is input file 我使用下一个代码 img c
Python pandas：删除字符串中分隔符之后的所有内容

我有数据框其中包含例如 vendor a ProductA vendor b ProductA vendor a Productb 我需要删除所有内容包括两个以便我最终得到 vendor a vendor b vendor a 我尝
检查多维 numpy 数组的所有边是否都是零数组

n 维数组有 2n 个边 1 维数组有 2 个端点 2 维数组有 4 个边或边 3 维数组有 6 个 2 维面 4 维数组有 8 个边 ETC 这类似于抽象 n 维立方体发生的情况我想检查 n 维数组的所有边是否仅由零组成以下是边由零组
使用Python进行图像识别[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个想法就是我想识别图像中的字母可能是 bmp或 jpg 例如这是一个包含字母 S 的 bmp 图像我想做的是使用Pyth
将分布拟合到直方图

I want to know the distribution of my data points so first I plotted the histogram of my data My histogram looks like th
覆盖现有的 django-admin 命令

除了编写自定义 django admin 命令之外这是有详细记录的 https docs djangoproject com en 1 9 howto custom management commands 我希望能够覆盖现有命令例如ma
来自数据框 groupby 的条形图

import pandas as pd import numpy as np import matplotlib pyplot as plt df pd read csv arrests csv df df replace np nan 0
什么时候用==，什么时候用is？

奇怪的是 gt gt gt a 123 gt gt gt b 123 gt gt gt a is b True gt gt gt a 123 gt gt gt b 123 gt gt gt a is b False Seems a is b
Python代码执行时自动打开浏览器

我正在 Python Flask 中实现 GUI Flask 的设计方式是必须手动打开本地主机以及端口号有没有一种方法可以使其自动化以便在运行代码时自动打开浏览器本地主机我尝试使用 webbrowser 包但它在会话终止后打
如何将一串Python代码编译成一个可以调用函数的模块？

在 Python 中我有一串 Python 源代码其中包含以下函数 mySrc def foo print foo def bar print bar 我想将这个字符串编译成某种形式类似模块的对象这样我就可以调用代码中包含的函数这是我
如何将 pip 指向 Mercurial 分支？

我正在尝试通过 pip 将我的应用程序安装到 virtualenv 进行测试安装时效果很好default or tip像这样 pip install e hg https email protected cdn cgi l email p
Bottle 是否可以处理没有并发的请求？

起初我认为 Bottle 会并发处理请求所以我编写了如下测试代码 import json from bottle import Bottle run request response get post import time app B
当我打印“查询”时获取 PY_VAR1

我正在制作一个简单的网络抓取代码当我尝试打印一个值时它给了我其他东西 def PeopleSearch query SearchTerm query what is query print str query SearchTerm St
Python `concurrent.futures`：根据完成顺序迭代 future

我想要类似的东西executor map 除了当我迭代结果时我想根据完成的顺序迭代它们例如首先完成的工作项应该首先出现在迭代中等等这样当且仅当序列中的每个工作项尚未完成时迭代就会阻塞我知道如何使用队列自己实现这一点但我想知道
在Python中确定句子中2个单词之间的邻近度

我需要确定 Python 句子中两个单词之间的接近度例如在下面的句子中 the foo and the bar is foo bar 我想确定单词之间的距离foo and bar 确定之间出现的单词数foo and bar 请注意该词
如何让 Python 找到 ffprobe？

I have ffmpeg and ffprobe安装在我的 mac macOS Sierra 上并且我已将它们的路径添加到 PATH 中我可以从终端运行它们我正在尝试使用ffprobe使用以下代码获取视频文件的宽度和高度 impor
为什么 tesseract 无法从这个简单的图像中读取文本？

我在 pytesseract 上阅读了大量的帖子但我无法让它从一个简单的图像中读取文本它返回一个空字符串这是图像我尝试过缩放它灰度化它调整对比度阈值模糊以及其他帖子中所说的一切但我的问题是我不知道 OCR 想要更好地工作
在Python中将罗马数字转换为整数

根据 user2486 所说这是我当前的代码 def romanMap map M 1000 CM 900 D 500 CD 400 C 100 XC 90 L 50 XL 40 X 10 IX 9 V 5 V 4 I 1 return
将自定义属性添加到 Tk 小部件

我的主要目标是向小部件添加隐藏标签或字符串之类的内容以在其上保存简短信息我想到创建一个新的自定义 Button 类在本例中我需要按钮它继承所有旧选项这是代码 form tkinter import class NButton Bu

随机推荐

更改 Bootstrap3 水平表单上输入的宽度

Reading django crispy forms http django crispy forms readthedocs org en latest crispy tag forms html bootstrap3 horizont
将 foreach 值添加到 Ajax

我有两个问题如下 1 如何将值从 foreach 传递到 ajax 这是我的代码和到目前为止我所拥有的尝试将ajax放入foreach中但它继续为我提供foreach中姓氏的id 2 有没有一种方法可以让我单击添加然后数据将被保存并
如果返回格式为 xml，如何删除 Web api 中的模式节点？

我有一个 Web api 方法它采用 format 作为参数提供返回 xml 和 json 方法返回的数据类型是 DataTable 在 json 格式中一切看起来都很好但在 xml 格式中数据表的架构和 xml 节点中的一些其他
如何在 Flutter 中安排特定时间的闹钟？

在我的 Flutter 项目中我想在一天中的特定时间安排闹钟或者只是在该特定时间触发手机中的内置闹钟为此我集成了 Flutter 的一个插件 https pub dev packages android alarm manager
如何在 iOS 8/Swift 中处理屏幕尺寸/方向变化的 NSLayoutConstraints？

如何使用 IB 约束和 NSLayoutConstraint 我想以编程方式微调 Interface Builder Storyboard 布局因为我无法仅通过 Interface Builder 中的约束来实现所需的布局 iPhone
从 Linux Makefile 打开终端

我们可以使用 makefile 或某个 c 文件从现有终端打开一个新的终端选项卡或窗口吗如果是的话怎么办预先感谢您的回复附我想这样做是因为首先在终端中我想运行服务器文件然后我想打开新终端并在那里运行客户端文件我想从第二个终端继续
从 UITableView 单元格内的 url 异步加载图像 - 滚动时图像更改为错误图像

我已经编写了两种在 UITableView 单元格内异步加载图片的方法在这两种情况下图像都会加载得很好但是当我滚动表格时图像会更改几次直到滚动结束并且图像将返回到正确的图像我不知道为什么会发生这种情况 define kBgQue
语法错误：意外的标记“=”。参数声明后应有“)”或“,”。在野生动物园中

我把一些 JS 代码搞混了这些代码似乎可以在 Firefox 中工作没有错误并且功能正常但会抛出 SyntaxError Unexpected token 参数声明后应有或在野生动物园中我在 php 中有以下对象 items A
iOS AutoLayout 多行 UILabel

以下问题是这个问题的延续 iOS 自动布局中的多行 UILabel https stackoverflow com questions 12789013 ios multi line uilabel in auto layout 主要思想是
NSString drawInRect:withAttributes: 使用 NSKernAttributeName 时未正确居中

当我使用drawInRect withAttributes 并传入段落样式NSTextAlignmentCenter和一个非零值NSKernAttributeName 字符串未正确居中我做错了什么还是这是预期的行为有解决方法吗截屏您
Django 多租户：如何为每个租户自定义 django 设置“ACCOUNT_EMAIL_VERIFICATION”？

Django 1 11 7 django tenant schemas 1 8 0 django allauth 0 34 0 使用 django tenant schemas postgres 的多租户站点对于不同的租户需要不同的设置
MatPlotLib 的 ion() 和 draw() 不起作用

我正在尝试使用 for 循环实时绘制数字我有以下简单的代码 import matplotlib pyplot as plt plt ion plt figure for i in range 100 plt plot i i o plt
如何比较两个 Google Protocol Buffer 消息的内容是否相等？

我在API中似乎找不到比较方法我有这两条消息它们有很多不同的值有时会深入到更多值例如我有一条消息它有一个字符串一个 int 和一个 custom snapshot 其中 custom snapshot 由一个 int 一个字符
React Router 更改 URL 但不会更新页面，除非从浏览器刷新页面

所以我在 YouTube 上看了很多关于 React 初学者的教程但是我在这个 URL localhost 上单击设置按钮将 URL 更改为 localhost settings 并且不会在浏览器中自动执行如果我使用 URL l
.svn 文件夹位于每个文件夹中，但现在消失了

我已经使用TortoiseSVN很长时间了我昨天开始使用 AnkhSVN 之后每个子文件夹中隐藏的 svn 都被删除我用谷歌搜索了一段时间但没找到不再需要每个文件夹中的 svn 了吗谢谢这可能是 AnkhSVN 使用 SVN
是否可以在动态域的序数尺度上使用 rangeBand() ？

我的数据看起来像这样 var data name a value 97 name b value 24 name c value 10 我有一个像这样创建的序数表 var y d3 scale ordinal rangeBands 0 30
基于视图的应用程序中的水效果

我在 xcode 中使用基于视图的应用程序我想做一个效果像这样的水效果video http www youtube com watch v Aix1QbE9m0w 在这个视频中这个人使用了opengl es 我不知道没有它是否可行以
使用php连接的SQL Server地址

我使用此代码连接到 SQL Server 2012 但它不起作用它总是打印Database Connect Failed 另外如何从外部 Web 服务器连接到本地 SQL Server 如果您的版本是 SQL Se
在 SQL Server 中的 SUM 函数上应用 OR 条件

我有 2 列名为Debit and Credit 我想从一列中获取值并将其放入第三列中 Balance 我想应用一个条件如果Debit包含任何值应将其放入Balance列并且如果Credit有一些东西那么它应该将该值插入到该列中但
tensorflow py_func 很方便，但使我的训练步骤非常慢。

我在使用张量流函数 py func 时遇到一些效率问题 Context 在我的项目中我有一批张量input features大小的 max items m 第一个维度设置为因为它是动态形状为自定义张量流读取器读取批次并使用 tf t

tensorflow py_func 很方便，但使我的训练步骤非常慢。

tensorflow py_func 很方便，但使我的训练步骤非常慢。 的相关文章

随机推荐

热门标签

tensorflow py_func 很方便，但使我的训练步骤非常慢。的相关文章