在 Theano 中循环（或向量化）可变长度矩阵

2024-01-20

我有一个矩阵列表L，其中每个项目M is a x*n矩阵（x是一个变量，n是一个常数）。

我想计算总和M'*M对于所有项目L (M'是转置M）如以下 Python 代码所示：

for M in L:
  res += np.dot(M.T, M)

实际上我想在Theano中实现这个（它不支持可变长度多维数组），并且我不想将所有矩阵填充到相同的大小，因为这会浪费太多空间（有些矩阵可能非常大））。

有一个更好的方法吗？

Edit:

L在 Theano 编译之前就已知。

Edit:

从@DanielRenshaw 和@Divakar 收到了两个出色的答案，在情感上很难选择一个接受。

鉴于在需要进行 Theano 编译之前矩阵的数量是已知的，因此可以简单地使用常规的 Python 矩阵列表。

这是一个完整的示例，显示了 numpy 和 Theano 版本之间的差异。

此代码已更新，包括与 @Divakar 的矢量化方法的比较，该方法的性能更好。 Theano 可以采用两种向量化方法，一种是 Theano 执行串联，另一种是 numpy 执行串联，然后将结果传递给 Theano。

import timeit
import numpy as np
import theano
import theano.tensor as tt


def compile_theano_version1(number_of_matrices, n, dtype):
    assert number_of_matrices > 0
    assert n > 0
    L = [tt.matrix() for _ in xrange(number_of_matrices)]
    res = tt.zeros(n, dtype=dtype)
    for M in L:
        res += tt.dot(M.T, M)
    return theano.function(L, res)


def compile_theano_version2(number_of_matrices):
    assert number_of_matrices > 0
    L = [tt.matrix() for _ in xrange(number_of_matrices)]
    concatenated_L = tt.concatenate(L, axis=0)
    res = tt.dot(concatenated_L.T, concatenated_L)
    return theano.function(L, res)


def compile_theano_version3():
    concatenated_L = tt.matrix()
    res = tt.dot(concatenated_L.T, concatenated_L)
    return theano.function([concatenated_L], res)


def numpy_version1(*L):
    assert len(L) > 0
    n = L[0].shape[1]
    res = np.zeros((n, n), dtype=L[0].dtype)
    for M in L:
        res += np.dot(M.T, M)
    return res


def numpy_version2(*L):
    concatenated_L = np.concatenate(L, axis=0)
    return np.dot(concatenated_L.T, concatenated_L)


def main():
    iteration_count = 100
    number_of_matrices = 20
    n = 300
    min_x = 400
    dtype = 'float64'
    theano_version1 = compile_theano_version1(number_of_matrices, n, dtype)
    theano_version2 = compile_theano_version2(number_of_matrices)
    theano_version3 = compile_theano_version3()
    L = [np.random.standard_normal(size=(x, n)).astype(dtype)
         for x in range(min_x, number_of_matrices + min_x)]

    start = timeit.default_timer()
    numpy_res1 = np.sum(numpy_version1(*L)
                        for _ in xrange(iteration_count))
    print 'numpy_version1', timeit.default_timer() - start

    start = timeit.default_timer()
    numpy_res2 = np.sum(numpy_version2(*L)
                        for _ in xrange(iteration_count))
    print 'numpy_version2', timeit.default_timer() - start

    start = timeit.default_timer()
    theano_res1 = np.sum(theano_version1(*L)
                         for _ in xrange(iteration_count))
    print 'theano_version1', timeit.default_timer() - start

    start = timeit.default_timer()
    theano_res2 = np.sum(theano_version2(*L)
                         for _ in xrange(iteration_count))
    print 'theano_version2', timeit.default_timer() - start

    start = timeit.default_timer()
    theano_res3 = np.sum(theano_version3(np.concatenate(L, axis=0))
                         for _ in xrange(iteration_count))
    print 'theano_version3', timeit.default_timer() - start

    assert np.allclose(numpy_res1, numpy_res2)
    assert np.allclose(numpy_res2, theano_res1)
    assert np.allclose(theano_res1, theano_res2)
    assert np.allclose(theano_res2, theano_res3)


main()

运行时会打印（类似）

numpy_version1 1.47830819649
numpy_version2 1.77405482179
theano_version1 1.3603150303
theano_version2 1.81665318145
theano_version3 1.86912039489

断言通过，表明 Theano 和 numpy 版本都以高精度计算相同的结果。显然，如果使用float32代替float64.

时序结果表明矢量化方法可能不是优选的，它取决于矩阵大小。在上面的例子中，矩阵很大，非串联方法速度更快，但如果n and min_x参数改变在main函数要小得多，然后串联方法更快。在 GPU 上运行时可能会出现其他结果（仅限 Theano 版本）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Theano 中循环（或向量化）可变长度矩阵的相关文章

PHP清晰度卷积矩阵

我正在使用一个卷积矩阵 http www php net manual en function imageconvolution php为了锐度PHP GD我想改变清晰度 level 我会去哪里做出改变如果我想做到的话或多或少尖锐 imag
如何按物种矩阵显示站点内植物物种生物量？

我之前问过如何将两列显示为二进制存在不存在矩阵这个问题得到了两个很好的答案我现在想更进一步在原始站点按物种列添加第三列该列反映每个地块中每个物种的生物量第 1 列地块指定约 200 个地块的代码第 2 列物种指定
带有元数据的 scipy kdtree

我目前正在寻找一种方法来构建几个 kd 树以快速查询一些 n 维数据但是我对 scipy KD 树算法有一些问题我的数据包括id gt data somedata coordinate x y 我希望能够基于坐标和 k 最近邻居的 i
将 3D 矩阵转换为级联 2D 矩阵

我有一个3Dpython中的矩阵如下 import numpy as np a np ones 2 2 3 a 0 0 0 2 a 0 0 1 3 a 0 0 2 4 我想转换这个3D矩阵到一组2D矩阵我努力了np reshape但这并没
Mysql：多个表还是一张大表？

这个问题已经被问过但我还没有找到 1 个语音答案最好这样做 1 张大桌子其中用户 ID 属性 1 属性 2 属性 3 属性 4 或 4 个小桌子其中用户 ID 属性 1 用户 ID 属性 2 用户 ID 属性 3 用户 ID 属
仅使用 numpy 和 pandas 计算转换矩阵中每个单词的频率

我正在尝试仅使用 numpy 和 pandas 来计算转换矩阵中每个单词的频率我有一根绳子 star wars darth leia luke han chewbacca luke chewbacca obi chewbacca luke
Scikit Learn GridSearchCV 无需交叉验证（无监督学习）

是否可以在没有交叉验证的情况下使用 GridSearchCV 我正在尝试通过网格搜索优化 KMeans 聚类中的聚类数量因此我不需要或想要交叉验证 The 文档 http scikit learn org stable modules g
打印从 1 到 100 的质数

此 C 代码打印出以下素数 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 但我不认为这就是我的书所希望的写作方式它提到了一些关于数字的平方根的内容
递归：n项级数之和

需要递归函数系列是 1 2 3 3 4 5 4 5 6 7 递归求 n 的级数之和我无法想到应该在函数中传递哪些参数我的方法我认为我应该传递 n 要相乘的项数但我无法想到的是我应该如何在同一个函数中和以及我的 return 语
查找数组中 2 个缺失数字的最快方法

这个问题的存在只是出于纯粹的好奇心不是作业找到在数组 1 n 中找到两个缺失数字的最快方法因此在相关帖子中查找数字数组中缺失数字的最快方法 https stackoverflow com questions 2113795 qui
java中高效的输入流到字符串方法

因此我在 Java 中的诚然非常简单应用程序上运行探查器令我惊讶的是仅次于需要在时间上发出 HTTP 请求的方法的是我的方法 inputStreamToString方法目前它的定义如下 public static String
CSR 矩阵 - 矩阵乘法

我有两个方阵A and B 我必须转换B to CSR Format并确定产品C A B csr C 我在网上找到了很多关于CSR 矩阵向量乘法 http www mathcs emory edu cheung Courses 561 S
Python 将字符串组合成尽可能短的字符串？

如果我有一个字符串列表我想将它们组合成一个具有重叠字符的字符串如果没有剩余的重叠字符串请将其添加到末尾这是一个过于简化的版本 input one two output twone 我正在寻找一种方法来对输入列表中的任意数量的字符串执
Haar级联正例图像大小调整

我正在迈出第一步为自定义对象识别创建 haar 级联我花了时间获取大量数据并编写了一些预处理脚本以将视频转换为帧我的下一步是裁剪感兴趣的对象以创建一些积极的训练示例我有几个问题我确实在网上寻找答案我有点困惑我读到我应该致力于
找到将一个数字转换为另一个数字的最小移动次数的算法

假设我们有两个正整数 a 和 b 每次移动我们都可以将 a 除以 2 但前提是 a 是偶数将 a 乘以 2 或者将 a 加 1 将a变为b需要多少步找到一个直接公式或一种有效的算法即以对数时间运行的算法我取得的一些进展我们可以把它
如何缩短 PHP if 语句？

我有一个 if 语句我需要将单个字符串与许多不同的选项进行比较我在下面发布的代码非常清楚地表明了我的意思我知道有两种方法可以做到这一点但另一种甚至更长那么是否有任何函数可以以更短的方式实现类似的功能我的要求可能看起来很愚蠢但
在 O(n) 时间内对列表中的数字方块进行排序？

给定一个按排序顺序排列的整数列表例如 9 2 0 2 3 我们必须对每个元素进行平方并按排序顺序返回结果所以输出将是 0 4 4 9 81 我可以找出两种方法 O NlogN 方法我们将每个元素的平方插入哈希集中然后将元素复制到列
MATLAB：MEX 矩阵除法给出的结果与 m 文件不同

我使用 MATLAB 的编码器工具创建了矩阵指数函数的 MEX 版本以在另一组函数中使用问题是 MEX 版本给出的结果与原始 m 文件不同经过调试我认为这是因为MEX文件和m文件没有做相同的矩阵除法或者 MEX 文件首先就有问题
计算按前两列中的索引分组的 numpy 数组条目的第 N 列的总和？

我想循环以下内容check matrix以这样的方式代码可以识别第一个和第二个元素是否是1 and 1 or 1 and 2ETC 然后对于每个单独的类对即1 1 or 1 2 or 2 2 代码应将最后一个元素在本例中索引为 8 乘
具有最小刻度的图表的漂亮标签算法

我需要手动计算图表的刻度标签和刻度范围我知道漂亮刻度的标准算法参见我也知道这个Java实现 http erison blogspot nl 2011 07 algorithm for optimal scaling on char

随机推荐

制作文件有问题吗？

为什么当我用 makefile 编译程序时我得到 gcc Wall pedantic src main c o wk main o src main c 9 11 warning C style comments are not allow
如何在 IE 和 Firefox 中解析 JavaScript 中的 XML？

我正在尝试编写一段代码来解析 IE 和 Firefox 中的 javascript 以下在 IE 中有效在 Firefox 中也能正常运行 function XmlDom sXml var oXml if window ActiveXOb
在 Flask-migrate ValueError 中：位置 15 处的连接字符串中的插值语法无效

我在用flask migrate使用flask sqlalchemy 在flask 中创建和迁移数据库一切都工作正常直到我更改了包含的数据库用户密码然后它停止工作所以我根据以下内容更新了我的代码当密码包含特殊字符时写入连接字符串
在Python中使用递归和map

我正在尝试学习函数式编程概念练习使用 map reduce 展平嵌套列表我的代码 lists 1 2 3 4 5 6 7 8 9 def flatten lists return map lambda x flatten x if i
Rails 服务器启动后退出

我想开始使用 Rails 我正在使用 git bash 当我尝试启动 Rails 服务器时出现此错误我已经尝试到处搜索但找不到这个问题的解决方案我为此下载了 ruby 3 0 0 谢谢 gt Booting Puma gt Rail
QSqlDatabase：Ubuntu 15.04 64 位上未加载 QMYSQL 驱动程序

在 Ubuntu 15 04 64 位中我安装了 Qt5 6 在线安装程序在尝试将开发环境从 Windows 7 迁移到 Linux 时我遇到了以下问题 SqlDatabase QMYSQL driver not loaded 下列的
泛型类型的签名约束

struct S int a int b void fun T T t I want fun跟共事S仅有的签名约束是什么样的我做不到fun的成员S 与void fun T T t if is T S I get Error struc
Postgres 跨阵列频率计数

我有一列文本如何获取列中所有对象的频率计数例子 col a a b a b a 输出应该是 col a count a 3 b 2 我的查询 with all tags as select array agg c from select
通过 RStudio 使用 RMySQL 的 SSH 隧道

我是使用 Mac OS X 使用 RStudio 的 R 新手我成功地使用sequel Pro来查看DB 就像这样我将 dbConnect 与 RMySQL 一起使用将 DBI 下面的代码与 RStudio 一起使用 library
如何从嵌套对象字面量访问外部成员？

在下面的代码中可以从嵌套对象字面量访问 x 成员吗 var outer x 0 inner a x 1 x is undefined b outer x 1 outer is undefined c this x 1 This doesn
Kubernetes 部署。如何更改容器环境变量以进行滚动更新？

以下是我在 google 上使用 kubernetes 的方式我有一个节点应用程序比方说图书门户节点应用程序正在使用配置的环境变量 Step1 我创建了 docker 文件并推送 gcr io
如何在 Typescript/Webpack 的 Bitbucket Pipelines 中增加 NodeJS 堆（--max-old-space-size）？

我在无服务器 TypeScript 项目中的 webpack 打包步骤中遇到内存问题我努力了增加内存限制 npm 包无济于事从 npm run 脚本调用以下命令通过bitbucket pipelines yml直接调用以下命令 no
取消选择所有 jquery 选项卡时遇到问题

我设置了一些 jQuery 选项卡一开始没有选择任何选项卡如下所示 tabs tabs selected 1 然后我还有一个单独的链接按下该链接需要取消选择所有选项卡 deselectButton click function tab
从另一个进程访问 mmap 内存

我开始玩 mmap 了我正在尝试创建一个示例工作区然后将其扩展到实际案例这就是我想要实现的目标流程1 mmap一个文件实际上是一个设备但是用文本文件生成一个例子是可以的进程2 不是从进程1复制而来只是一个独立的进程读取进程
在Python中编辑文本文件中的特定行

假设我有一个文本文件其中包含 Dan Warrior 500 1 0 有没有办法可以编辑该文本文件中的特定行现在我有这个 usr bin env python import io myfile open stats txt r dan
重复的 ID。日本科学基金会

我的 JSF 有问题谁能说为什么这不起作用
在 matlab GUI 中创建选项卡

如何在 matlab gui 中创建选项卡我不久前做了这样的事情我的意思是我在 GUI 顶部创建了一些菜单然后按每个菜单将设置某些控件的可见属性而其他控件则关闭这种方式对于小型 GUI 很有用但在 beag GUI 中会遇到问题
raku 语法的标记不会命中文档的第一次出现，但会命中类似的后续出现

我想处理希伯来语的整个 Tanach 文件为此我选择了 Raku 语言因为它的一些功能语法和 unicode 支持因此我定义了一些标记来选择相关数据 grammar HEB token TOP
如何使用 autoStartup=false 启动 Camel 路线

我想使用以下命令来控制我的路线何时启动RoutePolicy 因此我将其定义为autoStartup false
在 Theano 中循环（或向量化）可变长度矩阵

我有一个矩阵列表L 其中每个项目M is a x n矩阵 x是一个变量 n是一个常数我想计算总和M M对于所有项目L M 是转置M 如以下 Python 代码所示 for M in L res np dot M T M 实际上我想在The

在 Theano 中循环（或向量化）可变长度矩阵

在 Theano 中循环（或向量化）可变长度矩阵 的相关文章

随机推荐

热门标签

在 Theano 中循环（或向量化）可变长度矩阵的相关文章