使用多核的 Numpy np.einsum 数组乘法

2024-03-28

我用MKL编译了numpy 1.6.2和scipy，希望有更好的性能。目前我有一个严重依赖 np.einsum() 的代码，并且我被告知 einsum 不适用于 MKL，因为几乎没有矢量化。 =( 所以我想用 np.dot() 和切片重新编写一些代码，只是为了能够获得一些多核加速。我真的很喜欢 np.einsum() 的简单性并且可读性很好。无论如何，例如，我有一个以下形式的多维矩阵乘法：

np.einsum('mi,mnijqk->njqk',A,B)

那么我如何在 np.dot() 高效 MKL 操作中转换类似这样的东西，或其他 3,4 和 5 维数组乘法？

我会广告更多信息：我正在计算这个方程：

为此，我使用以下代码：

np.einsum('mn,mni,nij,nik,mi->njk',a,np.exp(b[:,:,np.newaxis]*U[np.newaxis,:,:]),P,P,X)

这并没有那么快，用 cython 编码的相同内容快了 5 倍：

    #STACKOVERFLOW QUESTION:
from __future__ import division
import numpy as np
cimport numpy as np
cimport cython

cdef extern from "math.h":
    double exp(double x)


DTYPE = np.float

ctypedef np.float_t DTYPE_t
@cython.boundscheck(False) # turn of bounds-checking for entire function
def cython_DX_h(np.ndarray[DTYPE_t, ndim=3] P, np.ndarray[DTYPE_t, ndim=1] a, np.ndarray[DTYPE_t, ndim=1] b, np.ndarray[DTYPE_t, ndim=2] U,  np.ndarray[DTYPE_t, ndim=2] X, int I, int M):
    assert P.dtype == DTYPE and a.dtype == DTYPE and b.dtype == DTYPE and U.dtype == DTYPE and X.dtype == DTYPE

cdef np.ndarray[DTYPE_t,ndim=3] DX_h=np.zeros((N,I,I),dtype=DTYPE)
cdef unsigned int j,n,k,m,i
for n in range(N):
    for j in range(I):
        for k in range(I):
            aux=0
            for m in range(N):
                for i in range(I):
                    aux+=a[m,n]*exp(b[m,n]*U[n,i])*P[n,i,j]*P[n,i,k]*X[m,i]
            DX_h[n,j,k]=aux
return DX_h

有没有办法在纯Python中以cython的性能来做到这一点？（我还没能弄清楚如何张量这个方程）无法在这个 cython 代码中进行 prange，有很多 gil 和 nogil 错误。

或者，您可以使用numpy.tensordot():

np.tensordot(A, B, axes=[[0, 1], [0, 2]])

它还将使用多个核心，例如numpy.dot().

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Arrays

NumPy

Cython

intelmkl

使用多核的 Numpy np.einsum 数组乘法的相关文章

无法将 datetime.datetime 与 datetime.date 进行比较

我有以下代码并收到上述错误由于我是 python 新手我无法理解这里的语法以及如何修复错误 if not start or date lt start start date 有一个datetime date 从日期时间转换为日期的方法
如何用xlrd读取公式

我正在尝试做一个解析器它读取几个 Excel 文件我通常需要位于行底部的值您可以在其中找到所有上部元素的总和因此单元格值实际上是 sum 或 A5 0 5 可以说对于使用 Excel 打开此文件的用户来说它看起来像一个数字这
如何从网站中提取冠状病毒病例？

我正在尝试从网站中提取冠状病毒 https www trackcorona live https www trackcorona live 但我得到了一个错误这是我的代码 response requests get https www t
Javascript：打乱数组中的对象组

我有一个对象数组我已按键排序 group如下使得所有具有相同值的对象group在索引中彼此相邻data 例如 var data foo cat group house foo cat group house foo cat group
如何在 openpyxl 中设置或更改表格的默认高度

我想通过openpyxl更改表格高度并且我希望首先默认一个更大的高度值然后我可以设置自动换行以使我的表格更漂亮但我不知道如何更改默认高度唯一的到目前为止我知道更改表格高度的方法是设置 row dimension idx heigh
使用 Python 解析 XML，解析外部 ENTITY 引用

在我的 S1000D xml 中它指定了一个带有对公共 URL 的引用的 DOCTYPE 该 URL 包含对包含所有有效字符实体的许多其他文件的引用我使用 xml etree ElementTree 和 lxml 尝试解析它并得到解析错
使用reduce方法的斐波那契数列

于是我看到有人用reduce方法来计算斐波那契数列这是他的想法 1 0 1 1 2 1 3 2 5 3 对应于 1 1 2 3 5 8 13 21 代码如下所示 def fib reduce n initial 1 0 dummy ra
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
Python 相当于 Bit Twiddling Hacks 中的 C 代码？

我有一个位计数方法我正在尝试尽可能快地实现我想尝试下面的算法位摆弄黑客 http graphics stanford edu seander bithacks html CountBitsSetParallel 但我不知道 C 什么是
如何检查包含 NaN 的列表 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案在我的 for 循环中我的代码生成一个如下所示的列表 list 0 0 0 0 sum 0 0 0 0 该循环生成所有其他数字向量但它也
在 GAE/Python 中放置一次性代码和每次代码的最佳位置在哪里？

我是 Google App Engine 和 Python 的新手我无法理解有关在 Google App Engine 上运行的 Python 应用程序的一些基本问题如果我想要执行代码对于每个传入的请求我应该将其放在哪里我们正在捕
如何解码 dtype=numpy.string_ 的 numpy 数组？

我需要使用 Python 3 解码按以下方式编码的字符串 gt gt gt s numpy asarray numpy string hello nworld gt gt gt s array b hello nworld dtype S1
Matplotlib 将颜色图 tab20 更改为三种颜色

Matplotlib 有一些新的且非常方便的颜色图选项卡颜色图 https matplotlib org examples color colormaps reference html 我错过的是生成像 tab20b 或 tab20c 这
如何将reportlab与Google应用程序引擎一起使用

我无法在谷歌应用程序引擎下正确导入reportlab 根据以下guide http blog notdot net 2010 04 Generating PDFs on App Engine Python and introducing M
从 postgres 表中提取 json 数组给出错误：无法从标量中提取元素

通过使用jsonb array elements 提取出来的函数jsonb来自 Postgres 的数据数组它给出了错误无法从标量中提取元素我认为这是因为NULL在返回调用中添加了NULL检查状况但不工作任何帮助表示赞赏 sele
本地设置的 Cython 编译器指令是否影响一个或所有函数？

我正在努力使用 Cython 加速一些 Python Numpy 代码并且对本地设置如定义的here http docs cython org en latest src reference compilation html在文档中
Windows 与 Linux 文本文件读取

问题是我最近从 Windows 切换到 Ubuntu 我的一些用于分析数据文件的 python 脚本给了我错误我不确定如何正确解决我当前仪器的数据文件输出如下 Header 有关仪器等的各种信息 Data 状态代码温度字段等 0
在 Haskell 中增长数组

我想在 Haskell 中实现以下命令式算法给定一个序列对 e0 s0 e1 s1 e2 s2 en sn 其中 e 和 s 部分不一定是自然数不同的是在每个时间步都会随机选择该序列的一个元素例如 ei si 并根据 ei si
Python 中的迭代器 (iter()) 函数。 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案对于字典我可以使用iter 用于迭代字典的键 y x 10 y 20 for val in iter y print val 当
Python - 打印漂亮的 XML 为空标签文本创建开始和结束标签

我正在编写一个 python 应用程序它创建一个 ElementTree XML 然后使用 minidom 的 toprettyxml 将其写入文件 final tree minidom parseString ET tostring r

随机推荐

如何打包 Visual Studio aws 无服务器项目？

我试图弄清楚是否有一种方法可以以自动化的方式打包 aws 无服务器项目以便我们可以拆分构建和发布管道使用dotnet lambda命令行工具我可以看到有一个dotnet lambda package命令将 lambda 打包为 zip
在 php 中集成 payfort api 时遇到问题

我正在关注 https docs start payfort com references api https docs start payfort com references api 实施 Payfort 付款 Api 的文档但我遇到
Kendo 自动完成显示两个建议列表

我的 Kendo 自动完成控件成功检索 Json 列表不幸的是它调用了 MVC 控制器方法两次并创建了两个建议列表重复列表直接显示在第一个列表后面当从第一个建议列表中选择一个值时该列表会消失但重复列表仍然可见我正在使用自动完成
Angular“=”范围不适用于驼峰命名法

我是指令的范围属性我使用时效果很好show作为属性名称 span span
如何在 pip 安装期间编译 C++ 依赖项？

我想让我的 python 代码可以使用 pip 但是我的代码依赖于另一个不可 pip 的库所以当用户调用时我需要以某种方式编译源代码pip install 我怎样才能做到这一点我无法通过简单的谷歌搜索找到好的参考资料我建议看看 l
使用请求对象 Flask 获取 json 响应

网络服务 app route get details def getDetails cur execute select from employee rows cur fetchall columns desc 0 for desc in
CSS / HTML 导航和徽标位于同一行

我不知道如何将它们放在同一条线上 http codepen io anon pen dovZdQ http codepen io anon pen dovZdQ div class navigation bar div img src lo
如何修复/调整 ggplot geom_tile 中每个带的宽度

这是我的问题的示例数据 sampledata lt matrix c 1 60 1 60 rep 0 1 each 60 sample 1 3 120 replace T ncol 3 colnames sampledata lt c Ti
如何进行递归子文件夹搜索并返回列表中的文件？

我正在编写一个脚本以递归方式遍历主文件夹中的子文件夹并构建特定文件类型的列表我的脚本有问题目前设置如下 for root subFolder files in os walk PATH for item in files if ite
Jquery AJAX：服务器端验证失败时如何显示Flash错误消息？

我正在使用 Jquery 表单插件通过 ajax 提交表单我已经在我的模型中的服务器端设置了验证现在当验证失败时我想使用 ajax 向用户显示相同的 flash error 消息如果验证成功我可以显示 flash notice
Xcode 卡在索引上

我已经工作了两个月的项目无缘无故停止工作因为 Xcode 卡在索引上我无法再构建该项目了如果我尝试构建 Xcode 就会冻结我必须强制退出这种情况仅发生在该项目中我尝试清理所有派生数据但没有帮助我正在使用 Xcode 4
jqgrid 更改单元格值并保持编辑模式

我在网格中使用内联编辑在某些情况下我想更改列内单元格的值我用 setCell 更改它效果很好我的问题是更改后单元格失去了编辑模式而该行的所有其他单元格都处于编辑模式我想在更改单元格后将其保持在编辑模式现在我所做的是保存该行
种子中的 DHT

我正在编写一个 P2P 实现我希望将其去中心化然而我在掌握如何做时遇到了一些困难DHT https en wikipedia org wiki Distributed hash table在像 BitTorrent 这样的协议中是有效的
帮助正确计算atan2

我需要计算线之间的角度我需要计算atan 所以我正在使用这样的代码 static inline CGFloat angleBetweenLinesInRadians2 CGPoint line1Start CGPoint line1End
python中“追加”和“+”有什么区别？ [复制]

这个问题在这里已经有答案了我不知道有什么区别f and g 功能中f 每当调用函数时列表 L 就会累积但在功能上g 它不是 def f a L L append 2 print L def g a L L L 2 print L pr
SQL Server 2008中的递归同表查询

我在 SQL Server 2008 数据库中有下表 Id Name ParentFolder 1 Europe NULL 2 Asia NULL 3 Germany 1 4 UK 1 5 China 2 6 India 2 7 Scotl
echo 函数跳转到 Div 之外

我创建了一个用于 gettext 翻译的函数该函数位于头文件中 function ex text echo gettext text 当我使用函数 ex 时它会翻译该函数中的任何文本效果很好尽管当我在另一个内部有 div 的函数中使用
使用 Apache Lucene 对 MySQL 数据库建立索引，并保持它们同步

当MySQL中添加一个新项目时它也必须被Lucene索引当现有项目从 MySQL 中删除时它也必须从 Lucene 的索引中删除这个想法是编写一个脚本通过调度程序例如 CRON 任务每 x 分钟调用一次这是保持 MySQL
简单的 Perl websocket 客户端

我正在尝试用 Perl 编写一个简单的 websocket 客户端 use Protocol WebSocket Client my client Protocol WebSocket gt new url gt ws myserver p
使用多核的 Numpy np.einsum 数组乘法

我用MKL编译了numpy 1 6 2和scipy 希望有更好的性能目前我有一个严重依赖 np einsum 的代码并且我被告知 einsum 不适用于 MKL 因为几乎没有矢量化所以我想用 np dot 和切片重新编写一些代码只是

使用多核的 Numpy np.einsum 数组乘法

使用多核的 Numpy np.einsum 数组乘法 的相关文章

随机推荐

热门标签

使用多核的 Numpy np.einsum 数组乘法的相关文章