向量化 for 循环 NumPy

2024-04-12

我对 Python 比较陌生，并且有一个嵌套的 for 循环。由于 for 循环需要一段时间才能运行，因此我试图找到一种方法来向量化此代码，以便它可以运行得更快。

在本例中，coord 是一个 3 维数组，其中 coord[x, 0, 0] 和 coord[x, 0, 1] 是整数，coord[x, 0, 2] 是 0 或 1。 H 是 SciPy稀疏矩阵，x_dist、y_dist、z_dist 和 a 都是浮点数。

# x_dist, y_dist, and z_dist are floats
# coord is a num x 1 x 3 numpy array where num can go into the hundreds of thousands
num = coord.shape[0]    
H = sparse.lil_matrix((num, num))
for i in xrange(num):
    for j in xrange(num):
        if (np.absolute(coord[i, 0, 0] - coord[j, 0, 0]) <= 2 and
                (np.absolute(coord[i, 0, 1] - coord[j, 0, 1]) <= 1)):

            x = ((coord[i, 0, 0] * x_dist + coord[i, 0, 2] * z_dist) -
                 (coord[j, 0, 0] * x_dist + coord[j, 0, 2] * z_dist))

            y = (coord[i, 0, 1] * y_dist) - (coord[j, 0, 1] * y_dist)

            if a - 0.5 <= np.sqrt(x ** 2 + y ** 2) <= a + 0.5:
                H[i, j] = -2.7

我还读到，使用 NumPy 进行广播虽然速度更快，但可能会导致临时数组使用大量内存。走矢量化路线或尝试使用 Cython 之类的东西会更好吗？

这就是我对代码进行矢量化的方式，稍后对注意事项进行一些讨论：

import numpy as np
import scipy.sparse as sps

idx = ((np.abs(coord[:, 0, 0] - coord[:, 0, 0, None]) <= 2) &
       (np.abs(coord[:, 0, 1] - coord[:, 0, 1, None]) <= 1))

rows, cols = np.nonzero(idx)
x = ((coord[rows, 0, 0]-coord[cols, 0, 0]) * x_dist +
     (coord[rows, 0, 2]-coord[cols, 0, 2]) * z_dist)
y = (coord[rows, 0, 1]-coord[cols, 0, 1]) * y_dist
r2 = x*x + y*y

idx = ((a - 0.5)**2 <= r2) & (r2 <= (a + 0.5)**2)

rows, cols = rows[idx], cols[idx]
data = np.repeat(2.7, len(rows))

H = sps.coo_matrix((data, (rows, cols)), shape=(num, num)).tolil()

正如您所指出的，问题将出现在第一个idx数组，因为它的形状(num, num)，所以如果num就是“入数十万”。

一种可能的解决方案是将问题分解为可管理的部分。如果您有一个包含 100,000 个元素的数组，则可以将其拆分为 100 个块，每块包含 1,000 个元素，并对 10,000 个块组合中的每一个运行上述代码的修改版本。您只需要 1,000,000 个元素idx数组（您可以预先分配和重用以获得更好的性能），并且您将拥有一个仅 10,000 次迭代的循环，而不是当前实现的 10,000,000,000 次迭代。这是一种穷人的并行化方案，如果您有一台多核机器，您实际上可以通过并行处理其中几个块来改进该方案。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

向量化 for 循环 NumPy 的相关文章

matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
组和平均 NumPy 矩阵

假设我有一个任意的 numpy 矩阵如下所示 arr 6 0 12 0 1 0 7 0 9 0 1 0 8 0 7 0 1 0 4 0 3 0 2 0 6 0 1 0 2 0 2 0 5 0 2 0 9 0 4 0 3 0 2 0 1 0
类型错误：float() 参数必须是字符串或数字，而不是“列表”python

我的 Python 有问题这是我的代码 def calcola a input b float a 0 split c float a 0 split d float a 0 split e float a 0 split j float
Perl 是否有相当于 Python 的 `if __name__ == '__main__'` 的功能？

有没有一种方法可以确定当前文件是否是 Perl 源中正在执行的文件在 Python 中我们使用以下结构来做到这一点 if name main This file is being executed raise NotImplemente
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
如何使用 i18n 切换器将“LANGUAGE_CODE”保存到数据库，以便在 Django 中的不同浏览器中语言不会更改？

有什么办法可以改变它的值LANGUAGE CODE单击按钮发送请求时 settings py 中的变量会动态变化吗我希望用户设置自己的默认语言他们的帐户现在用户可以使用下拉列表选择他们的首选语言并且网站会得到完美的翻译并且
通用详细视图 ProfileView 必须使用对象 pk 或 slug 调用

我是 Django 2 0 的新手在访问我的个人资料页面视图时收到此错误它适用于像这样的网址path users
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
Django 模型字段默认基于另一个模型字段

我使用 Django Admin 构建一个管理站点有两张表一张是ModelA其中有数据另一个是ModelB里面什么也没有如果一个模型字段b b in ModelB为None 可以显示在网页上值为ModelA的场a b 我不知道该怎
reStructuredText：README.rst 未在 PyPI 上解析

我有一个托管在 Github 和 PyPI 上的 Python 项目在 Github 上 https github com sloria TextBlob blob master README rst https github com s
Python 3在for循环中更改字典键的值不起作用

我的 python 3 代码没有按预期工作 def addFunc x y print x y def subABC x y z print x y z def doublePower base exp print 2 base exp d
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
如何正确导入主代码和模块中同时使用的模块？

假设我有一个主脚本 main py 它导入另一个 python 文件import coolfunctions另一个 import chores 现在假设 Coolfunctions 也使用家务活中的东西因此我声明import chore
Selenium 不会在新选项卡中打开新 URL（Python 和 Chrome）

我想使用 Selenium WebDriver 和 Python 在不同的选项卡中打开相当多的 URL 我不确定出了什么问题 driver webdriver Chrome driver get url1 time sleep 5 driv
python dicttoxml 多次使用相同的键

我正在尝试做如下所示的 xml
在 scipy 中创建新的发行版

我试图根据我拥有的一些数据创建一个分布然后从该分布中随机抽取这是我所拥有的 from scipy import stats import numpy def getDistribution data kernel stats gauss
在 HDF5 (PyTables) 中存储 numpy 稀疏矩阵

我在使用 PyTables 存储 numpy csr matrix 时遇到问题我收到此错误 TypeError objects of type csr matrix are not supported in this context so
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
Streamlabs API 405 响应代码

我正在尝试使用Streamlabs API https dev streamlabs com Streamlabs API 使用 Oauth2 来创建应用程序因此首先我将使用我的应用程序的用户发送到一个授权链接其中包含我的应用程序的客
Python 中的字符串slugification

我正在寻找 slugify 字符串的最佳方法蛞蝓是什么 https stackoverflow com questions 427102 in django what is a slug 我当前的解决方案基于这个食谱 http code

随机推荐

Marquee ProgressBar 对 BackgroundWorker 无响应

在我的代码中当单击按钮时进度条设置为选取框然后调用我的BackgroundWorker 但是当调用BackgroundWorker 时进度条会冻结或消失我使用BackgroundWorker 将ReportViewer 的Refr
为什么 SQLite 在添加 JOIN 时拒绝使用可用索引？

这与为什么 SQLite 拒绝使用可用索引 https stackoverflow com questions 19454787 why is sqlite refusing to use available indexes 创建数据库的查
有没有办法选择 Cheerio 中的每个元素？

有没有一种方法可以获取包含 html 页面中的每个元素包括子元素的 Cheerio 对象然后对其进行迭代我尝试过使用该对象 body 但它只给出 HTML 正文的直接子级而不是所有后续子级我可以做些什么来选择所有 HTML 元素
未找到列：1054“字段列表”Laravel 中的未知列“_token”

我尝试更新表类别的记录但它显示错误未找到列 1054 未知列 token Route Route post categorias edit id CategoryController update 控制器 public function
比较两列的值，然后选择较大的值

我需要查询一个表并选择 4 列值中的 3 个我需要比较第三列和第四列的值并选择较大的值例如 column1 column2 column3 column4 hello hello 3 5 hi hi 7 1 我需要返回 column1
没有及时更新GUI

我有一个更新 GUI 元素的类 public class UpdateLabelClass static MainGUI theForm MainGUI Application OpenForms 0 Label lblCurProgres
Android内核编译错误gcc6 linaro 6

我正在尝试使用 Linaro 6 进行编译但收到此错误我认为该错误与 GCC 6 有关我对编译内核或编码非常业余但即使搜索类似的术语我也无法弄清楚 CC drivers iommu msm iommu v1 o In file in
CloudFront 获得 X-Cache：来自 cloudfront 的错误，状态代码为 200

我试图托管我的网站example com使用具有两个 S3 源的 CloudFront S3 main对于该网站和S3 resources为了资源所以我设置S3 main as the default And S3 resources有路
Python - 将多个 Pickle 对象加载到单个字典中

所以我的问题是这样的我有多个 Pickle 对象文件即 Pickled 字典我想加载它们但本质上是将每个字典合并到一个更大的字典中 E g 我有 pickle file1 和 pickle file2 都包含字典我希望将 pick
在 WooCommerce 中隐藏购物车中的“删除商品”和“数量输入”

在 WooCommerce 购物车页面上我想隐藏删除项目按钮数量输入字段对于将在评论中出现的项目 HIDE REMOVE BUTTON QUNATITY OF THESE ITEMS在下面的代码中 if is cart forea
如何生成24小时后过期的唯一令牌？

我有一个 WCF Web 服务来检查用户是否有效如果用户有效我想生成一个 24 小时后过期的令牌 public bool authenticateUserManual string userName string password st
对象的递归实例化？

public class ran ran obj1 new ran will this create a recursive instantiating of objects public String s null public stat
当尝试使用已安装的开发人员工具进行编译时，editline/history.h 和 editline/readline.h 在 macOS 上未找到/工作

我正在编写有关构建您自己的 LISP 的教程 http www buildyourownlisp com chapter4 interactive prompt http www buildyourownlisp com chapter4
Angular2-fullcalendar 不是 NgModule。意外的指令 CalendarComponent

在最新版本的 Angular cli 上 angular2 fullcalendar 无法工作原因如下 CalendarComponent 中的错误不是 NgModule 在浏览器中我发现以下消息错误意外的指令 CalendarCom
Android、Firebase：minSdkVersion 15 不能小于版本 16

我需要降级我的 minsdk 以保持与某些设备的兼容性因此我需要将我的版本从 minsdk16 gt 15 降级但我有这个错误清单合并失败 uses sdk minSdkVersion 15 不能更小比库中声明的版本 16 com
如何处理 Razor Pages 中的 input=file / IFormFile 双向绑定

我有一个实体它具有 byte 将徽标作为 varbinary 存储在数据库中但为了在 Razor 页面上使用此模型我对其进行了扩展并添加了 IFormFile 属性来接收上传的文件 public class Company publi
Adb安装进度条

我是这方面的初学者所以如果我问任何明显的问题请介意我我正在尝试安装一个apk到我的设备使用adb install apk apk但是那apk大约有几百 MB 大并且需要一些时间我可以在命令窗口中实现某种进度条来显示进度吗我见过
如何将文件从 HTML5 拖放到 Rails 3 应用程序和回形针？

我正在尝试使用 Paperclip 在 Rails 3 应用程序中获得一些 html5 拖放功能所以基本上将一个或多个文件拖放到 DIV 上文件被 POST 到 Rails 操作一起或一次一个 Rails 操作将每个文件保存为 P
如何使用 Ruby 通过 HTTP 下载文件？

如何使用 Ruby 通过 HTTP 下载文件可能是下载文件的最短方法 require open uri download open http example com download pdf IO copy stream download
向量化 for 循环 NumPy

我对 Python 比较陌生并且有一个嵌套的 for 循环由于 for 循环需要一段时间才能运行因此我试图找到一种方法来向量化此代码以便它可以运行得更快在本例中 coord 是一个 3 维数组其中 coord x 0 0 和 c

向量化 for 循环 NumPy

向量化 for 循环 NumPy 的相关文章

随机推荐

热门标签