numpy 向量化而不是 for 循环

2024-05-30

我用 Python 写了一些代码，运行良好，但速度很慢；我认为是由于 for 循环。我希望可以使用 numpy 命令加速以下操作。让我定义目标。

假设我有一个 2D numpy 数组all_CMs尺寸row x col。例如考虑一个6x11数组（见下图）。

我想计算所有行的平均值，即sumⱼ aᵢⱼ 生成一个数组。这当然可以轻松完成。（我称这个值为CM_tilde)
现在，为了each row我想计算一些选定值的平均值，即通过计算它们的总和并将其除以所有列的数量来计算低于特定阈值的所有值（N）。如果该值高于此定义的阈值，CM_tilde添加值（整行的平均值）。这个值称为CM
随后，CM从行中的每个元素中减去值

除此之外，我想要一个 numpy 数组或列表，其中所有这些CM列出了值。

如图：

以下代码可以工作，但速度非常慢（特别是当数组变大时）

CM_tilde = np.mean(data, axis=1)
N = data.shape[1]
data_cm = np.zeros(( data.shape[0], data.shape[1], data.shape[2] ))
all_CMs = np.zeros(( data.shape[0], data.shape[2]))
for frame in range(data.shape[2]):
    for row in range(data.shape[0]):
        CM=0
        for col in range(data.shape[1]):
            if data[row, col, frame] < (CM_tilde[row, frame]+threshold):
               CM += data[row, col, frame]
            else:
               CM += CM_tilde[row, frame]
        CM = CM/N
        all_CMs[row, frame] = CM
        # calculate CM corrected value
        for col in range(data.shape[1]):
            data_cm[row, col, frame] = data[row, col, frame] - CM
    print "frame: ", frame
return data_cm, all_CMs

有任何想法吗？

将您正在做的事情矢量化非常容易：

import numpy as np

#generate dummy data
nrows=6
ncols=11
nframes=3
threshold=0.3
data=np.random.rand(nrows,ncols,nframes)

CM_tilde = np.mean(data, axis=1)
N = data.shape[1]

all_CMs2 = np.mean(np.where(data < (CM_tilde[:,None,:]+threshold),data,CM_tilde[:,None,:]),axis=1)
data_cm2 = data - all_CMs2[:,None,:]

将此与您的原件进行比较：

In [684]: (data_cm==data_cm2).all()
Out[684]: True

In [685]: (all_CMs==all_CMs2).all()
Out[685]: True

逻辑是我们使用大小的数组[nrows,ncols,nframes]同时地。主要技巧是利用Python的广播，通过转动CM_tilde大小的[nrows,nframes] into CM_tilde[:,None,:]大小的[nrows,1,nframes]。然后，Python 将为每一列使用相同的值，因为这是此修改后的单一维度CM_tilde.

通过使用np.where我们选择（基于threshold) 是否要获取对应的值data，或者，再次，广播值CM_tilde。一个新的用途np.mean允许我们计算all_CMs2.

在最后一步中，我们通过直接减去这个新的来利用广播all_CMs2从相应的元素data.

通过查看临时变量的隐式索引，可能有助于以这种方式矢量化代码。我的意思是你的临时变量CM生活在一个循环中[nrows,nframes]，并且其值在每次迭代时都会重置。这意味着CM实际上是一个数量CM[row,frame]（后来显式分配给二维数组all_CMs），从这里很容易看出，您可以通过总结适当的CMtmp[row,col,frames]沿其列尺寸的数量。如果有帮助，您可以命名np.where(...)部分作为CMtmp为此目的，然后计算np.mean(CMtmp,axis=1)从那。显然，结果相同，但可能更透明。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

numpy 向量化而不是 for 循环的相关文章

Pandas 字符串提取所有匹配项

我正在学习 pandas 系列字符串方法中的正则表达式操作我能够从字符串中提取第一个数字但我的正则表达式与第二个数字不匹配如何捕获这两个数字注意第二行第二个元素在这里是 NAN CODE import pandas as pd d
重新索引错误没有意义

I have DataFrames大小在 100k 到 2m 之间我正在处理这个问题的框架是如此之大但请注意我必须对其他框架执行相同的操作 gt gt gt len data 357451 现在这个文件是通过编译许多文件创建的所以它
pip 安装失败，SSL 证书验证失败 (_ssl.c:833)

我无法通过 pip install 安装任何外部 python 模块我已经正确安装了 python 但如果我使用 pip install 它会显示此错误这是我运行后的代码pip install pytesseract C Users 1
Python sqlite3参数化删除表

我在 python 中删除 sqlite3 表时遇到问题我正在使用标准sqlite3模块 self conn sqlite3 connect sql drop table self conn execute sql u table nam
Python 按照层次结构按多个分隔符分割字符串

我只想根据多个分隔符例如 and 和按顺序分割字符串一次例子 121 34 adsfd gt 121 34 adsfd dsfsd and adfd gt dsfsd adfd dsfsd adfd gt dsfsd adfd dsf
使用 Pymongo 从 Windows 连接到 AWS 实例上的 MongoDB

此行反复抛出错误 client MongoClient ec2 12 345 67 89 us east 2 compute amazonaws com 27017 ssl True ssl keyfile C mongo pem 由于显而
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
类型错误：需要 Future 或协程

我尝试在 asyncssh 上自动重新连接 ssh 客户端 SshConnectManager 必须留在后台并在需要时进行 ssh 会话 class SshConnectManager object def init self host u
如何使用 xlrd 将新列和行添加到 .xls 文件

如何向 xlrd 中的工作表添加新列和或行我有一个使用 open workbook 读取的 xls 文件我需要在第一张表中添加一个新列 bouncebacks 然后在该表中添加新行但我在 xlrd 文档中找不到任何显示如何添加新行和
使用 3d 对象作为 3d 散点图中的标记 - Python

使用下面的代码我尝试模拟一个用罐头制成的碗我希望每个标记都是一个罐头最好的方法是什么我真的很感激任何建议谢谢 import pylab import numpy as np from math import pi sin cos
使用 python 只读取 Excel 中的可见行

我想只读取 python 中 Excel 工作表中的可见行输入 Excel表所以当我过滤时作为 python 中的输出在本例中我将仅获得可见数据 1 行这是我的代码 from openpyxl import load workbo
如何在交互式绘图（Python）中获得鼠标指向的（x，y）位置？

我使用 ipython 笔记本带有魔法 matplotlib nbagg 我正在审查matplotlib widget Cursor但仅查看光标widgets Cursor http matplotlib org 1 4 3 exampl
如何在数据框中绘制包含三列的无向图，形成 3 种不同类型的节点（三方）？

我正在尝试使用三个不同的列表绘制网络的可视化这三个列表形成 3 种类型的节点下面的代码正在运行如图所示需要两个列表用户 ID 评分但是我希望我的图表是三部分的即 user userId review ratings prod
在python中安装scipy模块时出错

我正在尝试使用 pip 在 python 中安装 scipy 模块它显示以下错误 Command c users sony appdata local programs python python35 32 python exe u c
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
Qcut Pandas：ValueError：Bin 边缘必须是唯一的

我使用 Pandas 中的 Qcut 将数据离散化为大小相等的存储桶我想要有价格桶这是我的数据框 productId sell prix categ popularity 11997 16758760 0 28 75 50 524137
当价格低于阈值时使用 pandas DataFrame 实施矢量化止损

给出这个示例数据框 date close signal positions 2017 01 02 27 90 0 0 0 0 2017 01 03 27 76 0 0 0 0 2017 01 04 28 65 1 0 1 0 2017 01
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
django admin 中内联模型的分页器

我有这个简单的 django 模型由一个传感器和特定传感器的值组成每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

Android 工具测试库模块覆盖率

我继承了一个android项目来设置代码覆盖率由于我对 android 没有做过太多的工作在 gradle 中也几乎没有做过多少工作所以我开始寻找有用的教程令人惊讶的是前几个教程非常有帮助我能够包含 jacoco gradle
Pandas 根据条件替换数据框值

我有一个主数据框 df Colour Item Price Blue Car 40 Red Car 30 Green Truck 50 Green Bike 30 然后我有一个价格修正数据框 df pc Colour Item Price
如何在Phone类库项目中添加ResourceDictionary并访问它

我正在开发一个项目其中我有一个引用图书馆项目的子项目在我的库项目电话类库中如何创建 ResourceDictionary xaml 其中我需要添加一些样式并在 xaml 文件和 cs 文件中使用它我需要访问 xaml 文件中的
类型错误：无法连接“str”和“int”对象有人可以帮助新手使用他们的代码吗？

感谢任何帮助还有任何重大缺陷或您在格式或基本方面看到的任何重大缺陷请指出谢谢 day raw input How many days locations raw input Where to days str day location
使用 InputStream 通过 TCP 套接字接收多个图像

每次我从相机捕获图像时我试图将多个图像自动从我的 Android 手机一张一张地发送到服务器 PC 问题是read 函数仅在第一次时阻塞因此从技术上讲只有一张图像被接收并完美显示但在那之后当is read 回报 1 该功能不阻塞
在 Keras 中使用有状态 LSTM 训练多变量多级数回归问题

我有时间序列P过程每个过程的长度各不相同但都有 5 个变量维度我试图预测测试过程的估计寿命我正在用有状态的方法来解决这个问题LSTM在喀拉斯但我不确定我的训练过程是否正确我将每个序列分成长度的批次30 所以每个序列都是这样的形
使用mockery和sinon模拟类方法

我正在学习使用带有 sinon 的节点模块模拟进行单元测试仅使用模拟和普通类我就可以成功注入模拟不过我想注入一个 sinon 存根而不是一个普通的类但我在这方面遇到了很多麻烦我试图嘲笑的班级 function LdapAuth
批量电子邮件仅限 80 封电子邮件 (GMAIL)？

Gmail 在此处列出了其电子邮件限制 https support google com a answer 166852 hl en https support google com a answer 166852 hl en 但是我收到
当 C 中没有足够的内存用于静态分配时会发生什么？

当您动态分配内存时例如malloc 1024 sizeof char 结果指针设置为NULL如果没有足够的可用内存来满足请求当没有足够的内存来满足静态分配时会发生什么例如char c 1024 char c 1024 不一定是静态分配
Intern JS - 如何在链式 Command 方法中使用 Promise.all()？

我是用 Intern JS 编写测试的新手并且一直在遵循他们的文档来使用对象接口 https theintern github io intern interface object and 页面对象 https theintern git
Jquery Ajax 调用返回 403 状态

我有一个 jquery Ajax 调用来实现会话的 keepalive 这个 keepAlive 方法将每 20 分钟调用一次 function keepAlive ajax type POST url KeepAliveDummy asp
Sql 查询：Sum，表中所有可能的行组合

SQL Server 2008 R2 表结构示例 create table TempTable ID int identity value int insert into TempTable values 6 insert into Tem
Java小程序找不到JavaPOS配置文件

我创建了一个小程序它使用 JavaPOS 与用户本地系统上的支付终端进行通信当从 Eclipse IDE 中运行时该小程序可以正常工作但在浏览器中运行时则不然在浏览器中小程序似乎找不到 jpos res jpos propert
如何使breezejs所需的验证器允许空字符串

在breezejs中允许所需属性中存在空字符串的首选方式是什么 I found 这个答案 https stackoverflow com questions 19658297 how does breeze saves empty stri
从多个表中选择 - 一对多关系

我有这样的表表产品身份证姓名表格图像产品 ID 网址订单号表价产品 ID 组合货币价格表数量产品 ID 组合数量表 Product 与其他表是一对多关系我需要查询表并得到类似这样的结果伪数组 ProductI
用于一个自定义字段的 Jackson 反序列化器？

我相信我们需要一个自定义反序列化器来对我们类中的一个字段执行特定的操作看来一旦我这样做了我现在就负责反序列化所有其他字段有没有办法让杰克逊反序列化所有字段except我在这里关心的那个人 public class ThingDeser
geom_polygon 的渐变填充

此代码生成一个包含 3 个多边形的图表我正在创建一个显示 3 个多边形的图表如果有更好的方法来绘制多边形我不太感兴趣实际上这些多边形代表事件并且这些事件有一个持续时间首先我感兴趣的是使用渐变填充每个多边形的可能性 librar
Kendo 刷新 (DropDownList.refresh()) 不起作用错误未定义

我试图在另一个 DropDownList 更改后刷新下拉列表但 Refresh 方法未定义错误正在升级我尝试再次读取数据源它显示它正在加载但数据仍然相同帮助解决这个问题请 Code DropDownList1 change fun
为什么 C++20 范围不只提供管道语法？

我知道这个问题听起来很奇怪所以这里有一些背景信息最近我很失望地了解到 C 20 范围内的映射缩减并不像人们所期望的那样工作即 const double val data transform accumulate 不起作用你必须这样
numpy 向量化而不是 for 循环

我用 Python 写了一些代码运行良好但速度很慢我认为是由于 for 循环我希望可以使用 numpy 命令加速以下操作让我定义目标假设我有一个 2D numpy 数组all CMs尺寸row x col 例如考虑一个6x11数

numpy 向量化而不是 for 循环

numpy 向量化而不是 for 循环 的相关文章

随机推荐

热门标签

numpy 向量化而不是 for 循环的相关文章