numpy：高效执行数组的复杂重塑

2024-05-16

我正在将供应商提供的大型二进制数组读入 2D numpy 数组 tempfid(M, N)

# load data
data=numpy.fromfile(file=dirname+'/fid', dtype=numpy.dtype('i4'))

# convert to complex data
fid=data[::2]+1j*data[1::2]

tempfid=fid.reshape(I*J*K, N)

然后我需要使用索引的非平凡映射将其重塑为 4D 数组有用4d（N，I，J，K）。我使用 for 循环按照以下方式执行此操作：

for idx in range(M):
    i=f1(idx) # f1, f2, and f3 are functions involving / and % as well as some lookups
    j=f2(idx)
    k=f3(idx)
    newfid[:,i,j,k] = tempfid[idx,:] #SLOW! CAN WE IMPROVE THIS?

转换为复数需要 33% 的时间，而复制这些片 M 个片需要剩余的 66%。计算索引的速度很快，无论我是在如图所示的循环中逐一执行此操作，还是通过 numpy.vectorizing 操作并将其应用到 arange(M) 来执行此操作。

有没有办法加快这个速度？对于更有效的切片、复制（或不复制）等的任何帮助，我们表示赞赏。

EDIT:正如在问题的回答中了解到的“将交错 NumPy 整数数组转换为 Complex64 的最快方法是什么？” https://stackoverflow.com/q/5658047/607562如果使用视图来代替，则复杂的转换速度可以加快 6 倍：

 fid = data.astype(numpy.float32).view(numpy.complex64)

idx = numpy.arange(M)
i = numpy.vectorize(f1)(idx)
j = numpy.vectorize(f2)(idx)
k = numpy.vectorize(f3)(idx)

# you can index arrays with other arrays
# that lets you specify this operation in one line.    
newfid[:, i,j,k] = tempfid.T

我从未使用过 numpy 的矢量化。 Vectorize 只是意味着 numpy 会多次调用你的 python 函数。为了提高速度，您需要使用数组运算，就像我在这里展示的那样，您过去常常获取复数。

EDIT

问题在于，大小 128 的维度在 newfid 中排在第一位，但在 tempfid 中排在最后。通过使用采用转置的 .T 可以轻松实现这一点。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

numpy：高效执行数组的复杂重塑的相关文章

从Python中的字符串中提取货币金额

我正在制作一个程序从字符串中获取货币并将其转换为其他货币例如如果字符串是 the car cost me 13 250 我需要得到 and 13250 我已经有了这个正则表达式 1 确实如此但是该字符串很有可能有多个价格并且全部使
Python有条件求解时滞微分方程

我在用dde23 of pydelay包来求解延迟微分方程我的问题如何有条件地编写方程例如目标方程有两个选项 when x gt 1 dx dt 0 25 x t tau 1 0 pow x t tau 10 0 0 1 x othe
boto3 资源（例如 DynamoDB.Table）的类型注释

The boto3库提供了几种返回资源的工厂方法例如 dynamo boto3 resource dynamodb Table os environ DYNAMODB TABLE 我想注释这些资源以便我可以获得更好的类型检查和完成但我
Python从int到string的快速转换

我正在用 python 求解大量阶乘并发现当我完成计算阶乘时需要相同的时间才能转换为字符串以保存到文件中我试图找到一种将 int 转换为字符串的快速方法我将举一个计算和 int 转换时间的例子我正在使用通用的 a str a 但感
Jupyter Notebooks 不显示进度条

我正在尝试在 Jupyter 笔记本中显示进度条这是一台新电脑我通常做的事情似乎不起作用 from tqdm import tqdm notebook example iter 1 2 3 4 5 for rec in tqdm not
将 numpy 数组写入文本文件的速度

我需要将一个非常高的两列数组写入文本文件而且速度非常慢我发现如果我将数组改造成更宽的数组写入速度会快得多例如 import time import numpy as np dataMat1 np random rand 1000
Tweepy StreamListener 到 CSV

我是 python 新手我正在尝试开发一个应用程序使用 Tweepy 和 Streaming API 从 Twitter 检索数据并将数据转换为 CSV 文件问题是此代码不会创建输出 CSV 文件也许是因为我应该将代码设置为在实现例
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
了解 Python 中的酸洗

我最近接到一项作业需要以腌制形式放置一本字典其中每个键引用一个列表唯一的问题是我不知道腌制形式是什么谁能给我指出一些好的资源的正确方向来帮助我学习这个概念 pickle 模块实现了一个基本但强大的算法用于序列化和反序列化 Pyth
查找模块中显式定义的函数 (python)

好的我知道您可以使用 dir 方法列出模块中的所有内容但是有什么方法可以仅查看该模块中定义的函数吗例如假设我的模块如下所示 from datetime import date datetime def test return Thi
根据开始列和结束列扩展数据框（速度）

我有一个pandas DataFrame含有start and end列加上几个附加列我想将此数据框扩展为一个时间序列从start值并结束于end值但复制我的其他专栏到目前为止我想出了以下内容 import pandas as
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
使用 numpy 在 python 中执行最大方差旋转

我正在研究矩阵的主成分分析我已经找到了如下所示的组件矩阵 A np array 0 73465832 0 24819766 0 32045055 0 3728976 0 58628043 0 63433607 0 72617152 0 5
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
处理大文件的最快方法？

我有多个 3 GB 制表符分隔文件每个文件中有 2000 万行所有行都必须独立处理任何两行之间没有关系我的问题是什么会更快逐行阅读 with open as infile for line in infile 将文件分块读入内存
Python：高精度time.sleep

你能告诉我如何在 Win32 和 Linux 上的 Python 2 6 中获得高精度睡眠函数吗您可以在中使用浮点数sleep http docs python org library time html time sleep 该参数可以
如何在单元测试中使用 JSON 发送请求

我的 Flask 应用程序中有在请求中使用 JSON 的代码我可以像这样获取 JSON 对象 Request request get json 这一直工作得很好但是我正在尝试使用 Python 的 unittest 模块创建单元测试但
如何循环遍历字典列表并打印特定键的值？

我是 Python 新手有一个问题我知道这是一个非常简单的问题运行Python 3 4 我有一个需要迭代并提取特定信息的列表以下是列表称为部分的示例已截断数千个项目 state DEAD id phwl type name
长/宽数据到宽/长

我有一个数据框如下所示 import pandas as pd d decil 1 decil 1 decil 2 decil 2 decil 3 decil 3 decil kommune AA BB AA BB AA BB 2010

随机推荐

多重要求和允许强参数rails 4

在下面的情况下我尝试使用强参数我想要求email address password并允许remember me fields 但像下面这样使用它只允许最后一行在方法示例中在下面的情况下它只需要params permit rememb
我需要在 JFileChooser（打开模式）中显示不带扩展名的文件名。如何？

我在打开模式下使用 JFileChooser 我需要显示不带扩展名的文件名字段如何我知道文件视图它删除文件系统文件中的扩展名但将所选文件中的扩展名保留在文件名字段中解释 http saveimg ru show image
带有空格的 Firestore 文档字段名称在 Python 中与 .where() 一起使用时会返回错误

使用 Firebase 的 Cloud Firestore 在 Python 3 7 中编写一个非常简单的程序在程序中我使用 where 下拉集合的一部分然后使用 for 循环对其进行迭代当任何带有空格的字段名称被传递到 where
记录共享和映射的诊断上下文

据我所知其他人做了什么来解决 Commons Logging 项目针对 NET 和 Java 不支持映射或嵌套诊断上下文这一事实执行摘要我们选择直接使用实现者日志框架在我们的例子中为 log4j 长答案您是否需要一个抽象日志框架
以有效的方式从 Map 中删除多个键？

我有一个Map
将价格格式设置为逗号分隔

在我的数据库中我有类似的值 256 23 200 33 89 33 133 45 我必须将这些值乘以千然后将结果格式化为价格逗号分隔 256 23 x 1000 256230 I want to show this as 256 23
使用 Pytest 的参数化添加测试功能的描述

当其中一个测试失败时可以在测试正在测试的内容的参数化中添加描述快速了解测试失败的原因有时您不知道测试失败的原因您必须查看代码通过每个测试的描述您就可以知道例如 pytest mark parametrize num1 num2
用 C++ 解析 HTTP 标头

我正在使用curl 与服务器通信当我发出数据请求时我收到 HTTP 标头后跟由边界分隔的 jpeg 数据如下所示我需要解析出边界字符串内容长度我已将传入数据复制到 char 数组如下所示 static size t OnR
通过 RoboVM 在 iOS 模拟器中运行 Libgdx Eclipse 应用程序

我似乎无法让 RoboVM 通过 Eclipse 在 iOS 模拟器中运行应用程序我已关注本指南 http www robovm org docs html eclipse 但出现此错误当我尝试运行 Run as iOS Simulat
将命名空间添加到 ASP.NET MVC 6 中的所有视图

我正在使用 MVC 6 并且希望能够从我的所有 Razor 视图全局访问特定的命名空间在 MVC 5 中这相当简单我只需将以下代码添加到我的 views web config file
Mongodb 数据建模/投票更新（向上和向下）

Mongo 中有一个关于投票数据模型更新查询的示例 http www mongodb org display DOCS MongoDB Data Modeling and Rails MongoDBDataModelingandRails
XCode 7 中的 AWSS3TransferManagerUploadRequest

我今天升级到 Xcode 7 Swift 2 0 我的项目正在使用 CocoaPods 我正在 POD 文件中导入所有与 AWS 相关的文件我已经设置了桥接标头并导入了 Amazon 告诉我的所有文件在升级到 Swift 2 0 之前
Asp.net core默认路由

简化版Startup code public void ConfigureServices IServiceCollection services services AddMvc public void Configure IApplica
在 x86 程序集中存储大量布尔值的最佳方法是什么？

最近我一直在处理充满布尔值的大型数组目前我将它们存储在 bss部分有一个 space指令它允许我创建字节数组但是由于我只需要存储布尔值因此我希望从数组中逐位读取和写入数据目前我能想到的最好方法是有一个 space指令所需存储
调用许多网络服务的最佳方式？

我有 30 家子公司每家都实施了他们的 Web 服务使用不同的技术我需要实现一个Web服务来聚合它们例如所有子公司的Web服务都有一个名为的Web方法GetUserPoint int nationalCode 我需要实现我的网络服
如何比较行内的重叠值？

我似乎对这个 SQL 查询有问题 SELECT FROM appts WHERE timeStart gt timeStart AND timeEnd lt timeEnd AND dayappt boatdate 时间格式为军用时间物流
以类型化内存视图作为成员的结构定义

目前我正在尝试让一个具有类型化内存视图的结构能够工作例如 ctypedef struct node unsigned int inds 如果 inds 不是内存视图据我所知它可以完美地工作然而通过内存视图并使用类似的东西 def
JUnit5 平台启动器 API - 如果没有至少一个测试引擎，则无法创建启动器

我正在尝试升级我们的自动化测试套件的测试能力以接受 JUnit5 测试并遵循JUnit 平台启动器 API 说明 https junit org junit5 docs current user guide launcher api我收到错
如何在Sprite Kit中实现鼠标关节？

我已经在 iOS 上用 Cocos2d Box2d 编写了拖放功能的工作实现我需要将它移植到 Sprite Kit 逻辑非常基本当用户触摸屏幕时找到手指下的精灵在找到的精灵和场景的物理体之间创建鼠标关节将关节的目标设置为触摸位置
numpy：高效执行数组的复杂重塑

我正在将供应商提供的大型二进制数组读入 2D numpy 数组 tempfid M N load data data numpy fromfile file dirname fid dtype numpy dtype i4 convert

numpy：高效执行数组的复杂重塑

numpy：高效执行数组的复杂重塑 的相关文章

随机推荐

热门标签

numpy：高效执行数组的复杂重塑的相关文章