如何对 numpy 数组进行采样并有效地对每个样本执行计算？

2024-04-29

假设我有一个一维数组，我想要的是使用移动窗口进行采样，并在窗口内将每个元素除以第一个元素。

例如，如果我有[2, 5, 8, 9, 6]窗口大小为 3，结果将是

[[1, 2.5, 4],
 [1, 1.6, 1.8],
 [1, 1.125, 0.75]].

我现在所做的基本上是一个for循环

import numpy as np
arr = np.array([2., 5., 8., 9., 6.])
window_size = 3
for i in range(len(arr) - window_size + 1):
  result.append(arr[i : i + window_size] / arr[i])

etc.

当数组很大时，速度很慢，不知道是否有更好的方法？我猜想没有办法绕过 O(n^2) 复杂度，但也许 numpy 有一些我不知道的优化。

这是一种使用向量化的方法broadcasting https://docs.scipy.org/doc/numpy/user/basics.broadcasting.html -

N = 3  # Window size
nrows = a.size-N+1
a2D = a[np.arange(nrows)[:,None] + np.arange(N)]
out = a2D/a[:nrows,None].astype(float)

我们还可以使用NumPy strides https://docs.scipy.org/doc/numpy/reference/generated/numpy.ndarray.strides.html为了更有效地提取滑动窗口，就像这样 -

n = a.strides[0]
a2D = np.lib.stride_tricks.as_strided(a,shape=(nrows,N),strides=(n,n))

样本运行 -

In [73]: a
Out[73]: array([4, 9, 3, 6, 5, 7, 2])

In [74]: N = 3
    ...: nrows = a.size-N+1
    ...: a2D = a[np.arange(nrows)[:,None] + np.arange(N)]
    ...: out = a2D/a[:nrows,None].astype(float)
    ...: 

In [75]: out
Out[75]: 
array([[ 1.        ,  2.25      ,  0.75      ],
       [ 1.        ,  0.33333333,  0.66666667],
       [ 1.        ,  2.        ,  1.66666667],
       [ 1.        ,  0.83333333,  1.16666667],
       [ 1.        ,  1.4       ,  0.4       ]])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

performance

pandas

NumPy

vectorization

如何对 numpy 数组进行采样并有效地对每个样本执行计算？的相关文章

使用 pandas 将字符串对象转换为 int/float

import pandas as pd path1 home supertramp Desktop 100 life 180 data csv mydf pd read csv path1 numcigar Never 0 1 5 Ciga
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
在Python中以交互方式执行多行语句

我是 Python 世界的新手这是我用 Python 编写的第一个程序我来自 R 世界所以这对我来说有点不直观当我执行时 In 15 import math import random random random math sqrt
Django 不会以奇怪的错误“AttributeError: 'module' object has no attribute 'getargspec'”启动

我对 Django 的内部结构有点缺乏经验所以我现在完全陷入困境它昨天起作用了但我不记得我改变过任何重要的东西当我转身时DEBUG True任何恰好位于列表中第一个的模块上都有堆栈跟踪 Traceback most recent c
NumPy 和 SciPy - .todense() 和 .toarray() 之间的区别

我想知道使用是否有什么区别优点缺点 toarray vs todense 在稀疏 NumPy 数组上例如 import scipy as sp import numpy as np sparse m sp sparse bsr mat
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
Django 模型字段默认基于另一个模型字段

我使用 Django Admin 构建一个管理站点有两张表一张是ModelA其中有数据另一个是ModelB里面什么也没有如果一个模型字段b b in ModelB为None 可以显示在网页上值为ModelA的场a b 我不知道该怎
reStructuredText：README.rst 未在 PyPI 上解析

我有一个托管在 Github 和 PyPI 上的 Python 项目在 Github 上 https github com sloria TextBlob blob master README rst https github com s
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
Pandas groupby apply 执行缓慢

我正在开发一个涉及大量数据的程序我正在使用 python pandas 模块来查找数据中的错误这通常工作得非常快然而我当前编写的这段代码似乎比应有的速度慢得多我正在寻找一种方法来加快速度为了让你们正确测试它我上传了一段相当大的
将列表中的 None 替换为最左边的非 none 值

Given a None 1 2 3 None 4 None None I d like a None 1 2 3 3 4 4 4 目前我已经用以下方法强制它 def replaceNoneWithLeftmost val last Non
具有多个主键的 SQLAlchemy 不会自动设置任何

我有一个简单的表 class test Base tablename test id Column Integer primary key True title Column String def init self title self
在python中读取PASCAL VOC注释

我在 xml 文件中有注释例如这个它遵循 PASCAL VOC 约定
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
Python 导入非常慢 - Anaconda python 2.7

我的 python import 语句变得非常慢我使用 Anaconda 包在本地运行 python 2 7 导入模块后我编写的代码运行得非常快似乎只是导入需要很长时间例如我使用以下代码运行了一个 tester py 文件 imp
Python：无法使用 os.system() 打开文件

我正在编写一个使用该应用程序的 Python 脚本pdftk http www pdflabs com tools pdftk the pdf toolkit 几次来执行某些操作例如我可以在 Windows 命令行 shell 中使用
更新 SQLAlchemy 中的特定行

我将 SQLAlchemy 与 python 一起使用我想更新表中等于此查询的特定行 UPDATE User SET name user WHERE id 3 我通过 sql alchemy 编写了这段代码但它不起作用 session
Streamlabs API 405 响应代码

我正在尝试使用Streamlabs API https dev streamlabs com Streamlabs API 使用 Oauth2 来创建应用程序因此首先我将使用我的应用程序的用户发送到一个授权链接其中包含我的应用程序的客
如何更改matplotlib中双头注释的头大小？

Below figure shows the plot of which arrow head is very small 我尝试了下面的代码但它不起作用它说引发 AttributeError 未知属性 s k 属性错误未知属性头宽
抛出 Java 异常时是否会生成堆栈跟踪？

这是假设我们不调用 printstacktrace 方法只是抛出和捕获我们正在考虑这样做是为了解决一些性能瓶颈不堆栈跟踪是在构造异常对象时生成的而不是在抛出异常对象时生成的 Throwable 构造函数调用 fillInStack

随机推荐

无法在 Spark 中读取具有自定义一元转换器的管道模型

我在 Spark 中定义了一个新的自定义 UnaryTransformer 示例代码中的 cleanText 并在 Pipeline 中使用它当我保存安装的管道并尝试读回它时出现以下错误 java lang NoSuchMethodEx
将两个 HTML 文档嵌入到一页中

我想输出两个 HTML 文档包裹在一个 HTML 文档中是否可以用 HTML 来做这样的事情 First page here Second page here
android：检查应用程序中文件是否存在

我的应用程序的资产文件夹中有几个 html 文件我的应用程序根据设备语言加载这些文件当我检查文件是否存在时它说不存在但是当我使用 browser loadUrl filename 加载该文件时它加载得很好以下代码将帮助您理解我的
带代理的 PHP CURL 导致套接字上的 CLOSE_WAIT

我正在使用 PHPcurl 库来建立连接并从 WEB 检索内容通常我有多个 SOCKS5 代理服务器在 localhost 上运行端口从 10300 到 10350 PHP 随机选择一个端口 My code ch curl init
Lion：RVM 安装 rubies 时出现问题 - 与 openssl 相关的问题

我很绝望现在两天天都在摆弄以下问题但没有解决方案更新 Lion 后我想使用最新版本的 rvm 安装额外的 rubies 这是我之后调用捆绑器时发生的情况 Users felix rvm rubies ruby 1 9 2 p290
如何使用 v12+（12.0.0 及更高版本）向 Discord.js 中的所有公会发送消息

if command sendguildmessages if message author id 231956829159161856 var guildList client guilds array try guildList for
线程“main”中的异常 java.lang.NoSuchMethodError: scala.Product.$init$(Lscala/Product;)

我收到此错误的原因是什么最初 Scala 的 IDE 插件是 2 12 3 但由于我使用的是 Spark 2 2 0 所以我手动将其更改为 Scala 2 11 11 Using Spark s default log4j profile
防止 Edge 中的高对比度模式向文本添加背景

我正在努力调整一些组件以便它们在高对比度模式下都能正常工作并且看起来不错 Edge 似乎在 IE11 未添加的所有文本下添加了黑色背景我似乎找不到一种方法来在 CSS 中定位这个背景或者任何其他方法来规范两个浏览器之间的行为例如假
如何从 Matlab 在 virtualenv 中执行 Python 代码

我正在创建一个用于研究的 Matlab 工具箱我需要执行 Matlab 代码但也需要执行 Python 代码我想允许用户从 Matlab 执行 Python 代码问题是如果我立即执行此操作我将必须在 Python 环境中安装所有
当出现alertController（actionSheet）时inputAccessoryView动画向下

我有一个用于聊天应用程序的 inputAccessoryView 它始终保持可见并停靠在屏幕底部用于类似于大多数消息应用程序的文本输入当我呈现带有actionSheet样式的alertController时 inputAccessory
Flutter StatefulWidget 小部件和泛型

如何将泛型类型传递给State of a StatefulWidget 在这里我想使用我的泛型myMethod
如何在 Android 中使用 kSOAP 序列化双精度值

这是代码 package com SRS6 import org ksoap2 SoapEnvelope import org ksoap2 serialization SoapObject import org ksoap2 serial
小数点分隔符 oracle

我需要用点替换逗号然后我需要我的值是一个数字所以我写了这个 select replace 12345 6789 from dual it works fine 但后来我想转换to number该值我收到错误 invalid numbe
PostGIS - 将多多边形转换为单多边形

是否可以将包含多个多边形的形状文件导入到 PostGIS 中的单个多边形中每当我尝试导入多边形的形状文件时它都会作为多多边形而不是单个多边形存储在geom柱子因此我无法从多重多边形中将其提取为单个多边形值非常感谢所有有用的建议
使用 jQuery 更改 Bootstrap 动画进度条动画持续时间

我正在尝试更改 Twitter Bootstrap 动画进度条上使用的 CSS3 动画的持续时间我想要的结果是使用 jQuery 减少动画的持续时间以便获得更快的动画我有以下 HTML 和 CSS 并使用了以下 jQuery HTML
Julia 中过时的软件包列表

有没有办法列出 Julia 中所有过时的软件包相当于pip3 list outdated在Python中我做了几次搜索 1 https docs julialang org en v1 stdlib Pkg 2 https pkgdoc
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对
python string format() 与带有整数键的字典[重复]

这个问题在这里已经有答案了我想使用Python字符串format 充当快速而肮脏的模板但是那dict我想使用的键是整数字符串表示形式一个简化的例子如下 s hello there 5 d 5 you s format d 上面的代
在 iOS 中保存加密密钥的安全方法

在我的 iOS4 应用程序中我在多个地方使用 AES 加密整个应用程序必须非常安全为了做到这一点我必须在这个应用程序中硬编码几个密钥然后当我需要加密某些东西时随机选择这些密钥我的问题是如何存储这些私钥使用硬编码它们是否安全NS
如何对 numpy 数组进行采样并有效地对每个样本执行计算？

假设我有一个一维数组我想要的是使用移动窗口进行采样并在窗口内将每个元素除以第一个元素例如如果我有 2 5 8 9 6 窗口大小为 3 结果将是 1 2 5 4 1 1 6 1 8 1 1 125 0 75 我现在所做的基本上是一个f

如何对 numpy 数组进行采样并有效地对每个样本执行计算？

如何对 numpy 数组进行采样并有效地对每个样本执行计算？ 的相关文章

随机推荐

热门标签

如何对 numpy 数组进行采样并有效地对每个样本执行计算？的相关文章