NumPy：计算累积中位数

2024-03-28

我有大小 = n 的样本。

我想计算每个 i： 1 sample[:i]在 numpy. 例如，我计算了每个 i 的平均值：

cummean = np.cumsum(sample) / np.arange(1, n + 1)

我可以在没有循环和理解的情况下对中位数做类似的事情吗？

知道Python有一个heapq模块可以让你保持一个可迭代的运行“最小值”，我做了一个搜索heapq and median，并找到了各种项目steaming medium。这个：

http://www.ardendertat.com/2011/11/03/programming-interview-questions-13-median-of-integer-stream/ http://www.ardendertat.com/2011/11/03/programming-interview-questions-13-median-of-integer-stream/

has a class streamMedian维持两个heapq，一个包含值的下半部分，另一个包含值的上半部分。中位数是其中一个值的“最高值”，或者是两个值的平均值。班级有一个insert方法和一个getMedian方法。大部分工作都在insert.

我将其复制到 Ipython 会话中，并定义：

def cummedian_stream(b):
    S=streamMedian()
    ret = []
    for item in b:
        S.insert(item)
        ret.append(S.getMedian())
    return np.array(ret)

Testing:

In [155]: a = np.random.randint(0,100,(5000))
In [156]: amed = cummedian_stream(a)
In [157]: np.allclose(cummedian_sorted(a), amed)
Out[157]: True
In [158]: timeit cummedian_sorted(a)
1 loop, best of 3: 781 ms per loop
In [159]: timeit cummedian_stream(a)
10 loops, best of 3: 39.6 ms per loop

The heapq流方法要快得多。

列表理解@Uriel给的比较慢。但如果我替代np.median for statistics.median它比@Divakar's排序解决方案：

def fastloop(a):
    return np.array([np.median(a[:i+1]) for i in range(len(a))])

In [161]: timeit fastloop(a)
1 loop, best of 3: 360 ms per loop

And @Paul Panzer's分区方法也不错，但与流式传输类相比仍然很慢。

In [165]: timeit cummedian_partition(a)
1 loop, best of 3: 391 ms per loop

（我可以复制streamMedian如果需要的话，可以对此答案进行分类）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

statistics

vectorization

NumPy：计算累积中位数的相关文章

在 python 2 和 3 的spyder之间切换

根据我在文档中了解到的内容它指出您只需使用命令提示符创建一个新变量即可轻松在 2 个 python 环境之间切换如果我已经安装了 python 2 7 则 conda create n python34 python 3 4 anaco
根据 pandas 中的条件交换列值

我想按条件重新定位列如果国家地区是日本我需要将姓氏和名字反向重新定位 df pd DataFrame France Kylian Mbappe Japan Hiroyuki Tajima Japan Shiji Kagawa Eng
如何有条件地组合两个相同形状的 numpy 数组

这听起来很简单但我想我把它想得太复杂了我想创建一个数组其元素是从两个形状相同的源数组生成的具体取决于源数组中哪个元素更大为了显示 import numpy as np array1 np array 2 3 0 array2 np
如何用spaCy获取依赖树？

我一直在尝试寻找如何使用 spaCy 获取依赖树但我找不到任何有关如何获取树的信息只能在如何导航树 https spacy io usage examples subtrees 如果有人想轻松查看 spacy 生成的依赖关系树一种解决
如何在“python setup.py test”中运行 py.test 和 linter

我有一个项目setup py文件我用pytest作为测试框架我还在我的代码上运行各种 linter pep8 pylint pydocstyle pyflakes ETC 我用tox在多个 Python 版本中运行它们并使用以下命令构
使用 Python 解析 XML，解析外部 ENTITY 引用

在我的 S1000D xml 中它指定了一个带有对公共 URL 的引用的 DOCTYPE 该 URL 包含对包含所有有效字符实体的许多其他文件的引用我使用 xml etree ElementTree 和 lxml 尝试解析它并得到解析错
使用reduce方法的斐波那契数列

于是我看到有人用reduce方法来计算斐波那契数列这是他的想法 1 0 1 1 2 1 3 2 5 3 对应于 1 1 2 3 5 8 13 21 代码如下所示 def fib reduce n initial 1 0 dummy ra
以编程方式将列名称添加到 numpy ndarray

我正在尝试将列名称添加到 numpy ndarray 然后按名称选择列但这不起作用我无法判断问题是在添加名称时出现还是在稍后尝试调用它们时出现这是我的代码 data np genfromtxt csv file delimiter
熊猫记忆

我有冗长的计算我重复了很多次因此我想使用记忆诸如jug http packages python org Jug and joblib http packages python org joblib memory html 与Pan
在 GAE/Python 中放置一次性代码和每次代码的最佳位置在哪里？

我是 Google App Engine 和 Python 的新手我无法理解有关在 Google App Engine 上运行的 Python 应用程序的一些基本问题如果我想要执行代码对于每个传入的请求我应该将其放在哪里我们正在捕
从 python 中的缩进文本文件创建树/深度嵌套字典

基本上我想迭代一个文件并将每行的内容放入一个深层嵌套的字典中其结构由每行开头的空格数量定义本质上目标是采取这样的事情 a b c d e 并将其变成这样的东西 a b c d e Or this apple colours red
如何在python中递归复制目录并覆盖全部？

我正在尝试复制 home myUser dir1 及其所有内容及其内容等 home myuser dir2 在Python中此外我希望副本覆盖中的所有内容dir2 It looks like distutils dir util co
Matplotlib 将颜色图 tab20 更改为三种颜色

Matplotlib 有一些新的且非常方便的颜色图选项卡颜色图 https matplotlib org examples color colormaps reference html 我错过的是生成像 tab20b 或 tab20c 这
PermanentTaskFailure：“模块”对象没有属性“迁移”

我在 google appengine 上使用 Nick Johnson 的批量更新库 http blog notdot net 2010 03 Announcing a robust datastore bulk update utili
使用 pandas 绘制带有误差线的条形图

我正在尝试从 DataFrame 生成条形图如下所示 Pre Post Measure1 0 4 1 9 这些值是我从其他地方计算出来的中值我还有它们的方差和标准差以及标准误差我想将结果绘制为具有适当误差线的条形图但指定多个误差值
如何表示类的实例与将其作为输入的类之间的关系？

我有一堂课叫House 这个类的实例是house class House def init self height length self height height self length length def housePlan hou
本地设置的 Cython 编译器指令是否影响一个或所有函数？

我正在努力使用 Cython 加速一些 Python Numpy 代码并且对本地设置如定义的here http docs cython org en latest src reference compilation html在文档中
Python列表对象属性“append”是只读的

正如标题所说在Python中我试图做到这一点以便当有人输入一个选择在本例中为Choice13 时它会从密码列表中删除旧密码并添加新密码 passwords mrjoebblock mrjoefblock mrjoegblock m
如何将 Pandas Dataframe 中的字符串转换为字符列表或数组？

我有一个名为的数据框data 其中一列包含字符串我想从字符串中提取字符因为我的目标是对它们进行一次性编码并使之可用于分类包含字符串的列存储在预测因子如下 predictors pd DataFrame data columns Seq
如何抑制 Pandas Future 警告？

当我运行该程序时 Pandas 每次都会给出如下所示的未来警告 D Python lib site packages pandas core frame py 3581 FutureWarning rename with inplace

随机推荐

React-Native ProductFlavors（错误类型3：Activity类不存在）

我想用2productFlavors对于我的 Android 应用程序 live and staging In app build grandle我这样定义它们 defaultConfig applicationId com some id
spring boot webflux：避免处理程序中的线程阻塞方法调用

我刚刚开始使用WebFlux以及整个反应范式我坚持这一点 Component public class AbcHandler private ObjectMapper objectMapper new ObjectMapper publi
传递带有变量值作为参数的自定义属性

我创建了一个自定义属性类它将检查系统安全性并在存在安全错误时引发身份验证异常 public class EntityChecker System Attribute public EntityChecker int entityId d
Fetch / Axios 在 React Native 中严重崩溃（但仅限于某些 URL）

我的应用程序在执行时严重崩溃certainAPI 调用我将范围缩小到这一点这不是 HTTP 与 HTTPS 的问题我最终使用了两种不同的模拟 API 令我惊讶的是一种有效另一种则无效两者基本相同请参阅下面的片段 WIFI 或蜂
使用“是吗？”验证电话号码

我正在尝试使用 Yup 验证电话号码 phone Yup number typeError That doesn t look like a phone number positive A phone number can t start
Android：录制的视频似乎*失真*

我正在尝试使用 MediaRecorder 从相机录制视频这是一个代码片段 snip mr setAudioSource MediaRecorder AudioSource MIC mr setVideoSource MediaRecor
在 Apple Watch 模拟器（xCode 8、Swift 3、iOS 10）上的 watchOS 中运行 SpriteKit 游戏 - libswiftSwiftOnoneSupport 错误

我下载了xCode 8 0 beta并打开了一个最近写的项目swift 2然后我将其转换为swift 3使用 xCode 然后我添加了一个watchOS设置游戏以我的项目为目标文件 gt 新建 gt 目标我检查了 GameScene
如何限制字符串中的字母数量

我有一个程序要求用户输入问题然后程序回答它我想知道的是如何限制用户可以输入变量的字母数量蟒蛇的input函数不能直接执行此操作但您可以截断返回的字符串或重复直到结果足够短 method 1 answer input What s
SpringBoot - 解析HTTP请求头时出错

我在跑步SpringBoot Application刚刚检查了服务器日志发现了几个这样的错误我不明白是什么原因导致的因为每天 12 24 小时后都会出现该错误 Tomcat 版本运行于8 5 11 2018 03 04 17 03 2
以编程方式旋转 UITextView

有一个奇怪的问题如果你创建一个UITextView创建后立即旋转它某些线条或字符将不可见尝试这个 myTextView font UIFont boldSystemFontOfSize 20 myTextView text Hello
MySQL 更新触发器 - 查找更改的列？

我有一个有 120 列的表我需要设置审计跟踪如果发生更改它将记录任何列就像现在一样我想我必须为每一列设置一个具有如下条件的触发器 IF NEW columnName OLD columnName THEN log the old
使用正则表达式提取 r ngram

卡尔布罗曼的帖子 https kbroman wordpress com 2015 06 22 randomized hobbit 2 https kbroman wordpress com 2015 06 22 randomized h
Numpy 查找具有相同值的组的索引

我有一个由 0 和 1 组成的 numpy 数组 y 1 1 1 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1 1 1 我想计算 1 或 0 组的索引因此对于上面的示例一组的结果应该类似于 result 0 2 8 9
混合jpa继承策略-inheritanceType.JOINED与inheritanceType.SINGLE_TABLE

我的类结构如下所示我在这里实现了两个单独的策略但根类的继承策略即 InheritanceType JOINED 正在整个层次结构中使用 Entity Inheritance strategy InheritanceType JOINE
ORACLE 索引表上的插入性能

为什么 Insert 语句在索引表上执行速度较慢这实际上是同一类问题为什么需要更多时间才能将所有杂货放在厨房的正确位置而不是在逛完杂货店后把所有东西都留在袋子里这是因为在存放杂货时您希望将它们放在一个漂亮且众所周知的位置以便以后
使用 UMD 捆绑包捆绑 Angular 2 应用程序（不构建供应商捆绑包）

我目前正在将我的 Angular 2 应用程序与 WebPack 捆绑在一起我们仍在快速循环因此我们不想增加构建和应用程序加载过程的延迟而是希望包含很少变化的 Angular 2 UMD CDN 准备的捆绑包例如
PySpark 输出文件数量

我是 Spark 新手我有一个简单的 pyspark 脚本它读取 json 文件将其展平并将其作为 parquet 压缩文件写入 S3 位置读取和转换步骤运行得非常快并使用 50 个执行器我在 conf 中设置但写入阶段耗时较
Devise::PasswordsController#create 中的 EOFError

我在从 Ruby on Rails 应用程序发送邮件重置密码时遇到了问题密码重置邮件过去可以使用但现在不行了密码重置是服务器发送的唯一电子邮件一旦我提交了我想要获取密码的电子邮件 Rails 就会显示完整的跟踪信息 Devise P
防止只读文本框在 Silverlight 中变灰

在 Silverlight 中如何制作文本框IsReadOnly True 不会变灰我的应用程序的灰色效果看起来很糟糕我想禁用它或更改其外观颜色 Silverlight 2 中有几个选项最简单的是使用 TextBlock 因为它
NumPy：计算累积中位数

我有大小 n 的样本我想计算每个 i 1 sample i 在 numpy 例如我计算了每个 i 的平均值 cummean np cumsum sample np arange 1 n 1 我可以在没有循环和理解的情况下对中位数做类似的

NumPy：计算累积中位数

NumPy：计算累积中位数 的相关文章

随机推荐

热门标签

NumPy：计算累积中位数的相关文章