使用 numpy 获取每行的唯一计数〜和〜唯一值

2024-01-01

我试图获得与 np.unique 等效的值，但带有 'axis=1' 选项。

a = np.array([[8, 8, 8, 5, 8],
       [8, 2, 0, 8, 8],
       [4, 5, 4, 2, 4],
       [4, 6, 5, 2, 6]])

我希望获取每行中计数最高的值并将其保存到一维向量中。基本上是“每行中最常见的值”。

正确答案：本例中为[8,8,4,6]。

现在我正在做类似的事情：

y = np.zeros(len(a))

for i in xrange(len(a)):
    [u,cnt] = np.unique(a[i,:],return_counts=True)
    # pick the value from 'u' that is seen the most.
    y[i] = u[np.argmax(cnt)]

这给出了所需的结果，但在 Python 中循环数千行时速度非常慢。我正在寻找一种完全矢量化的方法。

I found 独特的行元素 https://stackoverflow.com/questions/28789014/count-unique-elements-row-wise-in-an-ndarray发布，但它并没有完全达到我想要的效果（要么我不够聪明，无法将其变成所需的形式，要么它不能直接适用。）

预先感谢您提供的任何帮助。

一种选择是使用scipy.stats.mode http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mode.html:

In [36]: from scipy.stats import mode

In [37]: a
Out[37]: 
array([[8, 8, 8, 5, 8],
       [8, 2, 0, 8, 8],
       [4, 5, 4, 2, 4],
       [4, 6, 5, 2, 6]])

In [38]: vals, counts = mode(a, axis=1)

In [39]: vals
Out[39]: 
array([[8],
       [8],
       [4],
       [6]])

In [40]: counts
Out[40]: 
array([[4],
       [3],
       [3],
       [2]])

但是，它是使用 numpy 用 Python 编写的，并且根据输入中值的分布，它可能不会比您的解决方案更快。您可以在中找到实现https://github.com/scipy/scipy/blob/master/scipy/stats/stats.py https://github.com/scipy/scipy/blob/master/scipy/stats/stats.py（当我写这篇文章时，它就在这里：https://github.com/scipy/scipy/blob/master/scipy/stats/stats.py#L372 https://github.com/scipy/scipy/blob/master/scipy/stats/stats.py#L372).

该函数的基本部分仅依赖于 numpy，因此，如果它对您来说足够好，但您不希望依赖于 scipy，您可以将该函数复制到您自己的项目中 - 只要确保遵循scipy 使用的 BSD 许可证。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

使用 numpy 获取每行的唯一计数〜和〜唯一值的相关文章

Python有条件求解时滞微分方程

我在用dde23 of pydelay包来求解延迟微分方程我的问题如何有条件地编写方程例如目标方程有两个选项 when x gt 1 dx dt 0 25 x t tau 1 0 pow x t tau 10 0 0 1 x othe
希伯来语中的稀疏句子标记化错误

尝试对希伯来语使用稀疏句子标记 import spacy nlp spacy load he doc nlp text sents list doc sents I get Warning no model found for he Onl
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
了解 Python 中的酸洗

我最近接到一项作业需要以腌制形式放置一本字典其中每个键引用一个列表唯一的问题是我不知道腌制形式是什么谁能给我指出一些好的资源的正确方向来帮助我学习这个概念 pickle 模块实现了一个基本但强大的算法用于序列化和反序列化 Pyth
当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
numpy 使用 datetime64 进行数字化

我似乎无法让 numpy digitize 与 datetime64 一起使用 date bins np array np datetime64 datetime datetime 2014 n 1 s for n in range 1 1
如何将 self 传递给装饰器？

我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
更改 python tkinter canvas 中的线坐标

我画了一条线tkinter Canvas现在我想移动一端这可能吗例如和itemconfig import tkinter tk tkinter Tk canvas tkinter Canvas tk canvas pack line c
python是带有字符串的运算符行为[重复]

这个问题在这里已经有答案了我无法理解以下行为我正在创建 2 个字符串并使用 is 运算符来比较它对于第一种情况它的工作方式有所不同对于第二种情况它按预期工作当我使用逗号或空格时它显示是什么原因False与比较is当没有使用
PySide6.1 与 matplotlib 3.4 不兼容

当我只安装PySide6时 GUI程序运行良好但是一旦我安装了matplotlib及其依赖包包括pyqt5 则GUI程序将无法运行并输出以下错误消息 This application failed to start because no
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
django-admin.py makemessages 不起作用

我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
具有屏蔽无效值的 pcolormesh

我试图将一维数组绘制为 pcolormesh 因此颜色沿 x 轴变化但每个 x 的 y 轴保持不变但我的数据有一些错误值因此我使用屏蔽数组和自定义颜色图其中屏蔽值设置为蓝色 import numpy as np import mat
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
Python]将两个文本文件合并为一个（逐行）[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我是蟒蛇新手我想做的是将文件 a 和文件 b 逐行合并到一个文件中例如 text file a a n b n c text fi
如何将回溯/sys.exc_info() 值保存在变量中？

我想将错误名称和回溯详细信息保存到变量中这是我的尝试 import sys try try print x except Exception ex raise NameError except Exception er print 0 s
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
在 Django shell 会话期间获取 SQL 查询计数

有没有办法打印 Django ORM 在 Django shell 会话期间执行的原始 SQL 查询的数量 Django 调试工具栏已经提供了此类信息例如 5 QUERIES in 5 83MS但如何从 shell 中获取它并不明显您可
如何获取所有mysql元组结果并转换为json

我能够从表中获取单个数据但是当我试图获取表上的所有数据时我只得到一行 cnn execute sql rows cnn fetchall column t 0 for t in cnn description for row in ro

随机推荐

XGBOOST：sample_Weights 与scale_pos_weight

我有一个高度不平衡的数据集想知道在哪里考虑权重因此我试图理解之间的区别scale pos weight论证中XGBClassifier和sample weight的参数fit方法如果可以同时使用这两种方法或者如何选择其中一种方法我们
增加ggplot2中axis.title和axis.text之间的间距（版本> = 0.9.0）

我目前正在使用 github 上的最新版本的 ggplot2 在 0 8 9 版本中我可以执行以下操作来增加 axis title 和 axis text 之间的空间 Before ggplot diamonds aes clarity
如何在使用 asm 库进行检测的方法中查找空的局部变量

在为其不同方法检测类时为了使方法在文本文件中执行写入操作我首先将字符串存储在显式定义的局部变量 3160 中如何选择这些变量以防止与已有变量发生冲突就像这段代码一样代码每次进入任何方法时都会将类名写入文本文件为了做到这一点必须使
如何将 tfjs-node 与从源代码构建的 libtensorflow 结合使用

我看到可以使用libtensorflow如自述文件中所述是从源代码构建的https github com tensorflow tfjs node optional build libtensorflow from tensorflow
C/C++ 中负数返回 false 吗？

在 C C 中将整数评估为布尔值时负数是真还是假无论编译器如何它们总是正确错误吗所有非零值将被转换为true 和零值false 当负数非零时它们会被转换为true 引用 C 11 标准强调我的 4 12 布尔转换 conv b
制作锁子甲背景主题

我想制作一个像这样的锁子甲我尝试过使用线性渐变但似乎不起作用 background linear gradient 0c0c0c 222222 important 我希望输出与 imgur 中显示的图像类似线性渐变有用吗你可以这样做
对 BITMAPINFO (HBITMAP) 中像素数据的原始/直接访问

我试图弄清楚如何从屏幕访问原始像素信息到目前为止我一直将屏幕捕获到 HBITMAP 填充 BITMAPINFO 然后创建此 BITMAPINFO 变量的指针以直接从内存读取我知道必须从文件中删除标头因此我将指针直接前进到位图数据
Express.js - 有什么方法可以显示文件/目录列表？

With Express js http expressjs com 有没有一种方法可以像 apache 一样显示文件目录列表当您访问没有索引文件的目录的 URL 时它会显示所有该目录内容的列表是否有一个我不知道的扩展或包可以执行此
调用未定义的方法 Illuminate\Database\Query\Builder::notify()

发行于拉拉维尔 5 3 6当在忘记密码中提交请求时错误详情调用未定义的方法 Illuminate Database Query Builder notify 问题在以下文件中供应商 laravel framework src Illu
如何扩展integer_sequence？

我有一个如下所示的函数 template
如何将 std::function 对象传递给采用函数指针的函数？

我正在尝试与用以下语言编写的库进行交互c 使用这种熟悉的模式 void some c handler void func void void data 现在我想写一个C 该函数的包装器如下所示 void my new cpp handle
html5：具有固定顶部/底部和可滚动中间的三行Flexbox

是否有可能制作一个html5固定的 Flexbox 布局header footer和一个可滚动的article如下所示的部分firefox 24 and chromium 31 header article footer 我已经尝试过这个
带有逻辑括号和优先顺序的 Django 模板 IF 条件

在我的 django 模板中我有 if object not readonly and user is worker or user is admin Django doc https docs djangoproject com en 1
Selenium 中如何处理这个 StaleElementReferenceException？

我目前正在阅读一本 Django TDD 简介书籍但遇到了 StaleElementReferenceException 并陷入困境我一直在谷歌上搜索并在 StackOverflow 中寻找解决我的错误的方法但我无法解决它我的相关代
ThreeJS：从场景中删除对象

我正在使用 ThreeJS 开发一个 Web 应用程序该应用程序显示实体列表每个实体都有相应的查看和隐藏按钮例如实体名称查看隐藏我认为看到您对 addEntity 和 removeEntity 代码的用法会很有帮助但我的第
如何延长快速会话超时

我将express js 4与express session一起使用并设置maxAge到一小时但是如果用户继续访问该网站则应延长超时时间否则即使用户仍在使用该网站也会被注销 app use session secret xxx
如何使用 Pyspark 从 Hive Context 调用用 Java 编写的 Hive UDF

I use getLastProcessedVal2hive 中的 UDF 从表中获取最新分区这个UDF是用java编写的我想使用 hive 上下文中的 pyspark 中的相同 UDF dfsql sel nxt batch id i
从 PHP 脚本与扫描仪对话

我经营一家小企业但我需要在收到的信件和发票方面更有条理这就是我想要实现的目标当我收到发票或其他纸质信息时我会将其放入扫描仪托盘中并留在那里每隔 15 分钟我的 Linux 机器就会询问我的扫描仪是否有任何要扫描的内容如果有则
java.lang.UnsupportedOperationException：没有已知的类 jenkins.tasks.SimpleBuildWrapper 的实现在 jenkins 中被命名为 BuildUser

我在 Jenkins 中准备脚本如下在构建作业时出现错误这项工作是向用户发送电子邮件input进行下一步 Pipeline End of Pipeline java lang UnsupportedOperationException
使用 numpy 获取每行的唯一计数〜和〜唯一值

我试图获得与 np unique 等效的值但带有 axis 1 选项 a np array 8 8 8 5 8 8 2 0 8 8 4 5 4 2 4 4 6 5 2 6 我希望获取每行中计数最高的值并将其保存到一维向量中基本上是每行

使用 numpy 获取每行的唯一计数〜和〜唯一值

使用 numpy 获取每行的唯一计数〜和〜唯一值 的相关文章

随机推荐

热门标签

使用 numpy 获取每行的唯一计数〜和〜唯一值的相关文章