如何将 numpy.argpartition 的输出应用于二维数组？

2024-04-23

我有一个较大的 2d numpy 数组，我想提取每行的最低 10 个元素及其索引。由于我的数组较大，我不想对整个数组进行排序。

我听说过argpartition()函数，用它我可以获得最低 10 个元素的索引：

top10indexes = np.argpartition(myBigArray,10)[:,:10]

注意argpartition()默认情况下对轴-1进行分区，这就是我想要的。这里的结果与 myBigArray 具有相同的形状，包含相应行的索引，使得前 10 个索引指向 10 个最低值。

我现在如何提取元素myBigArray对应那些指标？

明显的花哨索引就像myBigArray[top10indexes] or myBigArray[:,top10indexes]做一些完全不同的事情。我还可以使用列表理解，例如：

array([row[idxs] for row,idxs in zip(myBigArray,top10indexes)])

但这会导致迭代 numpy 行并将结果转换回数组时性能受到影响。

注意：我可以使用np.partition()获取值，它们甚至可能对应于索引（或者可能不对应..），但如果可以避免的话，我不想进行两次分区。

您可以通过执行以下操作来避免使用扁平副本以及提取所有值的需要：

num = 10
top = np.argpartition(myBigArray, num, axis=1)[:, :num]
myBigArray[np.arange(myBigArray.shape[0])[:, None], top]

对于 NumPy >= 1.9.0 这将非常有效并且可以与np.take().

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Arrays

performance

NumPy

Indexing

如何将 numpy.argpartition 的输出应用于二维数组？的相关文章

在这种情况下 b 是标量对象吗？

include
为什么数组索引或基索引以 0 开头？

在使用任何语言处理数组时我一直想知道为什么数组的基地址或索引号以零开头 int x 5 21 34 55 314 45 现在如果我想访问数组的任何第一个值我将不得不使用x 0 但是为什么 0 这背后有什么逻辑呢在 C 语言中数组的
Twython - 如何使用媒体 url 更新状态

在我的应用程序中我允许用户在 Twitter 上发帖现在我想让他们通过媒体更新他们的状态 In twython py我看到一个方法update status with media从文件系统读取图像并上传到 Twitter 我的图像不在文
使用 Python-AppKit-Objective C 转换为预组合 Unicode 字符串

苹果公司的这份文件技术问答 QA1235 http developer apple com qa qa2001 qa1235 html描述了一种将 unicode 字符串从组合版本转换为分解版本的方法由于我对包含某些字符例如重音符号的
如何使用Python在没有窗口的情况下在屏幕上显示文本

问题我需要在没有窗口的情况下直接将文本写入屏幕文本需要显示在所有其他窗口和全屏应用程序之上并且不应以任何方式单击或交互 Example The text doesn t need to have a transparent backg
python 中的子进程调用以使用 JAVA_OPTS 调用 java jar 文件

示例代码 import subprocess subprocess call java jar temp jar 如何在上面的命令中指定JAVA OPTS 当我使用上述命令时我收到 java lang OutOfMemoryError 无
使用 scikit 包在 Python 中绘制集群区域的边界

这是我处理 3 个属性 x y 值中的数据聚类的简单示例每个样本代表其位置 x y 及其所属变量我的代码发布在这里 x np arange 100 200 1 y np arange 100 200 1 value np random
有没有办法分析 WCF 应用程序的性能？

我们正在尝试测量我们的系统的性能该系统是一个使用 WCF 调用的 NET 3 5 应用程序问题是到目前为止我们无法分析这些调用中的方法编写了一个 winforms 客户端应用程序来测试我们的系统我们尝试使用ANTS 4 Profi
self.assertRaises 作为上下文管理器，但 msg 参数未按预期工作

请检查以下代码 import unittest CORRECT MESSAGE Correct message WRONG MESSAGE Wrong message def fn raise KeyError CORRECT MESSAG
在 LINUX 上使用 Python 连接到 OLAP 多维数据集

我知道如何在 Windows 上使用 Python 连接到 MS OLAP 多维数据集嗯至少有一种方法通常我使用 win32py 包并调用 COM 对象进行连接 import win32com client connection wi
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
Tornado：DummyFuture 不支持结果阻塞

我试图获得一个非常简单的初始服务器它可以异步获取 url 来工作但它会抛出 Exception DummyFuture does not support blocking for results 有这个SO https stacko
java charAt() 和startsWith() 哪个更快？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我的问题是如果我想检查特定索引中字符串的一个字符仅检查一个字符哪种方法非常有效charAt or startsWith 我的意思是据我所
Array.indexOf 如何比 Array.some 更高效

这个问题的灵感来自于这个问题的竞争答案具有多个参数的indexOf https stackoverflow com questions 39000151 indexof with multiple arguments 用户想知道一种有效的
优化mysql中日期类型字段的查询

我目前准备了以下查询 select sum amount as total from incomes where YEAR date 2019 and MONTH date 07 and incomes deleted at is null
Python Pandas DateOffset 使用另一列中的值

我以为这会很容易但下面的内容并不适合我想要的只是尝试通过使用另一列中的值将天数添加到预先存在的日期时间列来计算新的日期列我下面的偏移列只有 1 位数字 df new date df orig date apply lambda x
创建具有动态更新变量的数组

我有一些 PHP 变量它们的名称直接链接到它们包含的函数是否有办法自动创建这些变量以便我可以使用所有变量 00 200 这就是我现在正在做的事情 regdays00 is user reg matured 00 regdays02 i
如何检索 SQLAlchemy 结果集的 python 列表？ [复制]

这个问题在这里已经有答案了我有以下查询来检索单列数据 routes query select schema stop times c route number schema stop times c stop id stop id dis
将文本文件转换为 plink PED 和 MAP 格式

我有以下数据其中的一小部分名为 short2 pre snp tumor txt rs987435 C G 1 1 1 0 2 rs345783 C G 0 0 1 0 0 rs955894 G T 1 1 2 2 1 rs608879
在 python 中使用 ftplib 时

这是导致错误的相关代码 ftp ftplib FTP server ftp login r user r pass change directories to the incoming folder ftp cwd incoming fil

随机推荐

如何在提交表单时禁用“window.onbeforeunload”？

当我从浏览器关闭此页面时会打开一个警告框询问离开此页面或留在此页面没关系但是当从下面给出的提交按钮提交表单时它会再次询问并显示此警报框我如何在提交表单时禁用此功能不应该询问并显示警报框
IE8 中的不透明度不起作用

我已经设置了覆盖层的不透明度该覆盖层在 FF Chrome Safari 和 IE9 中工作正常但在 IE8 中不起作用我用谷歌搜索了很多但没有找到任何解决方案我的CSS代码是 overlayEffectDiv ms filter
使用 python Shutil.py 时出现 Errno 2 没有这样的文件或目录作为文件目标

我正在使用shutil python 模块在linux redhat 机器上复制文件和目录我编写了以下方法它接受 2 个参数 src 正在收集的文件或目录的路径和目标将收集的日志目录粘贴到的所需新路径 def copy src d
RandomAccess接口，为什么没有方法？

我正在读书Collections shuffle List javadoc http docs oracle com javase 7 docs api java util Collections html shuffle 28java u
Postman：如何在运行时删除/清除postman环境变量

有没有办法在运行时使用函数删除清除邮递员环境变量我可以设置为空白或一些特殊值但是有通用的处理方法吗沙盒APIpm environment unset variableName 也允许这样做如果您想立即清除所有环境变量您可能需要执
Twitter 数据 - 查找 MongoDB 中被提及最多的用户

假设我有来自 Twitter API 的流数据并且将数据作为文档存储在 MongoDB 中我想要找到的是计数screen name under entities user mentions id ObjectId 50657d58449
jquery 在点击时突出显示链接

如何使用 jquery 在单击链接时突出显示该链接例如当我单击链接 class1 1 时我想将此链接设为红色或其他颜色 JavaScript 代码在这里
无意中使用 = 而不是 ==

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动看起来 if x y 代替 if x y 是许多罪恶的根源为什么不all编译器将其标记
Android 5.0 JobScheduler API 在早期版本上？

我正在构建一个 Android 应用程序它利用清单广播接收器来了解设备何时插入我认为 Android 5 0 JobScheduler API 是一种更好的方法但我有一个问题是否可以在早期版本的 Android 上使用此 API 或
使用 PHP Swiftmailer 时如何解决错误 554 5.5.1（无有效收件人）？

在测试我们的邮件服务器时我们偶然发现了一个错误该错误阻止我们通过 PHP 发送邮件尽管每个 Mail in a box 的常规发送接收工作没有任何问题我们正在运行一个单独的 Ubuntu 18 04 服务器该服务器仅运行 Mai
Python SimpleHTTPServer 接收文件

我正在使用 SimpleHTTPServer 的 do POST 方法来接收文件如果我使用curl上传png文件该脚本工作正常但每当我使用python请求库上传文件时文件上传但会损坏这是 SimpleHTTPServer 代码 u
Maven findbugs:check - 错误的输出摘要

有谁知道如何配置 maven findbugs 插件以将错误摘要输出到控制台类似于 pmd 插件目前 findbugs check 只是打印出总共有多少个错误我需要检查各个模块 target findbugs 目录和每个 findbu
如何处理未知变量或如何处理多个数据库

我正在开发一个带有多个数据库的 Go RESTful API 应用程序启动服务器时用户提供他们想要使用的数据库在应用程序中我有三大功能其中一个处理连接 selectedDb Get selectedDb Add selectedDb
Linux Python Azure Function APP - 尽管在requirements.txt中但未找到pyodbc模块，并且其他模块工作正常

我正在使用一个Linux consumption plan 我收到以下错误 Exception ModuleNotFoundError No module named pyodbc 我已经添加了pyodbc in the requireme
如何在powershell中获取登录用户的电子邮件

使用 Vbscript 我们获取当前用户的电子邮件 ID 它就像下面几行一样简单 Option Explicit Dim objUser objADSysInfo Set objADSysInfo CreateObject ADSystem
如何在指定半径的圆内生成随机坐标？

我试图生成位于半径 5 公里的圆内的随机坐标纬度经度其中中心点位于某个坐标 x y 我正在尝试用 ruby 编写此代码并且正在使用该方法但不知何故我得到的结果不在指定的 5 公里半径内 def location lat lng m
我刚刚在哪个适配器上收到此 UDP 数据包？

我正在尝试用 C 编写一个 BOOTP 服务器我正在接收并解析来自客户端的 BOOTP 数据包我需要回复我的服务器 IP 地址问题是计算机可以有多个网络适配器客户端还没有 IP 地址有什么方法可以查出 UDP 数据包是在哪个适配
如何使用java + poi在Excel中设置单元格背景颜色

到目前为止我使用 Spring MVC 进行了以下编码重要我不在这里使用HSSFWorkbook 那么StreamingReader中的POI方法setCellStyle相当于什么呢 InputStream is new FileIn
如何在 hive 中创建一个空的结构数组？

我有一个观点Hive 1 1 0 根据条件它应该返回一个空数组或一个数组struct
如何将 numpy.argpartition 的输出应用于二维数组？

我有一个较大的 2d numpy 数组我想提取每行的最低 10 个元素及其索引由于我的数组较大我不想对整个数组进行排序我听说过argpartition 函数用它我可以获得最低 10 个元素的索引 top10indexes np a

如何将 numpy.argpartition 的输出应用于二维数组？

如何将 numpy.argpartition 的输出应用于二维数组？ 的相关文章

随机推荐

热门标签

如何将 numpy.argpartition 的输出应用于二维数组？的相关文章