具有“行”和索引的 ismember 的 Python 版本

2023-12-23

已经提出了类似的问题，但没有一个答案完全满足我的需要 - 有些答案允许多维搜索（又名 matlab 中的“行”选项），但不返回索引。有些返回索引但不允许行。我的数组非常大（1M x 2），并且我已经成功地创建了一个有效的循环，但显然这非常慢。在matlab中，内置的ismember函数大约需要10秒。

这是我正在寻找的：

a=np.array([[4, 6],[2, 6],[5, 2]])

b=np.array([[1, 7],[1, 8],[2, 6],[2, 1],[2, 4],[4, 6],[4, 7],[5, 9],[5, 2],[5, 1]])

执行此操作的具体 matlab 函数是：

[~,index] = ismember(a,b,'rows')

where

index = [6, 3, 9]

import numpy as np

def asvoid(arr):
    """
    View the array as dtype np.void (bytes)
    This views the last axis of ND-arrays as bytes so you can perform comparisons on
    the entire row.
    http://stackoverflow.com/a/16840350/190597 (Jaime, 2013-05)
    Warning: When using asvoid for comparison, note that float zeros may compare UNEQUALLY
    >>> asvoid([-0.]) == asvoid([0.])
    array([False], dtype=bool)
    """
    arr = np.ascontiguousarray(arr)
    return arr.view(np.dtype((np.void, arr.dtype.itemsize * arr.shape[-1])))


def in1d_index(a, b):
    voida, voidb = map(asvoid, (a, b))
    return np.where(np.in1d(voidb, voida))[0]    

a = np.array([[4, 6],[2, 6],[5, 2]])
b = np.array([[1, 7],[1, 8],[2, 6],[2, 1],[2, 4],[4, 6],[4, 7],[5, 9],[5, 2],[5, 1]])

print(in1d_index(a, b))

prints

[2 5 8]

这相当于 Matlab 的 [3,6,9]，因为 Python 使用基于 0 的索引。

一些注意事项：

索引按升序返回。他们不对应到项目的位置a in b.
asvoid 适用于整数数据类型，但使用 asvoid 时要小心在浮点数据类型上，因为asvoid([-0.]) == asvoid([0.])回报array([False]).
asvoid 在连续数组上效果最好。如果数组不连续，数据将被复制到连续数组，这会降低性能。

尽管有警告，人们可能会选择使用in1d_index无论如何，为了速度：

def ismember_rows(a, b):
    # http://stackoverflow.com/a/22705773/190597 (ashg)
    return np.nonzero(np.all(b == a[:,np.newaxis], axis=2))[1]

In [41]: a2 = np.tile(a,(2000,1))
In [42]: b2 = np.tile(b,(2000,1))

In [46]: %timeit in1d_index(a2, b2)
100 loops, best of 3: 8.49 ms per loop

In [47]: %timeit ismember_rows(a2, b2)
1 loops, best of 3: 5.55 s per loop

So in1d_index速度快了约 650 倍（对于长度在数千以内的数组），但再次注意，这种比较并不完全是同类比较，因为in1d_index按升序返回索引，同时ismember_rows返回顺序行中的索引a出现在b.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

具有“行”和索引的 ismember 的 Python 版本的相关文章

使用 selenium 和 python 在网页网格中抓取 javascript 数据

我的问题是我需要包含网站子域的网格中的所有数据https applipedia paloaltonetworks com https applipedia paloaltonetworks com 包含名称类别子类别风险技术的数据
使用不带引号的块样式的 Python YAML 转储

如何使用 PyYAML 加载和转储 YAML 以便它尽可能地使用原始样式我有 Python 来加载和转储 YAML 数据例如 import sys import yaml def represent dictorder self dat
我如何知道Python的unicode函数识别的所有支持的编码

Python 有一个unicode将字节流转换为 unicode 字符串的内置函数我只是希望我能查询所有可用的encoding在我的系统上但如何这个问题的原因是有人使用 MAC OS X 向我发送了一封内容编码为 iso 2022
使用 Python 访问内存映射文件

我希望利用激战 2 中的内存映射文件该文件旨在链接到 Mumble 以获得位置音频该文件包含有关字符坐标的信息和其他有用的信息我已经能够使用此脚本访问坐标信息 import mmap import struct last while
并行执行按位运算的代码

我有这段代码通过将该 AU 矩阵的每个字节 8 个元素打包到 A 中来减少内存消耗从而使 100k 200k 矩阵占用更少的空间正如您所期望的这段代码需要永远运行我也计划将行数增加到 200k 我正在一个非常强大的实例 CPU 和
在 Python 中解压存档时出现错误

我使用 Python 下载 bz2 文件然后我想使用以下方法解压存档 def unpack file dir file cwd os getcwd os chdir dir print Unpacking file s file cmd
如何在 dash/plotly 中使用 iframe？（Python/HTML）

我正在创建一个仪表板我想使用这个交互式地图网站链接 https www ons gov uk peoplepopulationandcommunity healthandsocialcare causesofdeath articles
使用 pytherejs 嵌入小部件：错误的视角和相机观察

我在用pythreejs可视化一些 3D 模型在 Jupyter 笔记本上可视化模型时一切都按预期进行但是当尝试将小部件嵌入 HTML 文档时我面临两个问题看起来相机在加载时正在查看 0 0 0 而不是预期的那样一旦您与小部件交
Python Jinja2 调用宏会导致（不需要的）换行符

我的 JINJA2 模板如下所示 macro print if john name if name John Hi John endif endmacro Hello World print if john Foo print if joh
[Python]比较两个 zip 文件的函数，一个位于 FTP 目录中，另一个位于我的本地计算机上

我在创建比较两个 zip 文件的函数时遇到问题如果它们相同而不仅仅是名称相同这是我的代码示例 def validate zip files self host 192 168 0 1 port 2323 username 123 pa
如何在 Google App Engine (Python) 中定义配置变量/常量？

我是 python GAE 的新手想知道如何快速定义和使用全局设置变量所以说你 git 克隆我的 GAE 应用程序然后打开config yaml 添加更改设置应用程序就全部连接起来如下所示 config yaml or whate
python 函数中的对象不可迭代错误

我有一个简单的功能如下 comdList range 0 27 for t in comdList print t 但是它返回一个 in object not iterable 错误在函数之外它工作正常这是怎么回事尝试这个 for t
numpy.polyval() 的反函数

我想知道 np polyval 是否有一个方便的反函数我在其中给出 y 值并求解 x 我知道我可以做到这一点的一种方法是 import numpy as np Set up the question p np array 1 1 10 y
pip 升级到 pip 10.x.x 后解析需求文件的正确方法？

所以今天我确实发现随着发布pip 10 x x the req软件包更改了其目录现在可以在下面找到pip internal req 由于通常的做法是使用parse requirements功能在你的setup py从需求文件中安装所有依赖
如何循环遍历列表中除最后一项之外的所有项？ [复制]

这个问题在这里已经有答案了 Using a for循环如何循环遍历列表中除最后一项之外的所有项我想遍历一个列表检查每个项目与后面的项目我可以在不使用索引的情况下做到这一点吗 for x in y 1 If y是一个生成器那么上面的
Python httplib 和 POST

我目前正在使用别人编写的一段代码它用httplib向服务器发出请求它以正确的格式提供所有数据例如消息正文标头值等问题是每次尝试发送 POST 请求时数据都在那里我可以在客户端看到它但没有任何内容到达服务器我已经阅读了库规
tkinter 库 treectrl 转换为 exe 安装程序时出现 cx_freeze 错误

我使用的是 python 版本 3 7 我使用了这个名为 treectrl 的外部库当我运行 py 文件时它工作得很好但是当我使用 cx freeze 转换为 exe 文件时它给了我错误 NomodulleFound 名为 tkint
Python pandas：向我的数据框中添加一列来计算变量

我有一个像这样的数据框 gt org group org1 1 org2 1 org3 2 org4 3 org5 3 org6 3 我想将列 count 添加到 gt 数据帧以计算组的成员数量预期结果如下 org group count
为什么变量 1 += 变量 2 比变量 1 = 变量 1 + 变量 2 快得多？

我继承了一些 Python 代码用于创建巨大的表最多 19 列宽 5000 行花了九秒用于在屏幕上绘制表格我注意到每一行都是使用以下代码添加的 sTable sTable n GetRow where sTable是一个字符串我将
Maya python 连接选择的属性

我一直在尝试制作一个简单的脚本它将采用两个视口选择然后基本上将第二个视口的旋转连接到第一个我不确定如何正确地从视口选择中为对象创建变量这是我的尝试但不起作用 import maya cmds as cmds sel cmds ls

随机推荐

ASP.NET MVC：添加将 DisplayName 合并到自定义 ValidationAttribute 的自定义 ErrorMessage

我正在使用带有 DataAnnotations 的 ASP NET MVC 我创建了以下自定义 ValidationAttribute 效果很好 public class StringRangeAttribute ValidationAtt
从 Windows SSH 到 EC2 Linux 实例

我正在开设云数据分析课程大多数学生可能会使用 Windows 学生必须设置 EC2 Ubuntu 实例并连接到它们为 Windows XP 7 设置 SSH 最简单的方法是什么我尝试过 PuTTY 但如果我在文本编辑器中手动添加换
请解释 rowspan 和 colspan、col 和 colgroup

谁能解释一下rowspan and colspan col and colgroup 这些 W3C 有效且语义正确吗这些在什么情况下有用 colspan table border 1 tr th people are th tr tr t
jQuery autoComplete 查看所有点击？

我以一种相对简单的方式使用 jQuery 的自动完成功能 document ready function var data text Choice 1 text Choice 2 text Choice 3 example autocomp
为什么我收到“对象引用未设置到对象实例”。但没有涉及任何代码行？

当我尝试构建 VB NET 解决方案时收到错误未将对象引用设置为对象的实例但在错误列表窗格中文件行列和项目列为空如果它不告诉我问题在哪里我该如何解决问题 UPDATE 我选择了项目然后显示项目依赖关系图并得到
使用 EF7 配置级联删除

我正在尝试在 ASP NET vNext 应用程序中使用 EF7 配置级联删除但我找不到如何执行此操作我凌驾于一切之上OnModelCreating我有这个代码 modelBuilder Entity
为 MongoDB 2.2 中的每个集合创建不同的数据库

MongoDB 2 2 每个数据库都有一个写锁而不是以前版本中服务器上的全局写锁那么如果我将每个集合存储在单独的数据库中以有效地为每个集合提供一个写锁可以吗这将使其看起来像 MyISAM 的表级锁定这种做法有问题吗锁定有一个关
如果我在头文件中实现一个类会发生什么？ [复制]

这个问题在这里已经有答案了可能的重复 C 中的内联函数 https stackoverflow com questions 2501776 inline functions in c 如果我在头文件中完全实现一个类编译器会做什么典型示
hibernate.jdbc.time_zone = 忽略 UTC

使用设置为 Spring框架5 0 2 RELEASE Spring安全5 0 0 RELEASE 休眠 5 2 11 Final 我跟着弹簧靴 https moelholm com 2016 11 09 spring boot contr
MongoDB：更新数组中的数组

我似乎在访问 mongodb 文档中数组中嵌套的数组内容时遇到问题我使用如下查询访问第一个数组组没有问题 db orgs update id org id groups id group id set groups name new
如何在 Angular 7 中设置 CdkVirtualScrollViewport 的初始索引（位置）

我需要的初始位置cdk virtual scroll viewport不是列表的第一个元素项目现在我找到了scrollToIndex and scrollTo方法但我只能在使用它时才能让它们工作ngAfterViewChecked 感
当父级中的 setState() 时，子级中的 componentWillReceiveProps 不会收到新的 props

我在 React 中有一个名为 App 的父组件它使用 HighCharts 实现呈现一个 Calories 子组件我期望的是根据 React 生命周期父组件渲染子组件然后调用 componentDidMount 然后我使用 fe
java.lang.RuntimeException：com.android.builder.dexing.DexArchiveMergerException：无法在Android Studio 3.0中合并dex [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案这是我的应用程序级别 gradle 文件 apply plugin com android application android
java中如何处理具有不同行分隔符的文件？

我有一个巨大的文件超过 3GB 其中包含以下格式的单个长行 1243 818 9287 543 然后我要分析的数据用分隔我的想法是更改默认的行尾 Java 使用的字符设置我正在尝试使用 System setProperty line
将数据转换为声音并返回

是否有库可以将数据文本文件等转换为声音并返回原始数据声音可以通过我希望的任何媒体传输无论是无线电等我只需要将数据存储在声音文件中设想 step1 将嵌入图像的 docx 文件转换为 wav step2 通过无线电波发送 step
用猫鼬填充后如何聚合

我正在使用猫鼬在填充后进行聚合时遇到问题下面是一个例子猫鼬模型架构有两种怪物和集合 const monster new Schema name type String power type Number armor type Num
如何为 Jenkin 配置 docker 镜像来创建 Android 版本？

我们如何使用 Android 和 Java SDK 的 Docker 镜像而不是在内部设置 Android 和 Java 的手动路径管理詹金 option 我已经在Gitlab在每次 Git 推送的帮助下创建多个 apk gitlab c
Apache Archiva 2.2.0 网络代理似乎无法正常工作

我一直在尝试使用 Archiva 为我们公司建立一个企业存储库虽然安装非常简单但我现在遇到了 Archiva 无法通过我们的公司代理访问中央存储库的问题我执行了以下操作来设置代理下面的屏幕截图通过 Apache UI 添加网络代理
让用户添加自己的样式表是一个坏主意吗？

我是 php 新手我试图弄清楚这是一个坏主意还是一个安全风险我有一个提供给用户的数据表它有一个加载的默认样式表但如果用户想要包含自己的样式表我已经制作了它这样他们就可以指向自己的样式表 http www mysite com i
具有“行”和索引的 ismember 的 Python 版本

已经提出了类似的问题但没有一个答案完全满足我的需要有些答案允许多维搜索又名 matlab 中的行选项但不返回索引有些返回索引但不允许行我的数组非常大 1M x 2 并且我已经成功地创建了一个有效的循环但显然这非常慢在ma

具有“行”和索引的 ismember 的 Python 版本

具有“行”和索引的 ismember 的 Python 版本 的相关文章

随机推荐

热门标签

具有“行”和索引的 ismember 的 Python 版本的相关文章