查找数组一中最接近数组二的元素

2023-12-09

这个答案解释如何找到最接近（已排序）的数组元素单点，以对大型数组有效的方式（稍作修改）：

def arg_nearest(array, value):
    idx = np.searchsorted(array, value, side="left")
    if idx > 0 and (idx == len(array) or math.fabs(value - array[idx-1]) < math.fabs(value - array[idx])):
        return idx-1
    else:
        return idx

相反，如果我们想找到最接近 a 的数组元素set点（即第二个数组）；除了使用 for 循环之外，是否还有有效的（对于大型数组的速度）扩展方法？

一些测试用例：

>>> xx = [0.2, 0.8, 1.3, 1.5, 2.0, 3.1, 3.8, 3.9, 4.5, 5.1, 5.5]
>>> yy = [1, 2, 3, 4, 5]
>>> of_x_nearest_y(xx, yy)
[0.5, 2.0, 3.1, 3.9, 5.1]

>>> xx = [0.2, 0.8, 1.3, 1.5, 2.0, 3.1, 3.8, 3.9, 4.5, 5.1, 5.5]
>>> yy = [-2, -1, 4.6, 5.8]
>>> of_x_nearest_y(xx, yy)
[0.2, 0.2, 4.5, 5.5]

编辑：假设两个数组都已排序，您可以执行以下操作little比一个更好完全地通过排除低于已匹配值的值来进行天真的 for 循环，即

def args_nearest(options, targets):
    locs = np.zeros(targets.size, dtype=int)
    prev = 0
    for ii, tt in enumerate(targets):
        locs[ii] = prev + arg_nearest(options[prev:], tt)
        prev = locs[ii]
    return locs

您可以进行一些更改来扩展它的元素数组value，就像这样-

idx = np.searchsorted(xx, yy, side="left").clip(max=xx.size-1)
mask = (idx > 0) &  \
       ( (idx == len(xx)) | (np.fabs(yy - xx[idx-1]) < np.fabs(yy - xx[idx])) )
out = xx[idx-mask]

解释

命名法：array是我们要在其中放置元素的数组value保持排序的性质array.

将单个元素的解决方案扩展到多个元素以进行搜索所需的更改：

1]剪辑索引数组idx从...获取np.searchsorted最多的array.size-1，因为对于中的元素value大于最大值array，我们需要使idx可索引的array.

2]介绍numpy取代math以矢量化方式执行这些操作。

3]用以下技巧替换条件语句idx - mask。在这种情况下，Python 会在内部进行上转换mask to an int数组与数据类型匹配idx。因此，所有的True元素变成1因此对于True我们将有效拥有的要素idx-1，哪一个是True原始代码中 IF 条件语句的情况。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Arrays

Algorithm

Sorting

NumPy

查找数组一中最接近数组二的元素的相关文章

更改 numpy 数组的结构强制给定值

如何缩小栅格数据的比例4 X 6大小成2 X 3如果 2 2 像素内的任何元素包含 1 则大小强制选择 1 否则选择 0 import numpy as np data np array 0 0 1 1 0 0 1 0 0 1 0 0 1
Django 说“id 可能不为 NULL”，但为什么会这样呢？

我今天要疯了我只是尝试插入一条新记录但它返回了 post blogpost id 可能不为 NULL 错误这是我的模型 class BlogPost models Model title models CharField max le
Python ElementTree 获取带有命名空间的属性

我试图访问 XML 中的 def 所以在这个例子中我会得到Evolus Common PlainTextV2作为输出我似乎无法弄清楚如何获取具有名称空间的属性如果我想得到id它工作得很好 Python for content ns in
从 Spark 数据帧中过滤大量 ID

我有一个大型数据框其格式类似于 ID Cat date 12 A 201602 14 B 201601 19 A 201608 12 F 201605 11 G 201603 我需要根据大约 500 万个 Is 的列表来过滤行最直接的方
在 Android 中将图像从可绘制图像转换为字节数组

由于我要将图像发送到 Parse com 因此我必须将其转换为字节数组我的第一种方法是从图库中选择图像并将其转换为字节数组如下所示 Override protected void onActivityResult int request
如何使用 numpy 从一维数组创建对角矩阵？

我正在使用 Python 和 numpy 来做线性代数我表演了numpy对矩阵进行 SVD 以获得矩阵 U i 和 V 然而 i 矩阵表示为 1 行的 1x4 矩阵 IE 12 22151125 4 92815942 2 06380839
telethon 库：如何通过电话号码添加用户

我正在研究 Telegram 的 Telethon 库它可以使用 Telegram API 充当 Telegram 客户端重要提示这是电报客户端 API https core telegram org telegram api 而不是
如何删除 pip 安装的所有软件包？

如何从当前激活的虚拟环境中卸载 pip 安装的所有软件包我发现这个片段作为替代解决方案与重新创建 virtualenv 相比删除库更加优雅 pip freeze xargs pip uninstall y 如果您通过 VCS 安装了软
如何使用 Python 实现并行 gzip 压缩？

使用python压缩大文件 https stackoverflow com questions 9518705 big file compression with python给出了一个很好的例子来说明如何使用例如bz2 纯粹用 Pytho
Pandas 中的数据透视表小计

我有以下数据 Employee Account Currency Amount Location Test 2 Basic USD 3000 Airport Test 2 Net USD 2000 Airport Test 1 Basic
Excel VBA 循环遍历 10,000 组行，每组包含 20 行

如何将当前按行循环的 Excel VBA 代码转换为循环 20 行集据我了解 Step函数可能与以下行一起使用 Range V1 Value Application Index vInput1 r 0 但是我不确定如何修改代码以循环遍历
当我在 PHP 中将 print_r() 应用于数组时，为什么会得到“Resource id #4”？ [复制]

这个问题在这里已经有答案了可能的重复我如何从 PHP 中的 MySql 响应中回显资源 id 6 https stackoverflow com questions 4290108 how do i echo a resource
datetime strftime 不输出正确的时间戳

下列 gt gt gt from dateutil parser import parse gt gt gt parse 2013 07 02 00 00 00 0000 datetime datetime 2013 7 2 0 0 tzi
“yield item”与 return iter(items) 相比有何优点？

在下面的示例中 resp results 是一个迭代器版本1 items for result in resp results item process result items append item return iter items
跟踪白色背景中的白球（Python/OpenCV）

我在 Python 3 中使用 OpenCV 来检测白场上的白黑球并给出它的精确 x y 半径和颜色我使用函数 cv2 Canny 和 cv2 findContours 来找到它但问题是 cv2 Canny 并不总是检测到圆的完整
gnuplot：第 1 行：无效命令

stackoverflow 上可爱的人们大家好我正在尝试使用 gnuplot 绘制数据我首先阅读表格并提取我想要的数据我将此数据写入 dat 文件截至目前我只是尝试通过命令行绘制它但会添加必要的代码以在 python 脚本工作后
如何对每一行进行 value_counts 并创建一些列，其值是每个值的计数

我得到一个数据框如下 df c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12 r1 0 1 1 1 1 0 0 0 0 0 0 0 r2 1 2 2 2 2 1 1 1 1 0 0 0 r3 1 0 2 0 0
AES 在 cryptojs 中加密并在 python Crypto.Cipher 中解密

使用 js CryptoJS 加密并使用 python crypto Cipher 解密时出现问题这是我在js中的实现附加 iv 与加密消息并使用 base64 进行编码
Pandas 2 个字段中唯一值的数量

我正在尝试查找覆盖 2 个字段的唯一值的数量例如一个典型的例子是姓氏和名字我有一个数据框当我执行以下操作时我只获取每列的唯一字段数在本例中为最后一个和第一个不是复合体 df Last Name First Name nu
如何从Python枚举类中获取所有值？

我正在使用 Enum4 库创建一个枚举类如下所示 class Color Enum RED 1 BLUE 2 我要打印 1 2 作为某处的列表我怎样才能实现这个目标您可以执行以下操作 e value for e in Color

随机推荐

如何根据 iFrame 内容的大小“增长”iFrame？

我正在动态加载 iFrame 有些页面比其他页面更高我希望 iFrame 能够相应地增长是否可以如果是这样怎么办是的 jquery 是可以的父页面代码 iframe页面上的脚本 function alertSize var m
如何实现网页的实时更新？

Google 的 GMail 服务之所以能做到这一点是因为它集成了 Google Talk 而 Etherpad 现在的 typewith me 使 Google Wave 等使用的系统闻名当其他用户对页面进行更改时所有此类系统都会立
禁用 LLVM 10 C++ API 的常量折叠

我正在使用 LLVM C API 为 C 语言的子集编写编译器前端我注意到生成的 IR 总是应用恒定的折叠优化但我想禁用此功能并获得忠实的未优化的 IR 有什么办法可以做到这一点吗以下是我用来从模块生成 IR 的代码 llvm ve
当通过 javascript/jquery 更改值时，多个选择不会更新

我有一个多重选择其中每个选项都设置了一个类根据类别我可以预先选择特定类别的所有选项因此用户不必自己选择所有选项到目前为止它运行良好直到我通过单击手动选择一个选项从现在开始预选似乎不再起作用了但只有视觉效果不再起作用选项
使用 Youtube Iframe API 创建的视频播放器停止与 Chrome v.85 配合使用

我在将 Youtube iframe API 与最新稳定版本的 Chrome 版本 85 一起使用时遇到问题我知道一个月前一切都可以正常工作但现在即使完全遵循 Youtube iframe API 文档中找到的最基本的示例 https
INotifyCollectionChanged 未更新 UI

我有一堂课如下所示为了简洁起见我删除了所有功能 public class PersonCollection IList
如何在部署到 Vercel 的 Next.js 应用程序中正确设置环境变量？

我正在 Next js 中构建我的网络应用程序并且我一直在做一些测试我正在做的是将我的代码推送到 GitHub 然后从那里将项目部署到 Vercel 我正在使用 Google API 依赖项它需要一些客户端 ID 和客户端密钥以便我
查找组中最常见的观察结果[重复]

这个问题在这里已经有答案了数据框 B pd DataFrame b II II II II II I I I MOST FREQUENT 1 2 2 1 1 1 2 2 我需要获取列中出现次数最多的值MOST FREQUENT对于每组 p
#[inline] 可以在特征方法声明和实现中使用吗？

我有一些小方法的特征这些方法通常作为实现结构所具有的其他方法的单行包装器来实现如果我想确保特征方法是内联的我应该放置 inline always 在特征定义内或在impl对于每个结构我更愿意简单地将其放入特征定义中但据我所知这
如何将最新更改拉取到 GitHub 中我当前的工作分支？

假设我在分支 abc test git pull origin master 这是否会将 master 分支与我当前的分支 abc test 合并或者我是否需要运行更多命令 tl dr run git fetch获取最新更改然后运行gi
在 2.0.5 中，将 cassandra 作为服务启动不起作用，sudo cassandra -f 有效

当我尝试在 ubuntu 12 04 上启动 cassandra 时通过 Datastax 安装 dsc20包作为服务如下 sudo 服务 cassandra 启动 it says 无法访问 Cassandra 的 pidfile 日志
如何使用弹出窗口在 JavaScript 中构建一个简单的图片库

我在互联网上寻找帮助但我无法让它工作有人能给我一个如何编写这样的代码的例子吗我会调整图像的大小并为弹出窗口提供一个缩略图大小的图像和一个更大的图像我希望用户单击缩略图大小的图像并在弹出窗口中显示全尺寸的图像我是 Javascri
Excel：如何使用VBA检查单元格是否为空？ [复制]

这个问题在这里已经有答案了通过VBA 我如何检查一个单元格是否是另一个具有特定信息的空单元格例如如果 A A 产品特殊且 B B 为 null 那么 C1 产品特殊另外我如何使用For Each循环在Range以及如何返回另一个
选择不同数据库中的列

是否可以在位于同一服务器上的不同数据库之间执行选择或插入语句如果是怎么办您可以使用以下语法指定数据库databasename tablename Example SELECT mydatabase1 tblUsers UserID
如何彻底卸载oracle 11g？

如何从笔记本电脑上卸载 Oracle 11g 软件附带的卸载程序并不能完全卸载所有组件我用Oracle12c试了一下留下了很多程序我尝试手动删除这些文件但 BIN 目录中的某些 dll 文件无法访问我想用 11g 做正确的事有什
使用jquery从父页面访问子IFrame中的元素

我尝试使用以下代码从父文档访问 iframe 中文档的元素但由于某种原因无法使其工作父级 html
需要帮助使用 GIOService（GLib、Glib-GIO）实现简单的套接字服务器

我正在学习使用 GLib 编写简单高效的套接字服务器的基础知识我正在尝试 GSocketService 到目前为止我似乎只能接受连接但随后它们立即关闭从文档中我无法弄清楚我错过了哪一步我希望有人能为我阐明这一点运行以下命令时
如何提高最低成本路径模型的模拟速度

通过使用网络扩展以下代码在两个多边形由多个面片组成之间构建成本最低的路径 to calculate LCP ID polygon 1 ID polygon 2 let path let path cost 1 Define polyg
如何确定用户在汇编语言 X86 中输入的字符串中单词的频率？

我是汇编语言编程的完全初学者我需要帮助编写一个汇编语言程序来从用户那里获取字符串计算并显示每个单词在用户输入的字符串中出现的次数例如如果用户输入 Hello Hello what is new Hello what is not n
查找数组一中最接近数组二的元素

这个答案解释如何找到最接近已排序的数组元素单点以对大型数组有效的方式稍作修改 def arg nearest array value idx np searchsorted array value side left if idx

查找数组一中最接近数组二的元素

查找数组一中最接近数组二的元素 的相关文章

随机推荐

热门标签

查找数组一中最接近数组二的元素的相关文章