为什么 Numba 不改进这个递归函数

2023-12-01

我有一个结构非常简单的真/假值数组：

# the real array has hundreds of thousands of items
positions = np.array([True, False, False, False, True, True, True, True, False, False, False], dtype=np.bool)

我想遍历这个数组并输出发生变化的地方（true 变为 false 或相反）。为此，我总结了两种不同的方法：

递归二分搜索（查看所有值是否相同，如果不同，则分成两部分，然后递归）
纯粹的迭代搜索（循环遍历所有元素并与上一个/下一个元素进行比较）

两个版本都给出了我想要的结果，但是 Numba 对其中一个版本的影响比另一个版本更大。对于包含 300k 值的虚拟数组，以下是性能结果：

300k 元素数组的性能结果

纯 Python 二分搜索运行时间为 11 毫秒

纯 Python 迭代搜索在 1.1 秒内运行（比二分查找慢 100 倍）

Numba 二分搜索在 5 毫秒内运行（比纯 Python 快 2 倍）

Numba 迭代搜索在 900 µs 内运行（比纯 Python 快 1,200 倍）

因此，使用 Numba 时，binary_search 比 iterative_search 慢 5 倍，而理论上它应该快 100 倍（如果适当加速，预计运行时间为 9 µs）。

如何才能使 Numba 加速二分搜索的速度与加速迭代搜索的速度一样快？

两种方法的代码（以及示例positionarray) 可以在这个公共要点上找到：https://gist.github.com/JivanRoquet/d58989aa0a4598e060ec2c705b9f3d8f

注意：Numba 未运行binary_search()在对象模式下，因为当提到nopython=True，它不会抱怨并愉快地编译该函数。

您可以使用以下方法找到值变化的位置np.diff，不需要运行更复杂的算法，或者使用numba:

positions = np.array([True, False, False, False, True, True, True, True, False, False, False], dtype=np.bool)
dpos = np.diff(positions)
# array([ True, False, False,  True, False, False, False,  True, False, False])

这有效，因为False - True == -1 and np.bool(-1) == True.

它在我的电池供电（=由于节能模式而节流）和几年前的笔记本电脑上表现得很好：

In [52]: positions = np.random.randint(0, 2, size=300_000, dtype=bool)          

In [53]: %timeit np.diff(positions)                                             
633 µs ± 4.09 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

我想象写你自己的差异numba应该产生类似的性能。

编辑：最后一个语句是错误的，我使用实现了一个简单的 diff 函数numba，并且比速度快 10 倍以上numpy一个（但它的功能显然也少得多，但对于这项任务来说应该足够了）：

@numba.njit 
def ndiff(x): 
    s = x.size - 1 
    r = np.empty(s, dtype=x.dtype) 
    for i in range(s): 
        r[i] = x[i+1] - x[i] 
    return r

In [68]: np.all(ndiff(positions) == np.diff(positions))                            
Out[68]: True

In [69]: %timeit ndiff(positions)                                               
46 µs ± 138 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Arrays

NumPy

BinarySearch

numba

为什么 Numba 不改进这个递归函数的相关文章

tkinter 上的“NoneType”对象没有属性“get”错误[重复]

这个问题在这里已经有答案了我最近开始使用 python 3 6 进行编码tkinter并尝试创建我自己的项目repl it 该项目是一个简单的交互式待办事项列表但是我陷入困境并且无法使该功能正常工作该函数只是简单地获取条目并将其添加到
Django 和 AWS 简单电子邮件服务 [重复]

这个问题在这里已经有答案了我正在尝试启动并运行 django 站点并且正在尝试启用 django 的标准密码重置服务我的网站由 AWS EC2 托管因此我想将 AWS SES 用于我的电子邮件服务但是我无法使 smtp 连接正常
将元组列表转换为字符串 Python

例如我用 python 编写了一个返回列表的函数 1 1 2 2 3 3 但我希望输出为字符串这样我就可以用另一个字符替换逗号这样输出就是 1 1 2 2 3 3 有什么简单的方法可以解决这个问题吗感谢您提前提供任何提示这看起来像
点击后 Dash DropDown 关闭

我不希望下拉菜单在选择值后关闭我希望它在我的页面上保持打开状态我正在使用 dcc Dropdown dcc Dropdown id job type options self options placeholder Select one
如何让 Discord 机器人显示“机器人正在输入...”状态？

所以如果我有一个像这样的长命令 bot command pass context True async def longCommand ctx typing status sleep 10 bot say Done 不幸的是在文档或此处没
将指针设置为任意维度数组？

当我想初始化多维数组时我通常只使用指针例如对于二维我使用 double array 对于三个我使用 double array 但是我想根据指示维度的命令行参数设置一个多维数组一旦你有了一个具有你想要的维数的变量有没有办法设置任意
Python服务器“通常只允许每个套接字地址使用一次”

我正在尝试用 python 创建一个非常基本的服务器它侦听端口当客户端尝试连接时创建 TCP 连接接收数据发回某些内容然后再次侦听并无限期地重复该过程这是我到目前为止所拥有的 from socket import server
Tensorflow：Cuda 计算能力 3.0。所需的最低 Cuda 能力为 3.5

我正在从源安装tensorflow 文档 https www tensorflow org versions r0 10 get started os setup html installing from sources Cuda驱动版本
提取二值图像中的最中心区域

我正在处理二进制图像之前使用此代码来查找二进制图像中的最大区域 Use the hue value to convert to binary thresh 20 thresh thresh img cv2 threshold h thre
Odoo：如何覆盖原始功能

在 Odoo 中每次打开产品表单时都会计算产品的数量这发生在模型中product product gt function product available 该函数返回一个名为 res 的字典 Example res 8 qty ava
Kivy错误（python 2.7）：sdl2导入错误

我尝试在我的 Python 2 7 项目在 PyCharm Windows 10 环境中上使用 kivy 但出现以下错误如果有人可以帮助我吗谢谢 PS 我多次尝试卸载重新安装库等并按照像这样的帖子上的建议进行操作但它不起作用
Python 多处理：全局对象未正确复制到子级

前几天我回答了一个关于SO的问题 https stackoverflow com q 67047533 1925388关于并行读取 tar 文件这是问题的要点 import bz2 import tarfile from multipro
使用 django-profiles 以配置文件形式编辑相关模型

我在用着Django 配置文件 http bitbucket org ubernostrum django profiles wiki Home在我的应用程序中因为它为我提供了一些简单的视图可以帮助我更快地到达我想去的地方但是我有一
Python 柯里化任意数量的变量

我正在尝试使用柯里化在 Python 中进行简单的函数添加我找到了这个咖喱装饰器here https gist github com JulienPalard 021f1c7332507d6a494b def curry func def
为什么变量不在循环外更新？

无法弄清楚为什么结果中的第一个键是 abc 而不是我期望的 c 我使用的是Python 3 6 4 数据结构很奇怪因为我删除了不相关的键和值 f replace ab r data abc 1 def 2 ghi 3 jkf 4 lmn
“gi.repository.Gtk”对象没有属性“gdk”

我正在尝试使用 GTK 创建多线程需要 Gtk gdk 但我收到有关没有 gdk 属性的错误我正在使用带有 Raspbian 的 Raspberry Pi 这就是我导入 GTK 库的方式 try import pygtk pygtk r
如何在Python中一次比较二维数组的2列与另一个数组的列

我有两个字符串数组每个数组有三列我想比较两个二维数组的前两列有 3 列和 4000 行如果它们匹配那么我需要那些匹配的值但是我的代码不起作用这是一个示例 array1 1stcolumn 2ndColumn 3rdColumn
类型错误：不可散列的类型：pandas 的“切片”

我有一个 pandas 数据结构我这样创建 test inputs pd read csv input test csv delimiter 它的形状 print test inputs shape is this 28000 784 我
如何找到 JAR：/home/hadoop/contrib/streaming/hadoop-streaming.jar

我正在练习有关 Amazon EMR 的复数视角视频教程我被困住了因为我收到此错误而无法继续 Not a valid JAR home hadoop contrib streaming hadoop streaming jar 请注意
根据对象内的值将对象数组分成两部分

我一直在尝试并努力弄清楚如何根据键值对拆分对象数组长话短说我有一个火车正在停靠的车站列表需要将之前的停靠点和未来的停靠点分开我正在使用的数据如下所示 station code SOC station name Southend

随机推荐

Delphi XE6 - 使用“USE_INDY”构建的 SOAP 通过代理问题连接到 Web 服务

我有一个使用连接到网络服务的应用程序THttpRio成分 Web服务有基本的身份验证我使用 USE INDY 指令编译了 Delphi SOAP 单元以便 THttpRio 组件使用 WinHttp 现在我需要通过代理访问我的网络服务
尝试使用 Swift AVPlayer 播放音频

这是我当前的视图控制器 import UIKit import AVFoundation class SecondViewController UIViewController override func viewDidLoad var p
重叠的 AWT 线和 Swing JLabels

我在使用线基元的应用程序中遇到问题JLables 我尝试解释一下我必须使用线条来代表道路来绘制车辆路线JLabels来代表城市我需要使用JLabels因为每个 JLabel 都有一个监听器用于显示包含城市信息的对话框我重新定义pai
如果返回值被忽略，如何发出警告？

我想查看我的代码 C 中忽略函数返回值的所有位置我怎样才能做到这一点使用 gcc 或静态代码分析工具错误代码示例 int f int z return z z 2 z 3 z z 23 int main int i 7 f i lt
Ajax 会话丢失

我将 Symfony 应用程序从 Symfony 4 0 7 升级到 Symfony 4 1 之后 AJAX 调用会丢失会话值我同时调用了大约 6 个 ajax 请求第一个进展顺利但其他人正在失去会话值它仅在迁移到 Symfony
用golang封装一个包

想象一个导出一些结构和一些函数的包如果我想围绕该包制作一个包装器以便它可以用作插件我是否应该重新创建嵌入旧结构的结构例子 package foo type Foo struct Field string func DoSomethi
Google Fit API 配额和限制

使用 google fit api 时是否有配额和请求限制我想使用 google fit api 我很好奇使用它时是否有限制您可以在以下位置检查您项目的 Fitness API 当前限制谷歌开发者控制台我检查了当前的项目默认限制是
Python - SqlAlchemy：按大圆距离过滤查询？

我正在使用 Python 和 Sqlalchemy 在 Sqlite 数据库中存储纬度和经度值我创建了一个混合法对于我的位置对象 hybrid method def great circle distance self other Tri
导入变量命名空间

是否可以使用这样的变量导入名称空间 namespace User Authorization Certificate use namespace 显然这不会运行use声明需要一个常量但有解决方法吗 Edit 发现了一个 gem 仅适用于
Liferay 7 主题中的 jQuery 插件

我需要一些帮助来理解 Liferay 7 主题特别是使用 jQuery 插件因为我遇到了与此线程相同的问题 https web liferay com community forums message boards view messa
由于嵌套节点依赖关系，路径太长

我正在使用 npm 来安装依赖项安装完这些后我想与非技术人员共享我的项目并且没有 npm 所以我想在应用程序内发送 node modules 但是由于节点嵌套了依赖项因此它创建的文件具有很长的路径 217 个字符 node mod
为什么 iTextSharp 中的 GetTextFromPage 返回的字符串越来越长？

我正在使用最新的iTextSharpnuGet 5 5 8 中的 lib 用于解析 pdf 文件中的一些文本我面临的问题是GetTextFromPage方法不仅返回应有的页面文本还返回上一页的文本这是我的代码 var url http
通过 C# 代码执行 Powershell 命令

我想通过 C 代码添加 Powershell 命令或脚本什么是正确的变量声明默认值存储在 C 变量中例如在 Powershell 中我输入以下行 user Admin 我想在 C 代码中添加这一行 powershell AddSc
在 Ubuntu 20.04 上安装 MySQL 时出现问题

我正在尝试在 Ubuntu 20 04 中安装 MySQL 8 0sudo apt install mysql server 但是重新安装和使用后仍然出现此错误sudo dpkg configure a Setting up mysql s
如何为一个类实例化更多 CDI bean？

Note 类似的问题已经在三年前被问过在 EE 6 的时候请参阅如何为一个类实例化多个 CDI Weld bean 有什么变化吗EE 7 在 Spring 中可以通过在 xml conf 中定义相应的 bean 来实例化任何类也可以
PhoneGap 启动图片 iOS Apple Store 提交 [重复]

这个问题在这里已经有答案了一如既往地提交iTunesConnect of my PhoneGap申请起来比较麻烦特别是当我尝试使用时我看到弹出这条新消息Application Loader Your binary is not opt
面向对象编程。从方法内部调用方法

如何从类内的函数调用类方法我的代码是 var myExtension init function Call onPageLoad onPageLoad function Do something 我试过了 onPageLoad 来自 in
如何在Vue Material中设置灵活的网格

我正在尝试构建一个使用 Vue Material 在网格中渲染用户输入的卡片的界面卡片正确渲染然而我希望我的网格能够以消除间隙的方式弯曲对齐和交错不同尺寸的卡片如下所示下面的代码与上面的网格相对应
PHP：使用来自 php 的参数调用 javascript 函数

我正在尝试使用 PHP 变量参数调用 JavaScript 函数我尝试了两种方法在 PHP 中使用 echo 中的脚本标签调用 JavaScript 函数 IE 将 PHP 变量值赋给 JavaScript 变量
为什么 Numba 不改进这个递归函数

我有一个结构非常简单的真假值数组 the real array has hundreds of thousands of items positions np array True False False False True True

为什么 Numba 不改进这个递归函数

300k 元素数组的性能结果

为什么 Numba 不改进这个递归函数 的相关文章

随机推荐

热门标签

为什么 Numba 不改进这个递归函数的相关文章