为什么 Python 列表上的 `for` 比 Numpy 数组上的 `for` 更快？

2023-12-23

因此，在没有讲一个很长的故事的情况下，我正在编写一些代码，从二进制文件中读取一些数据，然后使用 for 循环遍历每个点。所以我完成了代码，但它运行得慢得离谱。我从大约 128 个数据通道循环了大约 60,000 个点，这需要一分钟或更长时间来处理。这比我预期的 Python 运行速度要慢得多。因此，我通过使用 Numpy 使整个过程更加高效，但在试图找出为什么原始进程运行如此慢的过程中，我们进行了一些类型检查，发现我正在循环 Numpy 数组而不是 Python 列表。好的，没有什么大不了的，让我们的测试设置的输入相同，我在循环之前将 Numpy 数组转换为列表。原来需要一分钟才能运行的同样缓慢的代码现在只需要 10 秒。我很震惊。我唯一想到的就是将 Numpy 数组更改为 Python 列表，我又将其更改回来，但速度又慢得像泥巴一样。我简直不敢相信，所以我去寻找更确切的证据

$ python -m timeit -s "import numpy" "for k in numpy.arange(5000): k+1"
100 loops, best of 3: 5.46 msec per loop

$ python -m timeit "for k in range(5000): k+1"
1000 loops, best of 3: 256 usec per loop

到底是怎么回事？我知道 Numpy 数组和 Python 列表是不同的，但为什么迭代数组中的每个点要慢得多？

我相信，我在运行 Numpy 10.1 的 Python 2.6 和 2.7 中都观察到了这种行为。

我们可以做一些调查来弄清楚这一点：

>>> import numpy as np
>>> a = np.arange(32)
>>> a
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31])
>>> a.data
<read-write buffer for 0x107d01e40, size 256, offset 0 at 0x107d199b0>
>>> id(a.data)
4433424176
>>> id(a[0])
4424950096
>>> id(a[1])
4424950096
>>> for item in a:
...   print id(item)
... 
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120

那么这是怎么回事呢？首先，我查看了数组内存缓冲区的内存位置。它在4433424176。这本身并不是too有启发性。但是，numpy 将其数据存储为连续的 C 数组，因此 numpy 数组中的第一个元素should对应于数组本身的内存地址，但它不是：

>>> id(a[0])
4424950096

这样做是件好事，因为这会破坏 python 中的不变量，即两个对象永远不会有相同的对象id在他们的一生中。

So, how does numpy accomplish this? Well, the answer is that numpy has to wrap the returned object with a python type (e.g. numpy.float64 or numpy.int64 in this case) which takes time if you're iterating item-by-item¹. Further proof of this is demonstrated when iterating -- We see that we're alternating between 2 separate IDs while iterating over the array. This means that python's memory allocator and garbage collector are working overtime to create new objects and then free them.

A list没有内存分配器/垃圾收集器开销。列表中的对象已经作为 python 对象存在（并且它们在迭代后仍然存在），因此两者在列表迭代中都不起任何作用。

计时方法：

另请注意，您的假设会导致您的时间安排有些偏差。你假设k + 1在这两种情况下应该花费相同的时间，但事实并非如此。请注意我是否重复你的时间安排without做任何添加：

mgilson$ python -m timeit -s "import numpy" "for k in numpy.arange(5000): k"
1000 loops, best of 3: 233 usec per loop
mgilson$ python -m timeit "for k in range(5000): k"
10000 loops, best of 3: 114 usec per loop

大约只有 2 倍的差异。然而，进行加法运算会导致 5 倍左右的差异：

mgilson$ python -m timeit "for k in range(5000): k+1"
10000 loops, best of 3: 179 usec per loop
mgilson$ python -m timeit -s "import numpy" "for k in numpy.arange(5000): k+1"
1000 loops, best of 3: 786 usec per loop

为了好玩，让我们做一下加法：

$ python -m timeit -s "v = 1" "v + 1"
10000000 loops, best of 3: 0.0261 usec per loop
mgilson$ python -m timeit -s "import numpy; v = numpy.int64(1)" "v + 1"
10000000 loops, best of 3: 0.121 usec per loop

最后，您的 timeit 还包括列表/数组构建时间，这并不理想：

mgilson$ python -m timeit -s "v = range(5000)" "for k in v: k"
10000 loops, best of 3: 80.2 usec per loop
mgilson$ python -m timeit -s "import numpy; v = numpy.arange(5000)" "for k in v: k"
1000 loops, best of 3: 237 usec per loop

请注意，在这种情况下，numpy 实际上距离列表解决方案更远了。这表明迭代 really is速度较慢，如果将 numpy 类型转换为标准 python 类型，可能会获得一些加速。

^{¹Note, this doesn't take a lot of time when slicing because that only has to allocate O(1) new objects since numpy returns a view into the original array.}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 Python 列表上的 `for` 比 Numpy 数组上的 `for` 更快？的相关文章

LEFT JOIN 比 INNER JOIN 快得多

我有一张桌子 MainTable 有超过 600 000 条记录它通过第二个表连接到自身 JoinTable 在父子类型关系中 SELECT Child ID Parent ID FROM MainTable AS Child JOIN
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
Python HMAC：类型错误：字符映射必须返回整数、None 或 unicode

我在使用 HMAC 时遇到了一个小问题运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
python中basestring和types.StringType之间的区别？

有什么区别 isinstance foo types StringType and isinstance foo basestring 对于Python2 basestring是两者的基类str and unicode while type
查找 Pandas DF 行中的最短日期并创建新列

我有一个包含多个日期的表有些日期将为 NaN 我需要找到最旧的日期所以一行可能有 DATE MODIFIED WITHDRAWN DATE SOLD DATE STATUS DATE 等因此对于每一行一个或多个字段中都会有一个日期
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
如何查找或安装适用于 Python 的主题 tkinter ttk

过去 3 个月我一直在制作一个机器人仅用代码就可以完美运行现在我的下一个目标是为它制作一个 GUI 但是我发现了一些障碍主要的一个是能够看起来不像一个 30 年前的程序我使用的是 Windows 7 我仅使用 Python 3 3
2 使用我的代码在数组中查询

我使用滑块来显示我的 WordPress 精选文章它选择一个自定义类别并返回一定数量的帖子如何将显示的第一篇帖子设为自定义帖子我可以直接在滑块代码中添加特定帖子的 ID吗使该帖子首先出现然后是原始查询返回的其他内容例如在页面上
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
检测是否从psycopg2游标获取？

假设我执行以下命令 insert into hello username values me 我跑起来就像 cursor fetchall 我收到以下错误 psycopg2 ProgrammingError no results to fe
使用 PIL 在 Tkinter 中显示动画 GIF

我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
如何将带有参数的Python装饰器实现为类？

我正在尝试实现一个接受一些参数的装饰器通常带有参数的装饰器被实现为双重嵌套闭包如下所示 def mydecorator param1 param2 do something with params def wrapper fn def
为什么python+sqlite3特别慢？

我尝试使用 Python 2 7 4 sqlite3 和 Firefox SQLite Manager 0 8 0 处理对同一数据库的相同请求在小型数据库 8000 条记录上 Python 和 Firefox 都运行得很快并且给出了相同
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
python从二进制文件中读取16字节长的双精度值

我找到了蟒蛇struct unpack 读取其他程序生成的二进制数据非常方便问题如何阅读16 字节长双精度数出二进制文件以下 C 代码将 1 01 写入二进制文件三次分别使用 4 字节浮点型 8 字节双精度型和 16 字节长双精度型
如何（安全）将 Python 对象发送到我的 Flask API？

我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象我使用 Python 3 7 1 创建请求使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行我试图发
定义在文本小部件中双击时选择哪些字符

在 Windows 上双击文本小部件中的单词也将选择连接的标点符号有什么方法可以定义您想要选择的角色吗 tcl wordchars该变量的值是一个正则表达式可以设置它来控制什么被视为单词字符例如通过双击 Tk 中的文本来选择单

随机推荐

尽管安装成功但无法识别节点

我试着跑nodejs在全新安装的Windows 7的这就是我所做的使用 Windows 安装程序安装节点确保文件被提取到C Program Files x86 nodejs 确保我的 Path 环境变量包含C Program File
Apache C++ 模块持久全局对象

我希望在 Apache C 模块中保持一些全局对象在 Apache 子进程调用中保持不变我该怎么做呢您必须使用 Apache 进程外部的某种形式的存储基本选择一个数据库共享内存取决于操作系统另一个进程并使用IPC机制例如套接
Google Calendar API - 只能更新事件一次

我遇到了与这篇文章中描述的相同的问题 Google Calendar api v3 重新更新问题 https stackoverflow com questions 8574088 google calendar api v3 re upd
将私有方法公开以对其进行单元测试...好主意吗？

Moderator Note There are already 39 answers posted here some have been deleted Before you post your answer consider whet
Rstudio 的“在文件中查找”有 R 版本吗？

我喜欢 Rstudio 的在文件中查找功能您可以在指定目录中的所有文件中搜索文本但我讨厌指定要搜索的目录和文件类型的方式您必须单击并指向呃有谁知道在 R 控制台中执行此操作的简单方法 fif lt function what
Blazor 中的 SendGrid 电子邮件服务 - 依赖注入或静态方法

我正在 Blazor 应用程序 NET 5 中设置 SendGrid 电子邮件发送器根据 SendGrid 文档和示例他们正在编写一个签名为的方法static async Task然后他们await来自他们的 API 的响应他们的示例
正则表达式在 vb6 中的用法

我需要验证一个字符串该字符串可能包含字母数字以及特殊字符因为我必须传递仅包含字母字符的字符串不允许使用数字或任何其他特殊字符在当前的方法中我使用 ASCII 数字来评估每个字符是否为字母是否有其他有效的方法来发现字符串中是否存在
Google 地图显示空白地图

I am currently stuck with this problem Google Maps seems not to be loading at all Please see the image below 这真让我抓狂我已经完
在python3.6上导入yarl或discord.py时出现问题

由于列出的错误我最近更新了discord py在这篇文章中 https stackoverflow com questions 63027848 discord py glitch or random error typeerror ne
如何对齐引导表单中的元素

请看看我的代码 http www bootply com VcVDblSFK7 http www bootply com VcVDblSFK7 我希望将键符号和输入控件的范围放在同一行中后面是错误消息的范围但我已经做了太多的编辑并
在c/c++中通过内存中的地址调用函数

已知函数的原型及其在内存中的地址是否可以从另一个进程或除了原型和内存地址之外一无所知的一段代码中调用该函数如果可能的话如何在代码中处理返回的类型在现代操作系统上每个进程有自己的地址空间并且地址仅在进程内有效如果您想在其他进程中执
PowerManager.PARTIAL_WAKE_LOCK android

我很困惑是否要获取这个唤醒锁例如我有这种类型的代码是从onReceive of a BroadcastReceiever CONNECTIVITY CHANGE BOOT COMPLETED 等异步地即我正在启动一个IntentSe
如何读取 .lbl 文件

我想读我的 lbl文件并将其数据存储到数据库列中因此每当用户想要修改它时他们可以创建一个新的 lbl来自数据库的文件我已经转换了我的 lbl使用下面所示的代码片段将数据转换为二进制 byte fileBytes File ReadA
使用mock模拟嵌套属性

我有一个返回对象的函数调用 r Foo x y where r具有丰富的嵌套属性集例如我可以访问r prop a prop b prop c 我想嘲笑Foo 这样特定的叶子属性r被修改即使得r prop a prop b prop c
使用 libxml2 进行递归 XPath 查询的最有效方法是什么？

我为 libxml2 编写了一个 C 包装函数它使我可以轻松地对 XML 文档进行查询 bool XPathQuery const std string doc const std string query XPathResults re
阻止导航控制器影响其他视图控制器

我有一个应用程序它使用带有三个视图控制器的导航控制器来进行分步用户设置因此第一个视图将是步骤 1 第二个视图将是步骤 2 等等所有这些都将嵌入到导航控制器中以便用户能够来回移动但是一旦完成此设置并且用户按下完成按钮应用程
Android 数据库被其他线程锁定

我正在处理 android sqLite 数据库其中我无法将记录插入数据库在代码中我在启动应用程序时仅打开数据库一次并且设置了对我的应用程序类变量的引用以便我可以从代码的任何部分访问数据库并且效果很好问题是我可以访问数据库
从文件名中提取日期

我遇到一种情况我需要从文件名中提取日期其一般模式是 filename YYYYMMDD fileExtension e g xxx 20100326 xls or x2v 20100326 csv 下面的程序完成了这项工作 Number
获取复选框的多个值

我如何使用此代码在 codeigniter 中获取多个复选框值
为什么 Python 列表上的 `for` 比 Numpy 数组上的 `for` 更快？

因此在没有讲一个很长的故事的情况下我正在编写一些代码从二进制文件中读取一些数据然后使用 for 循环遍历每个点所以我完成了代码但它运行得慢得离谱我从大约 128 个数据通道循环了大约 60 000 个点这需要一分钟或更长时间

为什么 Python 列表上的 `for` 比 Numpy 数组上的 `for` 更快？

计时方法：

为什么 Python 列表上的 `for` 比 Numpy 数组上的 `for` 更快？ 的相关文章

随机推荐

热门标签

为什么 Python 列表上的 `for` 比 Numpy 数组上的 `for` 更快？的相关文章