为什么 Python 列表上的 `for` 比 Numpy 数组上的 `for` 更快?

2023-12-23

因此,在没有讲一个很长的故事的情况下,我正在编写一些代码,从二进制文件中读取一些数据,然后使用 for 循环遍历每个点。所以我完成了代码,但它运行得慢得离谱。我从大约 128 个数据通道循环了大约 60,000 个点,这需要一分钟或更长时间来处理。这比我预期的 Python 运行速度要慢得多。因此,我通过使用 Numpy 使整个过程更加高效,但在试图找出为什么原始进程运行如此慢的过程中,我们进行了一些类型检查,发现我正在循环 Numpy 数组而不是 Python 列表。好的,没有什么大不了的,让我们的测试设置的输入相同,我在循环之前将 Numpy 数组转换为列表。原来需要一分钟才能运行的同样缓慢的代码现在只需要 10 秒。我很震惊。我唯一想到的就是将 Numpy 数组更改为 Python 列表,我又将其更改回来,但速度又慢得像泥巴一样。我简直不敢相信,所以我去寻找更确切的证据

$ python -m timeit -s "import numpy" "for k in numpy.arange(5000): k+1"
100 loops, best of 3: 5.46 msec per loop

$ python -m timeit "for k in range(5000): k+1"
1000 loops, best of 3: 256 usec per loop

到底是怎么回事?我知道 Numpy 数组和 Python 列表是不同的,但为什么迭代数组中的每个点要慢得多?

我相信,我在运行 Numpy 10.1 的 Python 2.6 和 2.7 中都观察到了这种行为。


我们可以做一些调查来弄清楚这一点:

>>> import numpy as np
>>> a = np.arange(32)
>>> a
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31])
>>> a.data
<read-write buffer for 0x107d01e40, size 256, offset 0 at 0x107d199b0>
>>> id(a.data)
4433424176
>>> id(a[0])
4424950096
>>> id(a[1])
4424950096
>>> for item in a:
...   print id(item)
... 
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120

那么这是怎么回事呢?首先,我查看了数组内存缓冲区的内存位置。它在4433424176。这本身并不是too有启发性。但是,numpy 将其数据存储为连续的 C 数组,因此 numpy 数组中的第一个元素should对应于数组本身的内存地址,但它不是:

>>> id(a[0])
4424950096

这样做是件好事,因为这会破坏 python 中的不变量,即两个对象永远不会有相同的对象id在他们的一生中。

So, how does numpy accomplish this? Well, the answer is that numpy has to wrap the returned object with a python type (e.g. numpy.float64 or numpy.int64 in this case) which takes time if you're iterating item-by-item1. Further proof of this is demonstrated when iterating -- We see that we're alternating between 2 separate IDs while iterating over the array. This means that python's memory allocator and garbage collector are working overtime to create new objects and then free them.

A list没有内存分配器/垃圾收集器开销。列表中的对象已经作为 python 对象存在(并且它们在迭代后仍然存在),因此两者在列表迭代中都不起任何作用。

计时方法:

另请注意,您的假设会导致您的时间安排有些偏差。你假设k + 1在这两种情况下应该花费相同的时间,但事实并非如此。请注意我是否重复你的时间安排without做任何添加:

mgilson$ python -m timeit -s "import numpy" "for k in numpy.arange(5000): k"
1000 loops, best of 3: 233 usec per loop
mgilson$ python -m timeit "for k in range(5000): k"
10000 loops, best of 3: 114 usec per loop

大约只有 2 倍的差异。然而,进行加法运算会导致 5 倍左右的差异:

mgilson$ python -m timeit "for k in range(5000): k+1"
10000 loops, best of 3: 179 usec per loop
mgilson$ python -m timeit -s "import numpy" "for k in numpy.arange(5000): k+1"
1000 loops, best of 3: 786 usec per loop

为了好玩,让我们做一下加法:

$ python -m timeit -s "v = 1" "v + 1"
10000000 loops, best of 3: 0.0261 usec per loop
mgilson$ python -m timeit -s "import numpy; v = numpy.int64(1)" "v + 1"
10000000 loops, best of 3: 0.121 usec per loop

最后,您的 timeit 还包括列表/数组构建时间,这并不理想:

mgilson$ python -m timeit -s "v = range(5000)" "for k in v: k"
10000 loops, best of 3: 80.2 usec per loop
mgilson$ python -m timeit -s "import numpy; v = numpy.arange(5000)" "for k in v: k"
1000 loops, best of 3: 237 usec per loop

请注意,在这种情况下,numpy 实际上距离列表解决方案更远了。这表明迭代 really is速度较慢,如果将 numpy 类型转换为标准 python 类型,可能会获得一些加速。

1Note, this doesn't take a lot of time when slicing because that only has to allocate O(1) new objects since numpy returns a view into the original array.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 Python 列表上的 `for` 比 Numpy 数组上的 `for` 更快? 的相关文章

  • LEFT JOIN 比 INNER JOIN 快得多

    我有一张桌子 MainTable 有超过 600 000 条记录 它通过第二个表连接到自身 JoinTable 在父 子类型关系中 SELECT Child ID Parent ID FROM MainTable AS Child JOIN
  • Series.sort() 和 Series.order() 有什么区别?

    s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
  • 使用python从gst管道抓取帧到opencv

    我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好 以下命
  • AttributeError:“模块”对象没有属性[重复]

    这个问题在这里已经有答案了 我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
  • Python HMAC:类型错误:字符映射必须返回整数、None 或 unicode

    我在使用 HMAC 时遇到了一个小问题 运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
  • python中basestring和types.StringType之间的区别?

    有什么区别 isinstance foo types StringType and isinstance foo basestring 对于Python2 basestring是两者的基类str and unicode while type
  • 查找 Pandas DF 行中的最短日期并创建新列

    我有一个包含多个日期的表 有些日期将为 NaN 我需要找到最旧的日期 所以一行可能有 DATE MODIFIED WITHDRAWN DATE SOLD DATE STATUS DATE 等 因此 对于每一行 一个或多个字段中都会有一个日期
  • 从 Flask 运行 NPM 构建

    我有一个 React 前端 我想在与我的 python 后端 API 相同的源上提供服务 我正在尝试使用 Flask 来实现此目的 但我遇到了 Flask 找不到我的静态文件的问题 我的前端构建是用生成的npm run build in s
  • pandas 相当于 np.where

    np where具有向量化 if else 的语义 类似于 Apache Spark 的when otherwise数据帧方法 我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
  • 如何查找或安装适用于 Python 的主题 tkinter ttk

    过去 3 个月我一直在制作一个机器人 仅用代码就可以完美运行 现在我的下一个目标是为它制作一个 GUI 但是我发现了一些障碍 主要的一个是能够看起来不像一个 30 年前的程序 我使用的是 Windows 7 我仅使用 Python 3 3
  • 2 使用我的代码在数组中查询

    我使用滑块来显示我的 WordPress 精选文章 它选择一个自定义类别并返回一定数量的帖子 如何将显示的第一篇帖子设为自定义帖子 我可以直接在滑块代码中添加特定帖子的 ID吗使该帖子首先出现 然后是原始查询返回的其他内容 例如 在页面上
  • 使用 Python 将连续日期分组在一起

    Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
  • 检测是否从psycopg2游标获取?

    假设我执行以下命令 insert into hello username values me 我跑起来就像 cursor fetchall 我收到以下错误 psycopg2 ProgrammingError no results to fe
  • 使用 PIL 在 Tkinter 中显示动画 GIF

    我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
  • 如何将带有参数的Python装饰器实现为类?

    我正在尝试实现一个接受一些参数的装饰器 通常带有参数的装饰器被实现为双重嵌套闭包 如下所示 def mydecorator param1 param2 do something with params def wrapper fn def
  • 为什么python+sqlite3特别慢?

    我尝试使用 Python 2 7 4 sqlite3 和 Firefox SQLite Manager 0 8 0 处理对同一数据库的相同请求 在小型数据库 8000 条记录 上 Python 和 Firefox 都运行得很快并且给出了相同
  • 将 Keras 集成到 SKLearn 管道?

    我有一个 sklearn 管道 对异构数据类型 布尔 分类 数字 文本 执行特征工程 并想尝试使用神经网络作为我的学习算法来拟合模型 我遇到了输入数据形状的一些问题 我想知道我想做的事情是否可能 或者我是否应该尝试不同的方法 我尝试了几种不
  • python从二进制文件中读取16字节长的双精度值

    我找到了蟒蛇struct unpack 读取其他程序生成的二进制数据非常方便 问题 如何阅读16 字节长双精度数出二进制文件 以下 C 代码将 1 01 写入二进制文件三次 分别使用 4 字节浮点型 8 字节双精度型和 16 字节长双精度型
  • 如何(安全)将 Python 对象发送到我的 Flask API?

    我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象 我使用 Python 3 7 1 创建请求 使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行 我试图发
  • 定义在文本小部件中双击时选择哪些字符

    在 Windows 上 双击文本小部件中的单词也将选择连接的标点符号 有什么方法可以定义您想要选择的角色吗 tcl wordchars该变量的值是一个正则表达式 可以设置它来控制什么被视为 单词 字符 例如 通过双击 Tk 中的文本来选择单

随机推荐

  • 尽管安装成功但无法识别节点

    我试着跑nodejs在全新安装的Windows 7的 这就是我所做的 使用 Windows 安装程序安装节点 确保文件被提取到C Program Files x86 nodejs 确保我的 Path 环境变量包含C Program File
  • Apache C++ 模块持久全局对象

    我希望在 Apache C 模块中保持一些全局对象在 Apache 子进程调用中保持不变 我该怎么做呢 您必须使用 Apache 进程外部的某种形式的存储 基本选择 一个数据库 共享内存 取决于操作系统 另一个进程并使用IPC机制 例如套接
  • Google Calendar API - 只能更新事件一次

    我遇到了与这篇文章中描述的相同的问题 Google Calendar api v3 重新更新问题 https stackoverflow com questions 8574088 google calendar api v3 re upd
  • 将私有方法公开以对其进行单元测试...好主意吗?

    Moderator Note There are already 39 answers posted here some have been deleted Before you post your answer consider whet
  • Rstudio 的“在文件中查找”有 R 版本吗?

    我喜欢 Rstudio 的 在文件中查找 功能 您可以在指定目录中的所有文件中搜索文本 但我讨厌指定要搜索的目录和文件类型的方式 您必须单击并指向 呃 有谁知道在 R 控制台中执行此操作的简单方法 fif lt function what
  • Blazor 中的 SendGrid 电子邮件服务 - 依赖注入或静态方法

    我正在 Blazor 应用程序 NET 5 中设置 SendGrid 电子邮件发送器 根据 SendGrid 文档和示例 他们正在编写一个签名为的方法static async Task然后他们await来自他们的 API 的响应 他们的示例
  • 正则表达式在 vb6 中的用法

    我需要验证一个字符串 该字符串可能包含字母数字以及特殊字符 因为我必须传递仅包含字母字符的字符串 不允许使用数字或任何其他特殊字符 在当前的方法中 我使用 ASCII 数字来评估每个字符是否为字母 是否有其他有效的方法来发现字符串中是否存在
  • Google 地图显示空白地图

    I am currently stuck with this problem Google Maps seems not to be loading at all Please see the image below 这真让我抓狂 我已经完
  • 在python3.6上导入yarl或discord.py时出现问题

    由于列出的错误 我最近更新了discord py在这篇文章中 https stackoverflow com questions 63027848 discord py glitch or random error typeerror ne
  • 如何对齐引导表单中的元素

    请 看看我的代码 http www bootply com VcVDblSFK7 http www bootply com VcVDblSFK7 我希望将键符号和输入控件的范围放在同一行中 后 面是错误消息的范围 但我已经做了太多的编辑 并
  • 在c/c++中通过内存中的地址调用函数

    已知函数的原型及其在内存中的地址 是否可以从另一个进程或除了原型和内存地址之外一无所知的一段代码中调用该函数 如果可能的话 如何在代码中处理返回的类型 在现代操作系统上 每个进程有自己的地址空间并且地址仅在进程内有效 如果您想在其他进程中执
  • PowerManager.PARTIAL_WAKE_LOCK android

    我很困惑是否要获取这个唤醒锁 例如 我有这种类型的代码 是从onReceive of a BroadcastReceiever CONNECTIVITY CHANGE BOOT COMPLETED 等 异步地即我正在启动一个IntentSe
  • 如何读取 .lbl 文件

    我想读我的 lbl文件并将其数据存储到数据库列中 因此 每当用户想要修改它时 他们可以创建一个新的 lbl来自数据库的文件 我已经转换了我的 lbl使用下面所示的代码片段将数据转换为二进制 byte fileBytes File ReadA
  • 使用mock模拟嵌套属性

    我有一个返回对象的函数调用 r Foo x y where r具有丰富的嵌套属性集 例如 我可以访问r prop a prop b prop c 我想嘲笑Foo 这样特定的叶子属性r被修改 即使得r prop a prop b prop c
  • 使用 libxml2 进行递归 XPath 查询的最有效方法是什么?

    我为 libxml2 编写了一个 C 包装函数 它使我可以轻松地对 XML 文档进行查询 bool XPathQuery const std string doc const std string query XPathResults re
  • 阻止导航控制器影响其他视图控制器

    我有一个应用程序 它使用带有三个视图控制器的导航控制器来进行分步用户设置 因此 第一个视图将是步骤 1 第二个视图将是步骤 2 等等 所有这些都将嵌入到导航控制器中 以便用户能够来回移动 但是 一旦完成此设置并且用户按下 完成 按钮 应用程
  • Android 数据库被其他线程锁定

    我正在处理 android sqLite 数据库 其中我无法将记录插入数据库 在代码中 我在启动应用程序时仅打开数据库一次 并且设置了对我的应用程序类变量的引用 以便我可以从代码的任何部分访问数据库 并且效果很好 问题是 我可以访问数据库
  • 从文件名中提取日期

    我遇到一种情况 我需要从文件名中提取日期 其一般模式是 filename YYYYMMDD fileExtension e g xxx 20100326 xls or x2v 20100326 csv 下面的程序完成了这项工作 Number
  • 获取复选框的多个值

    我如何使用此代码在 codeigniter 中获取多个复选框值
  • 为什么 Python 列表上的 `for` 比 Numpy 数组上的 `for` 更快?

    因此 在没有讲一个很长的故事的情况下 我正在编写一些代码 从二进制文件中读取一些数据 然后使用 for 循环遍历每个点 所以我完成了代码 但它运行得慢得离谱 我从大约 128 个数据通道循环了大约 60 000 个点 这需要一分钟或更长时间