库 itertools 与 python 代码的性能比较

2023-12-10

作为我问题的答案查找两个列表相同的从 1 开始的位置我得到了使用 C 库 itertools 来加快速度的提示。

为了验证我使用 cProfile 编写了以下测试：

from itertools import takewhile, izip

def match_iter(self, other):
    return sum(1 for x in takewhile(lambda x: x[0] == x[1],
                                        izip(self, other)))

def match_loop(self, other):
    element = -1
    for element in range(min(len(self), len(other))):
        if self[element] != other[element]:
            element -= 1
            break
    return element +1

def test():
    a = [0, 1, 2, 3, 4]
    b = [0, 1, 2, 3, 4, 0]

    print("match_loop a=%s, b=%s, result=%s" % (a, b, match_loop(a, b)))
    print("match_iter a=%s, b=%s, result=%s" % (a, b, match_iter(a, b)))

    i = 10000
    while i > 0:
        i -= 1
        match_loop(a, b)
        match_iter(a, b)

def profile_test():
    import cProfile
    cProfile.run('test()')

if __name__ == '__main__':
    profile_test()

函数 match_iter() 使用 itertools，函数 match_loop() 是我在使用普通 python 之前实现的函数。

函数 test() 定义了两个列表，打印包含两个函数结果的列表以验证其是否正常工作。两个结果的预期值都是 5，即列表的长度相等。然后它对这两个函数循环 10,000 次。

最后使用 profile_test() 对整个事情进行分析。

我了解到 izip 没有在 python3 的 itertools 中实现，至少在我使用的 debian wheezy 中没有实现。所以我用 python2.7 运行测试

结果如下：

python2.7 match_test.py
match_loop a=[0, 1, 2, 3, 4], b=[0, 1, 2, 3, 4, 0], result=5
match_iter a=[0, 1, 2, 3, 4], b=[0, 1, 2, 3, 4, 0], result=5
         180021 function calls in 0.636 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.636    0.636 <string>:1(<module>)
        1    0.039    0.039    0.636    0.636 match_test.py:15(test)
    10001    0.048    0.000    0.434    0.000 match_test.py:3(match_iter)
    60006    0.188    0.000    0.275    0.000 match_test.py:4(<genexpr>)
    50005    0.087    0.000    0.087    0.000 match_test.py:4(<lambda>)
    10001    0.099    0.000    0.162    0.000 match_test.py:7(match_loop)
    20002    0.028    0.000    0.028    0.000 {len}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}
    10001    0.018    0.000    0.018    0.000 {min}
    10001    0.018    0.000    0.018    0.000 {range}
    10001    0.111    0.000    0.387    0.000 {sum}

让我想知道的是，查看 cumtime 值，我的普通 python 版本的 10,000 个循环的值为 0.162 秒，而 match_iter 版本需要 0.434 秒。

一方面，Python 非常快，非常棒，所以我不必担心。但是，C 库完成这项工作所需的时间是简单 Python 代码的两倍以上，这种说法是否正确？还是我犯了一个致命的错误？

为了验证我还使用 python2.6 运行了测试，这似乎更快，但循环和 itertools 之间具有相同的差异。

谁有经验并且愿意提供帮助？

首先，感谢您对某些事情的实际计时。
其次，可读性通常比编写快速代码更重要。如果你的代码运行速度快了 3 倍，但你每 3 周花 2 周的时间来调试它，那么就不值得你花时间。
第三，你还可以使用timeit对小段代码进行计时。我发现这种方法比使用更容易profile. (profile不过对于发现瓶颈很有好处）。

itertools一般来说，速度相当快。然而，尤其是在这种情况下，您的takewhile会减慢速度，因为 itertools 需要为沿途的每个元素调用一个函数。 python 中的每个函数调用都有一定量的与之相关的开销，因此这可能会稍微减慢您的速度（首先还有创建 lambda 函数的成本）。请注意sum使用生成器表达式也会增加一点开销。但最终，在这种情况下，基本循环似乎总是获胜。

from itertools import takewhile, izip

def match_iter(self, other):
    return sum(1 for x in takewhile(lambda x: x[0] == x[1],
                                        izip(self, other)))

def match_loop(self, other):
    cmp = lambda x1,x2: x1 == x2

    for element in range(min(len(self), len(other))):
        if self[element] == other[element]:
            element += 1
        else:
            break

    return element

def match_loop_lambda(self, other):
    cmp = lambda x1,x2: x1 == x2

    for element in range(min(len(self), len(other))):
        if cmp(self[element],other[element]):
            element += 1
        else:
            break

    return element

def match_iter_nosum(self,other):
    element = 0
    for _ in takewhile(lambda x: x[0] == x[1],
                       izip(self, other)):
        element += 1
    return element

def match_iter_izip(self,other):
    element = 0
    for x1,x2 in izip(self,other):
        if x1 == x2:
            element += 1
        else:
            break
    return element



a = [0, 1, 2, 3, 4]
b = [0, 1, 2, 3, 4, 0]

import timeit

print timeit.timeit('match_iter(a,b)','from __main__ import a,b,match_iter')
print timeit.timeit('match_loop(a,b)','from __main__ import a,b,match_loop')
print timeit.timeit('match_loop_lambda(a,b)','from __main__ import a,b,match_loop_lambda')
print timeit.timeit('match_iter_nosum(a,b)','from __main__ import a,b,match_iter_nosum')
print timeit.timeit('match_iter_izip(a,b)','from __main__ import a,b,match_iter_izip')

但请注意，最快的版本是循环+itertools 的混合体。这个（显式）循环izip也恰好更容易阅读（在我看来）。所以，我们可以由此得出结论takewhile是缓慢的部分，不一定itertools一般来说。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

库 itertools 与 python 代码的性能比较的相关文章

无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
小部件之间的自定义信号

尝试将信号从一个 gtk EventBox 子级发送到另一个在 init HeadMode 第 75 行上出现错误类型错误未知信号名称消息发送 why usr bin env python coding utf8 import p
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

使用 Jupyter Notebook 时 VSCode 中缺少在选择中查找按钮它会减慢开发速度所以我想请问有人知道如何激活它吗第一张图显示了在 python 文件中的搜索替换第二张图显示了笔记本电脑中缺少的按钮 Python
如何使用 javascript/jquery/AJAX 调用 Django REST API？

我想使用 Javascript jQuery AJAX 在前端调用 Django Rest API 请求方法是 POST 但当我看到 API 调用它的调用 OPTIONS 方法时所以我开始了解access control allow o
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
如何在 Azure 数据工厂 - Databricks 中使用 continuation_token 获取 ADF Pipeline 运行详细信息的下一页？

我在用 adf client pipeline runs query by factory resourceGroupName 工厂名称过滤器参数的方法azure mgmt datafactory DataFactoryManageme
在 Spyder 的变量资源管理器中查看局部变量

我是 python 新手正在使用 Spyder 的 IDE 我欣赏它的一项功能是它的变量资源管理器然而根据一些研究我发现它只显示全局变量我找到的解决方法是使用检查模块 import inspect local vars def m
如何用 kevent() 替换 select() 以获得更高的性能？

来自Kqueue 维基百科页面 http en wikipedia org wiki Kqueue Kqueue 在内核和用户空间之间提供高效的输入和输出事件管道因此可以修改事件过滤器以及接收待处理事件同时每次主事件循环迭代仅使用对
sqlite3从打印数据中删除括号

我创建了一个脚本用于查找数据库第一行中的最后一个值 import sqlite3 global SerialNum conn sqlite3 connect MyFirstDB db conn text factory str c con
字符串列表，获取n个元素的公共子串，Python

我的问题可能类似于this https stackoverflow com questions 37514193 count the number of occurrences of n length not given string in
在 C 中复制两个相邻字节的最快方法是什么？

好吧让我们从最明显的解决方案开始 memcpy Ptr const char a b 2 调用库函数的开销相当大编译器有时不会优化它我不会依赖编译器优化但即使 GCC 很聪明如果我将程序移植到带有垃圾编译器的更奇特的平台上我也不
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
[cocos2d-x]当我尝试在 Windows 10 中运行“python android-build.py -p 19 cpp-tests”时出现错误

当我尝试运行命令时python android build p cpp tests 我收到如图所示的错误在此之前我收到了另一条关于 Android SDK Tools 版本兼容性的错误消息所以我只是将 sdk 版本从 26 0 0
python 日志记录会刷新每个日志吗？

当我使用标准模块将日志写入文件时logging 每个日志会分别刷新到磁盘吗例如下面的代码会将日志刷新 10 次吗 logging basicConfig level logging DEBUG filename debug log fo
使用Multiprocessing和Pool时如何访问全局变量？

我试图避免将变量冗余地传递到dataList e g 1 globalDict 2 globalDict 3 globalDict 并在全球范围内使用它们 global globalDict然而在下面的代码中并不是这样做的解决方案是否有

随机推荐

为什么我收到手势识别器不能在原型对象上使用的信息？

当我将 UITapGestureRecognizer 放入场景中 UITableViewCell 内的 UIView 内时我从情节提要中收到上述错误知道为什么我会收到此错误吗我不确定为什么会出现这种限制但我知道为什么您会收到错误消息
向 Google 蜡烛图添加注释（发布的解决方案会触发 TypeError）

我正在尝试向 Google Candlestick 图表添加一些注释我注意到有人已经问过同样的问题向 Google 烛台图表添加注释用户Aper u回复了详细的解决方案来扩展图表并添加注释因为图表没有内置任何此类功能但是当我尝试
PHP正则表达式检查英文名称

寻找正则表达式来检查有效的英文名称即 A Z a z space only 名字可选中间名姓氏一个可接受的例子 John von Neumann Thanks 编辑添加检查代码 usr bin php
如何在 c/c++ 中构建没有导入表的可执行文件？

我找到了修复导入表的工具here 但是如果没有在 c c 中首先构建导入表 PE 是如何可执行的呢只是不要使用 CRT 也不要使用任何导入的函数 pragma comment linker entry start int start re
findAndModify 或 findOneAndUpdate - “不是函数”

首先哪个最好 findAndModify or findOneAndUpdate or findByIdAndUpdate 就我而言我有一张这样的表 seqkeys id invoice seq NumberInt 1 id recei
在编译时获取`std::initializer_list`的大小

我正在努力实施reshapefortran 与 C 11 14 的函数我设计了一个函数该函数接受两个std initializer list 首先initializer list给出我用来初始化的初始值D维数组第二initialize
GCC 如何自动知道包含 glib 库？

我用 C 语言编写了一个简单的程序它使用glib h 但是当我编译它时我收到如下错误 gcc test c o test test c 3 18 fatal error glib h No such file or directory
Facebook 成功登录后，ExternalLoginConfirmation 返回 null

在MVC 5模板中实现Facebook登录添加了应用程序ID和密码最初登录失败因为它返回 null public async Task
Twitter 的 Bootstrap typeahead 设置

我用的是官方的推特上的例子主要问题是我可能不知道如何使用霍根怪物 JS端 search name typeahead name name remote url entities search autocomplete json quer
MVC 3 和 WebForms 可以在网站上共存吗？

我目前有一个网站其中有一个 WebForms 4 网站该网站是 www mysite co uk 我目前正在使用 MVC 3 开发一个微型网站我想将其上传到同一网站但在不同的目录下这可能吗或者我需要创建一个新网站吗是的这是可
如何使用运动布局缩放父视图内的textView？

我正在尝试缩放容器视图内的 textView Activity 使用运动布局如果我不将 textView 放置在容器内我可以缩放它这是我的活动布局和运动布局描述文件如何使scaleX和scaleY工作活动布局
前置摄像头填充圆形 UIView

在我正在开发的应用程序中用户需要进行自拍是的我知道但该应用程序仅供私人使用我已经让相机在圆形 UIView 区域中显示一切正常工作但是我无法让它正确缩放并填充圆圈这是它现在正在做的事情这就是我想要它做的事情这是我的 UI
如何使用 Visual Studio Code 引用程序集？

我想在我在 OSX 上使用 Visual Studio Code 编写的控制台应用程序中引用 System Drawing dll 即我想使用这些 using 语句 using System Drawing using System Dra
视频缩略图阵列采用者滚动速度缓慢

我创建了一个采用者来显示特定文件夹中视频的图像缩略图但当我滚动时它有点滞后但这是为什么呢下面是代码主要活动类别 public class TestvideolistingActivity extends ListActivity
Gulp – 如何在终端中打开新选项卡？

我对 OSX 的终端知之甚少但我想通过 gulp 自动打开终端中的选项卡然后使用 gulp shell 之类的东西在其中运行 gulp 命令例如我想要一个 gulp 任务在终端选项卡上启动 mongoDB 并在另一个选项卡中启动我的
将毫秒 UTC 转换为人类可读的 Date_Time

我正在努力弄清楚如何使用 boost date time 执行转换我想将从 Unix 纪元 1970 年 1 月 1 日 00 00 测量的毫秒值转换为人类可读的字符串类似于 2 13 2012 15 20 11将是理想的我已经尝试过
Powershell：Register-ObjectEvent 可以监视剪贴板事件吗？

在 Windows 10 和 11 上我已成功使用 Register ObjectEvent 来监视文件系统事件它也可以用来监视剪贴板事件吗也就是说 Register ObjectEvent是如何用来hook Clipboard Co
使用 Gulp.js 和通配模式就地修改文件（相同目标）

我有一个 gulp 任务尝试将 scss 文件转换为 css 文件使用 gulp ruby sass 然后将生成的 css 文件放入与原始文件相同的位置问题是由于我使用的是通配模式因此我不一定知道原始文件的存储位置在下面的代码中
对 dataGridView 列逐行进行数学运算，然后在文本框中显示最终值

我一直在思考进行 datagridview 数学运算的最佳方法是什么我有这个 datagridview 我需要逐行将列 castka 与 po et 相乘然后下一行然后下一行直到最后然后在文本框中显示最终值因为我是初学者c
库 itertools 与 python 代码的性能比较

作为我问题的答案查找两个列表相同的从 1 开始的位置我得到了使用 C 库 itertools 来加快速度的提示为了验证我使用 cProfile 编写了以下测试 from itertools import takewhile izip de

库 itertools 与 python 代码的性能比较

库 itertools 与 python 代码的性能比较 的相关文章

随机推荐

热门标签

库 itertools 与 python 代码的性能比较的相关文章