为什么将列表作为参数传递比传递生成器性能更好？

2024-02-24

我正在回答这个问题 https://stackoverflow.com/questions/59925390/how-to-count-different-elements-in-list-of-lists/59925564?noredirect=1#comment106101518_59925564，当我测试解决方案的时间时，我发现了与我认为正确的矛盾。

提出问题的人想要找到一种方法来知道另一个列表中包含多少个不同的列表。（欲了解更多信息，您可以检查问题 https://stackoverflow.com/questions/59925390/how-to-count-different-elements-in-list-of-lists/59925564?noredirect=1#comment106101518_59925564)

我的回答基本上是这个功能：

def how_many_different_lists(lists):
    s = set(str(list_) for list_ in lists)
    return len(s)

现在，当我测量运行时间并将其与基本相同的函数进行比较时，情况出现了，但将列表而不是生成器作为参数传递给 set()：

def the_other_function(lists):
    s = set([str(list_) for list_ in lists])
    return len(s)

这是我用于测试功能的装饰器：

import time

def timer(func):
    def func_decorated(*args):
        start_time = time.clock()
        result = func(*args)   
        print(time.clock() - start_time, "seconds")
        return result
    return func_decorated

这是给定输入的结果：

>>> list1 = [[1,2,3],[1,2,3],[1,2,2],[1,2,2]]
>>> how_many_different_lists(list1)
6.916326725558974e-05 seconds
2
>>> the_other_function(list1)
3.882067261429256e-05 seconds
2

即使对于更大的列表：

# (52 elements)
>>> list2= [[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2],[1,2,3],[1,2,3],[1,2,2],[1,2,2]]
>>> how_many_different_lists(list2)
0.00023560132331112982 seconds
2
>>> the_other_function(list2)
0.00021329059177332965 seconds
2

现在，我的问题是：为什么第二个例子比第一个例子更快？由于“按需”生产元素，发电机难道不应该更快吗？我曾经认为制作一个列表并迭代它会比较慢。

PS：我已经测试了很多次，得到的结果基本相同。

我一直在对你的功能进行基准测试：

from simple_benchmark import BenchmarkBuilder
from random import choice

b = BenchmarkBuilder()
from operator import setitem


@b.add_function()
def how_many_different_lists(lists):
    s = set(str(list_) for list_ in lists)
    return len(s)


@b.add_function()
def the_other_function(lists):
    s = set([str(list_) for list_ in lists])
    return len(s)


@b.add_arguments('Number of lists in the list')
def argument_provider():
    for exp in range(2, 18):
        size = 2**exp

        yield size,  [list(range(choice(range(100)))) for _ in range(size)]


r = b.run()
r.plot()

生成器是惰性的，因为生成器表达式将动态创建项目，而列表理解将在内存中创建整个列表。你可以在这里阅读更多：生成器表达式与列表理解 https://stackoverflow.com/questions/47789/generator-expressions-vs-list-comprehension

正如您从基准测试中看到的那样，它们之间没有那么大的差异。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么将列表作为参数传递比传递生成器性能更好？的相关文章

如何让服务器监听多个端口

我想用同一台服务器监听 100 个不同的 TCP 端口这是我目前正在做的事情 import socket import select def main server socket socket socket socket AF INET
查找其他列表项中列表项的列表索引

我有一个长字符串列表我想获取与另一个列表中的字符串子字符串匹配的列表元素的索引使用列表理解可以轻松检查列表项是否包含列表中的单个字符串例如这个问题 https stackoverflow com questions 4843158 c
Boto3 - 打印 AWS 实例平均 CPU 利用率

我正在尝试仅打印 AWS 实例的平均 CPU 利用率此代码将打印出响应但最后的 for 循环不会打印平均利用率有人可以帮忙吗先感谢您 import boto3 import sys from datetime import dat
实现一个java UDF并从pyspark调用它

我需要创建一个在 pyspark python 中使用的 UDF 它使用 java 对象进行内部计算如果它是一个简单的 python 我会做类似的事情 def f x return 7 fudf pyspark sql functions
Python 中的类位于不同的文件中吗？

与 Java 或 php 非常相似我习惯将类与文件分开 Python 中也是同样的情况吗另外我应该如何命名该文件像classname py一样小写还是像ClassName py一样如果我想从此类创建一个对象我是否需要做一些特殊的
Spark MLLib 存在问题，导致概率和预测对于所有内容都相同

我正在学习如何将机器学习与 Spark MLLib 结合使用目的是对推文进行情感分析我从这里得到了一个情感分析数据集 http thinknook com wp content uploads 2012 09 Sentiment Ana
将字符串作为有序字典导入

我有一个没有扩展名的文件其中包含这样的行忽略行之间的间距但每一行都是单独的行 OrderedDict key1 u value1 key2 value2 OrderedDict key1 u value1 key2 value2 Or
python中根据变量类型处理数据子集

我将以下数据存储在 csv df sample csv 中我将列名放在名为 cols list 的列表中 df 数据样本 df data sample pd DataFrame new video BASE SHIVER PREFER
当按下 flutter 中编写的按钮时，有没有办法运行 python 脚本？

本质上我想做的是按下我在 Flutter 中编程的按钮当按下该按钮时 Python 脚本应该开始在我的 Android 设备上运行我想在 python 中使用 youtube dl 用于下载 Youtube 视频库但我想知道是否
如何在 Python 中将列表变量传递给 subprocess.call 命令

我有一个清单 apps apps append wq35a5huqlja45jsyukrpmwuiayovrmh apps append q7mimvgduueernwvw4y22t5huemykntw apps append pmudbp
pytube 在 Android 中传输视频所需的时间太长

我在用pytube在 Android 中流式传输视频借助chaquopy 视频文件 py from pytube import YouTube def video link yt YouTube f https www youtube c
带有多表查询的 SQL Join 版本的 Djangoviews.py

需要一些有关 Django 版本的 SQL 多表查询的帮助该查询使用 3 个表来检索餐厅名称地址Restaurants table和美食类型来自Cuisinetypes table 所有这些都基于通过 URL 传递的菜品名称菜品 ID
如何使用 Pandas 在现有 Excel 文件中保存新工作表？

我想使用excel文件来存储用python详细说明的数据我的问题是我无法将工作表添加到现有的 Excel 文件中在这里我建议使用示例代码来解决此问题 import pandas as pd import numpy as np pat
错误：线条魔术函数

我正在尝试使用 python 读取文件但不断收到此错误 ERROR Line magic function user vars not found 我的代码非常基本 names read csv Combined data csv nam
Python：计算非整数的阶乘

我想知道是否有一种快速的 Pythonic 的方法来计算非整数的阶乘例如 3 4 当然内置的factorial 函数在Math模块可用但它仅适用于积分我不关心这里的负数你想用math gamma x http docs pytho
如何在 nltk 中使用 hunpos 标记文本文件？

有人可以帮我解决在 nltk 中标记语料库的 hunpos 语法吗我要导入什么hunpos HunPosTagger module http nltk googlecode com svn trunk doc api nltk tag h
连接字符串：两个字符串列表的“乘法”[重复]

这个问题在这里已经有答案了对于字符串列表将乘法运算定义为连接 l1 aa bb cc l2 11 22 l3 l1 op l2 预期输出 l3 aa11 aa22 bb11 bb22 cc11 cc22 我们可以简单地使用 for l
App Engine、PIL 和叠加文本

我正在尝试在 GAE 上的图像上覆盖一些文本现在他们公开了 PIL 库这应该不是问题这就是我所拥有的它有效但我不禁认为我应该直接写入背景图像而不是创建单独的覆盖图像然后合并我可以用吗Image frombuffer http
为什么这个多处理代码会失败？ [复制]

这个问题在这里已经有答案了 def sample pass Process target sample start Process target sample start 上面的代码失败并出现错误已尝试在当前进程之前启动新进程进程已完成
Python TDD 目录结构

Python 中是否有用于 TDD 的特定目录结构教程讨论测试的内容但不讨论测试的位置通过研究 Python Koans 怀疑它是这样的 project main program py This has main method sta

随机推荐

Cocoa 应用程序如何将自身添加为全局登录项？

I tried LSSharedFileListRef globalLoginItems LSSharedFileListCreate NULL kLSSharedFileListGlobalLoginItems NULL if globa
在 HTML5 中，
和
标记可以出现在标记之外吗？

我目前以这种方式使用上述标签经典标签顺序
Pysolr：尝试查询时我不断收到 json.decoder 错误

import pysolr solr pysolr Solr http replaced url abc 8983 solr tran timings shard1 replica2 query timeout 10 results sol
Java GregorianCalendar 和 Calendar 错位了 2010 年 8 月和 9 月的周末、一个月中的日期

我正在尝试使用日历或公历来迭代并创建日期网格然而他们俩似乎都认为2010年8月有30天 9月2日和3日是周末就好像日历的年份错误但我已经对该参数进行了三次检查以下是一些摘录 startDate set 2010 8 28 Sche
为什么 IE7 无法识别锚标记上的 css 填充样式？

我的网站在 Firefox Safari Chrome 和 Opera 中运行良好但由于某种原因 IE7 无法识别任何锚标记上的 CSS 填充我无法弄清楚这一点在 IE7 中如果您查看主页上显示独家热门最近评论的选项卡htt
如何使用谷歌脚本检测两个单独行中的重复值？

我正在尝试使用 Google 脚本和 Google 电子表格检测 B 列中的值是否已在 A 列中提及这些列位于 2 个单独的工作表中由于某种原因我没有足够的经验来让它工作提前谢谢获取北欧 function insert e she
使用不同的指针类型作为参数来转换函数指针

我认为以下代码描述了我想要做的事情具体来说我希望将函数指针转换为通用函数类型签名的唯一区别是指针类型不同现在我知道函数指针需要兼容的正如所讨论的这个问题 https stackoverflow com questions 5595
python 3 字符串格式化（对齐）

我有一个代码其输出应如下所示 hello 3454 nice 222 bye 45433 well 3424 对齐和正确的理由给我带来了问题我在字符串 0 gt 7 中尝试了此操作但只有具有特定位数的数字才可以其他有一些数字的数字或
Android 中带手势（滑动功能）的 VideoView

我想合并默认值视频查看 and 手势监听器如果用户向左滑动则歌曲向后播放或向右滑动则歌曲向前播放我想在 VideoView 上实现类似的方法通过以下代码打开默认媒体播放器 Intent intent new Intent androi
pycosat中慢速dnf到cnf

问题简述有一个适当的输入pycosat https pypi org project pycosat 有没有办法加速从dnf到cnf的计算或者完全绕过它详细问题我一直在看这个视频 https www youtube com watc
ARC 相当于自动释放？

如果我有这个代码 MyCustomClass myCustomClass return MyCustomClass alloc init autorelease 这段代码保证返回的对象是自动释放的在 ARC 中相当于什么 ARC 中没有类
HTTP PUT 的查询参数的 Curl 命令行编码

我有多个查询参数想要使用curl 在 HTTP PUT 操作中发送如何对查询参数进行编码例子 curl X PUT http example com resource 1 param1 value 201 param2 value2 如
如何使用 Express 和 connect-timeout 自定义超时响应？

我想自定义在触发超时错误时发送给用户的响应更具体地说我想将它们重定向到静态页面解释为什么会引发超时错误我想写一些类似的东西 var express require express var timeout require connec
Laravel 无法验证用户身份

userdata array email gt Input get email password gt Input get password if Auth attempt userdata echo SUCCESS else return
格式化没有这样的文件或目录

我试图使用 C 格式实用程序 std format 我尝试编译这个简单的程序 include
Cassandra 中分区键、复合键和集群键之间的区别？

我一直在网上阅读文章以了解以下内容之间的差异key类型但这对我来说似乎很难理解例子肯定有助于更好地理解 primary key partition key composite key clustering key 对此有很多困惑我会尽
使用 jQuery，如何选择元素 id 以某个字符串结尾的所有元素？

使用jQuery 如何选择其中的所有元素id属性以某个字符串结尾有一个属性结尾为选择器 attr value http api jquery com attribute ends with selector 像这样 id somethin
当重叠很少时找到重叠间隔

我有一个巨大的数据库表n整数区间例如 1 5 4 16 6434 114343 并且需要找出哪些间隔相互重叠有丰富的SO的类似问题 https stackoverflow com questions 4542892 possible i
为什么单字母 UDF 名称不能使用 C 或 R？

我可以编写以下有效的 VBA 函数 Public Function C As Long C 5 End Function Public Function R As Long R 6 End Function 但如果不使用 VBA 项目或模块
为什么将列表作为参数传递比传递生成器性能更好？

我正在回答这个问题 https stackoverflow com questions 59925390 how to count different elements in list of lists 59925564 noredirec

为什么将列表作为参数传递比传递生成器性能更好？

为什么将列表作为参数传递比传递生成器性能更好？ 的相关文章

随机推荐

热门标签

为什么将列表作为参数传递比传递生成器性能更好？的相关文章