Python - “in”语句搜索对象列表的速度很慢

2024-04-13

我希望有人能解释为什么搜索对象引用列表比搜索普通列表慢得多。这是使用 python“in”关键字进行搜索，我认为它以“C 编译器”速度运行。我认为列表只是对象引用（指针）的数组，因此搜索应该非常快。两个列表在内存中的大小正好是 412236 字节。

普通列表（搜索需要 0.000 秒）：

alist = ['a' for x in range(100000)]
if 'b' in alist:
    print("Found")

对象引用列表（搜索需要 0.469 !! 秒）：

class Spam:
    pass
spamlist = [Spam() for x in range(100000)]
if Spam() in spamlist:
    print("Found")

Edit: So apparently this has something to do with old-style classes having way more overhead than new style classes. My script that was bogging down with only 400 objects can now easily handle up to 10000 objects simply by making all my classes inherit from the "object" class. Just when I thought I knew Python!.

I've read about new-style vs old-style before but it was never mentioned that old-style classes can be up to 100x slower than new style ones. What is the best way to search a list of object instances for a particular instance?
1. Keep using the "in" statement but make sure all classes are new style.
2. Perform some other type of search using the "is" statement like:

[obj for obj in spamlist if obj is target]

3.还有其他更Pythonic的方式吗？

这主要是由于不同的特殊方法查找机制旧式课程.

>>> timeit.timeit("Spam() in l", """
... # Old-style
... class Spam: pass
... l = [Spam() for i in xrange(100000)]""", number=10)
3.0454677856675403
>>> timeit.timeit("Spam() in l", """
... # New-style
... class Spam(object): pass
... l = [Spam() for i in xrange(100000)]""", number=10)
0.05137817007346257
>>> timeit.timeit("'a' in l", 'l = ["b" for i in xrange(100000)]', number=10)
0.03013876870841159

如您所见，该版本Spam继承自object运行速度要快得多，几乎与字符串的情况一样快。

The in列表使用的运算符==比较项目是否相等。==被定义为尝试对象'__eq__方法，他们的__cmp__方法和指针比较，按此顺序。

对于旧式类，这是以一种简单但缓慢的方式实现的。 Python 必须真正寻找__eq__ and __cmp__每个实例的字典以及每个实例的类和超类的字典中的方法。__coerce__作为三向比较过程的一部分，也会被查找。当这些方法实际上都不存在时，就需要进行 12 次字典查找才能进行指针比较。除了字典查找之外，还有很多其他开销，我实际上不确定该过程的哪些方面是最耗时的，但足以说该过程比它可能的更昂贵。

对于内置类型和新样式类，情况会更好。首先，Python 不会在实例的字典上查找特殊方法。这可以节省一些字典查找并启用下一部分。其次，类型对象具有与 Python 级特殊方法相对应的 C 级函数指针。当一个特殊方法在C中实现或者不存在时，相应的函数指针允许Python完全跳过方法查找过程。这意味着在新型情况下，Python 可以快速检测到它应该直接跳到指针比较。

至于你应该做什么，我建议使用in和新式课程。如果您发现此操作正在成为瓶颈，但您需要旧式类来实现向后兼容性，any(x is y for y in l)运行速度大约比x in l:

>>> timeit.timeit('x in l', '''
... class Foo: pass
... x = Foo(); l = [Foo()] * 100000''', number=10)
2.8618816054721936
>>> timeit.timeit('any(x is y for y in l)', '''
... class Foo: pass
... x = Foo(); l = [Foo()] * 100000''', number=10)
0.12331640524583776

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python - “in”语句搜索对象列表的速度很慢的相关文章

缺少 python 配置

我正在安装一个程序需要安装 python config 唯一的问题是我目前没有 python config 而且我似乎不知道如何获取它经过搜索后我应该可以通过以下方式安装它 yum install python devel 然而这样
是否可以将名为“None”的值添加到枚举类型？

我可以将名为 None 的值添加到枚举中吗例如 from enum import Enum class Color Enum None 0 represent no color at all red 1 green 2 blue 3 co
在 django 中构建动态表单

我正在尝试根据存储在数据库中的字段及其定义动态构建一个表单在我的数据库中我定义了 1 个带有一些标签的复选框和 1 个带有一些标签的文本字段如何根据数据库中的数据在我的视图中动态构建表单 Thanks 以下是我在 EuroDjango
可视化时间序列时标记特定日期

我有一个包含几年数据的时间序列例如 ts pd Series np random randn 1000 index pd date range 1 1 2000 periods 1000 ts ts cumsum ts plot 我还有两
Python：如何删除圆括号内的文本？

我试过了但没用 return re sub myResultStats text 建议 thanks 尝试这个 return re sub myResultStats text 括号表示捕获组因此您必须转义它们
从 SQL Server 中调用 Python 文件

我的文件名中有 Python 脚本 C Python HL py 在此 Python 脚本中有预测模型以及对 SQL 数据库中某些表的更新我想将此文件称为 SQL 作业我怎样才能做到这一点这个问题不一样如何在 SQL Server
使用 Pandas 滚动差异

您好我正在尝试使用 Pandas 滚动函数来计算下表中的滚动差异我正在尝试生成每月可用项目列中的值但没有得到任何结果请帮忙 Item Adds Subtracts Month Monthly Available items A
将图像转换为二进制流

我的应用程序有两个方面一方面我使用 C 来使用 Pleora 的 EBUS SDK 从相机读取帧当第一次接收到该流时在将缓冲区转换为图像之前我能够一次读取 16 位流以便对每个像素执行一些计算即每个像素都存在一个 16 位数据块
如何将 Jinja 与 Twisted 一起使用？

我正在计划使用 Python 与 Twisted Storm 和 Jinja 一起开发一个讨论软件问题是 Jinja 不是为 Twisted 或异步套接字库而设计的并且使用 Twisted 提供的性能是我不打算使用 Flask 的原因
为 Keras 编写自定义数据生成器

我将每个数据点存储在 npy 文件中其中shape 1024 7 8 我想通过类似的方式将它们加载到 Keras 模型中ImageDataGenerator 所以我编写并尝试了不同的自定义生成器但它们都不起作用这是我改编的一个this
Python 对象属性 - 访问方法

假设我有一个具有某些属性的类在 Pythonic OOP 中如何访问这些属性是最好的就像obj attr 或者也许编写 get 访问器此类事物可接受的命名风格是什么 Edit 您能否详细说明使用单下划线或双前导下划线命名属性的最佳实
使用 Beautifulsoup 解析时保持 XML 文件的缩进

我正在使用 BS4 解析 XML 文件并尝试将其写回新的 XML 文件输入文件
将 Matlab MEX 文件中的函数直接嵌入到 Python 中

我正在使用专有的 Matlab MEX 文件在 Matlab 中导入一些仿真结果当然没有可用的源代码 Matlab 的接口实际上非常简单因为只有一个函数返回一个 Matlab 结构体我想知道是否有任何方法可以直接从Python调用M
调试 python Web 服务

我正在使用找到的说明here http www diveintopython net http web services user agent html 尝试检查发送到我的网络服务器的 HTTP 命令但是我没有看到按照教程中的建议在控制
NumPy 数组不可 JSON 序列化

创建 NumPy 数组并将其保存为 Django 上下文变量后加载网页时收到以下错误 array 0 239 479 717 952 1192 1432 1667 dtype int64 is not JSON serializable
Windows 10 上的 Tensorflow 安装问题

我正在尝试在 Win 10 计算机上安装 Tensorflow 我成功安装了Python 3 7 然后尝试按照tensorflow org上的安装说明进行操作执行时 pip install tensorflow 我收到以下错误消息错误
如何在特定时间启动Tornado周期性回调？

目前在我的 Tornado 应用程序中我正在使用定期调用回调PeriodicCallback每隔一小时像这样 import tornado ioloop from tornado ioloop import PeriodicCallba
应用程序的外观 - Py2exe / wxPython

所以我的问题是我的应用程序的外观和感觉因为它看起来像一个旧的外观应用程序它是一个 wxPython 应用程序在 python 上它运行良好并且看起来不错但是当我使用 py2exe 将其转换为 exe 时外观很糟糕现在我知道如果你
如何访问模板缓存？ - 姜戈

I am 缓存 HTML在几个模板内例如 cache 900 stats stats endcache 我可以使用以下方式访问缓存吗低级图书馆例如 html cache get stats 我确实需要对模板缓存进行一些细粒度的控制有任
用于获取有关 SVN 存储库信息的 Python 库？

我正在寻找一个可以从 SVN 存储库中提取至少以下信息的库 not工作副本修订号及其作者和提交消息每个修订版中的更改添加删除修改文件有Python库可以做到这一点吗对于作者和提交消息我可以解析 db revprops 0

随机推荐

pthread_cond_broadcast 被 dlsym 破坏了？

我正在尝试使用 LD PRELOAD 机制插入对 pthread cond broadcast 的调用我插入的 pthread cond broadcast 函数只是调用原始的 pthread cond broadcast 然而对于一个
触摸并拖动 UIButton，但松开手指时不触发它

我试图允许一些UIButton我的一个视图上的实例被触摸并在屏幕上拖动最终带有动力但那是稍后的事我以非常简单的形式工作如下所示但问题是通过触摸按钮开始拖动它它会附着到手指上并且通过抬起手指会触发 Touch Up Insid
如何防止在 C# 代码中包装 WPF FlowDocument？

研究表明 http social msdn microsoft com Forums en US wpf thread 05e02dc6 c8e5 42e8 b755 505e66155c3c 这是防止在段落中换行的方法
swscaler@0dd9e620：已弃用的像素格式，请确保您正确设置了范围”

我正在使用 FFMpeg 解码 RTSP 视频流在显示时间调用cv imshow 我得到以下异常 swscaler 0d55e5c0 已弃用像素格式请确保您这样做了正确设置范围我正在将像素格式从 AV PIX FMT YUVJ42
无法将 Firebase 导入 Swift Playground

希望你一切顺利在过去的几个痛苦的小时里我一直在尝试找到一种方法将 Firebase 模块导入我的工作区中的 Swift Playground Foo工作区在随后将 Firebase 导入我的 Playground 之前我已尝试以下操
将 Video.js 插件重置为初始状态

我正在使用 jquery ui 选项卡和video js http www videojs com 我想在转到另一个选项卡时停止视频并在返回第二个选项卡时重置视频从 VideoJS v4 6 开始您可以执行以下操作来重置播放器 pla
如何在 Groovy Range 对象中执行此操作？

我想要从 0 1 到 2 的数字例如 0 1 0 2 0 3 0 4 等等到 2 0 因为我是一个很酷的人我决定Range将完成这项工作并附带如下代码 def a 0 1 2 println a 但它仅限于印刷 0 1 1 1 作为它
OpenMP 为内联函数声明 SIMD

The 当前的 OpenMP 标准 http www openmp org mp documents openmp 4 5 pdf subsection 2 8 2说关于declare simdC C 指令在函数上使用声明 simd 构造
仅当字段包含 null 或 0 时才更新 MYSQL 字段

我想将数据插入到表中然后如果表已经具有相同的 rName 输入值则更新此行因为 rName 是唯一索引这一切都做得很好但在更新时我希望它仅在字段中尚未包含某些内容 NULL 时才更新字段 INSERT INTO table rD
通过代码向 UITabBar 添加 UITabBar 和 tabbaritems （注意：我不想实现 TabBarController ）

我已经搜索了很多相信我我遇到了很多问题和示例代码但没有一个符合我的要求这太疯狂了怎么可能没有答案我的具体要求是 1 我想要一个 UITabBar 而不是 UITabBarController 2 我希望它位于 UIView 的右
为什么要在 Java 中使用嵌套的 InvokeLater 调用？

我正在重构一些运行多阶段流程的代码每个步骤都在嵌套的内部java awt EventQueue invokeLAter 称呼它看起来有点像这样 import java awt EventQueue public class Nested
如何使 SoapUI json 请求与德语元音变音一起使用？

我们的团队项目中的许多界面都使用 SoapUI 我们遇到了德语特殊符号称为元音变音的问题当发送带有 Json 正文和德语变音符号的 POST 请求时我们得到com fasterxml jackson databind JsonMap
将 Java 日期对象映射到 XML 模式日期时间格式

我在将 Java 数据类型映射到标准架构日期数据类型时遇到一些问题我有一个简单的类我是这样注释的 period 实例变量是 Java Date 对象类型 XmlAccessorType value XmlAccessType NONE
Scala 模式匹配推断“Any”而不是存在类型，会破坏类型安全吗？

我遇到了一个令人费解的案例类类型推理问题这是一个最小的例子 trait T X case class Thing A B X a A f A gt B extends T X def hmm X t T X t match case Th
如何在 vb.net 中引用项目中包含的文件

当您将图像包含在项目中时图像会复制到哪个目录中如果将其复制到输出目录则可以使用Path Combine Shared ReadOnly AppDirectory As String Path GetDirectoryName New
nginx；仅使用 try_files 如果文件存在则返回响应代码

Since IfIsEvil http wiki nginx org IfIsEvil我一直在尝试使用指令设置配置try files只是为了让维护页面与响应代码 503 一起显示对于任何 URI 无一例外即包括 php 页面如果存在维
将 HTML 附加到容器元素而不使用 innerHTML

我需要一种在不使用innerHTML 的情况下将HTML 附加到容器元素的方法我不想使用innerHTML的原因是因为当它像这样使用时 element innerHTML htmldata 它的工作原理是先替换所有 html 然后再添加旧
如何制作不完全圆的圆？

我想做如下图所示的圆角但我在制作内圆的时候遇到了麻烦我尝试过border top style border right style但还没有得到相同的结果 circle border radius 50 width 100px heigh
Flask 的 jsonify() 中缩小的 JSON

Flask 提供了方便的jsonify 函数它从 Python 变量返回 JSON 对象 from flask import Flask jsonify app Flask name app route def json hello re
Python - “in”语句搜索对象列表的速度很慢

我希望有人能解释为什么搜索对象引用列表比搜索普通列表慢得多这是使用 python in 关键字进行搜索我认为它以 C 编译器速度运行我认为列表只是对象引用指针的数组因此搜索应该非常快两个列表在内存中的大小正好是 412236

Python - “in”语句搜索对象列表的速度很慢

Python - “in”语句搜索对象列表的速度很慢 的相关文章

随机推荐

热门标签

Python - “in”语句搜索对象列表的速度很慢的相关文章