Python 元组作为键慢吗？

2024-04-26

我正在尝试实现字典中排序元组的快速查找；回答“元组 (3,8) 是否有关联值，如果有，它是什么？”的问题。令元组中的整数从下方以 0 为界，从上方以 max_int 为界。

我继续使用 Python 的 dict，但发现速度相当慢。解决此问题的另一种方法是创建一个具有 max_int （大部分为空）字典的列表 T，并为每个元组 (3,8) 输入 T[3][8] = value。我认为这正是 Python 对字典采用的存储桶哈希方法，但后者的速度大约快 30 倍（！）。

不过，它也很丑陋（特别是因为我现在即将实现 3 元组），所以我非常感谢这里的一些提示。

作为参考，这是我用来获取计时的代码：

import numpy as np
import time

# create a bunch of sorted tuples
num_tuples = 10
max_int = 100
a = np.random.rand(num_tuples,2) * max_int
a = a.astype(int)
for k in xrange(len(a)):
    a[k] = np.sort(a[k])

# create dictionary with tuples as keys
d = {}
for t in a:
    d[tuple(t)] = 42

print d

# do some lookups
m = 100000
start_time = time.time()
for k in xrange(m):
    (3,8) in d.keys()
elapsed = time.time() - start_time
print elapsed

# now create the bucket-list structure mentioned above
t = [{} for k in xrange(max_int)]
for k in xrange(len(a)):
    t[a[k][0]][a[k][1]] = 42

print t

# do some lookups
m = 10000
start_time = time.time()
for k in xrange(m):
    8 in t[3].keys()
elapsed = time.time() - start_time
print elapsed

以下是 Python 2.7 的精确计时结果：

>>> %timeit (3, 8) in d.keys()  # Slow, indeed
100000 loops, best of 3: 9.58 us per loop

>>> %timeit 8 in t[3].keys()  # Faster
1000000 loops, best of 3: 246 ns per loop

>>> %timeit (3, 8) in d  # Even faster!
10000000 loops, best of 3: 117 ns per loop

>>> %timeit 8 in t[3]  # Slightly slower
10000000 loops, best of 3: 127 ns per loop

他们表明，标准(3, 8) in d (no .keys()列表构建）实际上比（不太通用）快一点8 in t[3]方法，以及快两倍由于相对较快8 in t[3].keys()的问题。这.keys/no .keys差异来自于这样一个事实：(3, 8) in d.keys()构建一个键列表（在 Python 2 中），然后查找(3, 8)在这个列表中，这比查找要慢得多(3, 8)在字典的哈希表中d.

正如评论中所述，计时结果与 Python 3 不同：Python 3keys()有一个快速in测试因为keys()相反，返回键的视图，以便in运算符可以使用对应字典的哈希表。

原始问题中的速度差异来自于以下事实：d.keys()与相比，建立了一个相对较长的列表t[3].keys().

PS: the %timeit功能由优秀的提供IPython http://ipython.org/壳。原始程序可以通过 IPython 执行%run prog.py.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 元组作为键慢吗？的相关文章

OpenCV 错误：使用 COLOR_BGR2GRAY 函数时断言失败

我在使用 opencv 时遇到了一个奇怪的问题我在 jupyter 笔记本中工作时没有任何问题但在尝试运行此 Sublime 时却出现问题错误是 OpenCV错误 cvtColor中断言失败深度 CV 8U 深度 CV 16U 深度
无法将 datetime.datetime 与 datetime.date 进行比较

我有以下代码并收到上述错误由于我是 python 新手我无法理解这里的语法以及如何修复错误 if not start or date lt start start date 有一个datetime date 从日期时间转换为日期的方法
将 Django 表单中的所有 CharField 表单字段输入转换为小写

我使用 Django 表单进行用户注册用户可以在其中输入优惠券代码我希望在优惠券代码字段中输入的所有字符都转换为小写我尝试过在保存方法自定义清理方法和自定义验证器中使用 lower 但这些方法没有运气下面是我的代码 class S
multiprocessing.freeze_support()

为什么多处理模块需要调用特定的function http docs python org dev library multiprocessing html multiprocessing freeze support在被冻结以生成 Wi
基于 True/False 值的 Python 优雅赋值

我想根据三个布尔值中的值设置一个变量最直接的方法是 if 语句后跟一系列 elif if a and b and c name first elif a and b and not c name second elif a and not
使用 Python 抓取维基百科数据

我正在尝试从以下内容中检索 3 列 NFL 球队球员姓名大学球队维基百科页面 http en wikipedia org wiki 2008 NFL draft 我是 python 新手一直在尝试使用 beautifulsoup 来
一起使用 Argparse 和 Json

我是 Python 初学者我想知道 Argparse 和 JSON 是否可以一起使用说我有变量p q r 我可以将它们添加到 argparse 中 parser add argument p param1 help x variabl
我有一个 Employee 类，我想返回“姓名”列表

我有一个 Employee 类我想返回姓名列表雇员 py class Employee object def init self id name members None self id id self name name self
Python 相当于 Bit Twiddling Hacks 中的 C 代码？

我有一个位计数方法我正在尝试尽可能快地实现我想尝试下面的算法位摆弄黑客 http graphics stanford edu seander bithacks html CountBitsSetParallel 但我不知道 C 什么是
如何将同步函数包装在异步协程中？

我在用着aiohttp https github com aio libs aiohttp构建一个 API 服务器将 TCP 请求发送到单独的服务器发送 TCP 请求的模块是同步的对于我来说是一个黑匣子所以我的问题是这些请求阻塞了整
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
Pandas，按最大返回值进行分组 AssertionError：

熊猫有问题我想听听你的意见我有这个数据框我需要在其中获取最大值代码就在下面 df stack pd DataFrame 1 0 2016 0 NonResidential Hotel 98101 0 DOWNTOWN 47 6122
将具有不同大小的行的数据加载到 Numpy 数组中

假设我有一个包含如下数据的文本文件 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 如何将它加载到 numpy 数组中使其看起来像这样 1 2 3 4 5 0 6 7 8 0 0 0 9 1
Docker 日志中的 Python 异常标记为流：stdout

我想解析和处理来自 docker 容器的所有错误但当我期望 stderr 时 Python 异常标记为 stdout 举个简单的例子app py raise Exception 然后我在 docker 容器中运行这个文件但在 var l
在 Python 中，如何获取特定文件中定义的类列表？

如果一个文件myfile py包含 class A object Some implementation class B object Some implementation 我如何定义一个方法以便在给定的情况下myfile py 它返回
PermanentTaskFailure：“模块”对象没有属性“迁移”

我在 google appengine 上使用 Nick Johnson 的批量更新库 http blog notdot net 2010 03 Announcing a robust datastore bulk update utili
使用 pandas 绘制带有误差线的条形图

我正在尝试从 DataFrame 生成条形图如下所示 Pre Post Measure1 0 4 1 9 这些值是我从其他地方计算出来的中值我还有它们的方差和标准差以及标准误差我想将结果绘制为具有适当误差线的条形图但指定多个误差值
python csv按列转换为字典

是否可以将 csv 文件中的数据读取到字典中使得列的第一行是键同一列的其余行构成列表的值例如我有一个 csv 文件 strings numbers colors string1 1 blue string2 2 red string
Windows 与 Linux 文本文件读取

问题是我最近从 Windows 切换到 Ubuntu 我的一些用于分析数据文件的 python 脚本给了我错误我不确定如何正确解决我当前仪器的数据文件输出如下 Header 有关仪器等的各种信息 Data 状态代码温度字段等 0
Python 中的迭代器 (iter()) 函数。 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案对于字典我可以使用iter 用于迭代字典的键 y x 10 y 20 for val in iter y print val 当

随机推荐

从节点子进程检索值

var fp ffprobe fileName show streams grep var width exec fp width function err stdout stderr return stdout alert stdout
NgbDropdown autoClose“外部”不起作用

我正在使用 Angular4 和 ng bootstrap 我想在下拉菜单外部单击时关闭下拉菜单文档的其余部分查看文档后我发现autoClose 类型 boolean 外面里面但是当我尝试将其设置为参数 config autoClo
是否可以在浏览器中使用 javascript 对用户系统进行基准测试

随着 Html5 开始普及我们看到更多关于视频或画布元素等的实验当使用画布进行实验时例如用粒子制作烟花 1000 个粒子可能在现代机器上运行良好但在 3 年机器上可能会运行得很慢无论如何是否可以对用户系统进行基准测试以动态更改画
当摘要具有嵌入文本输入并且用户按空格键时，如何防止 html 详细信息元素切换

我在处于打开状态的详细信息元素的摘要标签内有一个文本输入目的是捕获用户输入该输入最终将显示为详细信息元素见下文但是当用户在输入文本时按空格键时详细信息元素会切换我想阻止这种情况我预计这可以在按键事件中使用 stopPropa
xgboost中的eval_metric和feval有什么区别？

有什么区别feval and eval metric在xgb train中这两个参数仅用于评估目的 Kaggle 的帖子提供了一些见解 https www kaggle com c prudential life insurance as
Java、类路径、类加载 => 同一 jar/项目的多个版本

我知道对于经验丰富的程序员来说这可能是一个愚蠢的问题但我有一个库一个 http 客户端我的项目中使用的一些其他框架 jar 需要它但它们都需要不同的主要版本例如 httpclient v1 jar gt Required by c
迭代器后继者

我想用另一个迭代器同类的后继者初始化一个迭代器任意类型以下代码适用于随机访问迭代器但不适用于前向或双向迭代器 Iterator i j 1 一个简单的解决方法是 Iterator i j i 但这不起作用初始化语句for 循环的
如何通过分页从附加页面中提取数据

我成功返回了第一页数据并获得了 API 调用中存在的附加数据页数这是我尝试提取附加数据页的代码 try const response UrlFetchApp fetch root endpoint params const respon
如何从右向左对齐日期选择器？

datepicker dob on click function datepicker datepicker format dd mm yyyy autoclose true
设计评论表

基本上我想创建一个评论系统其中评论可能有也是评论的父母但我也希望他们可能有可能是其他东西的父母例如用户或产品即我希望能够对产品发表评论用户其他评论或几乎任何资源我该怎么做呢当前表标签产品用户评论编辑这将适用于流
jQuery 获取容器的 html，包括容器本身

我如何获取 container 上的 html 包括 container 而不仅仅是其中的内容 div div test 1 div div test 2 div div test 3 div div test 4 div div 我有这个
多个 Docker 容器和 Celery

我们现在的项目结构如下处理来自客户端的传入请求的 Web 服务器向用户提供一些建议的分析模块我们决定保持这些模块完全独立并将它们移动到不同的 docker 容器中当用户的查询到达网络服务器时它会向分析模块发送另一个查询以获取推荐
如果我们不需要位图，是否必须显式回收它？

位图有一个recycle方法但是如果我们不再需要它是否必须显式调用它例如一个ImageView现在有一个位图当用户单击按钮时它将为 ImageView 设置一个新的位图在分配新位图之前我们是否必须回收原始位图是的如果您的目
如何在ggplot的facet_grid函数中应用下标

我想使用 ggplot 绘制空气污染物与出生体重变化之间的关联结果 95 CI 我的数据格式是这样的 variable exposure period coef coef lb coef ub PM10 entire pregnancy 2
如何从在 Cron 作业上运行的 Python 解锁 Gnome 密钥环？

我正在连接一个 Python 脚本来与 cron 一起运行在 Ubuntu 12 04 上但身份验证不起作用 cron 脚本访问几个服务并且必须提供凭据存储这些凭证keyring很简单只不过当 cron 作业实际运行时无法检索凭
Map：如何获取与某个值关联的所有键？

给定一个 Map 如何查找与特定值关联的所有键例如 Map
背包多重约束

我有一个动态规划问题我花了几个小时研究但没有结果第一部分很简单你有一背包物品你必须最大化这些物品的价值同时将它们保持在一定的重量以下问题的第二部分是相同的只是现在也有一个项目限制例如您可以放入袋子中的物品的最大价值是多少
查看 PHP 闭包的源代码

是否可以反映或以其他方式查看 PHP 闭包对象的源代码也就是说如果我做这样的事情 closure function return Hi There 然后是这样的 var dump closure PHP 输出 object Closur
是否可以在activerecord中定义与SQL表达式对应的虚拟属性？

我正在寻找类似虚拟属性的东西但这可以在数据库级别上工作假设我有一个字段age我想添加一个虚拟字段 age quintile这等于age 5 但可以这样说 Person select age quintile agv height gr
Python 元组作为键慢吗？

我正在尝试实现字典中排序元组的快速查找回答元组 3 8 是否有关联值如果有它是什么的问题令元组中的整数从下方以 0 为界从上方以 max int 为界我继续使用 Python 的 dict 但发现速度相当慢解决此问题的另一

Python 元组作为键慢吗？

Python 元组作为键慢吗？ 的相关文章

随机推荐

热门标签

Python 元组作为键慢吗？的相关文章