Python中关于list和set的搜索效率及底层原理浅析

2023-11-03

从上图可以看到，同样情况下，在set中查找大概60纳秒，在list中查找大概440微秒=440*1000纳秒=440000纳秒。所用时间大概是set的6000倍。

总结原因：

list是顺序存储的，在查找的时候遍历整个数组，所以时间复杂度是O(n)
set在底层是被设计成没有值的字典型，即只有key没有value。而字典dict类型在python中的实现是基于hash map哈希表的，有一个映射关系，所以在查找时候，通过哈希函数f(x)就能轻易地找到相应的值，所以时间复杂度是O(1)。在Python中，我们平时定义的对象或者它内置的对象很多都是基于dict来建立的。
但是dict占的内存相对较大，另外由于是使用哈希表，所以内存空间的使用不是连续的，所以当dict中剩余的内存空间小于申请的空间的1/3时，就触发扩容机制，在另一块内存空间中申请一块更大的内存，将当前的数据挪到申请的新内存上。在挪之前，dict中数据是按照输入时的顺序存放的，即有序的。但是在挪了之后，由于空间变大，所以相应的hash函数也要相应变大，数据存放位置需要重新hash，所以扩容之后，dict中的顺序可能改变。
另外，当存到dict中的数据通过hash都指向一块内存的时候，即发生哈希冲突问题，在通过其它方法解决之后，再在搜索的过程时，对于一个hash值的那些数据，只能顺序搜索，所以若是n个数据都是一个hash值，那么它的查找效率就是O(n).
由于底层使用hash实现，所以对于dict的键key以及set中的数据，都需要是不可变对象，即：int、float、str、tuple等。另外：set相当于是可变对象（底层是dict），所以不能作为dict的键或者存储在set中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

list

set

dict

Python中关于list和set的搜索效率及底层原理浅析的相关文章

Flask+Nginx+uWSGI：导入错误：没有名为站点的模块

我安装为http www reinbach com uwsgi nginx flask virtualenv mac os x html http www reinbach com uwsgi nginx flask virtualenv
Kivy - 文本换行工作错误

我正在尝试在 Kivy 1 8 0 应用程序中换行文本当没有太多文字时一切正常但如果文本很长并且窗口不是很大它只是剪切文本这是示例代码 vbox BoxLayout orientation vertical size hint y
Python在postgresql表中查找带有单引号符号的字符串

我需要从 psql 表中查找包含多个单引号的字符串我当前的解决方案是将单引号替换为双单引号如下所示 sql query f SELECT exists SELECT 1 FROM table name WHERE my column m
查找模块中显式定义的函数 (python)

好的我知道您可以使用 dir 方法列出模块中的所有内容但是有什么方法可以仅查看该模块中定义的函数吗例如假设我的模块如下所示 from datetime import date datetime def test return Thi
numpy 使用 datetime64 进行数字化

我似乎无法让 numpy digitize 与 datetime64 一起使用 date bins np array np datetime64 datetime datetime 2014 n 1 s for n in range 1 1
登录网站并使用 python 请求下载文件

我有一个带有 HTML 表单的网站登录后它会将我带到 start php 站点然后将我重定向到overview php 我想从该服务器下载文件当我单击 ZIP 文件的下载链接时链接后面的地址是 getimage php path
如何将 self 传递给装饰器？

我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
使用 scipy curve_fit 拟合噪声指数的建议？

我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
Pandas 滚动窗口 Spearman 相关性

我想使用滚动窗口计算 DataFrame 两列之间的 Spearman 和或 Pearson 相关性我努力了df corr df col1 rolling P corr df col2 P为窗口尺寸但我似乎无法定义该方法添加meth
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
如何使用 Django 项目设置 SQLite？

我已阅读 Django 文档仅供参考 https docs djangoproject com en 1 3 intro tutorial01 https docs djangoproject com en 1 3 intro tutor
与 while 循环一样，如何跳过 for 循环中的步骤？

我尝试像 while 循环一样跳过 for 循环中的几个步骤在 while 循环中步骤根据特定条件进行调整如下面的代码所示 i 0 while i lt 10 if i 3 i 5 else print i i i 1 result
Python 惰性迭代器

我试图了解迭代器表达式如何以及何时被求值以下似乎是一个懒惰的表达 g i for i in range 1000 if i 3 i 2 然而这个在构造上失败了 g line strip for line in open xxx r if
如何使用 sys.path.append 在 Python 中导入文件？

我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
无法在 python 3.8 上将带有 webapp 的 python 部署到 azure

我正在尝试使用部署一个测试项目Flask使用以下方法将框架迁移到 Azure 云中Azure CLI https learn microsoft com en us azure app service containers quicksta
是否可以将 pd.Series 分配给无序 pd.DataFrame 中的列而不映射到索引（即不重新排序值）？

在 Pandas 中创建或分配新列时我发现了一些意外的行为当我对 pd DataFrame 进行过滤或排序从而混合索引然后从 pd Series 创建新列时 Pandas 会重新排序该系列以映射到 DataFrame 索引例如 d
对数据帧的每 2 小时数据进行 Groupby

我有一个数据框 Time T201FN1ST2010 T201FN1VT2010 1791 2017 12 26 00 00 00 854 69 0 87 1792 2017 12 26 00 20 00 855 76 0 87 1793
如何在 robobrowser-python 中发出 POST 请求

http robobrowser readthedocs org en latest api html http robobrowser readthedocs org en latest api html 我正在尝试使用 APIbrows
使用 urllib 编码时保持 url 参数有序

我正在尝试用 python 模拟 get 请求我有一个参数字典并使用 urllib urlencode 对它们进行 urlencode 我注意到虽然字典的形式是 k1 v1 k2 v2 k3 v3 urlencoding 后参数的顺序切

随机推荐

20230504 - 二叉树3

1 104 二叉树的最大深度 class solution 递归法 public int maxDepth TreeNode root if root null return 0 int leftDepth maxDepth root le
查看当前用户名称：whoami命令

没什么可讲的就是显示当前用户名称效果同 id un 命令转载于 https www cnblogs com Stong p 6812866 html
医学图像格式转换 -- .dcm转为.nii.gz

注代码主要根据 dcm2nii 多张dcm 文件转换成nii等其他格式的存储进行函数整合感谢原作者 coding utf 8 import SimpleITK as sitk def dcm2nii dcms path nii pat
oracle改表结构非空字段类型,Oracle修改表结构语句

1 修改表的字段修改一个列的数据类型一般限于修改长度修改为一个不同类型时有诸多限制语法 ALTER TABLE 表名 MODIFY 列名数据类型 eg1 alter table skate test modify author n
解决“'export' is only available in ES6 (use 'esversion: 6')”问题

问题 export is only available in ES6 use esversion 6 截图把鼠标移上去就会有这个提示解决方法在顶部加入这句话 jshint esversion 6 如图所示没有红色下滑线啦完美解决
Discuz!教程之后台隔段时间需要重新登录的解决方法

用Discuz 的站长们都有一个很苦恼的问题就是后台登录页面过一段时间再去操作就要重新登录非常不方便为了减少站长们的工作量本文给站长们介绍放宽disduz后台登录默认限制方法一取消检测管理员ip 1 用ftp工具连接您的虚拟主机
一个简单通用的logback配置文件

首先pom依赖于ch qos logback基于slf4j
Spark SQL架构工作原理及流程解析

前言 Spark SQL架构工作原理及流程解析 spark sql从shark发展而来 Shark为了实现Hive兼容在HQL方面重用了Hive中HQL的解析逻辑执行计划翻译执行计划优化等逻辑 Spark SQL兼容Hive 因为Sp
DFRobot离线语音识别模块真实测评

春节前在DF商城到上架两款新品分别是离线语音识别模块离线语音合成模块它们和二哈识图一起组成了人工智能三剑客其中语音识别模块有现货语音合成模块接受预定心痒痒想在春节尝鲜看商城公告春节发货截止日期2月7日于是6日上午匆匆下单
学习笔记（一）：Java中Stream的基本用法和相关API详解

目录引言一什么是Stream 二 Stream有什么用三 Stream的分类四常用的Stream创建方法 1 Stream of 方法 2 Arrays stream 3 集合对象中的stream 方法五 Stream的常见操
opencv缩小图片的方法

scaling factor 0 4 img scaled cv2 resize img None fx scaling factor fy scaling factor interpolation cv2 INTER LINEAR 双线性
带你了解『百度智能云发布云智一体的AI开发全栈模式』

在云智一体的独家优势下百度智能云为企业的 AI 开发打开了更多可能 3月27日百度智能云2021云智技术论坛首场活动在京举行重磅发布云智一体的 AI 开发全栈模式基于百度全球领先的 AI 技术和生态优势 AI 原生的云基础设施
如何判断一个以太坊地址是不是合约地址？

转载自https blog csdn net shebao3333 article details 80043317 使用web3 js web3 eth getCode 方法返回指定地址上代码的16进制字符串由于普通账户地址处没有代码
osgcuda

osgcuda 转原文 http blog sina com cn s blog df1b276a0101inbi html osgCompute是对代码的并行流处理器执行的抽象基库库连接到OSG的 OSG 因此它可以被包括在场景图它
ReadTimeoutError: HTTPSConnectionPool(host=‘cdn-lfs.huggingface.co‘, port=443)

问题最近遇到需要从hugging face下载并导入预训练模型SimCSE 然后进行计算文本相似度代码如下 from transformers import AutoModel AutoTokenizer import os os en
python爬取京东商品评论（可实现翻页）

上一篇文章我们已经实现抓取商品第一页的功能下面来实现翻页的功能首先通过类定义三个方法初始化方法解析一页的方法翻页爬取 class jd comment object def init self pass def page sel
iOS 中集成 FFmpeg

FFmpeg是一套可以用来记录转换数字音频视频并能将其转化为流的开源计算机程序它提供了录制转换以及流化音视频的完整解决方案 ffmpeg的代码是包括两部分的一部分是library 一部分是tool api都是在library里面
靶场复现————平行越权、垂直越权

知识学习不能上升到现实确对不能什么是越权越权漏洞的概念越权漏洞是一种很常见的逻辑安全漏洞是由于服务器端对客户提出的数据操作请求过分信任忽略了对该用户操作权限的判定导致修改相关参数就可以拥有了其他账户的增删查改功能从而
第1章实践基础

文章目录第1章实践基础 1 1 如何运行本书的代码 1 1 1 本地运行 1 1 1 1 环境准备 1 1 1 2 快速安装 1 1 2 AI Studio运行 1 2 张量 1 2 1 创建张量 1 2 1 1 指定数据创建张量 1
Python中关于list和set的搜索效率及底层原理浅析

从上图可以看到同样情况下在set中查找大概60纳秒在list中查找大概440微秒 440 1000纳秒 440000纳秒所用时间大概是set的6000倍总结原因 list是顺序存储的在查找的时候遍历整个数组所以时间复杂度是O

Python中关于list和set的搜索效率及底层原理浅析

Python中关于list和set的搜索效率及底层原理浅析 的相关文章

随机推荐

热门标签

Python中关于list和set的搜索效率及底层原理浅析的相关文章