Python：从集合中检索项目

2023-11-23

一般来说，Python 集似乎并不是为通过键检索项目而设计的。显然这就是词典的用途。但是，无论如何，给定一个键，您可以从等于该键的集合中检索一个实例吗？

再说一次，我知道这正是字典的用途，但据我所知，有合理的理由想要用字典来做到这一点。假设您有一个类定义如下：

class Person:
   def __init__(self, firstname, lastname, age):
      self.firstname = firstname
      self.lastname = lastname
      self.age = age

现在，假设我要创建大量Person对象，每次我创建一个Person我需要确保它不是以前的对象的重复Person目的。 APerson被认为是另一个的重复Person如果他们有相同的firstname，不管其他实例变量。所以自然地，显而易见的事情就是插入所有Person对象到一个集合中，并定义一个__hash__ and __eq__方法使得Person对象通过它们的比较firstname.

另一种选择是创建一个字典Person对象，并使用单独创建的firstname字符串作为键。这里的缺点是我会重复firstname细绳。在大多数情况下这并不是真正的问题，但是如果我有 10,000,000 呢？Person物体？冗余字符串存储确实会开始增加内存使用量。

但如果两个Person对象比较相等，我需要能够检索原始对象，以便附加实例变量（除了firstname) 可以按照业务逻辑所需的方式进行合并。这让我回到了我的问题：我需要某种方法来从set.

有办法做到这一点吗？或者使用字典是这里唯一真正的选择吗？

我肯定会在这里使用字典。重复使用firstname实例变量作为字典键不会复制它——字典只会使用相同的对象。我怀疑字典会比集合使用更多的内存。

要真正节省内存，请添加__slots__归因于你的班级。这将防止 10,000,000 个实例中的每一个实例出现__dict__属性，这将比一个潜在的开销节省更多的内存dict over a set.

Edit：一些数字支持我的主张。我定义了一个愚蠢的示例类，存储随机字符串对：

def rand_str():
    return str.join("", (chr(random.randrange(97, 123))
                         for i in range(random.randrange(3, 16))))

class A(object):
    def __init__(self):
        self.x = rand_str()
        self.y = rand_str()
    def __hash__(self):
        return hash(self.x)
    def __eq__(self, other):
        return self.x == other.x

该类的一组 1,000,000 个实例使用的内存量

random.seed(42)
s = set(A() for i in xrange(1000000))

在我的机器上有 240 MB。如果我添加

    __slots__ = ("x", "y")

对于班级来说，这会减少到 112 MB。如果我将相同的数据存储在字典中

def key_value():
    a = A()
    return a.x, a

random.seed(42)
d = dict(key_value() for i in xrange(1000000))

这使用了 249 MB，没有__slots__和 121 MB__slots__.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python：从集合中检索项目的相关文章

Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
从 python 发起 SSH 隧道时出现问题

目标是在卫星服务器和集中式注册数据库之间建立 n 个 ssh 隧道我已经在我的服务器之间设置了公钥身份验证因此它们只需直接登录而无需密码提示怎么办我试过帕拉米科它看起来不错但仅仅建立一个基本的隧道就变得相当复杂尽管代码示例将受
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
使用 NumPy 将非均匀数据从文件读取到数组中

假设我有一个如下所示的文本文件 33 346 1223 10 23 11 23 12 23 13 23 14 23 15 23 16 24 10 24 11 24 12 24 13 24 14 24 15 24 16 25 14 25 15
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
具有自定义值的 Django 管理外键下拉列表

我有 3 个 Django 模型 class Test models Model pass class Page models Model test models ForeignKey Test class Question model M
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
列表值的意外更改

这是我的课 class variable object def init self name name alias parents values table name of the variable self name 这是有问题的函数 f

随机推荐

Eclipse 不一致：资源泄漏：“<未分配的可关闭值>”从未关闭

如果我有以下代码 public OutputStream test boolean condition throws FileNotFoundException return condition null new FileOutputStr
如何以编程方式知道 Grails 中是否存在视图或布局文件

我想以编程方式知道 grails 中是否存在视图或布局我正在考虑获取绝对路径并要求 File exists 但我不知道如何为每个环境获取此路径我曾尝试过groovyPagesTemplateEngine getUriWithinGrai
将 PHP 对象存储在会话变量中

我是面向对象编程的新手正在编写我的第一门课程我为一家保险经纪人工作并尝试使用类来存储有关报价的信息并将对象存储为会话变量问题是当我查看会话变量时我得到 sessionName PHP Incomplete Class Obje
这是 Files.lines() 中的错误，还是我误解了并行流的某些内容？

环境 Ubuntu x86 64 14 10 Oracle JDK 1 8u25 我尝试使用并行流Files lines 但是我要 skip 第一行它是一个带有标题的 CSV 文件因此我尝试这样做 try final Stream
linux中什么是chained irq，什么时候需要使用它们？

什么是链式IRQ 什么是chained irq enter and chained irq exit这样做因为在中断发生后 IRQ 线被禁用但是chained irq enter正在调用与屏蔽中断相关的函数如果线路已经被禁用为什么要
将多个版本的 Angular 应用程序部署到 Azure 应用服务

我有一个 Angular 应用程序可以毫无问题地部署到 Azure 应用服务首先我使用以下命令编译我的应用程序 ng build output path dist aot prod 然后我添加以下内容web config to the
NuGet 在 VS 2013 中保持“正在检索信息”或“未找到结果”

突然间 NuGet 停止了所有项目的工作我在办公室的 4 台不同的计算机上尝试过所有计算机都停止工作如果我转到管理 NuGet 包当节点出现时它会显示未找到项目 Online gt nuget org被选中我上次检查前一段时
将项目导入 Netbeans

我的客户刚刚向我发送了用于开发目的的基础项目我认为他只是将项目文件夹压缩并发送给我现在当我转到 NetBeans 时使用现有源的新项目首先我看到错误该项目已经包含构建文件夹我从项目中删除了构建文件夹然后收到错误该项目已经包
MVVM Light Messenger 的正确使用方法

正确的使用方法是什么Messenger班级我知道它可以用于 ViewModels Views 通信但是将它用于技术业务服务层是一个好方法吗例如日志记录导航服务在构造函数中注册一些消息并知道这些消息何时在应用程序中发生发送者
如何通过 PHP 访问 RESTful API

我对 PHP 以及使用 RESTful API 的整个过程还很陌生我现在想要做的就是成功发出一个简单的 HTTP GET 请求这开放街道地图 API 我正在使用tcdent 的简单 PHP REST 客户端我基本上了解它的功能我在 O
无法在 EF Core 中使用迁移：“42P07：关系“AspNetRoles”已存在”

我有一个奇怪的问题无法找到解决方案该堆栈是 NET Core 2 EF PostgreSQL 我将 NET Core Identity 与User IdentityUser使用附加字段扩展基本用户模型创建第一次迁移后删除整个数据库并
Java 同步 HashMap 中的 size()、put()、remove()、get() 是原子的吗？

我将 Java 地图声明为 Map
如何在执行重定向之前确保控制器和操作存在，asp.net mvc3

在我的控制器操作对之一中我从某处以字符串形式获取另一个控制器和操作的值并且我想重定向当前操作在进行重定向之前我想确保我的应用程序中存在控制器操作如果不存在则重定向到 404 我正在寻找一种方法来执行此操作 public Ac
如何列出某个 git 分支内的所有标签

我的 git 仓库中有几个分支我想知道是否有一个命令列出某个分支中的所有标签而不是整个存储库中的所有标签我试过git tag contains 但它没有按预期工作 Image 1 there s a list of all the t
错误：发生错误。检查您的日志或联系应用程序作者以获取澄清信息

while publishing app on web getting error called check your log or contact the app auther please find above image links
在 IE8 及更低版本中 CSS 旋转 90 度

如何在 IE 8 及更低版本中仅使用 CSS 旋转 90 度 horizontal display block width 300px height 100px height background FF0000 margin auto ma
如何在没有任何库的情况下使用jquery swipe？

我需要创建像滑动手势这样的 jQuery 移动设备 slider ul li div swipeleft 使用核心 jQuery 不使用任何库或插件甚至不使用 jQuery mobile 我知道 jQuery 移动小部件现在将被解耦以便
如何按照 MVVM 为 WPF 构建通用/可重用模式对话框

我想构建一个通用可重用的模式对话框可以在我们的 WPF MVVM WCF LOB 应用程序中使用我有一个视图和关联的视图模型我想使用对话框显示它们视图和视图模型之间的绑定是使用针对类型的数据模板完成的以下是我能够起草的一些要求
pandas statsmodels 中的多元线性回归：ValueError

Data https courses edx org c4x MITx 15 071x 2 asset NBA train csv 我知道如何使用这些数据将其拟合到多元线性回归模型中statsmodels formula api impor
Python：从集合中检索项目

一般来说 Python 集似乎并不是为通过键检索项目而设计的显然这就是词典的用途但是无论如何给定一个键您可以从等于该键的集合中检索一个实例吗再说一次我知道这正是字典的用途但据我所知有合理的理由想要用字典来做到这一点假设您

Python：从集合中检索项目

Python：从集合中检索项目 的相关文章

随机推荐

热门标签

Python：从集合中检索项目的相关文章