为什么命名元组使用的内存比字典少？

2024-01-03

我问这个是因为我觉得这很令人惊讶——我想namedtuple会有更多的开销。

（背景是我在内存中缓存了一个大型 Django 查询，发现 Django 对象的大小是.values()。然后我想知道什么开销namedtuple对象的版本将是，允许我仍然使用.访问作为属性的项目。更小不是我所期望的。）

#!/usr/bin/env python                                                           

from pympler.asizeof import asizeof                                             
from collections import namedtuple                                              

import random                                                                   
import string                                                                   

QTY = 100000                                                                    


class Foz(object):                                                              
    pass                                                                        

dicts = [{'foo': random.randint(0, 10000),                                      
          'bar': ''.join([random.choice(string.ascii_letters + string.digits) for n in xrange(32)]),
          'baz': random.randrange(10000),                                       
          'faz': random.choice([True, False]),                                  
          'foz': Foz()} for _ in range(QTY)]                                    

print "%d dicts: %d" % (len(dicts), asizeof(dicts))                             

# https://stackoverflow.com/questions/43921240/pythonic-way-to-convert-dictionary-to-namedtuple-or-another-hashable-dict-like

MyTuple = namedtuple('MyTuple', sorted(dicts[0]))                               

tuples = [MyTuple(**d) for d in dicts]                                          

print "%d namedtuples: %d" % (len(tuples), asizeof(tuples))                     

print "Ratio: %.01f" % (float(asizeof(tuples)) / float(asizeof(dicts)))

Running,

$ ./foo.py    
100000 dicts: 75107672
100000 namedtuples: 56707472
Ratio: 0.8

单个元组甚至更少，可能是由于list:

$ ./foo.py    
1 dicts: 1072
1 namedtuples: 688
Ratio: 0.6

是哈希表数组的开销吗？但不会是namedtuple还需要属性的哈希表吗？是pympler不准确吗？

基本答案很简单：“是”：普通对象有一个内部字典来存储实例的属性：

class Foo:
    pass

f = Foo()
print(f.__dict__)
# {}

它必须是一个字典，因为在 Python 中，您可以在类未定义的实例上分配新属性：

f.a = 1
print(f.__dict__)
# {'a': 1}

使用字典可以快速进行属性查找，但由于数据结构本身存在内存开销。另外，由于不同的实例Foo可能定义了不同的属性，每个实例可能需要自己的字典：

g = Foo()
print(g.__dict__)
# {}
print(f.__dict_ == g.__dict__)
# False

A namedtuple不允许在运行时添加属性。一个具体实例namedtuple因此，可以将其所有属性存储在由所有实例共享的单个实例中。

Given a namedtuple和一个实例：

Foo = collections.namedtuple("Foo", 'a,b')
f = Foo(1,2)

The namedtuple-构造函数产生 https://github.com/python/cpython/blob/12083284c54be25abadd85781d36b63731dc1f0c/Lib/collections/__init__.py#L458 a 描述符 https://stackoverflow.com/a/3798882/2722968对于每个字段并将其存储在类中；这里是存储命名属性和元组索引之间的转换的位置。当您访问属性时a实例f，属性访问通过此描述符进行路由：

type(Foo.a)
#<class 'property'>

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

为什么命名元组使用的内存比字典少？的相关文章

boto3 资源（例如 DynamoDB.Table）的类型注释

The boto3库提供了几种返回资源的工厂方法例如 dynamo boto3 resource dynamodb Table os environ DYNAMODB TABLE 我想注释这些资源以便我可以获得更好的类型检查和完成但我
for 循环如何评估其参数

我的问题很简单 Does a for循环评估它每次使用的参数 Such as for i in range 300 python 是否会为此循环的每次迭代创建一个包含 300 个项目的列表如果是的话这是避免这种情况的方法吗 lst ra
将 numpy 数组写入文本文件的速度

我需要将一个非常高的两列数组写入文本文件而且速度非常慢我发现如果我将数组改造成更宽的数组写入速度会快得多例如 import time import numpy as np dataMat1 np random rand 1000
查找模块中显式定义的函数 (python)

好的我知道您可以使用 dir 方法列出模块中的所有内容但是有什么方法可以仅查看该模块中定义的函数吗例如假设我的模块如下所示 from datetime import date datetime def test return Thi
当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
可以用 Django 制作移动应用程序吗？

我想知道我是否可以在我的网站上使用 Django 代码并以某种方式在移动应用程序 Flutter 等框架中使用它那么是否可以使用我现在拥有的 Django 后端并在移动应用程序中使用它所以就像models views etc 是的有
Python Fabric - 未找到主机。请指定用于连接的（单个）主机字符串：

如何获取找不到主机请指定用于连接的单个主机字符串面料如何解决 def bootstrap host ec2 54 xxx xxx xxx compute 1 amazonaws com env hosts host env use
python是带有字符串的运算符行为[重复]

这个问题在这里已经有答案了我无法理解以下行为我正在创建 2 个字符串并使用 is 运算符来比较它对于第一种情况它的工作方式有所不同对于第二种情况它按预期工作当我使用逗号或空格时它显示是什么原因False与比较is当没有使用
如何使用 Django 项目设置 SQLite？

我已阅读 Django 文档仅供参考 https docs djangoproject com en 1 3 intro tutorial01 https docs djangoproject com en 1 3 intro tutor
Python 惰性迭代器

我试图了解迭代器表达式如何以及何时被求值以下似乎是一个懒惰的表达 g i for i in range 1000 if i 3 i 2 然而这个在构造上失败了 g line strip for line in open xxx r if
如何使用 sys.path.append 在 Python 中导入文件？

我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s
由于 json 字符串化 dict 键导致数据丢失

考虑下面的例子 gt gt gt import json gt gt gt d 0 potato 0 spud gt gt gt json dumps d 0 potato 0 spud gt gt gt json loads json d
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
Python]将两个文本文件合并为一个（逐行）[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我是蟒蛇新手我想做的是将文件 a 和文件 b 逐行合并到一个文件中例如 text file a a n b n c text fi
无法在 python 3.8 上将带有 webapp 的 python 部署到 azure

我正在尝试使用部署一个测试项目Flask使用以下方法将框架迁移到 Azure 云中Azure CLI https learn microsoft com en us azure app service containers quicksta
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
如何在 robobrowser-python 中发出 POST 请求

http robobrowser readthedocs org en latest api html http robobrowser readthedocs org en latest api html 我正在尝试使用 APIbrows
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
python sklearn中的fit方法

我问自己关于 sklearn 中拟合方法的各种问题问题1 当我这样做时 from sklearn decomposition import TruncatedSVD model TruncatedSVD svd 1 model fit X
缓存 Flask-登录 user_loader

我有这个 login manager user loader def load user id None return User query get id 在我引入 Flask Principal 之前它运行得很好 identity loa

随机推荐

jquery 插件在其他公共函数中调用公共函数

我定义了我的插件基于http docs jquery com Plugins Authoring http docs jquery com Plugins Authoring function var methods init functi
使用 httplib 进行不完整读取

我在从特定网站获取 RSS 提要时一直遇到问题我最终编写了一个相当丑陋的程序来执行此功能但我很好奇为什么会发生这种情况以及是否有更高级别的接口正确处理此问题这个问题并不是真正的问题因为我不需要经常检索提要我已经阅读了一个捕获异常并
AngularJS Protractor E2E 模拟

我有一个 Angular SPA 从节点后端检索其数据由于节点项目完全覆盖了测试我想模拟 Angular HTTP 调用我不想开始讨论一般的功能冒烟测试谢谢我想要的是像这样 Api injector get Api sinon
按位 XOR（异或）是什么意思？

我试图理解 C 或一般情况下的二元运算符特别是异或 http msdn microsoft com en us library zkacc7k1 aspx 例如给定一个正整数数组除了一个出现奇数次的数字外所有数字都出现偶数次在
nodejs socket.io 在函数循环内发出

我想通过循环内的 socket io 发出为此我制作了一个运行良好的触发器但在每个触发器中我调用 socket emit 并且只有第一个发出有效这是服务器代码 var server require http createServer
从动态 PHP 页面生成 HTML 静态页面 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个脚本来在运行时从动态内容生成静态 HTML 页面我基本上想做的就是保存那些缓存那些ht
用于提取 HTML 图像属性的正则表达式

我需要一个正则表达式模式来提取图像标签的所有属性众所周知存在大量格式错误的 HTML 因此该模式必须涵盖这些可能性我正在看这个解决方案https stackoverflow com questions 138313 how to ex
用于乐观更新的操作存储是 Redux/Flux 中的一个好方法吗？

我一直在 React Flux 应用程序中进行乐观更新并看到了两件事如果用户在存在某些未完成的操作时尝试关闭窗口会发生什么情况例如在 Facebook 中即使没有真正持久化消息也会出现在墙上这就是乐观更新的作用对用户来说是
flag_shih_tzu 可以处理的最大标志数量是多少？

我正在使用 flag shih tzu gem 我想知道它可以处理的最大标志数量是多少或者它是否取决于 int 标志列中的长度我需要它来处理 64 个标志 can it 我是 flag shih tzu 的维护者最佳实践出于性能原因
我是否正确使用了 Automapper 2.0 的 Include 功能？

要么我没有要么它不起作用我有一个 Source 类我想将其映射到彼此继承的多个视图基本上基类是 Detail 子类是 Edit 或 Update 它们使用与 Detail 相同的所有数据再加上几个其他字段来管理自己的列表或其他内
如何更改 allauth 中的电子邮件验证链接

我在 django 应用程序中使用 allauth 创建用户后它会发送一封包含如下链接的电子邮件http localhost 8001 account confirm email asdfafsd 不过我希望链接是http localh
通过 AlamofireImage 下载 UIImage？ [复制]

这个问题在这里已经有答案了我有一个 URL 想通过返回函数下载图像但是我无法让它正常配合这是我的函数 func getTabImage url URL gt UIImage Alamofire request url response
为多个客户端运行 Magento - 单个安装与多个安装

我希望为多个客户端设置 Magento 社区版安装并且已经研究了几天这个问题我可以看到企业版中有我需要的东西但令人惊讶的是我不愿意支付每年 12 000 美元的订阅费用似乎有一些选项可供选择但我担心我将从各种选项中获得的性能选
删除 TensorFlow 图中除少数节点之外的所有节点

我的 TensorFlow 用例要求我为每个需要处理的实例构建一个新的计算图这最终会增加内存需求除了少数几个tf Variables这些是模型参数我想删除所有其他节点其他有类似问题的人也发现了tf reset default gra
如何在 Windows 中使用正则表达式匹配行尾

我在 Windows 中创建了一个 txt 文件现在应该在 Linux 中进行编辑我想用 grep 匹配行尾假设我要在文件中找到的行的内容是 foo bar bar 然后我发出命令grep r bar 但没有产生任何输出在 Wind
多线程 COMObject 和 UI 线程 (C#)

这是我在这里发表的第一篇文章因为实际上我通常用很棒的方法解决我所有的问题您可以在这里找到邮政数据库但我现在实际上陷入困境我正在开发一个遵循 MVVM 的项目其中包括一个 COM 对象正如我在研究过程中所读到的那样我了解到 CO
具有多个代理的 Ember CLI

问题我有一个 Ember CLI 应用程序它将使用多个 API 我需要在开发模式下代理这些 API 背景我有一个遗留的 api 它在以下位置公开服务 api在我的本地开发机器上运行localhost 3000 我有一个新的 api 它
申请家庭内如何分配？

我有包含多个因素的 data frame 我想重命名所有这些因素的因素级别例如 mydf lt data frame col1 as factor c A A NA NA col2 as factor c A NA NA A mydf l
不同 Modelica 仿真环境之间有什么区别？

有不同的 Modelica 仿真环境包括 Dymola Wolfram SystemModeler OpenModelica 和 Jmodelica 所以我尝试加载热流体库 ThermoSysProhttps github com Dw
为什么命名元组使用的内存比字典少？

我问这个是因为我觉得这很令人惊讶我想namedtuple会有更多的开销背景是我在内存中缓存了一个大型 Django 查询发现 Django 对象的大小是 values 然后我想知道什么开销namedtuple对象的版本将是允许我仍然

为什么命名元组使用的内存比字典少？

为什么命名元组使用的内存比字典少？ 的相关文章

随机推荐

热门标签

为什么命名元组使用的内存比字典少？的相关文章