如何估计 Pandas 的 DataFrame 需要多少内存？

2023-11-29

我一直在想...如果我正在将一个 400MB 的 csv 文件读取到 pandas 数据帧中（使用 read_csv 或 read_table），有什么方法可以猜测这将需要多少内存？只是想更好地感受数据帧和内存......

df.memory_usage()将返回每列占用多少字节：

>>> df.memory_usage()

Row_ID            20906600
Household_ID      20906600
Vehicle           20906600
Calendar_Year     20906600
Model_Year        20906600
...

要包含索引，请传递index=True.

因此，要获得总体内存消耗：

>>> df.memory_usage(index=True).sum()
731731000

还有，路过deep=True将启用更准确的内存使用报告，该报告说明了所包含对象的完整使用情况。

这是因为内存使用量不包括非数组组件的元素消耗的内存，如果deep=False（默认情况）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

如何估计 Pandas 的 DataFrame 需要多少内存？的相关文章

opencv水印周围的轮廓

我想在图像中的水印周围画一个框我已经提取了水印并找到了轮廓但是不会在水印周围绘制轮廓轮廓是在我的整个图像上绘制的请帮我提供正确的代码轮廓坐标的输出为 array 0 0 0 634 450 634 450 0 dtype int
使用 python 中的公式函数使从 Excel 中提取的值的百分比相等

import xlrd numpy excel Users Bob Desktop wb1 xlrd open workbook excel assignment3 xlsx sh1 wb1 sheet by index 0 colA co
如何检查python xlrd库中的excel文件是否有效

有什么办法与xlrd库来检查您使用的文件是否是有效的 Excel 文件我知道还有其他库可以检查文件头我可以使用文件扩展名检查但为了多平台性我想知道是否有任何我可以使用的功能xlrd库本身在尝试打开文件时可能会返回类似 false 的内
Kivy - 有所有颜色名称的列表吗？

在 Kivy 中小部件 color属性允许输入其值作为字符串颜色名称也例如在 kv file Label color red 是否有所有可能的颜色名称的列表就在这里来自Kivy 的文档 https kivy org doc sta
pyspark 数据框中的自定义排序

是否有推荐的方法在 pyspark 中实现分类数据的自定义排序我理想地寻找 pandas 分类数据类型提供的功能因此给定一个数据集Speed列可能的选项是 Super Fast Fast Medium Slow 我想实现适合上下文的
sklearn 中的 pca.inverse_transform

将我的数据拟合后 X 我的数据 pca PCA n components 1 pca fit X X pca pca fit transform X 现在 X pca 具有一维当我根据定义执行逆变换时它不是应该返回原始数据即 X 二维
如何在 Python 中加密并在 Java 中解密？

我正在尝试在 Python 程序中加密一些数据并将其保存然后在 Java 程序中解密该数据在Python中我像这样加密它 from Crypto Cipher import AES KEY 1234567890123456789012
Emacs 24.x 上的 IPython 支持

我对 IPython 与 Emacs 的集成感到困惑从 Emacs 24 开始 Emacs 附带了自己的python el 该文件是否支持 IPython 还是仅支持 Python 另外维基百科 http emacswiki org e
结构差异 sudo() run('sudo 命令')

我想知道函数之间有什么区别sudo 和函数run sudo u user smth 文档上有 sudo 在所有运行方式上都是相同的除了它总是换行调用 sudo 程序中的给定命令以提供超级用户特权但有几次 sudo cmd 提示我输入
在 Windows 上使用 apache mod_wsgi 运行 Flask 应用程序时导入冲突

我允许您询问我在 Windows 上使用您的 mod wsgi portage 托管 Flask 应用程序时遇到的问题我有两个烧瓶应用程序由于导入冲突只有一个可以同时存在 IE 如果请求申请 1 我有回复然后如果我请求应用程序 2
通过索引访问Python字典的元素

考虑一个像这样的字典 mydict Apple American 16 Mexican 10 Chinese 5 Grapes Arabian 25 Indian 20 例如我如何访问该字典的特定元素例如我想在对 Apple 的第一个
Matplotlib 中 x 轴标签的频率和旋转

我在下面编写了一个简单的脚本来使用 matplotlib 生成图形我想将 x tick 频率从每月增加到每周并轮换标签我不知道从哪里开始 x 轴频率我的旋转线产生错误 TypeError set xticks got an unexp
使用 Pandas 计算 delta 列

我有一个数据框如下所示 Name Variable Field A 2 3 412 A 2 9 861 A 3 5 1703 B 3 5 1731 A 4 0 2609 B 4 0 2539 A 4 6 2821 B 4 6 2779 A
Mac OSX 10.6 上的 Python mysqldb 不工作

我正在使用 Python 2 7 并尝试让 Django 项目在 MySQL 后端运行我已经下载了 mysqldb 并按照此处的指南进行操作 http cd34 com blog programming python mysql pyth
SocketIO + Flask 检测断开连接

我在这里有一个不同的问题但意识到它可以简化为如何检测客户端何时从页面断开连接关闭其页面或单击链接换句话说套接字连接关闭我想制作一个带有更新用户列表的聊天应用程序并且我在 Python 上使用 Flask 当用户连接时浏览器发
Django Admin 中的反向内联

我有以下 2 个型号现在我需要将模型 A 内联到模型 B 的页面上模型 py class A models Model name models CharField max length 50 class B models Model n
如何与其他用户一起使用 pyenv？

如何与其他用户一起使用 pyenv 例如如果我在用户 test 的环境中安装了 pyenv 则当我以 test 身份登录时可以使用 pyenv 但是当我以其他用户例如 root 身份登录时如何使用 pyenv 即使你这么做了我也会s
如何根据第一列创建新列，同时考虑Python Pandas中字母和列表的大小？ [复制]

这个问题在这里已经有答案了我在 Python Pandas 中有 DataFrame 如下所示 col1 John Simon prd agc Ann White BeN and Ann bad list Ben Wayne 我需要这样做
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此

随机推荐

创建 Python RPM

我一直在阅读有关为 Python 2 6 4 创建 RPM 的内容在此页面中 http docs python org distutils builtdist html它说你可以使用当前Python创建一个RPMpython setup
使用 LINQ 查找重复行（带有指定列的列表）

我使用下面的代码获取 3 列的重复行字符串日期货币我想知道是否有任何通用方法可以在此 LINQ 中输入动态列名列表来查找重复的行 DataTable allDuplicates dt AsEnumerable GroupBy dr
Windows 和 Linux 服务器中出现爆炸错误 \r\n 和 \n

我使用爆炸函数将文本区域内容基于行获取到数组中当我在本地主机 WAMPserver 2 1 中运行此代码时它与此代码完美配合 arr explode r n getdata 当我上传到我的Linux服务器时我每次都需要将上面的代码更改
Azure AD 预检请求未返回数据

我目前正在尝试发送帖子请求至https login microsoftonline com XXX oauth2 token用于检索应用程序的访问令牌和刷新令牌的端点使用 axios 向端点发送 post 请求时会发送预检但不会返回任
在 devise、ruby on Rails 中以管理员身份编辑其他用户

我在 Ruby on Rails 项目中使用 devise 并且用户具有管理属性架构 rb create table users force cascade do t t boolean admin default false end 我
PHP 使 if 更短

什么是真正的写法 if variable value1 value2 value3 它的工作原理应该类似于 if variable value1 variable value2 variable value3 只是想让这段代码更短现在我使
Java - repaint(x, y, w, h) 不调用paintComponent？（与 SSCCE 一起）

我之前问过这个问题但只是理论上的没有 SSCCE 现在我已经创建了一个但问题仍然存在我想知道为什么paintComponent没有被召唤repaint x y w h 但被调用repaint 两类 SANDBOX import j
Array.Sort 带数字的字符串[重复]

这个问题在这里已经有答案了我有下面的示例代码 List
如何检测电源连接状态？

当 USB 或交流电源连接到 Android 手机时是否有一种简单的方法可以收到通知在AndroidManifest xml中
R计算月末[重复]

这个问题在这里已经有答案了我有一个关于日期结束的问题我在下面解释这是我的示例数据 DATE 2015 01 01 2015 02 05 2015 09 29 2016 02 07 2016 07 24 2016 12 16 我知道如果
pandas DataFrame 中的波浪号符号

我是 python pandas 新手遇到了一个代码片段 df df df InvoiceNo str contains C 如果我能知道波浪号在这种情况下的用法我将非常感激这意味着按位非反转布尔掩码 Falses to Trues
MySQL 8.0 - 客户端不支持服务器请求的身份验证协议；考虑升级MySQL客户端

由于某种原因我无法与服务器建立简单的连接我使用默认设置安装了最新的 MySQL Community 8 0 数据库以及 Node JS 这是我的node js代码 var mysql require mysql var con mysq
无法在页面中央显示我的导航菜单

导航菜单未居中我尝试了很多让它居中的方法但没有任何效果 HTML div li a href index html Home a li li a href servicii html Servicii a li li a href po
将 datagridview 从一种窗体传递到另一种 c#

我想将我的 datagridview 从 form1 传递到 form2 我尝试使用构造函数但没有结果第二个表单中的 datagridview 为空有人可以帮助我吗我已经堆积了好几个小时了我不使用 sql 也不需要使用 dataTa
如何将我的应用程序限制为单个浏览器选项卡？

坦率地说在 v1 0 中需要提交三个表单的功能会带来太多麻烦 SESSION会话数据保存所有中间内容只是让用户启动一个操作然后打开第二个选项卡并执行第二个操作该操作会破坏会话数据我怀疑这是恶意的但不能否认更有可能的是用户开
Geochart 用独特的颜色填充国家/地区，并用其颜色作为图例显示国家/地区名称 [关闭]

Closed 这个问题需要多问focused 目前不接受答案我需要用列表中指定的唯一颜色填充每个国家并显示国家名称及其颜色作为地图下面的图例如随附的图像所示任何帮助将不胜感激
如何确定 ms sql server 2005 中打开/活动连接的总数

我的 PHP MS Sql Server 2005 win 2003 应用程序有时会变得非常无响应内存 CPU 使用率不会飙升如果我尝试从 sql management studio 打开任何新连接那么它只会挂在打开的连接对话框中如
什么是 AndroidX？

我正在阅读有关 Android 房间库的内容我看到他们改变了包裹android to androidx 我不明白有人可以解释一下吗 implementation androidx room room runtime room versi
无法将“In-Reply-To”参数传递给 Microsoft Graph sendMail

我允许用户使用 Microsoft Graph API 使用 Outlook 帐户发送电子邮件但它似乎在另一端创建多个线程当使用 Mailgun API 发送用户电子邮件时我能够传递引用前一条消息 Message ID 的 In Re
如何估计 Pandas 的 DataFrame 需要多少内存？

我一直在想如果我正在将一个 400MB 的 csv 文件读取到 pandas 数据帧中使用 read csv 或 read table 有什么方法可以猜测这将需要多少内存只是想更好地感受数据帧和内存 df memory usage 将

如何估计 Pandas 的 DataFrame 需要多少内存？

如何估计 Pandas 的 DataFrame 需要多少内存？ 的相关文章

随机推荐

热门标签

如何估计 Pandas 的 DataFrame 需要多少内存？的相关文章