在Sage中使用Python的pickle会导致内存使用率很高

2023-12-24

我正在使用基于 Python 的 Sage Mathematics 软件来创建一个很长的向量列表。该列表包含大约 100,000,000 个元素,sys.getsizeof() 告诉我它的大小略小于 1GB。

我将这个列表放入一个文件中(这已经花费了很长时间——但很公平)。只有当我解开这个列表时,它才会变得烦人。 RAM 使用量从 1.15GB 增加到 4.3GB,我想知道发生了什么?

我怎样才能在 Sage 中找到所有内存的用途?您是否有任何想法如何通过应用 Python 技巧来优化它?


这是对 kcrisman 评论的回复。

我无法发布确切的代码,因为它太长了。但这里有一个简单的例子,可以观察到这些现象。我正在使用 Linux 3.2.0-4-amd64 #1 SMP Debian 3.2.51-1 x86_64 GNU/Linux。

启动Sage并执行:

import pickle
L = [vector([1,2,3]) for k in range(1000000)]
f = open("mylist", 'w')
pickle.dump(L, f)

在我的系统上,该列表有 8697472 字节大,我腌制到的文件大约有 130MB。现在关闭 Sage 并观察您的记忆(例如,使用 htop)。然后执行以下几行:

import pickle
f = open("mylist", 'r')
pickle.load(f)

如果没有 Sage,我的 Linux 系统使用 1035MB 内存,当 Sage 运行时,使用量会增加到 1131MB。在我解压该文件后,它使用了 2535MB,我觉得很奇怪。


最好不要直接使用 python 的 pickle 模块。 cPickle 已经好一点了,但是 sage 中的很多 pickle 都假设协议 2,而 (c)Pickle 并不默认使用协议 2。你可以使用圣人自己的泡菜包装纸。如果我用你的例子

sage: open("mylist",'w').write(dumps(L))

然后通过以下方式将其加载到新会话中

sage: L = loads(open("mylist",'r').read())

我观察到没有问题。

请注意,上述接口并不是将 sage 中的 pickle/unpickle 到文件的最佳接口。你最好使用save/load。我这样做只是为了尽可能接近你的例子。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在Sage中使用Python的pickle会导致内存使用率很高 的相关文章

随机推荐

  • R - 如何通过嵌套 tibbles + pwalk(rmarkdown::render) 生成参数化报告

    我正在尝试根据学生数据生成评估报告 我的想法是创建一个 RDS 嵌套 tibble 来传递给rmarkdown render using purrr pwalk 我对 purrr 及其它还比较陌生map函数族 这是有效的代码部分 尝试一下
  • 如何在 haskell 中为这棵树实现 monoid 接口?

    请原谅这些术语 我的思想仍然弯曲 那个树 data Ftree a Empty Leaf a Branch Ftree a Ftree a deriving Show 我有几个问题 If Ftree不可能Empty 它不再是一个Monoid
  • Azure Web api VS 移动服务

    使用时主要区别是什么 Azure Web API 技术上使用 Azure 网站模块 https www windowsazure com en us develop net tutorials rest service using web
  • 从上方查看城市坐标

    作为一个小项目 我一直在考虑创建一个类似 Google 地球的动画 我想在旋转地球以各个城市为中心的同时播放时间线 目前 我可以使用默认视图设置来渲染地球仪 其中城市由点表示 当我尝试使用俯视城市 例如丹佛 的视图向量来调整相机方向时 我最
  • 使用 C# 从 NVarchar(Max) 列流式传输数据

    我想将一些文件的内容放入数据库中以供单独的进程读取 这是一个两步的事情 因为文件将上传到 java 服务器 然后由定期运行的单独的 c 应用程序进行处理 我本来打算使用nvarchar Max 列来表示数据 但我不知道如何以合理的方式从此类
  • MySQL 按小时分组

    我正在尝试按小时使用情况从历史记录表中获取报告 history表是 CREATE TABLE IF NOT EXISTS history history id int 11 unsigned NOT NULL AUTO INCREMENT
  • 错误:由于“_”未定义而无法实例化模块 restangular

    当第一次在工作网站上使用 Restangular 时 我收到以下 JavaScript 错误 由于 未定义 无法实例化模块 restangular 我缺少什么 未定义 在 Restangular 模块中 是什么意思 这是一个简单的疏忽 下划
  • mosquitto 中的地址已在使用错误

    我已经在我的 ubuntu 机器上安装了 mosquitto 服务器和客户端软件包 当我运行命令 mosquitto 来运行 mosquitto 服务器时 我收到错误 错误 地址已在使用中 为什么我会收到此错误 我该如何解决这个问题 我遇到
  • Qt 中的内存管理

    我对 Qt 内存管理有一点疑问 让我们以Listview为例 在listview中我们通过动态分配内存来添加每个项目 那么在这种情况下我们是否需要手动删除所有 新 的项目 E g Qlistview list new Qlistview Q
  • 纱线全局命令不起作用

    我正在使用 Yarn v0 16 1 如果我理解正确的话 根据文档 https yarnpkg com en docs cli global yarn global add
  • sleep 0 在 shell 脚本中做什么?如果在 ansible SSH 配置中使用它在每个命令后附加它会做什么?

    什么是sleep 0在 shell 脚本中做什么 我阅读了 sleep 的手册页 它说 延迟指定的时间 参数 NUMBER 以秒为单位指定这个时间 默认情况下 但我看到 ansible 使用sh c echo ec2 user sleep
  • VSCODE 中的 YAML 文件格式

    我刚刚开始使用 VSCODE 每次在现有 YML 文件中粘贴 YAML 代码时都会遇到麻烦 基本上 编辑器似乎会自动格式化文档 这样做会弄乱文档中的重要空间 这会导致 Azure Devops 中的构建中断 尽管 VS code 可以很好地
  • 发送在我的 NDIS 修改过滤器驱动程序中无法正常工作

    我正在尝试使用 NDIS 来实现数据包修改过滤器 我使用了丢弃数据包并从克隆 NBL 发起发送 接收的方法 msdn 上的文档说这是允许的 https learn microsoft com en us windows hardware d
  • Leaflet/shiny:无法绘制反应多边形

    看完了Leaflet for R 页面上的闪亮集成示例 https rstudio github io leaflet shiny html 我在子集化和显示一些多边形以在我闪亮的应用程序中显示时遇到问题 目前 我正在得到一个带有侧边栏的应
  • phantomjs 没有关闭并留下孤立进程

    在 PhantomJS 1 9 2 ubuntu 12 LTS 和 Ghostdirver 1 04 以及 selenium 2 35 上 测试后我得到了悬空的 phantomjs 进程 有人知道如何解决这个问题的好方法吗 这是一个演示奇怪
  • 使express.js 中单个用户的所有会话失效

    出于安全原因 我们希望能够使用户的所有活动会话无效 例如 如果他们更改密码 或者只是希望能够强制注销其他会话 我们使用 Node js Express express sessions 和 Redis 会话存储 在我们的应用程序中 我们有
  • 除非修改源代码,否则 Three.js 骨骼动画无法工作

    使用 Three js r68 我需要对源代码进行轻微修改才能使我的动画正常工作 未经修改 每种类型的模型中只有一个是动画的 每种类型的模型都有多个生成 这是第 29407 行的修改后的源代码 从 29389 开始发布的代码 THREE A
  • 使用 2.x API 的 Android 应用程序也可以在 1.x 上运行

    我正在开发一个 Android 应用程序 我想在其中使用多点触控 然而 我不想完全忽略那些仍在运行 1 x 操作系统的手机 如何对应用程序进行编程 以便可以使用 2 x 多点触控 API 或与此相关的任何其他更高级别的 API 并且仍然允许
  • d3js 中矩形的大小基于值的总和而不是项目的计数

    我正在开发 d3js 可视化 我想根据大小显示组和子组 除了矩形的大小之外 大部分功能都可以工作 如果您在加载时看到所有四个盒子尺寸都相同 因为它们都有相同的编号 补助金计划 我想根据 grant award 更改这些矩形的大小 这是我在以
  • 在Sage中使用Python的pickle会导致内存使用率很高

    我正在使用基于 Python 的 Sage Mathematics 软件来创建一个很长的向量列表 该列表包含大约 100 000 000 个元素 sys getsizeof 告诉我它的大小略小于 1GB 我将这个列表放入一个文件中 这已经花