Python：为什么要腌制？

2024-04-07

我一直在使用pickle并且很高兴，然后我看到了这篇文章：不要腌制你的数据 http://www.benfrederickson.com/2014/02/12/dont-pickle-your-data.html

进一步阅读似乎是：

泡菜很慢 http://kovshenin.com/2010/pickle-vs-json-which-is-faster/
泡菜不安全 https://stackoverflow.com/questions/6794454/json-vs-pickle-security
Pickle 不是人类可读的
Pickle 与语言无关

我已改用 JSON 格式保存数据，但我想了解最佳实践：

考虑到所有这些问题，你什么时候会使用pickle？哪些具体情况需要使用它？

Pickle 是不安全的，因为它通过调用任意函数来构造任意 Python 对象。然而，这也使其能够序列化几乎所有 Python 对象，而无需任何样板，甚至无需白名单/黑名单（在常见情况下）。这对于某些用例来说是非常理想的：

快速轻松的序列化，例如用于暂停和恢复长时间运行但简单的脚本。这里所有的问题都不重要，您只想按原样转储程序的状态并稍后加载它。
向其他进程或计算机发送任意 Python 数据，如下所示multiprocessing。安全问题may适用（但大多数情况下不适用），通用性是绝对必要的，人们不必阅读它。

在其他情况下，这些缺点都不足以证明将您的内容映射到 JSON 或其他限制性数据模型的工作是合理的。也许您不希望需要人类可读性/安全性/跨语言兼容性，或者也许您可以不需要。记住，你不会需要它。使用 JSON 是正确的事情™，但正确并不总是等于好的。

你会注意到我完全忽略了“慢”的缺点。这是因为它在一定程度上具有误导性：对于完全适合 JSON 模型（字符串、数字、数组、映射）的数据，Pickle 确实速度较慢，但如果您的数据是这样的，则无论如何您都应该出于其他原因使用 JSON。如果您的数据不是这样（很可能），您还需要考虑将对象转换为 JSON 数据所需的自定义代码，以及将 JSON 数据转换回您的对象所需的自定义代码。对象。它增加了工程工作量和运行时开销，必须根据具体情况进行量化。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pickle

Python：为什么要腌制？的相关文章

Django 中的 Rpy2 错误 - 未为“”类型的对象定义转换“py2rpy”

我以前从未使用过 R 并且正在尝试使用 rpy2 从 python 调用 R 函数它可以在独立的 python 终端上运行但不能在 Django 中运行但rpy2似乎无法将python字符串转换为r对象我正在使用同事提供的自定义库
使用应用程序脚本将 MS Word 文件（保存在云端硬盘中）转换为 Google 文档

我被某些事情困住了找不到解决办法有没有办法使用文件 url 或 id 将存储在 Google Drive 中的 MS Word 文件转换为 Google 文档我目前有一个电子表格其中包含文件的网址或者也可以使用 python 脚
最小二乘法拟合直线 python 代码

我有一个由 X 和 Y 坐标组成的散点图我想使用直线的最小二乘拟合来获得最佳拟合线直线最小二乘拟合是指如果 x 1 y 1 x n y n 是测量数据对则最佳直线是y A Bx 这是我的Python代码 number of poin
Tipfy：如何在模板中显示blob？

鉴于在 gae 上使用tipfy http www tipfy org python 以下模型 greeting avatar db Blob avatar 显示 blob 此处为图像的模板标签是什么在这种情况下斑点是一个图像这很棒
类型错误：float() 参数必须是字符串或数字，而不是“列表”python

我的 Python 有问题这是我的代码 def calcola a input b float a 0 split c float a 0 split d float a 0 split e float a 0 split j float
将一维数组转换为下三角矩阵

我想将一维数组转换为较低的零对角矩阵同时保留所有数字我知道numpy tril函数但它用零替换了一些元素我需要扩展矩阵以包含所有原始数字例如 10 20 40 46 33 14 12 46 52 30 59 18 11 22 30
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
如何使用 i18n 切换器将“LANGUAGE_CODE”保存到数据库，以便在 Django 中的不同浏览器中语言不会更改？

有什么办法可以改变它的值LANGUAGE CODE单击按钮发送请求时 settings py 中的变量会动态变化吗我希望用户设置自己的默认语言他们的帐户现在用户可以使用下拉列表选择他们的首选语言并且网站会得到完美的翻译并且
Django 不会以奇怪的错误“AttributeError: 'module' object has no attribute 'getargspec'”启动

我对 Django 的内部结构有点缺乏经验所以我现在完全陷入困境它昨天起作用了但我不记得我改变过任何重要的东西当我转身时DEBUG True任何恰好位于列表中第一个的模块上都有堆栈跟踪 Traceback most recent c
如何将类添加到 LinkML 中的 SchemaDefinition？

中的图表https linkml io linkml model docs SchemaDefinition https linkml io linkml model docs SchemaDefinition and https link
Pandas groupby apply 执行缓慢

我正在开发一个涉及大量数据的程序我正在使用 python pandas 模块来查找数据中的错误这通常工作得非常快然而我当前编写的这段代码似乎比应有的速度慢得多我正在寻找一种方法来加快速度为了让你们正确测试它我上传了一段相当大的
uri 警告中缺少端口：使用 Python OpenCV cv2.VideoCapture() 打开文件时出错

当我尝试流式传输 ipcam 时出现了如下所示的错误 tcp 000000000048c640 uri 中缺少端口警告打开文件时出错 build opencv modules videoio src cap ffmpeg impl h
如何正确导入主代码和模块中同时使用的模块？

假设我有一个主脚本 main py 它导入另一个 python 文件import coolfunctions另一个 import chores 现在假设 Coolfunctions 也使用家务活中的东西因此我声明import chore
根据第三个变量更改散点图中的标记样式

我正在处理多列字典我想绘制两列然后根据第三列和第四列更改标记的颜色和样式我很难改变 pylab 散点图中的标记样式我的方法适用于颜色不幸的是不适用于标记样式 x 1 2 3 4 5 6 y 1 3 4 5 6 7 m k l l
用于多个窗口的 Tkinter 示例代码，为什么按钮无法正确加载？

我正在编写一个程序应该按一下按钮即可打开一个窗口按另一个按钮关闭新打开的窗口我使用类以便稍后可以将代码插入到更大的程序中但是我无法正确加载按钮 import tkinter as tk class Demo1 tk Frame
线性同余生成器 - 如何选择种子和统计检验

我需要做一个线性同余生成器它将成功通过所选的统计测试我的问题是如何正确选择发电机的数字以及我应该选择哪些统计检验我想均匀性的卡方频率测试每代收集10 000个号码的方法将 0 1 细分为10个相等的细分柯尔莫哥洛夫斯米尔
计算 pyspark df 列中子字符串列表的出现次数

我想计算子字符串列表的出现次数并根据 pyspark df 中包含长字符串的列创建一个列 Input ID History 1 USA UK IND DEN MAL SWE AUS 2 USA UK PAK NOR 3 NOR NZE 4
Django Rest Framework POST 更新（如果存在或创建）

我是 DRF 的新手我阅读了 API 文档也许这是显而易见的但我找不到一个方便的方法来做到这一点我有一个Answer与 a 具有一对一关系的对象Question 在前端我曾经使用 POST 方法来创建发送到的答案api answe
如何使用 Pandas Series 绘制两个不同长度/开始日期的时间序列？

我正在绘制每周总事件的几个熊猫系列对象系列中的数据events per week看起来像这样 Datetime 1995 10 09 45 1995 10 16 63 1995 10 23 83 1995 10 30 91 1995
如何更改matplotlib中双头注释的头大小？

Below figure shows the plot of which arrow head is very small 我尝试了下面的代码但它不起作用它说引发 AttributeError 未知属性 s k 属性错误未知属性头宽

随机推荐

远程片段上的引导模式“加载”事件

我目前正在使用 Twitter Bootstrap 模式组件并且遇到一个问题我在使用 data remote 属性远程加载的内容中的输入字段上使用 jquery 验证插件因为内容是在 dom 上运行 jquery 验证之后加载的所以
Glassfish 3.1.1 启动失败

我正在运行 glassfish 3 1 1 在我的开发机器使用 Windows XP 上运行了一段时间但今天早上它无法启动跑步asadmin start domain domain1它报告 Waiting for domain1 to
RequireJS 中的命名模块与未命名模块

我们可以通过给它命名来在 requireJS 中创建一个模块 define name dep function dep module definition 或者我们可以创建一个不包含名称的 define dep function dep m
隐藏水平滚动条（Angular ui-grid）

我试图隐藏 Angular ui grid 的水平滚动条但我找不到正确的属性财产启用滚动条假删除两者是否可以只删除水平滚动条使用 Github v3 0 0 rc 16 上的最新版本您可以分别禁用水平和垂直滚动条代替 enab
为什么 Java 8 泛型类型推断选择这种重载？

考虑以下程序 public class GenericTypeInference public static void main String args print new SillyGenericWrapper get private s
使用水豚测试黄瓜中的饼干

作为网站集成测试的一部分我将黄瓜与水豚一起使用水豚似乎无法模拟cookie的使用例如我在用户登录时设置 cookie def sign in user cookies permanent signed remember token
iOS UiWebView“帧加载中断”

我有一个 UiWebView 指向一个外部站点该站点的会话过期时间为 30 分钟不活动在我的应用程序中我在应用程序中嵌入了一个自定义登录页面因为我无法使用远程站点的登录页面这个登录页面是 file index html 当用户将应
包（Python PIL/Pillow）已安装，但我无法导入它

我想做一些图像处理但遇到了问题导入枕头模块似乎不起作用我在这里找到了一个简单的脚本来检查安装了哪些软件包我找到了它但导入它似乎不起作用这是我尝试运行的代码 import pip installed packages pip ge
SignalR cookie 未从客户端发送

我有一个从客户端发送的 cookie 用作我的 MVC Web 服务的一部分但是现在我已将集线器集成到此应用程序中集线器不会发送 cookie 而 mvc 应用程序会发送该 cookie 现在在阅读其他类似的问题不是很多后 coo
Little Endian 并推入 nasm

我不明白为什么代码的输出是Ole 小字节序不应该影响push命令 global start section data x dd 3 section text start mov eax 4 mov ebx 1 mov dword x 0x0
C++： std::tie 与 std::ignore 的返回类型

我想知道 C 11 标准是否给出了关于type of the std tuple由返回std tie当一些论点是std ignore 更具体地说我可以假设 decltype std tie 42 std ignore 不等于decltyp
64 位 Microsoft SQL Server 数据工具

我无法找到 64 位版本的 Microsoft SQL Server Data Tools 有谁知道哪里可以下载64位版本Microsoft SQL Server 数据工具 Visual Studio 2013 和 SQL Server 2
在 Swift 中检查 iOS 设备是否有 LiDAR

Swift 有没有办法检查设备是否有 LiDAR 传感器不幸的是我在苹果官方纪录片和互联网搜索中都没有找到任何信息我当前的解决方法是确定设备类型如本文中所述如何确定当前的iPhone 设备型号 https stackoverflo
Sencha Touch 2 - 无法从控制器获取参考视图

我正在尝试通过参考查看在控制器中定义的方法内我收到错误消息对象 object Object 没有方法 getUserForm 这是我的视图和控制器如果有人可以帮助我我会很高兴提前致谢用户表格 Ext define appNam
.htaccess url重写

我想重写一个URL 假设您访问http files domain com uploads file name jpg http files domain com uploads file name jpg 我如何使用 htaccess 来编
Python - 导入函数和本地声明函数之间的性能差异？

在 Python 中导入函数与在当前文件中声明函数在性能上是否存在显着差异我有一个小函数单行我经常在几个函数中使用它 py我的程序中的文件我希望只定义一次以便我对它所做的更改反映在各处但是我不确定将它用作导入函数是否会在调用它
使 (Mac)Vim 重新打开并在关闭时打开文件

使用案例 MacVim 窗口中显示 2 3 个文件您按 ctrl Q MacVim 就会关闭当您重新启动 MacVim 时它会打开并显示与您关闭它时相同的文件你怎么能这么做呢 ANSWER 我将以下内容添加到我的 vmirc sav
组合 Spark UDF（而不是将 UDF 作为一个）时是否会造成性能损失？

我想知道编写 Spark udf 是否会降低性能一般来说我更喜欢编写只做一件事的小函数这是一个简单的例子给定一个DataFrame df def inc udf i Double gt i 1 def double udf i Do
Gson：java.text.ParseException：无法解析的日期：“2018-04-09T09：00：00 + 02：00”

如何解析以下格式的字符串日期 2018 04 09T09 00 00 02 00 Gson使用 new SimpleDateFormat yyyy MM dd T HH mm ss Z Locale US 但它给出了以下例外 com goo
Python：为什么要腌制？

我一直在使用pickle并且很高兴然后我看到了这篇文章不要腌制你的数据 http www benfrederickson com 2014 02 12 dont pickle your data html 进一步阅读似乎是泡菜很慢 h

Python：为什么要腌制？

Python：为什么要腌制？ 的相关文章

随机推荐

热门标签

Python：为什么要腌制？的相关文章