如何在 Python 中写入原始二进制数据？

2024-03-19

我有一个 Python 程序，可以存储数据并将数据写入文件。数据是原始二进制数据，内部存储为str。我正在通过 utf-8 编解码器将其写出来。但是，我得到UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 25: character maps to <undefined> in the cp1252.py file.

在我看来，Python 正在尝试使用默认代码页解释数据。但事实并非如此have默认代码页。这就是我使用的原因str, not unicode.

我想我的问题是：

如何在 Python 中表示内存中的原始二进制数据？
当我通过编解码器写入原始二进制数据时，如何对其进行编码/取消编码？

注意：这是为 Python 2.x 编写的。不确定是否适用于 3.x。

您的使用str对于内存中的原始二进制数据是正确的。
[如果您使用的是Python 2.6+，则更好使用bytes在 2.6+ 中它只是一个别名str但更好地表达了您的意图，并且如果有一天您将代码移植到 Python 3，将会有所帮助。]

正如其他人指出的那样，通过编解码器写入二进制数据很奇怪。写编解码器采用 unicode and 输出字节到文件中。你试图倒退，因此我们对你的意图感到困惑......

[并且您对错误的诊断看起来是正确的：由于编解码器需要 unicode，Python 正在使用系统的默认编码将您的 str 解码为 unicode，这令人窒息。]

您想在输出文件中看到什么？

如果文件应按原样包含二进制数据:

那么你一定不能通过编解码器发送它；你必须写它直接到文件。编解码器编码一切并且只能发出有效的 unicode 编码（在您的情况下，有效的 UTF-8）。没有任何输入可以让它发出任意信号字节序列！
- 如果您需要一个mixtureUTF-8 和原始二进制数据，您应该直接打开文件，并混合写入some_data with some_text.encode('utf8')...
但请注意，将 UTF-8 与原始任意数据混合是非常危险的。设计不好，因为这样的文件处理起来很不方便和！理解 unicode 的工具会因二进制文件而卡住数据，让您甚至无法方便地查看（更不用说修改）文件。
如果您想要任意字节的友好表示统一码:

Pass data.encode('base64')到编解码器。 Base64 只产生干净的ascii（字母、数字和一点标点符号）所以它可以清楚地嵌入到任何东西中，它在人们看来显然是二进制数据，而且相当紧凑（略高于 33% 高架）。

附：你可能会注意到data.encode('base64')很奇怪。
- .encode()应该采用 unicode 但我给它一个细绳？！ Python 有几个伪编解码器可以将 str->str 转换例如“base64”和“zlib”。
- .encode()总是返回一个 str 但你会将其输入编解码器期待统一码？！在这种情况下，它只会包含干净的 ascii，所以没关系。你可以明确地写data.encode('base64').encode('utf8')如果它让你感觉更好的。
如果您需要从任意字节到 unicode 的 1:1 映射:

Pass data.decode('latin1')到编解码器。latin1地图字节 0-255 到 unicode 字符 0-255，这有点优雅。

当然，编解码器会对您的字符进行编码 - 128-255 是以 UTF-8 编码为 2 或 3 个字节（令人惊讶的是，平均开销是 50%，比 base64 还多！）。这相当杀死 1:1 映射的“优雅”。

另请注意，unicode 字符 0-255 包括令人讨厌的字符不可见/控制字符（换行符、换页符、软连字符等）使您的二进制数据在文本编辑器中查看起来很烦人。

考虑到这些缺点，我不推荐拉丁1除非你完全明白为什么你想要它。
我只是将其称为另一种“自然”编码去提醒。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Python 中写入原始二进制数据？的相关文章

配置 PIP 以在代理后面工作

我已经安装了 python 3 4 3 附带pip 我想从代理后面使用 pip 所以我执行了以下操作 Created C Users foo pip pip ini并添加了代理配置部分 proxy export http proxy my
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
熊猫加入具有不同索引级别/日期时间的数据帧？

嗨我有两个 DataFrame 如下所示 dineType menuName unique columns date y m d
Python 错误：将 statsmodels 与一行数据一起使用时，对象的 len() 未调整大小

我可以使用 statsmodel 的 WLS 加权最小二乘回归 http statsmodels sourceforge net devel generated statsmodels regression linear model WLS
以编程方式结束/退出粘合作业

我正在使用 Glue 书签来处理数据我的工作是每天安排的但也可以手动启动由于我使用书签有时胶水作业可以在没有新数据要处理的情况下启动然后读取的数据帧为空在这种情况下我想好好地结束我的工作因为它没有什么关系我试过 if
如何使用 django Rest 框架保存多对多字段对象

我有博客发布标签三个模型在博客模型中我将字段 postedin 作为发布模型的外键将标签作为标签模型的许多字段模型 py class Posted models Model name models CharField Pos
如何使用格式保存 Tkinter 文本小部件的内容

我在 python 中使用 Tkinter 在文本窗口中显示输出我发现使用 get 功能我可以从此窗口检索文本内容但我有用不同背景颜色标记的文本部分是否可以将内容与这些颜色一起复制到文件例如 html 或 doc 中没有对你想要的
统计Sweep算子的Python实现

我正在学习一些用书中缺失的数据进行统计的技术缺失数据的统计分析作者利特尔和鲁宾对于处理单调无响应数据来说一个特别有用的函数是扫频操作员详情见第 148 151 页我知道 R 模块gmm有swp函数可以做到这一点但我想知道是否有
如何在 C++ 中对静态缓冲区执行字符串格式化？

我正在处理一段对性能要求非常高的代码我需要执行一些格式化的字符串操作但我试图避免内存分配甚至是内部库的内存分配在过去我会做类似以下的事情假设是 C 11 constexpr int BUFFER SIZE 200 char bu
pandas groupby 并转换为 json 列表

我有一个如下所示的 pandas 数据框 idx f1 f2 f3 1 a a b 2 b a c 3 a b c 87 e e e 我需要将其他列转换为基于索引列的字典列表所以最终结果应该是 idx features 1 f1 a f
Python3 - 如何将字符串转换为十六进制

我正在尝试将字符串逐个字符转换为十六进制但我无法在Python3中弄清楚它在较旧的 python 版本中我的以下内容有效 test This is a test for c in range 0 len test print 0x s
将具有多个时区的 pandas 列转换为单个时区

Problem 我在 pandas DataFrame 中有一个列其中包含带有时区的时间戳此列中有两个不同的时区我需要确保只有一个这是该列末尾的输出 260003 2019 05 21 12 00 00 06 00 260004 2
Python：两个列表之间的成对比较：列表 a >= 列表 b？

如果我想检查列表中的所有元素 a 1 2 3 6 大于或等于另一个列表中对应的元素 b 0 2 3 5 如果 a i gt b i 对于所有i的则返回 true 否则返回 false 这有逻辑功能吗比如a gt b 谢谢你可以这样做
在python中检测按下了哪些键

我需要知道现在按下的是哪个键我不想捕获一些特定的按键来触发事件或类似的事情我想知道现在按下了哪些键并显示它们的列表我还需要捕获特殊键如 F1 F12 shift alt home windows 等基本上是键盘上的所有键我如何在
Python-使用元组作为列表索引[重复]

这个问题在这里已经有答案了我有一个元组列表 tuples list 1 0 2 3 3 2 2 0 我想访问二维数组的元素a例如使用其中一些元组 for i in range 3 print a tuples list i 应该输出的值
使用 Celery 通过 Gevent 进行实时、同步的外部 API 查询

我正在开发一个 Web 应用程序该应用程序将接收用户的请求并且必须调用许多外部 API 来编写对该请求的答案这可以直接从主 Web 线程使用 gevent 之类的东西来扇出请求来完成或者我在想我可以将传入的请求放入队列中并使用
Python struct.pack() 'struct.error: bad char in struct format' 尝试保存字节顺序时

我正在尝试打包一个字符串和字符串的长度 fmt
`numpy.diff` 和 `scipy.fftpack.diff` 在微分时给出不同的结果

我正在尝试计算一些数据的导数并且正在尝试比较有限差分的输出和谱方法的输出但结果却截然不同我无法弄清楚到底为什么考虑下面的示例代码 import numpy as np from scipy import fftpack as sp
将小数格式化为两位或整数

对于 10 我想要 10 而不是 10 00 对于 10 11 我想要 10 11 没有代码可以实现吗即通过指定格式字符串类似于 0 N2 decimal num 10 11M Console WriteLine num ToString
收到 Python 错误“来自：无法读取 /var/mail/Bio”

我正在运行一个 bio python 脚本这会导致以下错误 from can t read var mail Bio 由于我的脚本与邮件没有任何关系我不明白为什么我的脚本在 var mail 中查找这里似乎有什么问题我怀疑这会有帮助

随机推荐

使用字符串中的名称获取变量的值

我想从变量的名称中获取其值澄清一下 XML 文档以字符串形式提供变量名称我想获得价值像这样的东西 string bublegumA strawberry string bubblegumB banana get which varia
将基于视图的 NSOutlineView 绑定到 Core Data

我正在尝试将新的基于视图的 OutlineView 实现为我的 Mac 应用程序中的源列表不过我无法获取要显示的值因此我从核心数据应用程序模板制作了一个小型测试应用程序但也无法让它在其中正常工作我在数据模型中定义了两个简单的类我
在 null 上调用成员函数 store() - laravel 5.4

我正在尝试上传图像但每次提交时都会返回 store 错误我已将表单设置为 enctype multipart form data 这没有帮助有人能指出我正确的方向吗 Thanks 控制器内部功能 public function sto
来自 Android 的 Facebook Score API 调用未在时间轴/股票代码上显示高分

我正在尝试让 Android 应用程序将高分发布到 Facebook 类似于 Facebook 上的愤怒的小鸟的做法它显示在时间轴上也显示在股票代码中请记住该游戏仅在 Android 上运行并且没有 FB Canvas 应用程
GiST 和 GIN 索引之间的区别

我正在实现一个表其中有一列的数据类型为tsvector我想了解什么索引更好使用 GIN 还是 GiST 在浏览中postgres 文档在这里 http www postgresql org docs 9 1 static textsear
模拟安全警报的解决方案 - X509TrustManager 的不安全实现

因此最近我在开发人员控制台中收到以下警告为了解决该问题我已完成了所需的修复根据谷歌的建议 here https support google com faqs answer 6346016 要确认您已进行正确的更改请将应用程序的更
CouchDB 备份和克隆数据库

我们正在寻找 CouchdDB 作为类似 CMS 的应用程序围绕备份我们的生产数据库有哪些常见模式最佳实践和工作流程建议我对克隆数据库以用于开发和测试的过程特别感兴趣仅从实时运行的实例下复制磁盘上的文件就足够了吗您可以在两个实时运
TabLayout 使用自定义视图更新选项卡内容

我在用着TabLayout新的材料设计我有一个问题创建选项卡后我无法更新自定义视图的选项卡内容我可以用以下方法简化 PagerAdapter 中的方法 public View setTabView int position boole
记录器服务错误：鼠标左键按下：无法找到匹配的元素 - Xcode 错误

我正在尝试通过 XCTest 自动化我的 mac 应用程序当尝试从 XCode 记录应用程序时我收到以下错误消息当我点击按钮时会发生这种情况按钮层次结构是按钮 gt 堆栈视图 gt NSView 这里 button是NSButto
外键和索引问题

我正在使用 SQL Server 2008 Enterprise 我有一个表其中一个列引用另一个表在同一个数据库中中的另一列作为外键这是相关的SQL语句更详细地说表 Foo 中的列 AnotherID 引用了另一个表表 Goo
如何使用 sass 正确避免在 HTML 上嵌入 twitter bootstrap 类名

我正在开发一个刚刚开始的 Rails 项目我们想使用 twitter bootstrap 作为我们样式的基础一开始我们只是直接在 HTML 代码上使用 bootstrap 的类名就像 bootstrap 的文档中所示但在阅读以下文章
如何检查 Python 数组中是否存在某个元素（相当于 PHP in_array）？

我是 Python 新手我正在寻找一个标准函数来告诉我数组中是否存在某个元素我找到了index方法但如果未找到该元素则会抛出异常我只需要一些可以返回的简单函数true如果该元素在数组中或者false if not 基本上相当于 P
hook_user()：将额外的字段插入数据库而不仅仅是表单

我可以在注册中添加一个额外的字段我需要知道的是我需要采取什么步骤来获取该输入并将其插入到 drupal 的用户表中下面的代码位于我的模块中它仅向表单添加一个字段但是当提交时它不会对数据执行任何操作 function perscri
如何组合两个索引不同的 pandas 系列？

我尝试将两个不同索引的系列组合在一起相同的行数我试过pd concat s1 s2 axis 1 例如 s1 为 index s1 0 1 5 1 2 s2 是 index s2 a 1 b 2 但我得到 index s1 s2 0 1
批量从文本文件中删除重复行

是否可以从文本文件中删除重复的行如果是怎么办当然可以但就像大多数批处理文本文件一样它并不漂亮而且不是特别快该解决方案在查找重复项时忽略大小写并对行进行排序文件名作为第一个也是唯一一个参数传递给批处理脚本 echo off
运行 jQuery 函数 onclick

所以我实现了一些 jQuery 它基本上通过由滑块激活的滑块来切换内容 a 标签现在考虑一下我宁愿让保存链接的 DIV 本身就是链接我正在使用的 jQuery 在我的脑海中看起来像这样 a
用 jQuery 收集表单中的所有项目

如何收集 jQuery 中的所有复选框和下拉列表项进行保存或者对于最新版本的 jquery 您可以使用 http docs jquery com Ajax serialize http docs jquery com Ajax seri
如何解决DEP6500和DEP6701错误？

我有一个项目叫BTLE在它自己的解决方案中加载项目并使用手机上的调试器运行它可以找到我有第二个解决方案可以很好地加载和编译我添加了BTLE项目添加现有项目到第二个解决方案编译它并尝试在调试器中运行它我可以看到应用程序已正确
使用 PIG 从 Hive 表解析嵌套 XML 字符串

我正在尝试使用 PIG 从 Hive 表中的字段而不是从 XML 文件中提取一些 XML 这是我读过的大多数示例的假设 XML 来自排列如下的表 ID XML string XML 字符串包含 n 行始终包含最多 10 个属性中的至少一个
如何在 Python 中写入原始二进制数据？

我有一个 Python 程序可以存储数据并将数据写入文件数据是原始二进制数据内部存储为str 我正在通过 utf 8 编解码器将其写出来但是我得到UnicodeDecodeError charmap codec can t dec

如何在 Python 中写入原始二进制数据？

如何在 Python 中写入原始二进制数据？ 的相关文章

随机推荐

热门标签

如何在 Python 中写入原始二进制数据？的相关文章