Python 2 和 3 中的分块字节（不是字符串）

2024-01-19

事实证明这比我预期的要棘手。我有一个字节字符串：

data = b'abcdefghijklmnopqrstuvwxyz'

我想分块读取这些数据n字节。在 Python 2 下，只需稍加修改即可实现这一点grouper食谱来自itertools文档：

def grouper(iterable, n, fillvalue=None):
    "Collect data into fixed-length chunks or blocks"
    # grouper('ABCDEFG', 3, 'x') --> ABC DEF Gxx
    args = [iter(iterable)] * n
    return (''.join(x) for x in izip_longest(fillvalue=fillvalue, *args))

有了这个，我可以打电话：

>>> list(grouper(data, 2))

And get:

['ab', 'cd', 'ef', 'gh', 'ij', 'kl', 'mn', 'op', 'qr', 'st', 'uv', 'wx', 'yz']

在 Python 3 下，这变得更加棘手。这grouper函数如所写简单地摔倒了：

>>> list(grouper(data, 2))
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 5, in <genexpr>
TypeError: sequence item 0: expected str instance, int found

这是因为在 Python 3 中，当你迭代一个字节串时（比如b'foo'），您将得到一个整数列表，而不是一个字节列表：

>>> list(b'foo')
[102, 111, 111]

蟒蛇3bytes函数将在这里提供帮助：

def grouper(iterable, n, fillvalue=None):
    "Collect data into fixed-length chunks or blocks"
    # grouper('ABCDEFG', 3, 'x') --> ABC DEF Gxx
    args = [iter(iterable)] * n
    return (bytes(x) for x in izip_longest(fillvalue=fillvalue, *args))

使用它，我得到了我想要的：

>>> list(grouper(data, 2))
[b'ab', b'cd', b'ef', b'gh', b'ij', b'kl', b'mn', b'op', b'qr', b'st', b'uv', b'wx', b'yz']

但是（当然！）bytesPython 2 下的函数不工作一样的方法。这只是一个别名str，结果是：

>>> list(grouper(data, 2))
["('a', 'b')", "('c', 'd')", "('e', 'f')", "('g', 'h')", "('i', 'j')", "('k', 'l')", "('m', 'n')", "('o', 'p')", "('q', 'r')", "('s', 't')", "('u', 'v')", "('w', 'x')", "('y', 'z')"]

...这根本没有帮助。我最终写了以下内容：

def to_bytes(s):
    if six.PY3:
        return bytes(s)
    else:
        return ''.encode('utf-8').join(list(s))

def grouper(iterable, n, fillvalue=None):
    "Collect data into fixed-length chunks or blocks"
    # grouper('ABCDEFG', 3, 'x') --> ABC DEF Gxx
    args = [iter(iterable)] * n
    return (to_bytes(x) for x in izip_longest(fillvalue=fillvalue, *args))

这似乎可行，但这真的是这样做的方法吗？

Funcy http://funcy.readthedocs.org/en/stable/overview.html（一个提供各种有用实用程序的库，支持 Python 2 和 3）提供chunks功能 http://funcy.readthedocs.org/en/stable/seqs.html#chunks这正是这样做的：

>>> import funcy
>>> data = b'abcdefghijklmnopqrstuvwxyz'
>>> list(funcy.chunks(6, data))
[b'abcdef', b'ghijkl', b'mnopqr', b'stuvwx', b'yz']   # Python 3
['abcdef', 'ghijkl', 'mnopqr', 'stuvwx', 'yz']        # Python 2.7

或者，您可以在程序中包含一个简单的实现（与 Python 2.7 和 3 兼容）：

def chunked(size, source):
    for i in range(0, len(source), size):
        yield source[i:i+size]

它的行为是相同的（至少对于你的数据而言；Funcy 的chunks也适用于迭代器，但不适用于）：

>>> list(chunked(6, data))
[b'abcdef', b'ghijkl', b'mnopqr', b'stuvwx', b'yz']   # Python 3
['abcdef', 'ghijkl', 'mnopqr', 'stuvwx', 'yz']        # Python 2.7

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

python2x

Python 2 和 3 中的分块字节（不是字符串）的相关文章

ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
定义Python源代码编码的正确方法

PEP 263 http www python org dev peps pep 0263 定义如何声明Python源代码编码通常 Python 文件的前两行应以以下内容开头 usr bin python coding
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
如何为未捕获的异常处理程序编写单元测试

我有一个函数可以捕获uncaught例外情况如下有没有办法编写一个单元测试来执行uncaught exception handler 功能正常但测试正常退出 import logging def config logger logge
尝试从网页Python和BeautifulSoup获取编码

我试图从网页检索字符集这会一直改变目前我使用 beautifulSoup 来解析页面然后从标题中提取字符集这工作正常直到我遇到一个网站到目前为止我的代码以及与其他页面一起使用的代码是 def get encoding soup
为什么第二个 request.session cookies 返回空？

我想使用 requests Session post 登录网站但是当我已经登录主页然后进入帐户页面时看来cookies还没有保存因为cookies是空的而且我无法进入正确的帐户页面 import requests from bs4
如何使用 opencv python 计算乐高积木上的孔数？

我正在开发我的 python 项目我需要计算每个乐高积木组件中有多少个孔我将从输入 json 文件中获取有关需要计算哪个程序集的信息如下所示 img 001 red 0 blue 2 white 1 grey 1 yellow 1 r
在Python中读取tiff标签

我正在尝试用 Python 读取 tiff 文件的标签该文件是 RGB 的uint16每个通道的值我目前正在使用tifffile import tifffile img tifffile imread file tif 然而 img是一
Python MySQL 操作错误：1045，“用户 root@'localhost' 的访问被拒绝

我试图通过以下方式从我的 python 程序访问数据库 db mysql connect host localhost user Max passwd maxkim db TESTDB cursor db cursor 但是我在第一行代码
仅当某些值相等时，如何才能将一个文本文件中的值替换为另一个文本文件中的其他值？

我有一个名为finalscores txt我想创建一个 python 脚本它将打开它并从两个单独的列中读取值这是我的finalscores txt file Atom nVa predppm avgppm stdev delta QPr
时间序列数据预处理 - numpy strides 技巧以节省内存

我正在预处理一个时间序列数据集将其形状从二维数据点特征更改为三维数据点时间窗口特征在这样的视角中时间窗口有时也称为回顾指示作为输入变量来预测下一个时间段的先前时间步长数据点的数量换句话说时间窗口是机器学习算法在对
检索 geodjango 多边形对象的边界框

如何在 geodjango 中获取 MultiPolygon 对象的边界框在 API 中找不到任何内容http geodjango org docs geos html http geodjango org docs geos html
为正则表达式编写解析器

即使经过多年的编程我很羞愧地说我从未真正完全掌握正则表达式一般来说当问题需要正则表达式时我通常可以在一堆引用语法之后想出一个合适的正则表达式但我发现自己越来越频繁地使用这种技术所以自学并理解正则表达式properly 我决
Discord.py 嵌入中禁用按钮/冻结按钮

I m trying to make a replica of this bot in which when I press any of the buttons below it shows a dropdown menu and you
确定分割形状几何体的“左”侧和“右”侧

我的问题是我怎样才能确定哪一个Aside and Bside的侧面已经分割的旋转矩形几何体 http nbviewer jupyter org urls dl dropbox com s ll3mchnx0jwzjnf determine
如何通过函数注释指示函数需要函数作为参数，或返回函数？

您可以使用函数注释 http www python org dev peps pep 3107 在python 3中指示参数和返回值的类型如下所示 def myfunction name str age int gt str return
在matlab中，如何读取python pickle文件？

在 python 中我生成了一个 p 数据文件 pickle dump allData open myallData p wb 现在我想在Matlab中读取myallData p 我的Matlab安装在Windows 8下其中没有Pyt
django jet 中的自定义徽标

我目前正在尝试对 django 管理面板的皮肤进行一些定制以使其更符合我们的品牌目前我们使用 django jet 来美化管理面板 django jet 可以自定义 css html 吗所有评论都说我应该更改一些 html 文件但我
Python 中的 Unix cat 函数 (cat * > merged.txt)？ [复制]

这个问题在这里已经有答案了一旦建立了目录有没有办法在Python中使用Unix中的cat函数或类似的函数我想将 files 1 3 合并到 merged txt 我通常会在 Unix 中找到该目录然后运行 cat gt merged
如何通过点击复制 folium 地图上的标记位置？

I am able to print the location of a given marker on the map using folium plugins MousePosition class GeoMap def update

随机推荐

C++ 程序没有输出

首先很抱歉如果这是错误的类别因为我不确定这个问题的原因是什么出于教育目的我创建了一个小型 Hello World 应用程序 include
当指令长度可变时的指令解码

以下是一些指令及其对应的编码 55 push ebp 89 e5 mov esp ebp 83 ec 18 sub 0x18 esp a1 0c 9f 04 08 mov 0x8049f0c eax 85 c0 test eax eax 7
如何在 Python 中为 Discord 服务器创建只能使用一次的特定数量的邀请链接

我是使用 Discord 服务器的新手我想创建一个私人 Discord 服务器只有我邀请的用户才能加入我读到了一些可以实现这一目标的方法但它们都不是我真正想要的我正在考虑创建一个 Discord 应用程序该应用程序生成特定数量的
使用 Jenkins 在管道中触发器中的时区

我想使用管道通过触发器设置时区我可以在作业配置中手动设置构建触发器 check Build periodically 日程 0 0 TZ Asia Seoul 这有效但在管道中以下语法有效 pipeline triggers cron
Twitter bootstrap select readonly 仍然可以更改选项

我有一个引导选择readonly true 但我仍然可以更改所选选项我需要disabled true 行为但是当我使用它时选择不会提交我需要两者的组合所选选项无法更改但必须提交选择我可以使用隐藏字段但我希望有一个更简单的解决
关于 getView() 的问题

任何人都可以解释以下代码的作用吗 public View getView int position View convertView ViewGroup parent TODO Auto generated method stub View
如何在节点中将 Hex 转换为 Uint8Array？

我可以使用下面的代码将 Uint8Array 转换为十六进制 var bkh publicKey new Uint8Array 91 221 234 40 144 246 91 187 154 76 60 178 204 81 35 195
pickle 加载错误“__init__() 恰好需要 2 个参数（给定 1 个）”

我的问题是自定义类已使用 pickle dump 保存因为这些文件已保存自定义类已更改现在当我使用 pickle load 时出现此错误是不是保存的文件有问题错误 File cprprod extern lib python2 7
这里是 Python 菜鸟：在支持 Python 的 Web 服务器上，如何使用 Python？

usr bin env python coding UTF 8 enable debugging import cgitb cgitb enable print Content Type text plain charset utf 8 p
RecyclerView 中未从 Firebase 获取数据

大家我正在尝试制作一个音乐应用程序为此我创建了一个 Horizo ntalRecyclerView in my HomeFragment和我的水平RecyclerView正在获取带有艺术家姓名的图像但单击后我加载了另一个活动在我的
ContextMenu StaysOpen 不起作用

我正在展示一个UserControl inside ContextMenu 此外在那UserControl我正在展示一个Popup其中包含一些按钮和数据网格所有数据在Popup运行时加载问题是ContextMenu忽略属性StaysOp
Google Drive Api 上传文件错误，错误代码为 500 内部服务器错误和 410 消失

我正在通过可恢复简单上传将文件上传到 Google 云端硬盘具体取决于文件大小我在上传谷歌文档文件时遇到问题500内部服务器错误正如谷歌文档建议使用指数备份对于这个错误我尝试在一段时间间隔后一分钟后上传相同的数据 gt 但它给
使用实体框架 6 返回具有最大列值的记录

试图获得最大记录datetime价值ReceivedDateTime列但是数据集应该经过一些预先过滤Id列不是唯一的是这样解决的 using var db new SystemEntities var records db Table
Symfony2 更改树枝词法分析器

我想更改 symfony2 中的默认树枝词法分析器我创建了自定义控制器为其设置服务设置服务路线将 twig lexer 注入到服务中在我的控制器的构造函数中更改词法分析器当我不使用插值时结果呈现良好但词法分析器仍然没有改变
Python 中元组字典键匹配的一个元素

如果我有一个字典例如 foo foo 45 5 bar 34 3 我如何检查该元组的一部分 if foo in foo should be true pass if 45 in foo also should be true 或者其他一些
WSO2 Synapse：设置 URL 参数

我正在尝试做一些看似简单但无法使其发挥作用的事情基本上我希望 WSO2 API 管理器向 REST 调用添加 URL 参数设置和问题我安装了 WSO2 API 管理器我还有一个 Tomcat 运行着一个名为一些servlet它只是记
ARM Cortex-M4 中不同情况的条件汇编分支指令持续时间是多少？

我试图确定下面简单延迟循环的时钟周期的确切持续时间 loop subs r2 r2 1 bne loop The Cortex M4 技术参考手册 https developer arm com documentation ddi0439
如何使表格的某些列固定，某些列可滚动？

我正在使用 twitter bootstrap 3 开发一个网页有些表格不适合我的页面边距它们溢出来了所以我想创建一个像 Excel 电子表格一样工作的结构最左边的两列蓝色区域将被固定其余的列将尽可能显示如果用户向右滚动表格
查找 WPF 窗口的句柄

Windows 窗体有一个属性 win1 Handle 如果我记得的话它返回主窗口句柄的句柄有没有等效的方法来获取 WPF 窗口的句柄我在网上找到了以下代码 IntPtr windowHandle new WindowInteropH
Python 2 和 3 中的分块字节（不是字符串）

事实证明这比我预期的要棘手我有一个字节字符串 data b abcdefghijklmnopqrstuvwxyz 我想分块读取这些数据n字节在 Python 2 下只需稍加修改即可实现这一点grouper食谱来自itertools文档

Python 2 和 3 中的分块字节（不是字符串）

Python 2 和 3 中的分块字节（不是字符串） 的相关文章

随机推荐

热门标签

Python 2 和 3 中的分块字节（不是字符串）的相关文章