使用带有字节计数的 textwrap.wrap

2023-12-23

我怎样才能使用textwrap在行达到一定字节数之前分割的模块（不分割多字节字符）？

我想要这样的东西：

>>> textwrap.wrap('☺ ☺☺ ☺☺ ☺ ☺ ☺☺ ☺☺', bytewidth=10)
☺ ☺☺
☺☺ ☺
☺ ☺☺
☺☺

结果取决于所使用的编码，因为每个字节数字符是编码的函数，在许多编码中，字符是编码的函数性格也是如此。我假设我们使用 UTF-8，其中'☺'是编码为e298ba并且是三个字节长；给定的例子是与该假设一致。

一切都在textwrap适用于角色；它什么都不知道关于编码。解决这个问题的一种方法是将输入字符串转换为另一种格式，每个字符变成一串字符其长度与字节长度成正比。我将使用三个字符：两个用于十六进制字节，加一个用于控制换行。因此：

'a' -> '61x'         non-breaking
' ' -> '20 '         breaking
'☺' -> 'e2x98xbax'   non-breaking

为了简单起见，我假设我们只在空格上中断，而不是制表符或任何其他角色。

import textwrap

def wrapbytes(s, bytewidth, encoding='utf-8', show_work=False):
    byts = s.encode(encoding)
    encoded = ''.join('{:02x}{}'.format(b, ' ' if b in b' ' else 'x')
                      for b in byts)
    if show_work:
        print('encoded = {}\n'.format(encoded))
    ewidth = bytewidth * 3 + 2
    elist = textwrap.wrap(encoded, width=ewidth)
    if show_work:
        print('elist = {}\n'.format(elist))
    # Remove trailing encoded spaces.
    elist = [s[:-2] if s[-2:] == '20' else s for s in elist]
    if show_work:
        print('elist = {}\n'.format(elist))
    # Decode. Method 1: inefficient and lengthy, but readable.
    bl1 = []
    for s in elist:
        bstr = "b'"
        for i in range(0, len(s), 3):
            hexchars = s[i:i+2]
            b = r'\x' + hexchars
            bstr += b
        bstr += "'"
        bl1.append(eval(bstr))
    # Method 2: equivalent, efficient, terse, hard to read.
    bl2 = [eval("b'{}'".format(''.join(r'\x{}'.format(s[i:i+2])
                                       for i in range(0, len(s), 3))))
             for s in elist]
    assert(bl1 == bl2)
    if show_work:
        print('bl1 = {}\n'.format(bl1))
    dlist = [b.decode(encoding) for b in bl1]
    if show_work:
        print('dlist = {}\n'.format(dlist))
    return(dlist)

result = wrapbytes('☺ ☺☺ ☺☺ ☺ ☺ ☺☺ ☺☺', bytewidth=10, show_work=True)
print('\n'.join(result))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用带有字节计数的 textwrap.wrap 的相关文章

优化完美平方问题，类似于Python中的硬币找零

我这里有一个硬币兑换的解决方案 python 中的 leetcode 硬币兑换 https stackoverflow com questions 69517078 coin change leetcode in python 因为完全平方
如何将本机 popcount 与 numba 一起使用

我正在使用 numba 0 57 1 我想在我的代码中利用本机 CPU popcount 我现有的代码太慢因为我需要运行它数亿次这是一个 MWE import numba as nb nb njit nb uint64 nb uint6
如何修复 Apache mod_wsgi 的 Python 版本不匹配问题？

我收到此错误 Thu Jul 12 14 31 36 2012 error python init Python version mismatch expected 2 6 7 found 2 6 8 当尝试启动 Apache 服务器时在
如何使用 django (python) 和 s3 上传文件？

我正在寻找一种将文件上传到 s3 的方法我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
Python sqlite3参数化删除表

我在 python 中删除 sqlite3 表时遇到问题我正在使用标准sqlite3模块 self conn sqlite3 connect sql drop table self conn execute sql u table nam
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
使用 boto3 从 s3 下载时使用 filename 作为文件名

我正在使用 boto3 上传文件如下所示 client boto3 client s3 aws access key id id aws secret access key key client upload file tmp test
类型错误：需要 Future 或协程

我尝试在 asyncssh 上自动重新连接 ssh 客户端 SshConnectManager 必须留在后台并在需要时进行 ssh 会话 class SshConnectManager object def init self host u
python：是否有用于对输入流进行分块的库函数？

我想对输入流进行分块以进行批处理给定一个输入列表或生成器 x in 1 2 3 4 5 6 我想要一个能够返回该输入块的函数说如果chunk size 4 then x chunked 1 2 3 4 5 6 这是我一遍又一遍地做的事
PyCharm 无法识别字典值类型

我有一个简单的代码片段其中我将字典值设置为空列表 new dict for i in range 1 13 new dict i 现在如果在下一行的循环内我会输入new dict i 并添加一个点我希望 PyCharm 向我显示可用于
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
如何在 Pytorch 中将一维 IntTensor 转换为 int

如何将一维 IntTensor 转换为整数这 IntTensor int 给出错误 KeyError Variable containing 423 torch IntTensor of size 1 我所知道的最简单最干净的方法 In
PyCharm - 如何挂起所有线程

我们使用 PyCharm 5 0 1 进行多线程调试当它在断点处停止时只有特定线程停止而所有其他线程继续这使得冻结时刻和检查参数值以及其他线程的当前状态变得困难当其中一个线程在断点处停止时是否可以挂起所有线程这在最新的 P
Python Camelot无边框表格提取问题

我正在努力从 pdf 文件中提取一些无边框表格如下图所示我已经安装了 python camelot 如图所示here https github com socialcopsdev camelot并且仅适用于有边框的表格请参阅以下详细信
如何限制scrapy请求对象？

所以我有一个蜘蛛我认为它正在泄漏内存结果当我检查 telnet 控制台 gt gt gt prefs 时它只是从链接丰富的页面中抓取了太多链接有时它会超过 100 000 个现在我已经一遍又一遍地浏览文档和谷歌但我找不到一种方法
Pip 突然使用了错误版本的 Python

在 os x 上使用 pip 时遇到一个奇怪的问题据我所知快速查看我的 bash history 似乎可以确认我最近没有对我的配置进行任何更改唉 pip 命令似乎突然使用了与以前不同的 python 版本到目前为止我使用命令 p
Matplotlib 中的 TwoSlopeNorm 未按预期工作

我正在尝试创建一个具有发散颜色图的绘图该颜色图在零附近不对称 In this https stackoverflow com a 20146989 6288682例如 DivergingNorm函数被使用并产生我想要的然而我使用的是更
Facebook Messenger 机器人的日期选择器 webview - 无法将字段值带回机器人的输入字段

我正在使用 Dialogflow 和 Messenger 开发聊天机器人 Webhook 是用 Python 3 x 编写的我面临着如何再次将数据从 webview 传输到信使聊天窗口以继续与用户对话的问题 Messenger 聊天机器人

随机推荐

PHP 脚本中的 XSS 漏洞

我一直在到处寻找试图找到解决这个问题的方法我最近在我们的网站上运行扫描以查找任何 XSS 和 SQL 注入漏洞有些项目引起了我的注意用户输入的任何数据现在都使用filter var 进行验证和清理我现在的问题是 XSS 和操纵
python 和 java api 的释放错误：未定义符号：_ZN5boost6system15system_categoryEv

我在 Ubuntu 13 10 中安装了 freeling 并且尝试使用 python 或 java api 但每当我尝试执行以下操作时都会收到错误 matias matias IdeaPad U430 Touch Programas To
在 MVC 中显示文件夹中的所有图像。与 foreach

我想将我的文件夹 Images uploads 文件夹中的所有图片显示到 MVC 视图中所以它显示在网站上但似乎没什么作用
GWT (2.4.0) + XSRF

我一直在尝试让 XSRF 在网络应用程序上运行但没有成功我正在研究一个典型的登录实现我正在关注谷歌的代码 https developers google com web toolkit doc latest DevGuideSecur
向工人发送数据

我正在尝试创建一段并行代码来加速非常大几亿行数组的处理为了并行化我将数据切成 8 个我的核心数块并尝试向每个工作人员发送 1 个块然而看看我的 RAM 使用情况似乎每一块都发送给每个工作人员有效地将我的 RAM 使用量
ServiceStack OnDeserialized 等效项

我正在实时反序列化 websocket 消息在我收到的消息 json 字符串中有一个 unix 时间戳长一旦每个对象被反序列化我就需要它尽快调用一个方法以便我可以捕获消息发送和接收时间之间的延迟使用 Json NET 这很简
如何对字典（在运行时）进行类型提示/类型检查以查找任意数量的任意键/值对？

我定义一个类如下 from numbers import Number from typing import Dict from typeguard import typechecked Data Dict str Number typec
缓慢/跳跃地调整大小

我使用简单的渐变扩展 JComponent 并调整 PaintComponent 方法制作了自己的 BottomBar 然后我将它添加到使用 BorderLayout 的 JFrame 的南部一切一开始看起来都是正确的当我调整框架大小时
如何在android中获取纬度和经度？

android2 3 3中如何获取当前的经纬度我尝试跟随this https stackoverflow com questions 2227292 how to get latitude and longitude of the mob
当使用实体框架代码优先映射属性到单独的表时，移动外键字段

使用代码优先 EF 映射表时遇到奇怪的问题我有一个父类 Contract 与另一个类 Supplier 具有多对一关系要求在合同实体中存储合同的扫描副本为了避免每次都查询文档字节我想将此属性存储在单独的表中我可以让 EF 将 Co
为什么我的“事件”总是空？

我正在尝试连接一个新事件但由于某种原因更改总是评估为空 public class MyTreeViewItem INotifyPropertyChanged private MyTreeViewItem parent public M
Windows 批处理中的 if/then/else 语句

在 shell 脚本中我有以下代码 if echo Mr 32 then echo Success else echo Failed exit fi Windows 批处理文件的等效语法是什么我很难想象 ECHO 何时会失败并返回 ERR
将布尔值绑定到视觉状态

我正在使用表达式混合当列表框没有元素时我想将文本框的状态更改为红色边框和红色文本因此当文本更改时我会过滤列表框 private void OnIPAddressTextChanged object sender System Wi
启动 docker 守护进程监听特定端口的正确方法

我是 Docker 新手希望以守护进程模式启动它监听特定的 IP 地址和端口在里面文档 https docs docker com reference commandline daemon 据说这可以通过写来完成sudo usr bi
关于AMR音频文件在不同设备上播放的问题

我这里遇到了一个很奇怪的问题我正在开发一个IM软件需要在Android上播放另一个客户端录制的音频文件我得到的相同音频文件可以在 3GS IOS 4 2 1 设备和模拟器 4 2 上使用 AVAudioPlayer 播放但是当我尝试
如何在gmake中返回变量的第一个字符

使用 GNU 的 make 我想提取变量的第一个字符目前我正在使用 shell 函数bash执行子串我想知道是否有办法使用 gmake 的内置函数来执行相同的操作 DIR user shell echo USER 0 1 USER 这不
ViewModel 在 Activity 之间共享数据

我正在使用 android viewmodel 但我无法从另一个活动传递和访问活动视图模型的数据我只能用片段来做到这一点我应该使用像 EventBus 这样的库在几个活动之间共享数据吗最佳实践是什么 None
Libgdx，使用 Shader 的 Alpha 文本不起作用

我在使用舞台操作在文本使用着色器中应用 alpha 时遇到一些问题我正在使用添加窗口演员和窗口添加标签演员的组我组中的其他演员应用 Actions alpha 工作得很好但我的标签使用着色器绘制不起作用与其他小部件不同的是我
SQL Server 理解 SCOPE_IDENTITY()

我在存储过程中有这段代码 BEGIN SET UserId NULL IF Username IS NOT NULL BEGIN EXECUTE SP ADD USER Username UserId OUTPUT END EXECUTE
使用带有字节计数的 textwrap.wrap

我怎样才能使用textwrap在行达到一定字节数之前分割的模块不分割多字节字符我想要这样的东西 gt gt gt textwrap wrap bytewidth 10 结果取决于所使用的编码因为每个字节数字符是编码的函数在许多编码

使用带有字节计数的 textwrap.wrap

使用带有字节计数的 textwrap.wrap 的相关文章

随机推荐

热门标签