Python：将原始字符串转换为字节字符串而不添加转义字符

2024-04-12

我有一个字符串：

'BZh91AY&SYA\xaf\x82\r\x00\x00\x01\x01\x80\x02\xc0\x02\x00 \x00!\x9ah3M\x07<]\xc9\x14\xe1BA\x06\xbe\x084'

而且我要：

b'BZh91AY&SYA\xaf\x82\r\x00\x00\x01\x01\x80\x02\xc0\x02\x00 \x00!\x9ah3M\x07<]\xc9\x14\xe1BA\x06\xbe\x084'

但我不断得到：

b'BZh91AY&SYA\\xaf\\x82\\r\\x00\\x00\\x01\\x01\\x80\\x02\\xc0\\x02\\x00 \\x00!\\x9ah3M\\x07<]\\xc9\\x14\\xe1BA\\x06\\xbe\\x084'

Context

我从网页上刮下一个字符串并将其存储在变量中un。现在我想使用 BZip2 解压缩它：

bz2.decompress(un)

然而，自从un is a str对象，我收到此错误：

TypeError: a bytes-like object is required, not 'str'

因此，我需要转换un到类似字节的对象，而不将单个反斜杠更改为转义的反斜杠。

Edit 1:感谢您的所有帮助！ @wim我现在明白你的意思了，但我不知道如何从我的网络抓取方法中检索类似字节的对象：

r = requests.get('http://www.pythonchallenge.com/pc/def/integrity.html')

doc = html.fromstring(r.content)
comment = doc.xpath('//comment()')[0].text.split('\n')[1:3]

pattern = re.compile("[a-z]{2}: '(.+)'")

un = re.search(pattern, comment[0]).group(1)

我正在使用的软件包是requests, lxml.html, re, and bz2.

再次强调，我的目标是减压un using bz2，但我很难从我的网络抓取过程中获取类似字节的对象。

有什么指点吗？

您的错误较早存在。唯一可接受的解决方案是更改抓取代码，使其返回字节对象而不是文本对象。不要尝试“转换”你的字符串un转换成字节，它不能可靠地完成。

Do NOT做这个：

>>> un = 'BZh91AY&SYA\xaf\x82\r\x00\x00\x01\x01\x80\x02\xc0\x02\x00 \x00!\x9ah3M\x07<]\xc9\x14\xe1BA\x06\xbe\x084'
>>> bz2.decompress(un.encode('raw_unicode_escape'))
b'huge'

“raw_unicode_escape”只是一种 Latin-1 编码，它具有针对其之外的字符的内置后备。此编码使用 \uXXXX 和 \UXXXXXXXXX 作为其他代码点。现有的反斜杠不会以任何方式转义。它用于 Python pickle 协议。对于无法表示为 \xXX 序列的 Unicode 字符，您的数据将被损坏。

网络抓取代码没有必要将 bz2 编码的字节作为str，所以这就是你需要解决的地方cause解决问题，而不是试图解决症状。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

lxml

lxmlhtml

bz2

Python：将原始字符串转换为字节字符串而不添加转义字符的相关文章

python 3 argparse 调用函数

我想在 python3 中创建一个类似命令行类似 shell 的界面 Argparse 似乎负责解析和显示帮助错误消息根据argparse 的 python3 文档 https docs python org 3 5 library
组和平均 NumPy 矩阵

假设我有一个任意的 numpy 矩阵如下所示 arr 6 0 12 0 1 0 7 0 9 0 1 0 8 0 7 0 1 0 4 0 3 0 2 0 6 0 1 0 2 0 2 0 5 0 2 0 9 0 4 0 3 0 2 0 1 0
通用详细视图 ProfileView 必须使用对象 pk 或 slug 调用

我是 Django 2 0 的新手在访问我的个人资料页面视图时收到此错误它适用于像这样的网址path users
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
按多个键分组并对字典列表的值进行汇总/平均值

在Python中按多个键进行分组并对字典列表进行汇总平均值的最Pythonic方法是什么假设我有一个字典列表如下所示 input dept 001 sku foo transId uniqueId1 qty 100 dept 001
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
如何使用 Celery 多工作人员启用自动缩放？

命令celery worker A proj autoscale 10 1 loglevel info启动具有自动缩放功能的工作人员当创建多个工人时 me mypc projects x celery multi start mywork
使用 WSGI 在 Windows XAMPP 中设置 Python 路径

我正在 Webfaction 上设置实时服务器的开发版本在本地计算机上的虚拟 Apache 服务器环境运行没有任何错误中运行 Django 应用程序 XP 使用 Python 2 6 运行 XAMPP Lite 我可以提交更改通过 G
如何正确导入主代码和模块中同时使用的模块？

假设我有一个主脚本 main py 它导入另一个 python 文件import coolfunctions另一个 import chores 现在假设 Coolfunctions 也使用家务活中的东西因此我声明import chore
计算 pyspark df 列中子字符串列表的出现次数

我想计算子字符串列表的出现次数并根据 pyspark df 中包含长字符串的列创建一个列 Input ID History 1 USA UK IND DEN MAL SWE AUS 2 USA UK PAK NOR 3 NOR NZE 4
删除 HoloViews 中的 Bokeh 徽标

是否可以从 HoloViews 生成的图中删除 Bokeh 徽标没有什么反对的只是在某些报告中显示它可能没有意义我知道在 Bokeh 中我可以简单地执行以下操作 p bkp figure p toolbar logo None UPD
在python中读取PASCAL VOC注释

我在 xml 文件中有注释例如这个它遵循 PASCAL VOC 约定
在Python中连续解析文件

我正在编写一个脚本该脚本使用 HTTP 流量行解析文件并取出域目前仅将它们打印到屏幕上我正在使用 httpry 将流量连续写入文件这是我用来删除域名的脚本 usr bin python import re input open r
在 scipy 中创建新的发行版

我试图根据我拥有的一些数据创建一个分布然后从该分布中随机抽取这是我所拥有的 from scipy import stats import numpy def getDistribution data kernel stats gauss
Python 导入非常慢 - Anaconda python 2.7

我的 python import 语句变得非常慢我使用 Anaconda 包在本地运行 python 2 7 导入模块后我编写的代码运行得非常快似乎只是导入需要很长时间例如我使用以下代码运行了一个 tester py 文件 imp
更新 SQLAlchemy 中的特定行

我将 SQLAlchemy 与 python 一起使用我想更新表中等于此查询的特定行 UPDATE User SET name user WHERE id 3 我通过 sql alchemy 编写了这段代码但它不起作用 session
沿轴 0 重复 scipy csr 稀疏矩阵

我想重复 scipy csr 稀疏矩阵的行但是当我尝试调用 numpy 的重复方法时它只是将稀疏矩阵视为对象并且只会将其作为 ndarray 中的对象重复我浏览了文档但找不到任何实用程序来重复 scipy csr 稀疏矩阵的行我
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
在父类中访问子类变量

我有一个父类和一个继承的子类我想知道如何访问我的父类中的子类变量我尝试了这个但失败了 class Parent object def init self print x class Child Parent x 1 x Child Er
使用 SERVER_NAME 时出现 Flask 404

在我的 Flask 配置中我将 SERVER NAME 设置为 app example com 之类的域我这样做是因为我需要使用url for with external网址如果未设置 SERVER NAME Flask 会认为服务器

随机推荐

为以 exec 启动的进程设置自定义工作目录

我正在打电话execv在我的 C 代码中启动可执行文件但我想将其工作目录设置为自定义目录例如在一种情况下我正在启动ls 但它列出了我原始程序目录中的文件但我想将工作目录设置为自定义目录我将如何实现它这样我将其设置为 usr
无法将 Watson IoT Platform 连接到 Cloudant

一段时间以来我一直在尝试将 Watson IoT Platform 作为 Historian 服务连接到 Cloudant 数据库我遵循了各种可用教程中的说明但一项服务从未显示为与另一项服务的可能连接或扩展这是我尝试过的一个教程ht
ios 8 解析推送中没有声音[重复]

这个问题在这里已经有答案了这很奇怪更新我的应用程序以支持通过 Parse 使用 Parse 仪表板发送的 iOS 8 推送通知后推送通知不会发出任何声音我在 Stackoverflow 上发现了这个重复项但发布的答案对我不起作用
解析 JSON 到 MySQL 表

我正在使用 Zend Framework 1 12 我想创建一个基于 JSON 文件的表我已经创建了表及其字段现在它们都是长文本它所要做的就是将它们插入到正确的列中我遵循了这些例子 http www daniweb com web
代表和活动之间有什么区别？

代表和活动之间有什么区别两者不都包含对可以执行的函数的引用吗 An Event声明增加了一层抽象和保护delegate实例此保护可防止委托的客户端重置委托及其调用列表并且仅允许在调用列表中添加或删除目标
WCF 中未返回 DateTime.Kind

当处理DateTime具有 WCF 的对象返回DateTime对象丢失了Kind财产永远是DateTimeKind Unspecified即使我在退货之前手动更改它我在 WCF 端这样做了 dateFrom DateTime Spec
根据用户 ID 限制下拉选项

我问这个问题是因为我不确定解决问题的最佳方法问题我有一个预先填充的下拉列表其中包含 1 000 个左右的数字我需要根据使用下拉列表的用户来限制下拉列表中显示的数字我想到的解决方案使用 jQuery 隐藏所有数字使用 jQuer
Firebase：如何检查电子邮件是否在运行时经过验证

所以流程将是这样的用户通过 firebase 使用电子邮件和密码登录如果电子邮件经过验证他们将转到主要活动否则他们将进入验证电子邮件活动我想做的是当他们处于验证电子邮件活动时我将在 onCreate 方法中发送验证电子邮件然
有没有办法用#define 代替长命名空间？

假设我有一个很长的命名空间我不想一直输入它但我不想使用using namespace 任何一个我可以为此使用 define 吗 Example define glm quat glm gtc quaternion class Came
Javascript 网络摄像头捕获并使用 PHP 上传到服务器

我有一个页面使用 javascript 和 PHP 上传文件成功上传图像表单画布第二页已成功将网络摄像头捕获到画布并正确显示我正在尝试使用摄像头捕获实时CSS对象来调整图像上传脚本但什么也不做 html是折断 div div cl
Laravel Passport tokensExpireIn 似乎不起作用

我正在使用 Laravel 5 4 Passport 来创建 SPA 应用程序但是我能够使身份验证工作但访问令牌始终是短期令牌过期时间为 600 秒我无法通过以下方式增加过期时间 Passport tokensExpireIn C
如何在 pandas groupby 直方图中显示标签名称

我可以使用 pandas 在单个图中绘制多个直方图但缺少一些东西如何给出标签我只能绘制一个图形如何将其更改为layout 3 1 或其他内容另外在图1中所有的垃圾箱都填充了纯色很难知道哪个是哪个那么如何用不同的标记例如十
有没有有效的方法来禁用 HTML 表单中的自动完成功能？

当使用xhtml1 transitional dtddoctype 使用以下 HTML 收集信用卡号
Play2 如何从服务层而不是动作层管理事务？

我正在使用 Play2 1 1 Java 和 JPA2 0 以及 hibernate 实现通过代码控制事务而不是像下面那样使用 transactional 是正常的 JPA 代码风格有没有办法在 Play 上像下面这样工作或者如何使用
在 p5js 中将画布导出为 GIF/PNG

I use 原子编辑器我要实现20 秒 GIF用我的画布 saveFrames 有一个限制我猜即使我输入它也可以将 png 文件保存为短 gif 3 5 秒 saveFrames aa png 15 22 我发现了 CCapture
如何组织大型代码文件？

我越来越意识到任何单个文件中的代码通常可以很容易地跨越数百行尽管我知道实现可能是合理的但它仍然感觉混乱和无组织我知道在某些情况下需要大量代码但是组织所有代码的最佳方法是什么我考虑过将变量与方法分开 privates from p
Dart 中的函数类型定义/函数类型别名是什么？

我已经阅读了描述我明白它是一个函数类型别名 typedef 或函数类型别名为函数类型提供一个名称您可以在声明字段和返回类型时使用该名称当将函数类型分配给变量时 typedef 会保留类型信息 http www dartlang org
如何知道两个线程中哪个线程首先完成执行

我有两个线程 A 和 B 如果 A 先完成那么我必须执行 function1 否则如果 B 先完成我需要执行 function 2 我如何知道两个线程中哪一个先完成执行您可以使用以下内容仅当先前的值为空时才会设置该内容即使只有一个
未收到 ACTION_MY_PACKAGE_REPLACED

我正在使用 ACTION MY PACKAGE REPLACED 来接收我的应用程序更新或重新安装的信息我的问题是该事件永远不会被触发我尝试了 Eclipse 和真实设备这就是我所做的显现
Python：将原始字符串转换为字节字符串而不添加转义字符

我有一个字符串 BZh91AY SYA xaf x82 r x00 x00 x01 x01 x80 x02 xc0 x02 x00 x00 x9ah3M x07 lt xc9 x14 xe1BA x06 xbe x084 而且我要 b BZ

Python：将原始字符串转换为字节字符串而不添加转义字符

Python：将原始字符串转换为字节字符串而不添加转义字符 的相关文章

随机推荐

热门标签

Python：将原始字符串转换为字节字符串而不添加转义字符的相关文章