将八位字节字符串转换为 Unicode 字符串，Python 3

2024-01-04

我正在尝试使用 Python 3 将带有八进制转义 Unicode 的字符串转换回正确的 Unicode 字符串，如下所示：

"training\345\256\214\346\210\220\345\276\214.txt"是读入的字符串。

"training完成後.txt"是我想要获取的字符串的实际表示形式。

然而，在略读之后，似乎我能找到的 Python 3 的建议解决方案如下：

decoded_string = bytes(myString, "utf-8").decode("unicode_escape")

不幸的是，当应用于我的示例时，这似乎会产生错误的 Unicode 字符串：

'trainingÃ¥Â®Â\x8cÃ¦Â\x88Â\x90Ã¥Â¾Â\x8c.txt'

这对于字节文字以及 Python 2 来说似乎很容易做到，但不幸的是对于 Python 3 中的字符串似乎并不那么容易。非常感谢您的帮助，谢谢！ :)

假设您的起始字符串是带有文字反斜杠的 Unicode 字符串，您首先需要一个字节字符串才能使用unicode-escape编解码器，但八进制转义符是 UTF-8，因此您需要再次将其转换为字节字符串，然后解码为 UTF-8：

>>> s = r'training\345\256\214\346\210\220\345\276\214.txt'
>>> s
'training\\345\\256\\214\\346\\210\\220\\345\\276\\214.txt'
>>> s.encode('latin1')
b'training\\345\\256\\214\\346\\210\\220\\345\\276\\214.txt'
>>> s.encode('latin1').decode('unicode-escape')
'trainingå®\x8cæ\x88\x90å¾\x8c.txt'
>>> s.encode('latin1').decode('unicode-escape').encode('latin1')
b'training\xe5\xae\x8c\xe6\x88\x90\xe5\xbe\x8c.txt'
>>> s.encode('latin1').decode('unicode-escape').encode('latin1').decode('utf8')
'training完成後.txt'

请注意，latin1编解码器将 Unicode 代码点 U+0000 到 U+00FF 直接转换为字节 00-FF。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

string

python3x

Unicode

octal

将八位字节字符串转换为 Unicode 字符串，Python 3 的相关文章

安装后导入 fastai 库时出现错误

我想使用 fastai 库来执行文本处理我的第一份工作安装了 fastai 库我曾经后来导入过但是没有任何代码只是给出导入错误我正在使用Python 3 5 2 我的操作系统 Ubuntu 16 04 asd py from fa
Python 异常 - args 属性如何自动设置？

假设我定义了以下异常 gt gt gt class MyError Exception def init self arg1 pass 然后我实例化该类以创建异常对象 gt gt gt e MyError abc gt gt gt e ar
如何将列表中的每个项目转换为字符串，以便连接它们？ [复制]

这个问题在这里已经有答案了我需要加入一个项目列表列表中的许多项目都是从函数返回的整数值 IE myList append munfunc 我应该如何将返回的结果转换为字符串以便将其加入列表我是否需要对每个整数值执行以下操作 myLis
控制台应用程序中使用 Unicode 字符的 _tprintf

我正在从 Unicode 构建的控制台应用程序使用 C 和 Visual Studio 2008 执行这个简单的输出此代码旨在在 Windows 上运行 tprintf L Some sample string n 一切正常但是如果我
使用 WriteConsoleOutput 用 c# 编写 Unicode

我正在尝试使用WriteConsoleOutput来自 kernel32 dll 的函数但是我无法正确显示 unicode 字符它们总是显示为错误的字符我尝试过使用 Console OutputEncoding System Text
Python ctypes from_buffer 使用上下文管理器映射到内存映射文件（mmap）

我在用着ctypes from buffer 将 ctypes 结构映射到内存映射文件以执行某些任务通常这些文件包含结构化标头和二进制数据的串联 ctypes 结构允许稳定的二进制表示和对字段的简单 Python 访问在这方面是真正的
如何在Python中找到低精度浮点值的原始文本表示？

我遇到了显示问题floatPython 中的值从外部数据源加载它们是 32 位浮点数但这也适用于较低精度的浮点数以防万一这些值是由人类在 C C 中输入的因此与任意计算值不同与round数字很可能not预期的但不能被忽略
点击后 Dash DropDown 关闭

我不希望下拉菜单在选择值后关闭我希望它在我的页面上保持打开状态我正在使用 dcc Dropdown dcc Dropdown id job type options self options placeholder Select one
为什么Python 3中实例方法可以作为类方法调用？

考虑下面的类 class Foo object def bar self print self 在Python 2中 2 7 13 调用bar 作为类方法引发异常 gt gt gt Foo bar hello Traceback most
在 Django admin 中保存包含非 ASCII 字符的 ImageField 时出现 UnicodeEncodeError

我试图在 django admin inlines 中上传图像文件并在尝试上传文件名包含非 ascii 字符的文件时收到 UnicodeEncodeError File usr local lib python2 6 site packa
有什么理由不在Python中混合使用多处理和线程模块

我正在考虑使用Python来实现一个需要大量多线程的程序另一个要求是它将在桌面上运行因此拥有许多进程将使应用程序显得混乱且难以杀死在任务管理器中因此我正在考虑使用线程和多处理模块来减少进程数量据我了解 GIL 仅适用于单个进程
为什么函数会修改列表以及如何防止它发生？

我正在 Python 3 7 x 中调用一个函数并向其传递一个列表我愿意not希望修改列表在函数内部我复制了列表并对其进行修改函数完成后传递给函数的原始列表已被修改为什么会发生这种情况我该如何预防这是代码 def appen
没有窗口的 GetFontUnicodeRanges

有机会打电话吗GetFontUnicodeRanges没有窗户例如它可能是不允许与桌面交互的 Windows 服务目前我正在使用控制台应用程序对此进行测试 program UnicodeConsoleOutput APPTYPE CO
如何将 CString 传递给格式字符串 %s？

class MyString public MyString const std wstring s2 s s2 operator LPCWSTR const return s c str private std wstring s int
如何在 pygame 中水平翻转图像？

这是在 pygame 如何翻转图像假设一个图像猪向右看时向左看我按向左箭头键然后保持这样即使我不按任何键或者按向上和向下箭头键那么当我按向右箭头键时如何再次将其切换回向右看并使其保持这种状态即使我不按任何键或按向上和向
在 Swift 中删除字符串中第一个字符的最简洁方法是什么？

我想删除字符串中的第一个字符到目前为止我想到的最简洁的事情是 display text display text substringFromIndex advance display text startIndex 1 我知道我们不能用
使用 ABCMeta 和 EnumMeta 的抽象枚举类[重复]

这个问题在这里已经有答案了简单的例子目标是通过从两者派生的元类创建一个抽象枚举类abc ABCMeta and enum EnumMeta 例如 import abc import enum class ABCEnumMeta abc
采用迭代器而不是可迭代的方法[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案关于迭代器和可迭代对象仅是我的观察如果我错了请纠正我大多数构造函数数组类型将迭代器作为质量构造函数迭代器是显式创建的或
通过服务器端的服务帐户使用 gmail api，避免使用 OAUTH2 GUI

我有一个用 python 开发的应用程序它使用 SMTP 服务连接到 gmail 帐户这种类型的连接典型为访问不安全的应用程序不太安全的应用程序 https myaccount google com lesssecureapps 为
通过 subprocess.communicate 在 python 脚本之间传输 pickled 对象输出

我有两个 python 脚本 object generator py 它会腌制给定的对象并打印它另一个脚本 object consumer py 通过 subprocess communicate 选择第一个脚本的输出并尝试使用 pic

随机推荐

在 JS 中新建一行

你好我有这个 JS 代码 function myFunction var g var d new Date getDay switch d case 0 g Today it s Sunday break case 1 g Today i
如何发送 FastAPI 响应而不将用户重定向到另一个页面？

我正在使用 FastAPI 创建一个 API 它接收form data从 HTML 页面处理数据需要一些时间并返回一条消息说明此任务已完成这是我的后端 from cgi import test from fastapi import
安装 geopandas 的问题

我正在尝试在我的笔记本电脑 Windows 10 版本 1709 机器上安装 geopandas 执行 pip install geopandas 命令后我收到以下消息 command python setup py egg info
为什么jsp改变时tomcat不需要重启

我一直在使用JSP Servlet很长一段时间我知道每当我们改变任何东西Servlet我们需要重新启动 Tomcat 服务器才能获取更改如果 JSP 发生更改 tomcat 不需要重新启动据我所知JSP页面被转换成Servlet仅当编
如何检测浏览器中的链接复制情况？

昨天我和一个出租车司机聊天当他提到我是一名程序员时他告诉我几天前他经历了以下情况在尝试从浏览器地址栏中复制 URL 时出现一个消息框带有类似的消息请不要复制此链接而是注册我不是网络开发人员所以这可能是一个蹩脚的问题但我想
Jenkins 插件中的变量替换

我正在开发一个新的 Jenkins 插件该插件将在 Jenkins 作业的构建阶段执行并且要求允许用户在插件的作业配置中指定变量名称而不是文字值目的是当作业执行时用户指定的变量名称将被替换为与该变量关联的实际值并且插件将在运行
ASP.NET MVC - 动态样式表

我想让用户选择网站的背景颜色并将所选颜色保存在数据库中当用户登录时后台将显示正确的颜色基于以下website http www codeproject com KB aspnet CSSVariables aspx 我可以在范围内设置
如何有条件地为张量赋值[屏蔽损失函数]？

我想创建一个 L2 损失函数忽略标签值为 0 的值 gt 像素张量batch 1 包含标签同时output是净输出的张量两者的形状均为 None 300 300 1 labels mask tf identity batch 1 l
laravel phpexcel 更新中不明确的类解析

我尝试使用 php excel 更新 laravel 同时安装我在作曲家中发现了以下警告 Error Warning Ambiguous class resolution SettingsController was found in bo
可移植地处理 C++ 中的异常错误

我正在致力于将 Visual C 应用程序移植到 GCC 应该在 MingW 和 Linux 上构建现有代码使用 try except 1 在几个地方阻塞这样几乎没有什么除了内存不足类型错误会让程序退出而不做一些最小的日志记录使用
Git merge - 三路“git merge”

I am trying to simulate the example on three way merge process in git given here https git scm com book en v2 Git Branch
Psr7 Http Message，为什么不可变？

我正在看PSR 7 https github com php fig http message tree master src接口并思考如何实现它们我也一直在读这篇博文 http evertpot com psr 7 issues 显然
Vue.js：v-for完成后的事件

我正在尝试使用 Vue js 构建一个简单的聊天应用程序我的问题是当写入新消息时消息区域需要滚动到底部我使用 v for 指令循环遍历消息 v for 更新 DOM 时是否有事件我已经做到了以便消息区域 div 监听组件的消息数
时间序列作为 data.table 中的“ts”列？

我有多组时间序列数据希望帮助找出将它们放入 R 并使用 R 进行分析的最佳方法我对 data table 非常熟悉但对 R 不太熟悉ts支持时间序列分析的类我特别想知道如何使用ts http stat ethz ch R manua
Selenium - 如何在 iframe 上定位元素

我正在尝试在 iframe 中查找元素但我无能为力这是我的代码和我收到的错误这是我的脚本 public class Add Lists public static void main String args throws Interr
在android中滚动listView时重新加载图像

我正在尝试编写一个新闻列表应用程序我已经解析了来自服务器的 JSON 数据并创建了 CustomListAdapter 我的listView中有三个textView和imageView 它工作得很好图像已加载我将其设置为 imageV
使用 OnItemClickListener 从 ListView 和数据库中删除项目

我创建了一个数据库并设法将添加的项目显示到 ListView 中现在我需要一种方法来从 ListView 和数据库中删除项目 public class ZeigeFaecherListe extends AppCompatActivity
从详细 JSON 升级到 JSON 轻量级会对只查看数据而不查看元数据的人产生什么影响？

谁能用简单的英语简洁地向我解释一下 WCF 数据服务的详细 JSON 和 JSON light 之间的主要区别是什么我找到了微软的一份名为 JSON light at aglance 的文档不过有23页那么长我不关心元数据我只关心数
批处理文件打开窗口并调整其大小

我目前正在尝试通过批处理文件打开两个窗口然后调整它们的大小并移动它们分屏打开单独的窗口很容易 echo off cd C Program Files x86 Internet Explorer start iexplore exe c
将八位字节字符串转换为 Unicode 字符串，Python 3

我正在尝试使用 Python 3 将带有八进制转义 Unicode 的字符串转换回正确的 Unicode 字符串如下所示 training 345 256 214 346 210 220 345 276 214 txt 是读入的字符串 t

将八位字节字符串转换为 Unicode 字符串，Python 3

将八位字节字符串转换为 Unicode 字符串，Python 3 的相关文章

随机推荐

热门标签