如何在 Python 中将代理对转换为普通字符串？

2024-04-25

这是后续如何将包含 Unicode 代理项对的 JSON 编码数据转换为字符串？ https://stackoverflow.com/questions/38106422/converting-to-emoji。在这个问题中，OP 有一个json.dumps()- 带有表示为代理对的表情符号的编码文件 -\ud83d\ude4f。他们在读取文件和正确翻译表情符号时遇到问题，并且正确的answer https://stackoverflow.com/a/38145581/1426065 was to json.loads()文件中的每一行，以及json模块将处理从代理对到（我假设是 UTF8 编码）表情符号的转换。

所以这是我的情况：假设我只有一个常规的 Python 3 unicode 字符串，其中有一个代理对：

emoji = "This is \ud83d\ude4f, an emoji."

我如何处理这个字符串以获得的表示emoji http://apps.timwhitlock.info/unicode/inspect?s=%F0%9F%99%8F出来了吗？我希望得到这样的东西：

"This is ????, an emoji."
# or
"This is \U0001f64f, an emoji."

我试过了：

print(emoji)
print(emoji.encode("utf-8")) # also tried "ascii", "utf-16", and "utf-16-le"
json.loads(emoji) # and `.encode()` with various codecs

通常我会收到类似的错误UnicodeEncodeError: XXX codec can't encode character '\ud83d' in position 8: surrogates no allowed.

我在 Linux 上运行 Python 3.5.1，$LANG set to en_US.UTF-8。我已经在命令行上的 Python 解释器中以及在 Sublime Text 中运行的 IPython 中运行了这些示例 - 似乎没有任何差异。

你混合了一个文字字符串\ud83d在磁盘上的 json 文件中（六个字符：\ u d 8 3 d) and a single特点u'\ud83d'（在 Python 源代码中使用字符串文字指定）在内存中。这是之间的区别len(r'\ud83d') == 6 and len('\ud83d') == 1在 Python 3 上。

如果你看到'\ud83d\ude4f'Python 字符串 (2字符）那么上游有一个错误。通常，您不应该得到这样的字符串。如果你得到了一个，但你无法修复生成它的上游；你可以使用修复它surrogatepass错误处理程序：

>>> "\ud83d\ude4f".encode('utf-16', 'surrogatepass').decode('utf-16')
'????'

Python 2 更加宽松 http://bugs.python.org/issue26260.

注意：即使您的 json 文件包含文字 \ud83d\ude4f (12人物）;你不应该得到代理对：

>>> print(ascii(json.loads(r'"\ud83d\ude4f"')))
'\U0001f64f'

注意：结果是1特点（'\U0001f64f'），而不是代理对（'\ud83d\ude4f').

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Python 中将代理对转换为普通字符串？的相关文章

如何在多个端口上运行 FastAPI 应用程序？

我有一个 FastAPI 应用程序正在使用 Uvicorn 以编程方式在端口 30000 上运行现在我也想在端口 8443 上运行相同的应用程序相同的应用程序需要在这两个端口上运行我怎样才能在Python代码中做到这一点最小可重现
Google PubSub 在阻止和等待消息时没有标准输出

我正在使用这个问题底部的 Python 代码监听 Google PubSub 消息它实际上是来自 Google 的异步拉取示例我运行我的程序并输出到文件 python my script py tee log txt 如果我在接收消息时
pyqt5调用url时处于无响应状态

我刚刚在 pyqt 中实现了登录但在调用 url 和获取响应之间 qt 窗口显示无响应状态谁能建议我如何避免不响应状态 code class Login QDialog def init self height width parent
使用另一个索引数组正确索引多维 Numpy 数组

我正在尝试索引多维数组P与另一个数组indices 它指定我想要沿最后一个轴的哪个元素如下所示 import numpy as np M N 20 10 P np random rand M N 2 9 index into the la
Python 有哪些重要的语言特性（习语）需要尽早学习[重复]

这个问题在这里已经有答案了我有兴趣了解 StackOverflow 社区认为 Python 的重要语言特性习语是什么将程序员定义为 Pythonic 的特征 Python pythonic 习语 Python 语言自然的或特有的代
TensorFlow 未编译为使用 SSE（等）指令，但这些指令是可用的

我第一次使用一些示例代码运行 TensorFlow 运行代码时我收到以下警告有谁知道为什么会发生这种情况以及如何解决它 2017 03 31 02 12 59 346109 W c tf jenkins home workspace re
使用光栅重新投影 .tiff 文件：CRSError：无法解析 WKT。 OGR 错误代码 6

我正在尝试使用以下代码将 tiff 文件重新投影到 EPSG 32638 我安装过的版本光栅版本 1 1 5 Numpy 版本 1 18 1 这是我正在使用的代码 https rasterio readthedocs io en late
将 Pandas 列转换为日期时间

我在 pandas DataFrame 中有一个字段以字符串格式导入它应该是一个日期时间变量如何将其转换为日期时间列然后根据日期进行过滤 Example raw data pd DataFrame Mycol 05SEP2014 00
计算两个表中等效行的交集

我有两个 FITS 文件让我们考虑一下例如第一个文件有 100 行和 2 列第二个文件有 1000 行和 2 列 FITS FILE 1 FITS FILE 2 A B C D 1 2 1 2 1 3 1 2 2 4 1 2 我需要采取
如何在 Ubuntu 上通过 pip 安装 python3 版本的软件包？

我两者都有python2 7 and python3 2安装在Ubuntu 12 04 符号链接python链接到python2 7 当我输入 sudo pip install package name 它将默认安装python2的版本pa
dataframe KeyError，尽管它存在

鉴于数据 rows x 1 y 2 z 3 x 2 y 2 z 3 如果我尝试构建这样的数据框 frame pd DataFrame from records rows index x 效果很好然而这 frame pd DataFram
如何使用 OpenCV 检测图像帧中的对象？

我正在使用 Raspberry Pi 开发一个漫游器它将清扫房间并捡起掉落在地上的物体为了检测物体我使用了在流动站操作开始时拍摄的参考图像以及每 10 秒单击一次的图像新图像为了确定图像帧是否发生变化我在参考图像和新图像之间进
如何在 Microsoft Azure 中提取 Blob 存储中的 Blob 的上次修改日期

我对 MS Azure 的世界还很陌生我正在尝试使用 Python 获取保存在我的 blob 存储中的一堆文件块 blob 的文件名和最后修改日期这是我正在使用的代码 import datetime from azure storag
如何让 list_blobs 表现得像 gsutil

我只想获得 GCS 上假文件夹结构的第一级如果我运行例如 gsutil ls gs gcp public data sentinel 2 tiles 我得到一个这样的列表 gs gcp public data sentinel 2 til
Pandas：Drop() int64 基于值返回对象

我需要删除其中一列低于某个值的所有行我使用了下面的命令但这将列作为对象返回我需要将其保留为int64 df customer id df drop df customer id df customer id lt 9999999 in
如何使用电子表格中的第一行作为 Dataframe 列名称而不是 0 1 2...等？

我希望我的数据框将第一行名称显示为数据框列名称而不是从 0 等编号我该如何执行此操作我尝试使用 pandas 和 openpyxl 模块将我的 Excel 电子表格转换为数据框 import pandas as pd from ope
如何使用 Google Drive API 通过服务帐户访问域中的共享文件？

我一直在尝试从 Python 3 7 脚本访问有关 Google Shared Drive 文件的一些简单信息上次修改共享云端硬盘上的 Google 表格文件的时间我创建了一个服务帐户在 GCP Drive API 菜单中它可以通过
Django - 在启动时执行代码

我正在使用 Django 1 9 3 我有一个包含多个应用程序的项目我想在项目启动时更新其中一个应用程序的表用例例如假设我想在我的网站上销售商品我有一个包含模型项目的应用程序我在 Django 之外有一个网络服务它提供服务 g
Mac OS X 上的 Python 框架和非框架构建之间的差异

Question Mac OS X 上的 Python 框架构建和非框架构建即标准 UNIX 构建之间有什么区别另外各自的优点和缺点是什么初步研究以下是我在发布此问题之前找到的信息 Pythonmac SIG Why is Fr
从tensorflow 2.0 beta中的tf.data.Dataset检索下一个元素

在tensorflow 2 0 beta之前要从tf data Dataset中检索第一个元素我们可以使用迭代器如下所示 usr bin python import tensorflow as tf train dataset tf

随机推荐

无法通过 WSO2 API Manager 中的自定义中介流中的呼叫中介器

在 WSO2 AM 1 10 中创建自定义中介流以实现 API 链接作为第一步我创建了此流程作为测试它调用 REST 服务以生成令牌并将响应返回给客户端
Java Swing 组件中的 HTML 标签

向 Swing 组件例如 JLabels 添加 HTML 标签是否会使 JFrame 的渲染速度变慢我的意思是 Swing 组件中 HTML 渲染的性能如何是的这取决于你的 html 的复杂程度实际上当你的 jlabel 中有
jquery 自动完成不响应动态插入的元素

我们正在研究使用 jquery 动态插入元素的自动完成之前对静态元素进行过自动完成下面是插入一个自动完成添加元素的 html 源代码同一页面上可能插入多个元素插入元素的 id 在插入之前是未知的 id 因元素而异
在 jupyter 中 for 循环播放音频

我有大量需要注释的训练数据为了做到这一点我需要听一堆声音片段并记下我听到的内容我在笔记本上为此写了一个小脚本我的主要问题是 IPython 显示不循环显示举个例子 import numpy import IPython displ
在没有活动的情况下启动应用程序，我的广播接收器不工作

在我的应用程序中我有一个广播接收器用于捕获发送到手机的消息
Observer() 的结果似乎没有考虑 PyEphem 中的海拔影响

我对 PyEphem 模块给出的与 Observer 查询相关的结果以及海拔的影响进行了查询我从几个来源了解到例如http curious astro cornell edu question php number 388 http c
如何在 Spring MVC 中执行自定义验证？

我有以下代码允许用户更新姓名和年份 Model Entity public class Person implements Serializable private static final long serialVersionUID 1
如何使用 jax-rs 子资源定位器处理持久性上下文（EntityManager）？

我在我的应用程序中使用 jax rs Restful Web 服务和子资源定位器但是将entityManager 传递给子资源后我无法在此子资源中保留任何新对象然而 entityManager 允许我查询它的数据这是我的主要资源
类型错误：无法读取未定义的属性“directoryExists”

更新我的 Angular 2 CLI 项目1 0 0 beta 11 webpack 2 to 1 0 0 beta 11 webpack 8 via ng init 并运行ng serve结果出现以下错误 NG Live Developm
在头文件中使用结构“未知类型”错误

我在 Kubuntu 中使用 Kdevelop 我在 datasetup h 文件中声明了一个结构 ifndef A H define A H struct georeg val int p double h double hfov dou
如何链接到 MUI 迷你抽屉侧边栏中的另一个页面？

我尝试用封装我的 ListItem 组件但它不起作用我也尝试使用历史选项但这让我感到困惑我的代码和框 codesandbox io s funny einstein deuqhi file src App js 这是我的 side
TransactionScope() 和并行查询执行

我们尝试在事务范围内运行并行查询以提高代码的性能我们要在数据库中进行几项彼此没有连接的更改我们可以这样运行代码 using var tran new System Transactions TransactionScope await
精度和规模有什么区别？

Oracle中精度和小数位数有什么区别在教程中他们通常在创建主键时将比例保留为空并将精度设置为 6 精度和规模代表什么精度 4 尺度 2 99 99 精度 10 小数位数 0 9999999999 精度 8 标度 3 99999 99
如何将数据过滤器添加到我的谷歌表格标题

我想在我的谷歌工作表的标题中添加一个过滤器我发现这个答案 https stackoverflow com questions 38111483 looking for examples how to use the google shee
站点启用/中不允许使用 nginx“mail”和“stream”指令

当我尝试在 nginx 中使用流或邮件指令时遇到问题我正在使用 nginx 1 16 1 和 Ubuntu 18 04 4 LTS 这是我的 nginx conf user www data worker processes auto p
如何使用 VS Code 编辑 kubernetes pod 容器中的代码？

通常如果我有远程服务器我可以使用 ssh 访问它并且 VS Code 提供了一个漂亮的扩展用于编辑和调试远程服务器的代码但是当我在 Kuberneters 中创建 pod 时我无法真正通过 ssh 进入容器因此我无法编辑 po
Swift：多个本地通知，但只显示最新的

我想在一天中的某些时间显示本地通知并且我应该只能在通知中心看到一个最新通知然而我的问题是 1 如果我将本地通知设置为不同的标识符我会收到多个通知这是预期的但不是我想要的 2 如果我有一个标识符并将其设置为所有时间我只会在我设
Django 覆盖bulk_create

如何重写bulk create方法我试试这个 class SomeModel models Model field models CharField def bulk create self objs batch size None do
如何在 F# 列表和 F# 元组之间进行转换？

有没有办法在 F List 和 F Tuple 之间进行转换例如 1 2 3 gt 1 2 3 1 2 3 4 gt 1 2 3 4 我需要两个函数来做到这一点 let listToTuple list let tupleToList t
如何在 Python 中将代理对转换为普通字符串？

这是后续如何将包含 Unicode 代理项对的 JSON 编码数据转换为字符串 https stackoverflow com questions 38106422 converting to emoji 在这个问题中 OP 有一个json

如何在 Python 中将代理对转换为普通字符串？

如何在 Python 中将代理对转换为普通字符串？ 的相关文章

随机推荐

热门标签

如何在 Python 中将代理对转换为普通字符串？的相关文章