如何在 python 中正确打印 unicode 字符列表？

2023-12-22

我正在尝试在 python 字符串中搜索表情符号。所以我有，例如，

em_test = ['\U0001f680']
print(em_test)
['????']
test = 'This is a test string ????????????'
if any(x in test for x in em_test):
    print ("yes, the emoticon is there")
else: 
    print ("no, the emoticon is not there")

yes, the emoticon is there

如果在中搜索 em_test

'这是一个测试字符串????????????'

我其实可以找到它。

所以我制作了一个 csv 文件，其中包含我想要通过其 unicode 定义的所有表情符号。 CSV 看起来像这样：

\U0001F600

\U0001F601

\U0001F602

\U0001F923

当我导入它并打印它时，我实际上没有得到表情符号，而只是得到文本表示：

['\\U0001F600',
 '\\U0001F601',
 '\\U0001F602',
 '\\U0001F923',
...
]

因此我不能用它来搜索另一个字符串中的这些表情符号...... 我以某种方式知道双反斜杠 \ 仅表示单斜杠，但不知何故 unicode 阅读器无法理解它......我不知道我错过了什么。

有什么建议么？

您可以使用以下命令解码这些 Unicode 转义序列.decode('unicode-escape')。然而，.decode is a bytes方法，因此如果这些序列是文本而不是字节，您首先需要将它们编码为字节。或者，您（可能）可以以二进制模式打开 CSV 文件，以便将这些序列读取为bytes而不是作为文本字符串。

只是为了好玩，我也会使用unicodedata获取这些表情符号的名称。

import unicodedata as ud

emojis = [
    '\\U0001F600',
    '\\U0001F601',
    '\\U0001F602',
    '\\U0001F923',
]

for u in emojis:
    s = u.encode('ASCII').decode('unicode-escape')
    print(u, ud.name(s), s)

output

\U0001F600 GRINNING FACE ????
\U0001F601 GRINNING FACE WITH SMILING EYES ????
\U0001F602 FACE WITH TEARS OF JOY ????
\U0001F923 ROLLING ON THE FLOOR LAUGHING ????

这应该比使用快得多ast.literal_eval。如果您以二进制模式读取数据，速度会更快，因为它避免了读取文件时的初始解码步骤，并且允许您消除.encode('ASCII') call.

您可以使用以下方法使解码更加稳健

u.encode('Latin1').decode('unicode-escape')

但这对于您的表情符号数据来说不是必需的。正如我之前所说，如果以二进制模式打开文件以避免对其进行编码，那就更好了。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

string

Unicode

emoticons

如何在 python 中正确打印 unicode 字符列表？的相关文章

ValueError：“连接”层需要具有匹配形状的输入（连接轴除外）

我正在尝试为我的项目构建 Pix2Pix 并收到错误值错误 Concatenate层需要具有匹配形状的输入除了连接轴之外获得输入形状 None 64 64 128 None 63 63 128 生成器是一个 U 网模型我的输入高度
ipdb 和 pdb++ 之间的区别？

Python 有一个名为 pdb 的默认调试器但社区创建了一些替代品其中两个是ipdb https github com gotcha ipdb and pdb https github com pdbpp pdbpp 它们似乎迎合了相
帮助需要在可选条件下编写正则表达式[关闭]

我有一个日志文件包含如下内容 log Using data from yyyy mm dd 2011 8 3 0 files queued for scanning Warning E test H ndler pdf File not F
静态文件配置不正确

我已经在 Heroku 上部署了简单的博客应用程序它运行在Django 1 8 4 我在静态文件方面遇到了一些问题当打开我的应用程序时我看到Application Error页面所以我尝试调试它并发现当我提交到 Heroku 时它无
如何在 Django 管理中以表格格式显示添加模型？

我刚刚开始使用 Django 编写我的第一个应用程序为我的家庭设计的家务图表管理器在本教程中它向您展示了如何添加相关对象 http docs djangoproject com en dev intro tutorial02 cust
我怎样才能在python cgi中找到上传的文件名

我制作了如下简单的网络服务器 import BaseHTTPServer os cgi import cgitb cgitb enable html
如何在Python中的BeautifulSoup4中使用.next_sibling时忽略空行

由于我想删除 html 网站中重复的占位符因此我使用 BeautifulSoup 的 next sibling 运算符只要重复项位于同一行就可以正常工作参见数据但有时它们之间有一个空行所以我希望 next sibling 忽略它
在 Python 3 中动态导入模块的问题

我遇到的情况是在我的 Python 3 项目中在运行时必须包含某些模块我在用着importlib import module为了这第二次更新我确实找到了一种方法来做一些接近我想要的事情一些额外的代码可能会使我的一些链接稍微偏离一
将 matplotlib png 转换为 base64 以在 html 模板中查看

背景你好我正在尝试制作一个简单的网络应用程序按照教程计算阻尼振动方程并将结果的 png 返回到 html 页面然后将其转换为 Base64 字符串 Problem 该应用程序运行正常只是在计算结果时返回损坏的图像图标可能是因为
Selenium Webdriver - Python - leboncoin - pb 选择带重音的按钮

我正在尝试在以下网站上自动填写表格 https www leboncoin fr https www leboncoin fr 我用 Selenium IDE 录制了一个脚本我有一个通过单击 Se 连接器按钮并填写我的密码和用户名来自动
Pyinstaller --onefile 警告文件已存在但不应存在

跑步时Pyinstaller onefile 并开始得到结果 exe 会出现多个弹出窗口并显示以下警告 WARNING file already exists but should not C Users myuser AppData L
如何在ggplot2中使用希腊符号？

我的类别需要用希腊字母命名我在用ggplot2 并且它与数据配合得很好不幸的是我无法弄清楚如何将这些希腊符号放在 x 轴上在刻度线处并使它们出现在图例中有什么办法可以做到吗更新我看了一下link https github c
如何使用 jira-python 设置 fixVersions 字段

我正在尝试使用 jira python 模块 http jira python readthedocs org en latest 更新现有的 JIRA 具体来说我正在尝试设置问题的fixesVersion 列表我已经尝试了一段时间但没
在 MATLAB 中创建共享库

一位研究人员在 MATLAB 中创建了一个小型仿真我们希望其他人也能使用它我的计划是进行模拟清理一些东西并将其变成一组函数然后我打算将其编译成C库并使用SWIG https en wikipedia org wiki SWIG创建一
如何使用 msgpack 进行读写？

如何序列化反序列化字典data with msgpack http msgpack org The Python 文档 http msgpack python readthedocs io en latest badge latest似乎
提交表格并上传带有请求的文件

我正在努力提交特定的表格蟒蛇请求 http www python requests org 我想使用它的网站上的其他表单工作正常我可以提交登录表单等这只是我遇到问题的文件上传显然提交表单效果很好因为我从网站收到一条消息说请返回
Floyd-Warshall 算法：获取最短路径

假设一个图由一个表示n x n维数邻接矩阵我知道如何获得所有对的最短路径矩阵但我想知道有没有办法追踪所有最短路径 Blow是python代码实现 v len graph for k in range 0 v for i in range
python中打印字符串的长度

有没有什么方法可以找到即使是最好的猜测 Python中字符串的打印长度例如 potaa bto 是 8 个字符len但 tty 上只打印 6 个字符宽预期用途 s potato x1b 01 32mpotato x1b 0 0mp
使 matplotlib 图形默认看起来像 R？

Is there a way to make matplotlib behave identically to R or almost like R in terms of plotting defaults For example R t
如何使用 Python 将我的 GoPro Hero 4 相机直播连接到 openCV？

我在尝试从我的新 GoPro Hero 4 相机捕获实时流并使用 openCV 对其进行一些图像处理时遇到麻烦这是我的试用创建的窗口上没有显示任何内容 import cv2 import argparse import time imp

随机推荐

silverlight xaml c# 中只有两个圆角的图像

我如何在 xaml 中显示图像only two圆角
在不同应用程序域上运行时 SynchronizationContext.Current 为 null

我有一个 Web 应用程序在一台机器上运行服务在另一台机器上运行即两者都在不同的应用程序域中我的服务层中有一个工作流服务它从 SynchronizationContext Current 获取同步上下文我得到的 Synchroni
Firedrill：从开发人员克隆重新创建 Github（或任何其他中央）存储库

假设您有一个带有中央主 git 存储库的场景开发人员和 CI 引擎可以从中进行克隆 IE 非常接近传统的非分布式版本控制系统设置具有中央集线器和许多节点这可以是像 Github Gitlab Savannah Azure 等这样的云
确定任何打开的 IE 窗口的 URL

有谁知道如何获取计算机上任何打开的 IE 进程的 URL 我根本不需要操作 IE 实例只需获取有关当前加载的页面的信息即可 Thanks 这似乎是一种方法代码是 Visual Basic 抱歉但它显示了原理 Private Decla
HTML 表单/CSS - “位置”应该位于封闭的 DIV 或封闭的控件上吗？

哪个是对的 div class TEdit div
Php Artisan 服务命令不服务 Laravel 5.8

我安装了一个新的 Laravel 实例使用版本 5 8 一路上我发现我无法使用普通的 Laravel 为该项目提供服务php artisan serve命令经过大量试验和错误的研究后我发现了这个answer https stacko
图像函数或 .insertImage 不适用于 Google Apps 脚本和表格

我目前正在使用一个脚本当某人提交表单时自动从我的驱动器中提取他们的照片我一直在使用 Google Sheets 的 image 函数以及以下脚本来实现此目的 function imageUpdate var images DriveA
如何使用 HTML/JavaScript 强制下载？

我有一个链接如果用户单击它我需要发生两件事正确的 HTTP 响应会发送给用户尤其是Content Type video mp4 并且视频文件将自动开始下载我在 PHP 中见过类似的东西但是只有 HTML JavaScript 才
C# - 垃圾收集

好的我了解堆栈和堆值位于堆栈上引用位于堆上当我声明一个类的新实例时它位于堆上并引用堆栈上内存中的这一点我还知道 C 有自己的垃圾收集即它确定实例化类何时不再使用并回收内存我有两个问题我对垃圾收集的理解是否正确我可以自
验证 Windows 文件名

如何确定给定字符串是否是有效的 Windows 文件名我正在考虑一些可以给出字符串并返回布尔值的函数它应该检查不允许的字符和保留字 CON PRN 等 isValidWindowsFilename readme txt true is
Rails 3 不适用于 Windows 7

红宝石 1 8 7 宝石1 3 7 导轨 3 0 0 3 0 0 rc 当我写rails v时错误信息来了在任何 gem 源中都找不到 gem mysql2 0 runtime gt 尝试运行捆绑安装当我运行bundle insta
Java正则表达式匹配开始/结束标签导致堆栈溢出

标准执行情况Java Pattern类使用递归来实现多种形式的正则表达式例如某些运算符交替这种方法会导致输入字符串超过相对较小长度的堆栈溢出问题该长度甚至可能不超过 1 000 个字符具体取决于所涉及的正则表达式一个典型的
MS-SQL 按降序对输出进行排序

我有一个 MS SQL 查询数据库中有数千行记录 SELECT DISTINCT TOP 7 DATENAME MM mydatetime CAST DAY mydatetime AS VARCHAR 2 as thedate MONTH
MASM SEG 运营商

假设我们正在使用 MASM 6 1 16 位大数据模型编写汇编代码并且我们有一个名为 MY VAR 的变量标签一个名为 MY SEG 的段和一个名为 MY GROUP 的段组假设 MY VAR 放置在 MY SEG 中并且 MY
使用 Powershell 监听按键，但不要等待

我正在尝试编写一个定期切换大写锁定键的脚本但我也希望能够切换该脚本因为它会导致其他功能出现一些问题例如 alt tab 键以及滚动任务栏中的窗口以查看预览到目前为止我的脚本是 outer while true do echo To
如何在 Blazor 中执行客户端 UI 事件

我刚刚开始使用 Blazor 我已经看到了这个新框架的巨大潜力不过我想知道它将如何处理简单的事情例如将焦点设置在输入控件上例如在处理单击事件后我想将焦点设置到文本输入控件我是否必须使用 JQuery 来完成类似的事情或者 B
使用 SQLAlchemy 正确的文件结构以及如何将数据添加到数据库

我正在尝试构建一个简单的博客平台来学习Python和Flask 我正在使用 SQLAlchemy 连接到 Heroku 和 Flask s3 上托管的 Postgres 数据库以提供来自 AWS 存储桶的静态文件我主要是遵循这个 htt
google.maps.places 及其自动完成方法未定义

我正在加载谷歌地图 API https developers google com maps documentation javascript jQuery http jquery com 和这个地理完整 http ubilabs gith
在 Spring 框架下：警告：警告找不到记录器的附加程序（org.springframework.web.context.ContextLoader）

我花了一整天的时间试图解决 web 应用程序中使用 log4j 时遇到的日志记录问题无论我做什么我都无法摆脱以下问题 log4j WARN No appenders could be found for logger org sprin
如何在 python 中正确打印 unicode 字符列表？

我正在尝试在 python 字符串中搜索表情符号所以我有例如 em test U0001f680 print em test test This is a test string if any x in test for x in em

如何在 python 中正确打印 unicode 字符列表？

如何在 python 中正确打印 unicode 字符列表？ 的相关文章

随机推荐

热门标签

如何在 python 中正确打印 unicode 字符列表？的相关文章