Python - 用 ASCII 字符替换 unicode 表情符号

2024-03-21

我当前的周末项目之一有问题。我正在编写一个 Python 脚本，它从不同来源获取一些数据，然后将所有内容输出到 esc-pos 打印机。正如您可能想象的那样，POS 打印机并不完全喜欢表情符号......

所以文本如下：

可爱!!!!!!!!????????????????????????????????

给我这个字符串：

'\u53ef\u7231!!!!!!!!\U0001f60d\U0001f60d\U0001f60d\U0001f60d\U0001f60d\U0001f60d\U0001f60d\U0001f61d'

当然，打印机输出的结果与我想要的完全不同。所以我需要用其他字符替换这些非 ASCII 字符。我并不真正关心第一个字符，但我确实关心表情符号。使用类似的东西：unidecode(str(text))至少会去掉它们，但我想将它们转换成更有用的东西。要么是经典的表情符号，例如 [:-D]，要么是 [心形眼睛的笑脸]。

我的问题是......人们将如何去做呢？为最常见的表情符号手动创建查找表似乎有点乏味，所以我想知道是否还有其他方法可以做。

与提示有关unicodedata.name以及一些进一步的研究，我设法将这个东西放在一起：

import unicodedata
from unidecode import unidecode

def deEmojify(inputString):
    returnString = ""

    for character in inputString:
        try:
            character.encode("ascii")
            returnString += character
        except UnicodeEncodeError:
            replaced = unidecode(str(character))
            if replaced != '':
                returnString += replaced
            else:
                try:
                     returnString += "[" + unicodedata.name(character) + "]"
                except ValueError:
                     returnString += "[x]"

    return returnString

基本上它首先尝试找到最合适的 ascii 表示形式，如果失败，它会尝试使用 unicode 名称，如果即使失败，它也只是用一些简单的标记替换它。

例如，采用这个字符串：

abcdšeđfčgžhÅiØjÆk 可爱!!!!!!!!!????????????????????????????????

并运行该函数：

string = u'abcdšeđfčgžhÅiØjÆk \u53ef\u7231!!!!!!!!\U0001f60d\U0001f60d\U0001f60d\U0001f60d\U0001f60d\U0001f60d\U0001f60d\U0001f61d'
print(deEmojify(string))

将产生以下结果：

abcdsedfcgzhAiOjAEk[x] 可艾!!!!!!!![心形笑脸眼睛][心形眼睛的笑脸][心形眼睛的笑脸心形眼睛][笑脸心形眼睛][笑脸心形眼][笑脸心形眼][微笑心形眼脸][吐舌脸紧闭双眼]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python - 用 ASCII 字符替换 unicode 表情符号的相关文章

为什么我的混淆矩阵只返回一个数字？

我正在做二元分类每当我的预测等于事实时我发现sklearn metrics confusion matrix返回单个值难道没有问题吗 from sklearn metrics import confusion matrix print
将 yerr/xerr 绘制为阴影区域而不是误差线

在 matplotlib 中如何将误差绘制为阴影区域而不是误差条例如而不是忽略示例图中各点之间的平滑插值这需要进行一些手动插值或者只是获得更高分辨率的数据您可以使用pyplot fill between https matpl
从字典的元素创建 Pandas 数据框

我正在尝试从字典创建一个 pandas 数据框字典设置为 nvalues y1 1 2 3 4 y2 5 6 7 8 y3 a b c d 我希望数据框仅包含 y1 and y2 到目前为止我可以使用 df pd DataFrame fr
尝试从网页Python和BeautifulSoup获取编码

我试图从网页检索字符集这会一直改变目前我使用 beautifulSoup 来解析页面然后从标题中提取字符集这工作正常直到我遇到一个网站到目前为止我的代码以及与其他页面一起使用的代码是 def get encoding soup
如何使用 Python boto3 获取 redshift 中的列名称

我想使用 python boto3 获取 redshift 中的列名称创建Redshift集群将数据插入其中配置的机密管理器配置 SageMaker 笔记本打开Jupyter Notebook写入以下代码 import boto3
检查 python 中命令行参数的数量

我是蟒蛇新手还是把脚弄湿了我正在尝试做这样的事情 import sys if len sys argv lt 3 or lt len sys argv gt 3 print This script will compare two fi
如何获取numpy.random.choice的索引？ - Python

是否可以修改 numpy random choice 函数以使其返回所选元素的索引基本上我想创建一个列表并随机选择元素而不进行替换 import numpy as np gt gt gt a 1 4 1 3 3 2 1 4 gt gt
如何将 sql 数据输出到 QCalendarWidget

我希望能够在日历小部件上突出显示 SQL 数据库中的一天就像启动程序时突出显示当前日期一样在我的示例中它是红色突出显示我想要发生的是当用户按下突出显示的日期时数据库中日期旁边的文本将显示在日历下方的标签上这是我使用 QT De
如何在 Python 中的函数入口、内部和退出处进行日志记录

我希望能够使用 Python 日志记录工具在我的代码中进行简单且一致的日志记录我能够执行以下操作我希望所有现有未来的模块和函数都有输入和完成日志消息我不想添加相同的代码片段来定义日志记录参数如下所示don t want t
在 Mac OSX 上从 Python 3.6 运行 wine 命令

我正在尝试用 Python 编写一个打开的脚本wine然后发送代码到wine终端打开一个 exe程序这 exe程序也是命令驱动的我可以打开wine 但我无法进一步 import shlex subprocess line usr bin
仅当某些值相等时，如何才能将一个文本文件中的值替换为另一个文本文件中的其他值？

我有一个名为finalscores txt我想创建一个 python 脚本它将打开它并从两个单独的列中读取值这是我的finalscores txt file Atom nVa predppm avgppm stdev delta QPr
在 Mac OS X 上安装 libxml2 时出现问题

我正在尝试在我的 Mac 操作系统 10 6 4 上安装 libxml2 我实际上正在尝试在 Python 中运行 Scrapy 脚本这需要我安装 Twisted Zope 现在还需要安装 libxml2 我已经下载了最新版本 2 7 7
时间序列数据预处理 - numpy strides 技巧以节省内存

我正在预处理一个时间序列数据集将其形状从二维数据点特征更改为三维数据点时间窗口特征在这样的视角中时间窗口有时也称为回顾指示作为输入变量来预测下一个时间段的先前时间步长数据点的数量换句话说时间窗口是机器学习算法在对
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
检索 geodjango 多边形对象的边界框

如何在 geodjango 中获取 MultiPolygon 对象的边界框在 API 中找不到任何内容http geodjango org docs geos html http geodjango org docs geos html
为正则表达式编写解析器

即使经过多年的编程我很羞愧地说我从未真正完全掌握正则表达式一般来说当问题需要正则表达式时我通常可以在一堆引用语法之后想出一个合适的正则表达式但我发现自己越来越频繁地使用这种技术所以自学并理解正则表达式properly 我决
基于值而不是类型的单次调度

我在 Django 上构建 SPA 并且有一个庞大的功能其中包含许多功能if用于检查我的对象字段的状态名称的语句像这样 if self state new do some logic if self state archive do s
使用 selenium 和 python 来提取 javascript 生成的 HTML？萤火虫？

这里是Python新手我遇到的是数据收集问题我在这个网站上当我用 Firebug 检查我想要的元素时它显示了包含我需要的信息的源然而常规源代码没有 Firebug 不会给我这个信息这意味着我也无法通过正常的 selenium
如何绘制更大的边界框和仅裁剪边界框文本 Python Opencv

我正在使用 easyocr 来检测图像中的文本该方法给出输出边界框输入图像如下所示 Image 1 Image 2 使用下面的代码获得输出图像 But I want to draw a Single Bigger bounding bo
Jupyter Notebook：带有小部件的交互式绘图

我正在尝试生成一个依赖于小部件的交互式绘图我遇到的问题是当我使用滑块更改参数时会在前一个绘图之后完成一个新绘图而我预计只有一个绘图会根据参数发生变化 Example from ipywidgets import interact i

随机推荐

从 ant 类路径中排除 jar

我正在尝试在一些使用 ant 脚本的遗留项目上进行干净的 Maven 设置我对蚂蚁了解不多所以我的问题可能显得很幼稚我快完成了但是由于类路径中存在冗余交付蚂蚁脚本失败了如果我理解构建这些行应该添加到提供范围内每个库的类路
多个构造函数与 Structuremap 改变范围？

为了说明问题这是我的设置的简化版本我有一家这样的工厂 public interface IFactory public class Factory IFactory public Factory Console WriteLine pa
同一 AWS Cognito 用户池中的多个应用程序对于同一用户来说 cognitoID 是否相同？

我有一个 Cognito 用户池可以与我的 iOS 和 Android 应用程序配合良好该池有一个客户端密钥我现在想建立网络身份验证 Cognito 的 javascript sdk 不支持使用应用程序客户端密钥配置的用户池假设我在
Google 的 Vision Api protobuf 对 Python 字典的响应对象

我正在开发一个项目需要使用 Google 的 Vision API 分析图像并将响应发布到 Dynamodb 表我已经成功实现了 Vision API 但无法将其响应转换为 Python 字典这是我尝试过的 if form is va
Pandas DF 有一列包含列表。如何使用此列表的每个值重复行？

我有一个像这样的熊猫数据框 title author year type 0 t1 a1 1980 article 1 t2 a2 a3 a4 1983 article 2 t3 a5 1982 article 3 t4 a6 1977 a
jQuery 验证中的正则表达式 - jQuery 中的单引号问题

我有一个正则表达式来验证密码是否包含数字小写和大写字符下面这个效果很好但是当我在 jQuery 验证中使用它时 txtPassword required true regex Regex Regex 8 16 d a z A Z am
如何使用脚本重新创建 IPython 的“--pylab”选项的效果？

我想创建一个与 IPython 执行相同操作的配置文件 pylab 用手标记为了实现这一目标脚本的内容应该是什么包导入名称空间指定设置等作为替代方案我还想知道是否有一种方法可以检查 pylab当前 IPython 会话启动时
什么是 ls -F (ls --classify) [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案看着普通旧版的手册页ls http linux die net man 1 ls我看到有一个标志 F F classify append
Int 转换不起作用[重复]

这个问题在这里已经有答案了我正在为我的游戏创建高分功能但无法让它发挥作用这是我的方法 def game over self Game over Screen keys pygame key get pressed self gameo
正则表达式麻烦，转义引号

基本上我正在传递一个字符串我需要以与 nix shell 标记命令行选项大致相同的方式对其进行标记假设我有以下字符串 Hello World Hello Universe Hi 我怎样才能把它变成一个三元素列表你好世界你好宇宙 H
magento 产品页面中买家需填写的字段

我一直在寻找但找不到类似的东西我需要创建一个产品页面买家在将产品添加到购物车之前将在其中填写一些文本字段大部分类似于此页面的内容 http bitly com Sw4jzR http bitly com Sw4jzR 添加到购物车时
在容器和主机之间共享“node_modules”文件夹

这是一个非常热门的话题但我从未真正找到解决方案您可能知道当我们在容器中有一个卷并且安装依赖项时使用npm i或其他东西从 Dockerfile 具有默认权限 Npm 将创建一个node modules容器中的文件夹root roo
使用多线程 vb.net 时更新文本框

My code Imports System IO Public Class Form1 Dim thread As System Threading Thread Dim thread2 As System Threading Threa
如何在Python中比较两个时区？

Example import pytz b pytz timezone Europe Rome c pytz timezone Europe Berlin 然而这两个时区具有不同的名称但代表相同的事物 b c 返回 false b zon
RStudio Run命令运行两次问题[重复]

这个问题在这里已经有答案了我在使用 RStudio 时遇到了一个奇怪的问题当我使用任何命令运行脚本时例如 Ctrl R Ctrl Enter 或 RStudio 上的实际运行命令该命令会运行两次我在互联网上找不到任何与此相关的信息
C++、多态性和迭代器

我想要一个存储接口抽象类和一组存储实现 SQLite MySQL Memcached 用于存储已知类的对象并从存储中检索子集对我来说清晰的界面是 class Storable int id blah blah blah string
JSP/GlassFish：如何正确设置 UTF-8 编码

我正在寻求帮助将堆栈中的所有层都转换为 UTF 8 编码我发现这篇好文章 http www javapractices com topic TopicAction do Id 206 http www javapractices com
AWS - 错误 504 - 网关超时 - Flask 应用程序

昨天我在 Amazon Elastic Beanstalk 上部署了我的第一个 Flask 应用程序应用程序正在运行但当我按下启动抓取过程的按钮时出现问题这个过程相当长可能需要大约 3 4 分钟显然在我按下按钮一分钟后我收到了
在 Microsoft SQL Server 中从十六进制文字插入 varbinary 值

我有一个 SpringBoot 应用程序我使用 jdbcTemplate 将一行插入到 mssql int numOfRowsAffected remoteJdbcTemplate update insert into dbo ELCOR
Python - 用 ASCII 字符替换 unicode 表情符号

我当前的周末项目之一有问题我正在编写一个 Python 脚本它从不同来源获取一些数据然后将所有内容输出到 esc pos 打印机正如您可能想象的那样 POS 打印机并不完全喜欢表情符号所以文本如下可爱给我这个字符串 u53ef

Python - 用 ASCII 字符替换 unicode 表情符号

Python - 用 ASCII 字符替换 unicode 表情符号 的相关文章

随机推荐

热门标签

Python - 用 ASCII 字符替换 unicode 表情符号的相关文章