制作 unicode 转义码的更有效方法

2024-02-02

我用的是python自动生成qsfQualtrics 在线调查文件。这qsf文件需要使用 unicode 字符进行转义\u+hex约定：'слово' = '\u0441\u043b\u043e\u0432\u043e'。目前，我通过以下表达式实现这一目标：

'слово'.encode('ascii','backslashreplace').decode('ascii')

输出正是我需要的，但由于这是一个两步过程，我想知道是否有更有效的方法来获得相同的结果。

如果您将输出文件打开为“wb”，那么它接受字节流而不是 unicode 参数：

s = 'слово'
with open('data.txt','wb') as f:
    f.write(s.encode('unicode_escape'))
    f.write(b'\n')  # add a line feed

这似乎做你想做的：

$ cat data.txt
\u0441\u043b\u043e\u0432\u043e

它避免了解码以及将 unicode 写入文本流时发生的任何翻译。

根据@J.F.Sebastian 的建议更新为使用encode('unicode_escape')。

%timeit 报告它比encode('ascii', 'backslashreplace') 快很多：

In [18]: f = open('data.txt', 'wb')

In [19]: %timeit f.write(s.encode('unicode_escape'))
The slowest run took 224.43 times longer than the fastest. This could mean that an intermediate result is being cached.
100000 loops, best of 3: 1.55 µs per loop

In [20]: %timeit f.write(s.encode('ascii','backslashreplace'))
The slowest run took 9.13 times longer than the fastest. This could mean that an intermediate result is being cached.
100000 loops, best of 3: 2.37 µs per loop

In [21]: f.close()

奇怪的是，尽管每次循环时间更快，但编码（'unicode_escape'）的 timeit 的滞后比编码（'ascii'，'backslashreplace'）的滞后要长得多，因此请务必在您的环境中测试两者。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

Unicode

characterencoding

制作 unicode 转义码的更有效方法的相关文章

在 django ORM 中查询时如何将 char 转换为整数？

最近开始使用 Django ORM 我想执行这个查询 select student id from students where student id like 97318 order by CAST student id as UNSIG
安装了 32 位的 Python，显示为 64 位

我需要运行 32 位版本的 Python 我认为这就是我在我的机器上运行的因为这是我下载的安装程序当我重新运行安装程序时它会将当前安装的 Python 版本称为 Python 3 5 32 位然而当我跑步时platform arch
当变量取特定值时如何使 PyCharm 中断？

我有一本大字典其中一些元素偶尔会出现非法值我想弄清楚非法值从何而来 PyCharm 应该不断监视我的字典的值一旦它们中的任何一个取了非法值它就应该中断并让我检查程序的状态我知道我可以通过为我的字典创建一个 getter sette
需要在python中找到print或printf的源代码[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在做一些我不能完全谈论的事情我
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
YOLOv8获取预测边界框

我想将 OpenCV 与 YOLOv8 集成ultralytics 所以我想从模型预测中获取边界框坐标我该怎么做呢 from ultralytics import YOLO import cv2 model YOLO yolov8n pt
Python beautifulsoup 仅限 1 级文本

我看过其他 beautifulsoup 得到相同级别类型的问题看来我的有点不同这是网站我正试图拿到右边那张桌子请注意表的第一行如何展开为该数据的详细细分我不想要那个数据我只想要最顶层的数据您还可以看到其他行也可以展开但在本例
Python，将函数的输出重定向到文件中

我正在尝试将函数的输出存储到Python中的文件中我想做的是这样的 def test print This is a Test file open Log a file write test file close 但是当我这样做时我收到
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
Cython 和类的构造函数

我对 Cython 使用默认构造函数有疑问我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
import matplotlib.pyplot 给出 AttributeError: 'NoneType' 对象没有属性 'is_interactive'

我尝试在 Pycharm 控制台中导入 matplotlib pyplt import matplotlib pyplot as plt 然后作为回报我得到 Traceback most recent call last File D Pr
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
如何解决 PDFBox 没有 unicode 映射错误？

我有一个现有的 PDF 文件我想使用 python 脚本将其转换为 Excel 文件目前正在使用PDFBox 但是存在多个类似以下错误 org apache pdfbox pdmodel font PDType0Font toUnico
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
在 JavaScript 函数的 Django 模板中转义字符串参数

我有一个 JavaScript 函数它返回一组对象 return Func id name 例如我在传递包含引号的字符串时遇到问题 Dr Seuss ABC BOOk 是无效语法 I tried name safe 但无济于事有什么解
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk

随机推荐

JsonConverter如何反序列化为通用对象

我通过 webapi 发送这个结构 DataContract public class PacketData public enum Opcodes Hello 0x00 Close 0x01 Serial 0x02 GPIO 0x04 D
模型类未声明显式 app_label 并且不在 INSTALLED_APPS 中的应用程序中

我正在使用 sphinx 并尝试为我的 Django 项目生成文档我决定首先尝试记录模型因此在我的 rst 文件中我这样做了 wdland models automodule wdland models members undoc me
如何检测innerHTML何时完成

我已经做了很多寻找这个问题的解决方案但到目前为止还没有找到一个可以跨浏览器工作的解决方案我需要的是一个原始的javascript函数一旦innerHTML成功插入到dom中它将接受一个元素并运行回调 e g var element
对 CUBEVALUE 中的多个度量求和

我尝试了多个不同的函数 CUBESET CUBEVALUE 等但我似乎无法找到一种方法来在同一公式中对多个度量求和关于如何完成这项工作有什么建议吗我进行了大量搜索但找不到方法想法如下但这不起作用 CUBEVALUE Connect
org.webrtc.RTCPeerConnection 无法将视频发布到服务器

我使用 webrtc 在会议中发送和获取视频子主视频正常显示但问题是视频没有发布到服务器我检查方法 setlocalDescription 没有返回错误这是我的sdp 有人可以帮忙吗我搜索了很多解决方案但我仍然不知道我的问题我
Oracle PLSQL IN() 子句中的数组

我将字符串数组 plcListchar 传递给存储过程我想在 IN 子句中使用这个字符串数组我不能在 IN 子句中直接使用 plcListchar 让我展示一下如何在 JAVA 中创建 plcListchar 字符串数组 String
github 操作workflow_run.conclusion 随机失败的任何解决方法吗？

我在用着workflow run conclusion按照以下方式发送工作流程通知github 文档 https docs github com en actions using workflows events that trigger
Python 与电报机器人中的关键字“from”冲突

我想使用 python telegram bot 在 Python 脚本中打印用户信息参考this https core telegram org bots api user page 但是当我打字时 print update messa
如何在 Azure 表存储中存储任意键值对？

背景我从客户端收到 CSV 数据文件其中包含大量我不需要的数据和少量我需要的数据将来我可能需要访问这些数据虽然我正在存档原始数据文件但我希望有一些更容易查询的东西我希望找到一个并不意味着数据文件保持相同格式的解决方案即客户端可
在 XNA 4.0 中绘制具有多个侧面的纹理立方体

几个小时以来我一直在努力解决这个问题我想做的是画一个立方体每一面都有不同的纹理或者更具体地说我希望能够指定每面我想要的任何纹理我用了这个例子here http www switchonthecode com tutorials c
GWT：如何更改 GWT Celltable 中的行颜色

我在 GWT 中有一个单元格表我可以通过此更改特定列的颜色 celltable addColumnStyleName 4 bluetext 但我怎样才能改变例如第3行的颜色 Thanks 您必须提供一个RowStyles返回每行的 css
什么是异步图片下载以及如何下载过多图片？

我有太多图像无法从网络下载到 iPhone 中如何使用异步图像下载构建应用程序最常见和最简单的方法是使用 NSURLConnection 进行异步请求与请求集委托创建连接当收到下一个数据块完成加载或失败时它开始在后台调用委托方法
Netbeans 可能存在错误，它正在执行我更改的旧代码

我一直在一个包含 500 多个类的项目中进行编码其中一个类负责从磁盘检索数据由于某些原因我更改了代码但是当我运行代码时它仍然执行类的旧代码当我调试时调试器会移过空行这意味着它仍然运行我更改的旧代码我多次清理和构建了该项目
片段 YouTubePlayerSupportFragment 中存在重复的 ID

我正在尝试使用 API Youtube 执行播放视频但在 XML 重复 ID 0x7f080039 中收到错误知道如何解决这个问题吗我的片段扩展了 YouTubePlayerSupportFragment Override publi
为什么`false && true || true` 评估为 true？

根据MDN 逻辑运算符 https developer mozilla org en US docs Web JavaScript Reference Operators Logical Operators page false 任何短路评
在Django项目中，如何通过迁移文件重建模型类？

在Django项目中如果模型文件夹文件被删除是否可以使用migrations文件夹文件来重建模型类 mohammadKazemSamiel 我用我的 Postgres 数据库尝试了以下操作 python manage py inspec
我可以使用 Gmail API 获取 Gmail 草稿的 URL 链接吗？

新的 Gmail API 允许我们创建和查看草稿但是有没有办法获得 URL 链接来查看草稿呢我可以使用草稿的 ThreadId 手动创建链接如下所示 https mail google com mail u 0 drafts comp
PHP 错误处理：die() 与trigger_error() 与 throw Exception

关于 PHP 中的错误处理据我所知有 3 种风格 die or exit style con mysql connect localhost root password if con die Could not connect mysql
无法设置 POSIX 消息队列属性

我的环境 CentOS 6 5 64位内核海湾合作委员会 4 4 7 20120313 我正在尝试设置 POSIX 消息队列的属性但代码不会更改该属性我只获得默认属性值你能指出我的代码有什么问题吗我以用户而不是 root 身份执
制作 unicode 转义码的更有效方法

我用的是python自动生成qsfQualtrics 在线调查文件这qsf文件需要使用 unicode 字符进行转义 u hex约定 u0441 u043b u043e u0432 u043e 目前我通过以下表达式实现这一目标 enco

制作 unicode 转义码的更有效方法

制作 unicode 转义码的更有效方法 的相关文章

随机推荐

热门标签

制作 unicode 转义码的更有效方法的相关文章