在python中将unicode文本输出到RTF文件

2024-02-23

我正在尝试从 python 脚本将 unicode 文本输出到 RTF 文件。对于背景，维基百科 https://en.wikipedia.org/wiki/Rich_text_format#Character_encoding says

对于 Unicode 转义，使用控制字 \u，后跟给出 Unicode UTF-16 代码单元编号的 16 位有符号十进制整数。为了使不支持 Unicode 的程序受益，后面必须跟上指定代码页中该字符的最接近的表示形式。例如，\u1576？会给出阿拉伯字母 bā´ à，指定不支持 Unicode 的旧程序应将其呈现为问号。

还有这个关于从Java输出RTF的问题 https://stackoverflow.com/questions/7894772/writing-unicode-to-rtf-file and 这是关于在 C# 中这样做的 https://stackoverflow.com/questions/1368020/how-to-output-unicode-string-to-rtf-using-c.

但是，我不知道如何从Python将unicode代码点输出为“具有Unicode UTF-16代码单元编号的16位有符号十进制整数”。我试过这个：

for char in unicode_string:
    print '\\' + 'u' + ord(char) + '?',

但在文字处理器中打开时，输出只会呈现为乱码；问题似乎是它不是 UTF-16 代码。但不知道如何得到它；虽然可以用utf-16编码，但是如何获取编码号呢？

顺便说一句，PyRTF 不支持 unicode（它被列为“todo”），虽然 Pyrtf-NG 应该这样做，但该项目似乎没有维护并且几乎没有文档，所以我对在准项目中使用它持谨慎态度。 -生产系统。

Edit:我的错。上面的代码中有两个错误 - 正如下面 Wobble 所指出的，字符串必须是 unicode 字符串，而不是已经编码的字符串，并且上面的代码生成的结果中字符之间有空格。正确的代码是这样的：

convertstring=""
for char in unicode(<my_encoded_string>,'utf-8'):
    convertstring = convertstring + '\\' + 'u' + str(ord(char)) + '?'

这工作得很好，至少对于 OpenOffice 来说是这样。我将其留在这里作为其他人的参考（在下面的讨论后进一步纠正了一个错误）。

根据您最新编辑的信息，我认为该功能可以正常工作。除了下面的改进版本。

def rtf_encode(unistr):
    return ''.join([c if ord(c) < 128 else u'\\u' + unicode(ord(c)) + u'?' for c in unistr])

>>> test_unicode = u'\xa92012'
>>> print test_unicode
©2012
>>> test_utf8 = test_unicode.encode('utf-8')
>>> print test_utf8
©2012
>>> print rtf_encode(test_utf8.decode('utf-8'))
\u169?2012

这是另一个版本，为了更容易理解而进行了一些细分。我还使其一致地返回 ASCII 字符串，而不是保留 Unicode 并在join。它还包含基于评论的修复。

def rtf_encode_char(unichar):
    code = ord(unichar)
    if code < 128:
        return str(unichar)
    return '\\u' + str(code if code <= 32767 else code-65536) + '?'

def rtf_encode(unistr):
    return ''.join(rtf_encode_char(c) for c in unistr)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

rtf

在python中将unicode文本输出到RTF文件的相关文章

Python 和 Numpy 是 nan 和 set

我在使用 Python 的 Numpy set 和 NaN 非数字时遇到了不可预测的行为 gt gt gt set np float64 nan np float64 nan set nan nan gt gt gt set np flo
如何指定聚类的距离函数？

我想对给定距离的点进行聚类奇怪的是似乎 scipy 和 sklearn 聚类方法都不允许指定距离函数例如在sklearn cluster AgglomerativeClustering 我唯一可以做的就是输入一个亲和力矩阵这将非常
使用 pandas.date_range() 生成多个日期时间，每周两个日期

我在用着pd date range start date end date freq W MON 每周一生成每周频率日期时间start date 2017 01 01 and end date 2017 12 31 这意味着每月大约生成 4
从字典的元素创建 Pandas 数据框

我正在尝试从字典创建一个 pandas 数据框字典设置为 nvalues y1 1 2 3 4 y2 5 6 7 8 y3 a b c d 我希望数据框仅包含 y1 and y2 到目前为止我可以使用 df pd DataFrame fr
定义Python源代码编码的正确方法

PEP 263 http www python org dev peps pep 0263 定义如何声明Python源代码编码通常 Python 文件的前两行应以以下内容开头 usr bin python coding
如何为未捕获的异常处理程序编写单元测试

我有一个函数可以捕获uncaught例外情况如下有没有办法编写一个单元测试来执行uncaught exception handler 功能正常但测试正常退出 import logging def config logger logge
指示电子邮件的类型

我有以下自动化程序它将电子邮件发送给我自己并添加了特定的链接 import win32com client as win32 import easygui import tkinter as to from tkinter import
数据框 - 平均列

我在 pandas 中有以下数据框 Column 1 Column 2 Column3 Column 4 2 2 2 4 1 2 2 3 我正在创建一个数据框其中包含第 1 列和第 2 列第 3 列和第 4 列等的平均值 ColumnA
为什么第二个 request.session cookies 返回空？

我想使用 requests Session post 登录网站但是当我已经登录主页然后进入帐户页面时看来cookies还没有保存因为cookies是空的而且我无法进入正确的帐户页面 import requests from bs4
使用 Pytest 的参数化添加测试功能的描述

当其中一个测试失败时可以在测试正在测试的内容的参数化中添加描述快速了解测试失败的原因有时您不知道测试失败的原因您必须查看代码通过每个测试的描述您就可以知道例如 pytest mark parametrize num1 num2
以类型化内存视图作为成员的结构定义

目前我正在尝试让一个具有类型化内存视图的结构能够工作例如 ctypedef struct node unsigned int inds 如果 inds 不是内存视图据我所知它可以完美地工作然而通过内存视图并使用类似的东西 def
如何在 Python 中的函数入口、内部和退出处进行日志记录

我希望能够使用 Python 日志记录工具在我的代码中进行简单且一致的日志记录我能够执行以下操作我希望所有现有未来的模块和函数都有输入和完成日志消息我不想添加相同的代码片段来定义日志记录参数如下所示don t want t
更改QLineEdit的ClearButton图标

我想在Windows 10 1909 64位上的Python 3 8和PyQt5 5 15 0 上更改我的QLineEdit的ClearButton图标稍后我想在Linux上运行代码我尝试应用此处找到的代码如何在 QLineEdit
在 Mac OS X 上安装 libxml2 时出现问题

我正在尝试在我的 Mac 操作系统 10 6 4 上安装 libxml2 我实际上正在尝试在 Python 中运行 Scrapy 脚本这需要我安装 Twisted Zope 现在还需要安装 libxml2 我已经下载了最新版本 2 7 7
Jupyter 笔记本中未显示绘图图表

我已经尝试解决这个问题几个小时了我按照上面的步骤操作情节网站 https plot ly python getting started start plotting online并且图表仍然没有显示在笔记本中这是我的情节代码 color
检索 geodjango 多边形对象的边界框

如何在 geodjango 中获取 MultiPolygon 对象的边界框在 API 中找不到任何内容http geodjango org docs geos html http geodjango org docs geos html
如何在 Seaborn 中的热图轴上表达类

我使用 Seaborn 创建了一个非常简单的热图显示相似性方阵这是我使用的一行代码 sns heatmap sim mat linewidths 0 square True robust True sns plt show 这是我得到的
Discord.py 嵌入中禁用按钮/冻结按钮

I m trying to make a replica of this bot in which when I press any of the buttons below it shows a dropdown menu and you
确定分割形状几何体的“左”侧和“右”侧

我的问题是我怎样才能确定哪一个Aside and Bside的侧面已经分割的旋转矩形几何体 http nbviewer jupyter org urls dl dropbox com s ll3mchnx0jwzjnf determine
描述符“join”需要“unicode”对象，但收到“str”

代码改编自here http wiki geany org howtos convert camelcase from foo bar to Foo Bar def lower case underscore to camel case s

随机推荐

.htaccess 重写正则表达式：匹配除“index”之外的任何内容

我正在尝试创建一个在 htaccess 文件中使用的规则来匹配除了特定的字符串在本例中 index 我认为应该可以先匹配这个特殊字符串并使用 L 但这不起作用并且应该可以使用以下正则表达式但它会导致 500 错误我想匹配页面名称1
有没有一个命令行程序可以查找Scaladoc？

Ruby 有一个名为 ri 的程序您可以在其中输入 ri Array 并获取其联机帮助页 scaladoc 有类似的东西吗现在 Scaladoc Web 应用程序正在通过浏览器内快速搜索的索引得到增强这种事情应该变得容易得多特别是
无法通过 HTTP/REST 访问 FireBase 数据库错误 403 Forbidden

Swift Vapor 服务器框架 Xcode 8 1 我正在尝试读取 Firebase 实时数据库向我的数据库发出 HTTP 请求但权限被拒绝这些是步骤 1 创建 JWT 使用从 console developers google
在 xsl 中格式化科学数字表示形式

我的 XML 中有以下值 1 8959581529998104E 4 我想将其格式化为使用 XSL 给我的确切数字 0 000189595815299981 format number 1 8959581529998104E 4 0 000
获取响应流时出错 (ReadDone2)：接收失败

请帮帮我发送后查询后我出现网络异常获取响应流时出错 ReadDone2 接收失败帮助摆脱这个错误谢谢一段代码 try string queryContent string Format login 0 password 1 mo
为什么通过 Expression.Call 编译的 lambda 构建比应该执行相同操作的委托稍慢？

为什么通过 Expression Call 编译的 lambda 构建比应该执行相同操作的委托稍慢以及如何避免呢解释 BenchmarkDotNet 结果我们正在比较CallBuildedReal vs CallLambda 另外两个
strings.xml 中的 Android `templateMergeStrategy`

什么是templateMergeStrategyAndroid 资源中的属性意味着什么例如在 Google 地图 API 密钥文件中
Heroku 的 SSH 隧道

我提供了一个在 Heroku 上托管的服务它允许用户使用他们的数据库报告他们自己的数据我的客户必须将我的 Heroku 应用程序连接到他们的数据库他们中的一些人显然害怕让数据在互联网上清晰传输 Heroku 是否可以打开从我的应用程序
如何存储重复日期并记住夏令时

我将事件存储在我的数据库中我有开始和结束日期时间 tickets start 和 tickets end 门票销售实际开始结束的时间而不是实际活动的开始结束的时间到目前为止我已经构建了一些方法来完成所有有趣的事情例如在
在 PHP 中处理 csv 文件时如何指定编码？

上面来自php手册但是我没有看到在哪里指定编码比如utf8左右尝试更改区域设置就像下面的例子中所说的那样manual
Android 中的 Activity 太多？

当我开始我的 Android 项目时我有一个误解即应用程序中显示的每个屏幕都必须是一个新活动现在我已经完成了这个项目我已经在我的模拟器以及几部 Android 手机上检查了它到目前为止我还没有看到任何问题但最近我在某处读到应
MVC4 绑定列表中的下拉列表（错误）

我在视图中有以下代码索引 cshtml 绑定问题第一个下拉列表根据 ChildItem 编辑器模板选择正确的值使用内联下拉列表的第二个示例不起作用我不想创建一个编辑器模板只是为了显示下拉值奇怪的是 TextBoxFor 将显示正确的
在使用 CLI 创建的 MongoDB 分片集合中插入文档时出错

使用最新的 azure cli 2 0 21 我尝试使用以下脚本来自 powershell 在 CosmosDB 中创建分片 MongoDB 集合 resourceGroupName RG S01 APP CASRWA 001 name
带有 uuid 字段的 Django 迁移生成重复值

我有一个uuid字段不是主键生成的迁移是 from future import unicode literals from django db import migrations models import uuid class Mig
Lua中的反序列化

我已经在lua中序列化了一个表 lua有没有反序列化它的函数 function dump o if type o table then local s for k v in pairs o do if type k number then
CherryPy：“error_page.default”与“error_page.404”配置设置之间有什么区别？

假设我想显示我自己的 404 和 500 页面到目前为止我发现了两种可能性 1 使用cherrypy config update def error page 404 status message traceback version re
如何使用 CLI 添加模块到 Wildfly

我正在尝试使用 postgres 数据源创建 Wildfly docker 映像当我构建 dockerfile 时当我尝试安装 postgres 模块时它总是失败并显示权限被拒绝我的 dockerfile 看起来是这样的 FROM
将注册表项加载到 wso2 属性中介器中

我当前正在使用以下语句从 wso2 esb 中的本地条目加载数据
使用 HashMap 实现类似 SQL 的 RIGHT OUTER JOIN 的迭代器适配器

我正在努力延长幸福的时间Rust 工具 http bluss github io rust itertools doc itertools index html使用类似 SQL 的连接迭代器我在使用散列连接策略的 RIGHT OUTER
在python中将unicode文本输出到RTF文件

我正在尝试从 python 脚本将 unicode 文本输出到 RTF 文件对于背景维基百科 https en wikipedia org wiki Rich text format Character encoding says 对于

在python中将unicode文本输出到RTF文件

在python中将unicode文本输出到RTF文件 的相关文章

随机推荐

热门标签

在python中将unicode文本输出到RTF文件的相关文章