我正在寻找一种将 HTML 文本转换为 RTF 字符串的方法。有没有任何图书馆可以完成这项工作。我在项目中动态获取 html 内容,并需要将其以 RTF 格式呈现。我正在使用 HTML 解析器将 HTML 文本转换为普通字符串,然后尝试使用 PyRTF 转换为 RTF 格式。有没有更好的方法可以做到这一点。提前致谢。
RTF 似乎是一种难以转换的格式。例如,我尝试过在 Mac OS X 上的应用程序之间进行剪切和粘贴,其中 RTF 是一种通用语。其中一些应用程序是 Microsoft 应用程序(相关的 RTF 是 Microsoft 开发的格式),其他应用程序则不是。当从一个表面上使用 RTF 的应用程序复制到另一个应用程序时,即使是基本的格式信息(例如字体大小、字体、行距和列表样式(有序或无序))也会变得混乱。简单来说,就是一团糟。
我一直在寻找以编程方式读取、写入和转换 RTF 的方法,最好是使用 Python。我在 PyPI 上发现了许多软件包,尝试它们的经历令人失望。例如,当当前版本是 1.9.1 时,他们将支持 RTF 1.5。 RTF 已经存在很长时间了,但 2005 年版本的规范并不是最近出现的。有很多问题和不兼容性。很多。
现在,我并不是说这是不可能的,或者没有其他库可以做到这一点。我有not尝试过zopyx.convert
例如,其他人在这里提到过。也许这很棒。但看看它的依赖项——Java、FOP 等——它看起来像是一个相当复杂(因此可能很脆弱)的工具链。我读它的代码在github上 https://github.com/zopyx/zopyx.convert2,而 Python 实际上只是作为协调饰面。它组织了外部工具 XFC、XINC、FOP 和 PrinceXML——其中四个是商业软件。其中包括处理 RTF 的关键 XFC 部分。让我感到怀疑。
我发现有两个转换器值得一看:如果您使用的是 Mac,则textutil https://developer.apple.com/library/mac/documentation/Darwin/Reference/ManPages/man1/textutil.1.html命令行程序实际上是我见过的更好、更简单的工具之一。
textutil -convert html filename.rtf -output filename.html
另一个值得考虑的格式化引擎是自由办公室 http://www.libreoffice.org。它是免费的、开源的、相当适合自动化,并且作为互操作性中心具有良好的基础。这不仅仅是一个猜测;而是一个猜测。我围绕它构建了复杂的多格式文档工作流程。
我想问你为什么要尝试进入RTF。这似乎是您试图逃避的文档格式。但如果您需要这样做,textutil 和 LibreOffice 是我发现的最差的机制。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)