将 unicode 对象转换为带有实体的拉丁字符串

2024-04-25

我有一个 unicode 对象，例如

x = u"a & 日本語:  enči hallöle"

并希望将其转换为带有 html-entities 的 latin-1 字符串，例如

"a &amp; &#26085;&#26412;&#35486;: en&#269;i hallöle"

这背后的原因是，我希望我的用户能够输入 unicode 数据，但我需要保存数据的旧数据库只接受 latin-1 字符串。（“ö”不应该转换，但其他特殊字符必须转换）

知道这里使用哪个模块吗？我搜索了编码模块，查找了一些编解码器，尝试了一些 unicode 对象的方法，但没有找到合理的解决方案。

Use the "xmlcharrefreplace"的选项unicode.encode，但请注意，它不会翻译& to &为你：

>>> x = "a & 日本語:  enči hallöle".decode("utf-8")
>>> x.replace("&", "&amp;").encode("latin-1", "xmlcharrefreplace")
'a &amp; &#26085;&#26412;&#35486;:  en&#269;i hall\xf6le'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Unicode

将 unicode 对象转换为带有实体的拉丁字符串的相关文章

如何在 QTableView 标题中单击鼠标右键单击上下文菜单？

下面的示例代码很大程度上受到here http www saltycrane com blog 2007 12 pyqt 43 qtableview qabstracttablemodel 有一个右键单击上下文菜单当用户单击表中的单元格
区分大小写的实体识别

我的关键字全部以小写形式存储例如折扣耐克鞋我正在尝试对其执行实体提取我遇到的问题是 spaCy 在 NER 方面似乎区分大小写请注意我不认为这是 spaCy 特有的当我跑步时 doc nlp u i love nike sho
在推送到容器注册表之前如何对构建的映像运行测试？

从 gitlab 文档中可以看出如何使用 kaniko 创建 docker 镜像 build stage build image name gcr io kaniko project executor debug entrypoint sc
sy.sympify(str(表达式)) 不等于表达式

据我了解 str将 SymPy 表达式转换为字符串并sympify将字符串转换为 SymPy 表达式因此我希望以下内容成立对于合理的表达 gt gt gt sy sympify str expr expr True 我尝试过这个确实
Django 查询：“datetime + delta”作为表达式

好吧我的问题如下假设我有下一个模型这是一个简单的情况 class Period models Model name CharField field specs here start date DateTimeField field s
如何使用 python、openCV 计算图像中的行数

我想数纸张所以我正在考虑使用线条检测我尝试过一些方法例如Canny HoughLines and FLD 但我只得到处理过的照片我不知道如何计算有一些小线段就是我们想要的线我用过len lines or len contours
当我从本地计算机更改为虚拟主机时，从 python 脚本调用 pdftotext 不起作用

我编写了一个小的 python 脚本来解析提取 PDF 中的信息我在本地机器上测试了它我有 python 2 6 2 和 pdftotext 版本 0 12 4 我正在尝试在我的虚拟主机服务器 dreamhost 上运行它它有 py
如何在 numpy 数组中查找并保存重复的行？

我有一个数组例如 Array 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 1 1 1 2 2 2 我想要输出以下内容的东西 Repeated 1 1 1 2 2 2 保留重复行的数量也可以例如 Repeated 1 1
如果另一列中的值为空，则删除重复项 - Pandas

我拥有的 df Name Vehicle Dave Car Mark Bike Steve Car Dave Steve 我想从名称列中删除重复项但前提是车辆列中的相应值为空我知道我可以使用 df dropduplicates
Python sys.modules 包含尚未导入的模块

我试图了解加载的模块与导入的模块之间的区别如果有的话我正在使用 Python 2 7 3 并且只是从命令行运行 Python 如果我执行 import sys sys modules 我得到一个列表其中包括os 例如文档说sys m
获取 int() 参数必须是字符串或数字，而不是“Column”- Apache Spark

如果我使用以下代码我会收到此异常 int argument must be a string or a number not Column df df withColumn FY F when df ID substr 5 2 isin
无法在我的程序中使用 matplotlib 函数

我正在 Windows 10 中运行 Anaconda 安装 conda 版本 4 3 8 这是我尝试在 python 命令行中运行的代码 import matplotlib pyplot as plt x 1 2 3 4 y 5 6 7
一个类似 dict 的 Python 类

我想编写一个自定义类其行为类似于dict 所以我继承自dict 不过我的问题是我是否需要创建一个私有的dict我的成员 init 方法我不明白这个有什么意义因为我已经有了dict如果我只是继承自的行为dict 谁能指出为什么大多
Python：“直接”调用方法是否实例化对象？

我是 Python 新手在对我的对象进行单元测试时我注意到一些奇怪的东西 class Ape object def init self print ooook def say self s print s def main Ape
在 pygame 中，我如何创建一个数据结构来跟踪调整大小事件和对象的坐标？

我希望在调整屏幕大小后使鼠标事件与对象保持同步有人告诉我需要创建一个数据结构来跟踪调整事件大小新坐标以匹配调整大小如何使用简单的代数方程来完成此操作并将其集成到调整大小事件中以进行准确更新反过来做创建一个虚拟游戏地图在绘制场景
django 中的身份验证方法返回 None

你好我在 django 中做了一个简单的注册和登录页面当想要登录时登录视图中的身份验证方法不返回任何内容我的身份验证应用程序模型 py from django db import models from django contri
如何在 Python 中跟踪日志文件？

我想在 Python 中提供 tail F 或类似内容的输出而无需阻塞或锁定我找到了一些非常旧的代码来做到这一点here http code activestate com recipes 436477 filetailpy 但我认为现
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
旧版本的 spaCy 在尝试安装模型时抛出“KeyError: 'package'”错误

我在 Ubuntu 14 04 4 LTS x64 上使用 spaCy 1 6 0 和 python3 5 为了安装 spaCy 的英文版本我尝试运行这给了我错误消息 ubun ner 3 NeuroNER master src pyt
OSError: [WinError 193] %1 不是有效的 Win32 应用程序，同时使用 CTypes 在 python 中读取自定义 DLL

我正在尝试编写用 python 封装 C 库的代码我计划使用 CTypes 来完成此操作并使用 Visual Studio 来编译我的 DLL 我从一个简单的函数开始在 Visual Studio 内的标头中添加了以下内容然后将其构

随机推荐

TypeScript 类函数不可用

我正在尝试调用 TypeScript 类的实例方法在 ASP NET MVC 项目中但是在运行时我遇到了类似的异常0x800a01b6 JavaScript runtime error Object doesn t support p
从 CLI 列出 ARM 的 Docker 映像

我拥有一台 Mac M1 我在上面运行 Docker 在 OSX 上 Docker 可以运行本机 ARM 映像但也可以模拟 x86 amd64 来运行不是为 ARM 构建的映像我的问题很简单从命令行我试图找到显示图像的命令 dock
用于色彩空间转换的 IMTransform 视频处理器的设置

我正在尝试使用视频处理器 MFT 进行一些基本的色彩空间转换我的相机本身支持 NV12 我需要 RGB24 来编写一些着色器以提供类似卡通的效果下面是用于执行 MF 的 Media 类的定义 class Media public IM
使用 scikit learn 对通过 networkx 生成的图进行谱聚类

我有一个 3000x50 特征向量矩阵我使用以下方法获得了一个相似度矩阵sklearn metrics pairwise distances作为相似度矩阵现在我用了networkx使用上一步中生成的相似度矩阵创建一个图G nx fro
使用 Https 连接的 Java 应用程序：“连接被拒绝错误”

我为我的 JavaAppliaction 创建了一个 jar 从这个应用程序中我连接到 WebApplicaton 中的 servlet 我将名称和密码从 swing 传递到 servlet 这里我只是在 servlet 中显示名称和密码
如何在多进程内更新 Tkinter 小部件？

我正在尝试使用进程更新框架但我无法这样做如果我不使用进程框架将使用子元素进行更新但在使用多进程时则不会这是我尝试过的代码是类的一部分 def zx self q print asdadsas lbl Label self myf
Scala 相当于 Java 的 static 块吗？

Scala 相当于 Java 的 static 块吗伴生对象的构造函数即主体中的代码是not与 Java 类的静态初始化块中的代码完全相同在下面的示例中我创建了 A 的实例但未进行初始化 scala gt object Test
Laravel 对包含多个项目的集合求和

我有一个模型SettlementEntries与子表有关系return this gt hasMany App Online entry id 当尝试获取一个条目时我可以对我的集合进行求和如下例所示 item SettlementEnt
Android 地图 API，异常

我正在使用谷歌地图 v2 我的代码在方法上被破解 public void onConnected Bundle bundle mLastLocation LocationServices FusedLocationApi getLastLo
将文件上传到 S3 的 upload() 和 putObject() 之间的区别？

在aws sdk中S3类有什么区别upload http docs aws amazon com AWSJavaScriptSDK latest AWS S3 html upload property and putObject http
使 CSS url() 相对于文档

当涉及 CSS 时适用以下规则 Partial URLs are interpreted relative to the source of the style sheet not relative to the document 但这是
使用 javascript 比较日期[重复]

这个问题在这里已经有答案了我在 JavaScript 中有两个日期 var first 2012 11 21 var second 2012 11 03 我想做 if first gt second 在没有外部库的情况下最好的方法是什么
无法在 Eclipse 4.2 上安装 Aptana 插件

我已经安装了 Eclipse 4 2 Juno 现在我想安装 aptana 来开发 ruby 但出现以下错误无法读取存储库http download aptana com studio3 plugin install content ja
获取 `TypeError: jest.fn 不是一个函数`

我正在尝试使用 Jest 创建以下单元测试 jest dontMock pointsAwardingActions js describe points awarding actions gt describe award points g
获取个人资料的 Facebook 创建日期[重复]

这个问题在这里已经有答案了是否可以通过使用 Graph API 获取 Facebook 个人资料的创建日期时间我需要它来建立一个身份验证机制该机制不允许刚刚创建的 Facebook 用户调用 Facebook API 是一个相对
找不到主要出口来加载“XYZComponent”

我在 Net MVC 组件中加载了 ng2 代码但控制台中显示以下错误异常未捕获承诺错误找不到加载 UsersComponent 的主要出口错误找不到加载 UsersComponent 的主要出口知道可能是什么问题吗我正
Ruby On Rails 更新 Heroku 动态路由

我有一个使用应用程序范围的 slugs 的应用程序使用懒惰的宝石 https github com RISCfuture slugalicious与 Sluggable 表并使用以下代码路由到这些 slugs Slugs begin S
在 Fluent nHibernate 中使用派生类

我有两个共享公共字段的表我不想重新映射所有这些而是希望拥有一个具有公共字段的基类对于 POCO 来说这很简单 class Base public string commonField get set class Derived Ba
如何在 C# 中读取文本文件并将数据添加到 int 数组中？

我正在尝试读取一个文本文件其中包含以逗号分隔的数字当我阅读时使用File Readline 我把它拿到string 我需要将其转换为 int 数组但它给出了错误文本文件的内容 146429 143689 144380 141523
将 unicode 对象转换为带有实体的拉丁字符串

我有一个 unicode 对象例如 x u a 日本語 en i hall le 并希望将其转换为带有 h tml entities 的 latin 1 字符串例如 a amp 26085 26412 35486 en 269 i ha

将 unicode 对象转换为带有实体的拉丁字符串

将 unicode 对象转换为带有实体的拉丁字符串 的相关文章

随机推荐

热门标签

将 unicode 对象转换为带有实体的拉丁字符串的相关文章