我有一个 unicode 对象,例如
x = u"a & 日本語: enči hallöle"
并希望将其转换为带有 html-entities 的 latin-1 字符串,例如
"a & 日本語: enči hallöle"
这背后的原因是,我希望我的用户能够输入 unicode 数据,但我需要保存数据的旧数据库只接受 latin-1 字符串。 (“ö”不应该转换,但其他特殊字符必须转换)
知道这里使用哪个模块吗?我搜索了编码模块,查找了一些编解码器,尝试了一些 unicode 对象的方法,但没有找到合理的解决方案。
Use the "xmlcharrefreplace"
的选项unicode.encode
,但请注意,它不会翻译&
to &
为你:
>>> x = "a & 日本語: enči hallöle".decode("utf-8")
>>> x.replace("&", "&").encode("latin-1", "xmlcharrefreplace")
'a & 日本語: enči hall\xf6le'
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)