如何修复 Python 中损坏的 utf-8 编码？

2024-05-07

我的字符串是Niá»‡m Bá»“ TÃ¡t (Thiá»n sÆ° Nháº¥t Háº¡nh)我想将其解码为Niệm Bồ Tát (Thiền sư Nhất Hạnh)。我在那个网站上看到可以做到这一点http://www.enderminh.com/minh/utf8-to-unicode-converter.aspx http://www.enderminh.com/minh/utf8-to-unicode-converter.aspx

我开始尝试用Python

mystr = '09. BÃ¡t NhÃ£ TÃ¢m Kinh'
mystr.decode('utf-8')

但实际上它是不正确的，因为原始字符串是 utf-8 但字符串显示不是我期望的结果。

注意：这是越南语字符。

该案如何解决？这是 Windows Unicode 还是什么？这里如何检测编码。

唯一能帮助我解决断断续续的西里尔字母字符串的事情 -https://github.com/LuminosoInsight/python-ftfy https://github.com/LuminosoInsight/python-ftfy

该模块几乎修复了所有问题，并且比在线解码器工作得更好。

>>> from ftfy import fix_encoding
>>> mystr = '09. BÃ¡t NhÃ£ TÃ¢m Kinh'
>>> fix_encoding(mystr)
'09. Bát Nhã Tâm Kinh'

它可以使用轻松安装pip install ftfy

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Unicode

UTF8

characterencoding

如何修复 Python 中损坏的 utf-8 编码？的相关文章

将 JSON 发布到 Python CGI

我已经安装了 Apache2 并且 Python 可以工作但我有一个问题我有两页一个是 Python 页面另一个是带有 JQuery 的 Html 页面有人可以告诉我如何让我的 ajax 帖子正常工作吗
为什么需要在 Python 方法中显式使用“self”参数？ [复制]

这个问题在这里已经有答案了当在 Python 中的类上定义方法时它看起来像这样 class MyClass object def init self x y self x x self y y 但在其他一些语言中例如 C 您可以使用
如何计算数据框中按另一列的列值分组的一列的连续字符串值？

我有以下数据框 Levels Labels Confidence 0 Hands 0 8 0 Leg 0 7 0 Eye 0 9 1 Ear 0 9 1 Eye 0 8 2 Hands 0 9 2 Eye 0 8 3 Eye 0 8 我想检
雅虎财务请求功能出现 404 客户端错误

yahoo Financials的请求功能出现404 Client Error 直接点击以下网址没有问题 https finance yahoo com quote AAPL financials p AAPL https finance
类型错误：“datetime.datetime”和“str”的实例之间不支持“>”

我是 python 日期和时间类型的新手我有一个日期值 date 2018 11 10 10 55 31 00 00 我需要检查该日期值是否超过 90 天我试过 from datetime import datetime from da
带有 mkdocs 的本地 mathjax

我想在无法访问互联网的计算机上使用 MathJax 和 Mkdocs 因此我不能只调用 Mathjax CDN Config mkdocs yml site name My Docs extra javascript javascripts
Django 多对多关系（类别）

我的目标是向我的 Post 模型添加类别我希望以后能够按不同类别有时是多个类别查询所有帖子模型 py class Category models Model categories 1 red 2 blue 3 black title
为什么 re.findall 在查找字符串中的三元组项时不具体。 Python

所以我有四行代码 seq ATGGAAGTTGGATGAAAGTGGAGGTAAAGAGAAGACGTTTGA OR 0 re findall r ATG 9 TAA TAG TGA seq 首先让我解释一下我正在尝试做什么如果这令人困惑
设置高亮大括号的 vim 颜色主题

如何更改突出显示大括号的 vim 配色方案我希望实际编辑 vim 主题文件以使更改永久生效问候克雷格匹配括号的自动高亮颜色称为MatchParen 您可以通过执行以下操作来更改 vimrc 中的颜色 highlight MatchP
Py2exe - Pmw WindowsError：[错误 3]

我正在尝试使用 Py2exe 构建独立的可执行文件我已经导入了 Pmw 类当我运行独立可执行文件时出现以下错误 Traceback most recent call last File py line 9 in
在请求中设置端口

我正在尝试利用cgminer使用 Python 的 API 我对利用requests图书馆我了解如何做基本的事情requests but cgminer想要更具体一点我想缩小 import socket import json sock
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
Django 2、python 3.4 无法解码 urlsafe_base64_decode(uidb64)

我正在尝试通过电子邮件激活用户电子邮件有效编码有效我使用了 django1 11 中的方法该方法运行成功在 Django 1 11 中以下内容成功解码为 28 其中 uidb64 b Mjg force text urlsafe
是否可以在Python中将日+月（不是年）与当前日+月进行比较？

我正在获取 5 月 10 日格式的数据我试图弄清楚它是今年还是明年该日期仅一年因此 5 月 10 日表示 2015 年 5 月 10 日而 5 月 20 日表示 2014 年 5 月 20 日为此我想将字符串转换为日期格式并进
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
无法导入QUERY_TERMS

我正在运行一个网站Python and Django Django filters 2 1 installed Django 2 1 installed 当我运行时我收到以下错误 importError Could not import
从迭代器外部将 StopIteration 发送到 for 循环

有几种方法可以打破一些嵌套循环他们是 1 使用中断继续 for x in xrange 10 for y in xrange 10 print x y if x y gt 50 break else continue only exec
如何使用 enumerate 来倒数？

letters a b c 假设这是我的清单在哪里for i letter in enumerate letters 将会 0 a 1 b 2 c 我怎样才能让它向后枚举如 2 a 1 b 0 c 这是一个很好的解决方案并且工作完美 i
MoviePY 无法在 Windows 上检测 ImageMagick 二进制文件

我刚买了一台新笔记本电脑想要设置MoviePY在那新的Windows 64x Python3 7 0 机器我对所有内容都进行了三次检查但是当涉及到我的代码的文本部分时它向我抛出了这个错误 OSError MoviePy Error
在Python中停止ThreadPool中的进程

我一直在尝试为控制某些硬件的库编写一个交互式包装器用于 ipython 有些调用对 IO 的影响很大因此并行执行任务是有意义的使用 ThreadPool 几乎效果很好 from multiprocessing pool import

随机推荐

在 Pandas 中按索引分组

如何使用 groupby by 索引 1 2 3 它们的顺序相同并获得属于每个索引范围的列分数的总和基本上我有这个 index score 1 2 2 2 3 2 1 3 2 3 3 3 我想要的是 index score sum 1
Ionic 2 自定义后退按钮操作

我想自定义此屏幕截图中提到的后退按钮的单击操作我希望通过单击我不会返回到上一页而是返回到我自己指定的页面或者在返回之前进行处理要自定义默认后退按钮操作您需要覆盖返回按钮点击 NavBar 组件的方法 Step 1 在你的自定义类
将范围传递给 forEach

我正在尝试使用回调方法addToCount而不是匿名函数forEach 但我无法访问this count其中返回undefined function Words sentence this sentence sentence this c
在 Transport.send(message) 上获取 ParseException

由于某种原因当我在 MimeMessage 上调用 Transport send 时出现 javax mail internet ParseException 以前当它只是一封纯文本电子邮件时这是有效的但是当我将其更改为同时包含文
Spring MVC 中拦截器和过滤器的区别

我有点困惑Filter and Interceptor目的据我从文档中了解到 Interceptor在请求之间运行另一方面Filter在渲染视图之前运行但在控制器渲染响应之后运行那么两者的区别在哪里postHandle 在拦截器和d
MVC4 中的 ELMAH 和 API 控制器不记录错误

在 MVC4 中使用 API 控制器当控制器操作引发异常时 ELMAH 不会记录错误我认为问题在于 MVC4 将 HTTP 状态代码设置为 500 并且它返回 JSON 对象中的异常详细信息但它不会抛出未处理的异常因此 ELMAH
如何在Java中获取具有泛型类型的类

我正在尝试进行这样的方法调用 public class GenericsTest
AttributeError：“MainRouter”对象没有属性“_disabled_count”

我正在创建一个 kivy 应用程序其中我使用了显示此错误的路由器 AttributeError MainRouter 对象没有属性 disabled count 有什么解决办法吗我也得到了这个但使用 super 修复了它使用以下命令
为什么 # 后面跟一个数字在 C plus plus 中似乎没有任何作用

重现步骤将以下行插入到 C 源代码的任意行中 1234 任何行包括第一行最后一行甚至你也可以像这样在函数头和函数体之间输入 int foo 1234 return 0 数字可以很长我测试了170多个字符如果添加任何非数字字符则
Spring Boot logback.xml 创建 .tmp 文件

我正在尝试保留 Spring Boot 应用程序的日志但是由于生成的日志很大我正在尝试使用 logback xml 将大于 350MB 的文件滚动到压缩文件中我每天可以滚动几 MB 但中途服务开始写入临时文件我已经尝试了 Time
ngrx：如何将参数传递给 createSelector 方法内的选择器

我的商店有一个非常简单的状态 const state records 1 2 3 我有一个记录选择器 export const getRecords createSelector getState state State gt state
使用 RequireJS 的条件注释仅加载 IE7/8 jQuery

我在我的项目中使用 Require JS 它加载 jQuery 和其他一些与整个网站和所有浏览器相关的 JavaScript 文件但是我需要在 Internet Explorer 7 和 8 上使用一些条件 jQuery 我尝试将其放在
将计算列设置为非空时遇到问题

我在将计算列设置为时遇到问题not null 我想要实现的是C001 C002 等同时将其设置为not null 我在论坛上读到这可以通过使用 NULL 值的默认值 0 来实现 E g ISNULL Price Taxes 0 我尝试应
Javascript 是否处理整数上溢和下溢？如果是，怎么办？

我们知道Java不处理下溢和溢出 https stackoverflow com questions 3001836 how does java handle integer underflows and overflows and how
在 Ubuntu 上用 C 项目编译和链接 GTK 3

我相信这不是重复的问题在发布此问题之前我已经看过所有问题答案我想我这里的情况有所不同我使用Ubuntu 12 04并下载GTK 2 和 3 我从 GNOME 网站复制了一个简单的 GTK 源代码但是当我在终端中使用这个命令时 gc
IntelliJ IDEA 无法在 Ubuntu 上启动

我用IDEA好几个月了到现在还可以现在从快捷方式启动IDEA没有效果我想这是在一些更新之后发生的我尝试重新安装IDEA 但问题仍然存在从终端启动 idea sh 会产生类似的效果 chronoexp ChronoExp PC Pr
mysql REPLACE 具有多个主键的查询

因此如果存在与插入数据具有相同主键的列则 MYSQL 的 REPLACE 命令不要与字符串替换函数混淆将替换一行但是如果我有两个主键并且我想使用这两个主键来指定要替换的行而不仅仅是其中一个我如何指定 mysql 使用两个键而不是
将每月数据分解为每日数据

我有一家公司的预算数据采用以下每月格式 SqlFiddle 链接在这里 http sqlfiddle com 3 09263 1 Dept YearMonth Budget 001 201301 100 001 201302 110 00
将聊天文本中的成对符号替换为 html 标签，以设置粗体、斜体和删除线样式

我正在尝试制作 Whatsapp 风格的文本帖子当用户创建这样的文本时 Hi how are you where are you 然后这个文本会像这样自动改变 Hi你好吗你在哪我知道我可以使用 php 正则表达式来做到这一点如下所示
如何修复 Python 中损坏的 utf-8 编码？

我的字符串是Ni m B T t Thi n s Nh t H nh 我想将其解码为Ni m B T t Thi n s Nh t H nh 我在那个网站上看到可以做到这一点http www enderminh com minh utf8

如何修复 Python 中损坏的 utf-8 编码？

如何修复 Python 中损坏的 utf-8 编码？ 的相关文章

随机推荐

热门标签

如何修复 Python 中损坏的 utf-8 编码？的相关文章