Python 输出中的俄语符号已损坏（编码）

2024-06-22

我解析了一个 HTML 文档，其中包含俄语文本。当我尝试打印它时Python http://en.wikipedia.org/wiki/Python_%28programming_language%29，我明白了：

ÐÐ»ÑÐ±Ð½Ð¸ÑÐ½ÑÐ¹ Ð½Ð¾Ð²Ð¾Ð³Ð¾Ð´Ð½Ð¸Ð¹ Ð¿ÑÐ½Ñ

我尝试解码它并得到 ISO-8859-1 编码。我试图像这样解码它：

print drink_name.decode('iso8859-1')

但我收到错误。我如何打印此文本，或将其编码为Unicode http://en.wikipedia.org/wiki/Unicode?

你有一个Mojibake http://en.wikipedia.org/wiki/Mojibake;在本例中，UTF-8 字节解码为 Latin-1 或 CP1251。

您可以通过相反的过程来修复它：

>>> print u'ÐÐ»ÑÐ±Ð½Ð¸ÑÐ½ÑÐ¹ Ð½Ð¾Ð²Ð¾Ð³Ð¾Ð´Ð½Ð¸Ð¹ Ð¿ÑÐ½Ñ'.encode('latin1').decode('utf8')
Клубничный новогодний пунш

（我必须从原始帖子源复制字符串以捕获 Mojibake 中的所有不可打印字节）。

更好的方法是没有错误解码首先。您使用错误的编码解码原始文本，请改用 UTF-8 作为编解码器。

如果你用过requests下载页面，请勿使用response.text在这种情况下;如果服务器无法识别特定的编解码器，则 HTTP RFC 默认使用 Latin-1，但 HTML 文档通常将编码嵌入到<meta>标题代替。在这种情况下，将解码留给解析器，例如 BeautifulSoup：

response = requests.get(url)
soup = BeautifulSoup(response.content)  # pass in undecoded bytes

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

encoding

UTF8

cyrillic

mojibake

Python 输出中的俄语符号已损坏（编码）的相关文章

从networkx中的文件中读取具有pos属性的节点

我是 Networkx 的新手我有一个包含以下格式的节点位置的文件 0 23 23 12 23 where 0是一个节点 23 23 and 12 23分别是X和Y坐标有谁知道如何读取节点pos属性使用类似的函数read edgeli
Ruby 相当于 Python 的多处理模块是什么？

为了在 Ruby 或 Python 中获得真正的并发性我需要创建新的进程 Python 使用以下命令使这变得非常简单multiprocessing模块它抽象了所有 fork wait 的好处让我专注于我的代码 Ruby 有类似的东西吗
如何在嵌套列表中查找给定元素？

这是我的迭代解决方案 def exists key arg if not arg return False else for element in arg if isinstance element list for i in elemen
为什么Flask后台线程获取错误的数据库信息？

为了将实时数据库信息推送到客户端我在服务器端使用flask socketio 通过使用websocket将所有实时数据库信息推送到客户端我的视图文件有一个片段 from models import Host from flask soc
使用 cx_oracle 返回 MERGE 中受影响的行数

如何在 CX Oracle 中执行 MERGE INTO sql 命令来获取受影响的行数当我在cx oracle 上执行MERGE SQL 时我得到的cursor rowcount 为 1 有没有办法获取受合并影响的行数由于 cx o
python 函数 *args 和 **kwargs 以及其他指定的关键字参数

我有一个 Python 类它的方法应该以这种方式接受参数和关键字参数 class plot def init self x y self x x self y y def set axis self args xlabel x ylabe
使用 Python 访问内存映射文件

我希望利用激战 2 中的内存映射文件该文件旨在链接到 Mumble 以获得位置音频该文件包含有关字符坐标的信息和其他有用的信息我已经能够使用此脚本访问坐标信息 import mmap import struct last while
并行执行按位运算的代码

我有这段代码通过将该 AU 矩阵的每个字节 8 个元素打包到 A 中来减少内存消耗从而使 100k 200k 矩阵占用更少的空间正如您所期望的这段代码需要永远运行我也计划将行数增加到 200k 我正在一个非常强大的实例 CPU 和
使用 pytherejs 嵌入小部件：错误的视角和相机观察

我在用pythreejs可视化一些 3D 模型在 Jupyter 笔记本上可视化模型时一切都按预期进行但是当尝试将小部件嵌入 HTML 文档时我面临两个问题看起来相机在加载时正在查看 0 0 0 而不是预期的那样一旦您与小部件交
os.walk 无需深入研究下面的目录

我该如何限制os walk只返回我提供的目录中的文件 def dir list self dir name whitelist outputList for root dirs files in os walk dir name for f
Plotly：如何在堆叠条形图顶部显示值的总和以及各个条形值？

我正在尝试在 Python 中的 Plotly Express 中添加每个堆叠条形顶部的总计以及各个条形值 import plotly express as px df px data medals long fig px bar df x
将 postgres 连接到 django 时遇到问题

以下文档来自Django Postgres 文档 https docs djangoproject com en 4 1 ref databases postgresql notes我添加到我的settings py 在我设置的设置中 DA
在Python中将月份和年份的列合并为季度和年份的列

我有一个数据框 df Month 1 8 Year 2015 2020 df pd DataFrame data df df 想要将其转变为新列期望的输出 df Month 1 8 Year 2015 2020 Quarter Q1201
如何在Python中将N毫秒添加到日期时间

我正在设置一个日期时间变量 fulldate datetime datetime strptime date time Y m d H M S f 其中日期和时间是适合日期时间性质的字符串如何将此日期时间增加 N 毫秒 Use timed
折叠 numpy 数组除前两个维度之外的所有维度

我有一个可变维度的 numpy 数组例如它可以具有以下形状 64 64 64 64 2 5 64 64 40 64 64 10 20 4 我想要做的是如果维数大于 3 我想将其他所有内容折叠堆叠到第三维中同时保留顺序因此在我上面
Perl 和 MySql 中的 utf8 编码

我的数据库 MySql 有 utf8 general 排序规则我正在从数据库访问数据并显示一个网页用 Perl 开发它显示瑞典语字符和不同的字符我检查了Mysql数据库在那里我可以看到其中包含字符的数据看来访问数据时存在编
numpy.polyval() 的反函数

我想知道 np polyval 是否有一个方便的反函数我在其中给出 y 值并求解 x 我知道我可以做到这一点的一种方法是 import numpy as np Set up the question p np array 1 1 10 y
抓取 Shopee API v4

我有一个最终项目其中我想要检索的数据是通过在shopee上抓取数据来获取的但是当我在隐藏的API上抓取shopee时遇到问题当我在Insomnia脚本上尝试时脚本会运行但是当我尝试时在本地或 google colab 脚本上这是
从Python列表中挑选出具有特定索引的项目

我确信在 Python 中有一种很好的方法可以做到这一点但我对这门语言还很陌生所以如果这是一个简单的方法请原谅我我有一个列表我想从该列表中挑选某些值我想要挑选的值是列表中索引在另一个列表中指定的值例如 indexes 2 4
Python pandas：向我的数据框中添加一列来计算变量

我有一个像这样的数据框 gt org group org1 1 org2 1 org3 2 org4 3 org5 3 org6 3 我想将列 count 添加到 gt 数据帧以计算组的成员数量预期结果如下 org group count

随机推荐

Autoscaling launchconfig 组中的 aws cloudformation“NetworkInterfaces”

在 aws cloudformation 中如何在 Autoscaling launchconfig 组中添加 NetworkInterfaces 因为我想配置启动的每个实例并且需要 NetworkInterfaces 位于相同的 AW
是否可以包含 JSF 中一个文件夹中的所有 javascript 文件？

我正在使用 JSF 2 0 并且正在寻找一种方法来包含页面上给定文件夹中的所有 javascript 即执行类似的操作
如何在 python 中定义全局列表并向其附加本地列表

我想定义一个全局列表并向其附加一个列表我通过一些点击事件获得了一个列表 i 0 并将其附加到 mnum list 中现在我想创建一个全局列表并将 mnum list 附加到其中知道如何做到这一点吗 def OnClick self e
将日期格式设置为 mm/dd/yyyy 文本

一旦 mm dd yyyy 格式的日期与空格和文本连接起来例如 05 03 2015 摘要报告您如何将此连接的单元格复制到另一个单元格作为文本但没有日期变成 42127摘要报告 CONCATENATE TEXT A1 月日年总结
致命错误 LNK1104：无法打开文件“libboost_system-vc110-mt-gd-1_51.lib”

看来我无法让这个工作我制作了一个简单的控制台应用程序这取决于websocket 图书馆需要Boost库但是当我尝试编译时我得到致命错误 LNK1104 无法打开文件 libboost system vc110 mt gd 1 51
Angular UI 网格 - 选定行上的单击事件

Target 我有一个 UI 网格当我单击一行时它应该被选中并且应该调用以该行作为参数的函数目前的方法我使用以下配置代码来生成网格 scope gridOptions enableFiltering true enableRowH
如何识别哪个图像被触摸

我正在开发一个应用程序用户可以将项目拖放到画布上当他释放图像时图像就会绘制在画布上这是我处理触摸的 DragImage 类 class DragImages UIImageView var originalPos CGPoint v
SQLAlchemy load_only 和 defer

我尝试使用 SQLAlchemy 方法 load only 和 defer 仅发送数据库中的某些列但我似乎无法让它们工作这是我正在使用的代码 query db session query Vendor options defer own
设置restAssured 以全局记录所有请求和响应

我想为所有人启用日志记录RestAssured默认情况下响应和请求这就是我所做的 RestAssured requestSpecification new RequestSpecBuilder setBaseUri api setCont
从字符串中提取值

我正在尝试从字符串中提取值我试图获取re match工作但没有任何运气该字符串是 opt ad bin ptzflip r nValue 1800 r nMin 0 r nMax 3600 r nStep 1 r n 我努力了 map
如何为桌面上的任何应用程序创建快捷方式？

我想我已经尝试了在互联网上找到的所有解决方案但没有一个有效没有强制关闭但桌面上没有出现任何内容现在我有这个 private void createShortcutOnDesktop Application app Intent s
验证文本框字段仅用于数字输入。

我创建了一个基于表单的程序需要一些输入验证我需要确保用户只能输入距离文本框内的数值到目前为止我已经检查了文本框中是否有内容但如果它有值那么它应该继续验证输入的值是否是数字 else if txtEvDistance Text L
使用 jasmine 测试 Express.js

我正在学习 Node js 和 Express 框架我是茉莉花的忠实粉丝所以我想尽可能使用 jasmine 但是我找不到用 jasmine 测试 Express 的好方法例如我应该如何在 app js 中测试路由如果我在 app
我怎样才能获得特定的结果块？

是否可以检索特定范围的结果我知道如何执行 TOP x 但我将检索的结果太大并且会超时我希望能够选择前 10 000 个结果然后选择接下来的 10 000 个结果依此类推这可能吗 WITH Q AS SELECT ROW NUMBE
如何在 Swift 中使用 `syslog`

好像syslog Swift 2 中不提供此功能我怎样才能发送消息给syslog在 OS X 上问题是 void syslog int priority const char message 采用可变参数列表并且不会导入到 Swift
用户“xxx”登录失败无法打开显式指定的数据库解决办法

我首先使用实体框架代码启动应用程序时应用程序尝试在 SQLServer2008R2 上创建数据库我收到的错误消息是用户 NT instans Networkservice 登录失败无法打开明确指定的数据库更仔细地查看 SQLS
Android Studio gradle bintray 上传失败：无法签署版本

运行后 gradlew bintrayUpload 我收到以下错误我的库 bintray上传失败失败构建失败并出现异常出了什么问题任务 my library bintrayUpload 执行失败无法签署版本 0 8 1 HTTP
popstate 从 Safari 16 开始就不起作用了？它一直工作到 Safari 15

我想在用户单击浏览器的后退按钮时显示图像下面的代码在 safari 15 5 中运行良好但是当我升级到 safari 16 1 时它不起作用 Popstate 无法在 Safari 16 1 中工作
当输入字符而不是数字时，防止 FORTRAN 关闭

我有一个读取语句需要一个数字非常简单的示例代码 program test integer var read var end 问题是我通常输入一串字符即 yes 因为分心如何防止我的代码完全停止并显示以下类型的错误消息您输入了错误的值
Python 输出中的俄语符号已损坏（编码）

我解析了一个 HTML 文档其中包含俄语文本当我尝试打印它时Python http en wikipedia org wiki Python 28programming language 29 我明白了我尝试解码它并得到 ISO 88

Python 输出中的俄语符号已损坏（编码）

Python 输出中的俄语符号已损坏（编码） 的相关文章

随机推荐

热门标签

Python 输出中的俄语符号已损坏（编码）的相关文章