UnicodeEncodeError：“charmap”编解码器无法编码 - 字符映射到<未定义>，打印函数[重复]

2023-12-23

我正在编写一个 Python (Python 3.3) 程序，使用 POST 方法将一些数据发送到网页。主要用于调试过程，我获取页面结果并将其显示在屏幕上使用print()功能。

代码是这样的：

conn.request("POST", resource, params, headers)
response = conn.getresponse()
print(response.status, response.reason)
data = response.read()
print(data.decode('utf-8'));

the HTTPResponse .read()方法返回一个bytes对页面进行编码的元素（这是一个格式良好的 UTF-8 文档）看起来还不错，直到我停止使用 Windows 的 IDLE GUI 并改用 Windows 控制台。返回的页面有一个 U+2014 字符（em-dash），打印函数在 Windows GUI 中可以很好地转换该字符（我假设代码页 1252），但在 Windows 控制台（代码页 850）中却不能。鉴于strict默认行为我收到以下错误：

UnicodeEncodeError: 'charmap' codec can't encode character '\u2014' in position 10248: character maps to <undefined>

我可以使用这个相当丑陋的代码来修复它：

print(data.decode('utf-8').encode('cp850','replace').decode('cp850'))

现在它将有问题的字符“—”替换为?。这不是理想的情况（连字符应该是更好的替代品），但足以满足我的目的。

我的解决方案中有几处是我不喜欢的。

经过所有的解码、编码和解码，代码变得丑陋。
它仅解决了本例的问题。如果我将程序移植到使用其他编码（latin-1、cp437、返回 cp1252 等）的系统，它应该识别目标编码。它不是。（例如，当再次使用 IDLE GUI 时，emdash 也会丢失，这以前没有发生过）
如果将破折号翻译为连字符而不是审讯爆炸，那就更好了。

问题不在于破折号（我可以想出几种方法来解决这个特定问题），但我需要编写健壮的代码。我正在向页面提供来自数据库的数据，并且该数据可以返回。我可以预见许多其他冲突的情况：“Á”U+00c1（在我的数据库中可能）可以转换为 CP-850（西欧语言的 DOS/Windows 控制台编码），但不能转换为 CP-437（美国编码）英语，许多 Windows 安装中的默认设置）。

那么，问题是：

是否有更好的解决方案使我的代码与输出接口编码无关？

我看到了三种解决方案：

更改输出编码，因此它将始终输出 UTF-8。参见例如在 Python 中管道 stdout 时设置正确的编码 https://stackoverflow.com/questions/492483/setting-the-correct-encoding-when-piping-stdout-in-python，但我无法让这些示例发挥作用。
以下示例代码使输出了解您的目标字符集。
```
# -*- coding: utf-8 -*-
import sys

print sys.stdout.encoding
print u"Stöcker".encode(sys.stdout.encoding, errors='replace')
print u"Стоескер".encode(sys.stdout.encoding, errors='replace')
```
此示例正确地将我的名字中的任何不可打印字符替换为问号。

如果您创建自定义打印功能，例如被称为myprint，使用该机制对输出进行正确编码，您可以简单地将 print 替换为myprint任何必要的地方都可以，而不会让整个代码看起来很难看。
在软件开始时全局重置输出编码：

这一页http://www.macfreek.nl/memory/Encoding_of_Python_stdout http://www.macfreek.nl/memory/Encoding_of_Python_stdout有一个很好的总结如何更改输出编码。尤其是“StreamWriter Wrapper around Stdout”部分很有趣。本质上它说的是改变 I/O 编码函数，如下所示：

在Python 2中：
```
if sys.stdout.encoding != 'cp850':
  sys.stdout = codecs.getwriter('cp850')(sys.stdout, 'strict')
if sys.stderr.encoding != 'cp850':
  sys.stderr = codecs.getwriter('cp850')(sys.stderr, 'strict')
```
在Python 3中：
```
if sys.stdout.encoding != 'cp850':
  sys.stdout = codecs.getwriter('cp850')(sys.stdout.buffer, 'strict')
if sys.stderr.encoding != 'cp850':
  sys.stderr = codecs.getwriter('cp850')(sys.stderr.buffer, 'strict')
```
如果在 CGI 输出 HTML 中使用，您可以将“strict”替换为“xmlcharrefreplace”，以获得不可打印字符的 HTML 编码标记。

请随意修改方法，设置不同的编码，...请注意，它仍然无法输出非指定的数据。因此任何数据、输入、文本都必须正确转换为 unicode：
```
# -*- coding: utf-8 -*-
import sys
import codecs
sys.stdout = codecs.getwriter("iso-8859-1")(sys.stdout, 'xmlcharrefreplace')
print u"Stöcker"                # works
print "Stöcker".decode("utf-8") # works
print "Stöcker"                 # fails
```

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

UnicodeEncodeError：“charmap”编解码器无法编码 - 字符映射到<未定义>，打印函数[重复] 的相关文章

使用 Pillow 和 Numpy 进行图像推导

I have two images and 我想导出一个只有红色 Hello 的图像例如所以我正在运行一个简单的推导python脚本 from PIL import Image import numpy as np root root
查找 python 数据框中每行的最高值

我想找到每行中的最高值并返回 python 中该值的列标题例如我想找到每行的前两个 df A B C D 5 9 8 2 4 1 2 3 我希望我的输出看起来像这样 df B C A D 您可以使用字典理解来生成largest n数据帧
使用 Python 的 optparse 模块时如何遵守 PEP 257 文档字符串？

根据PEP 257 http www python org dev peps pep 0257 multi line docstrings命令行脚本的文档字符串应该是它的使用消息脚本的文档字符串 a 独立程序应该可用作为其使用消息
修复类以在 Flask 会话中启用对象存储[重复]

这个问题在这里已经有答案了我有一个自定义类 Passport 其中包含活动用户身份和权限我曾经将它存储在会话中如下所示 p Passport p do something fancy session passport p 它就奏效了
SQLAlchemy：检查给定值是否在列表中

问题在 PostgreSQL 中检查某个字段是否在给定列表中是使用IN操作员 SELECT FROM stars WHERE star type IN Nova Planet SQLAlchemy 的等价物是什么INSQL查询我尝试过
Python 列表理解不适用于 itertools.groupby 解码

我正在尝试解码结果itertools groupby到一个值列表中我的来源是 x 1 2 2 1 6 3 6 5 1 3 最初的方法是使用 for 语句来实现如下所示 keyfunc itemgetter 0 groups unique
导入错误：没有名为“wordcloud”的模块

我正在努力将 wordcloud 安装到我的环境中这是我正在运行的代码 import os import matplotlib pyplot as plt from wordcloud import WordCloud 我收到以下错误 I
使用 OpenCV 进行相机校准 - 如何调整棋盘方块大小？

我正在使用 OpenCV Python 示例开发相机校准程序来自 OpenCV 教程 http opencv python tutroals readthedocs io en latest py tutorials py calib3d
Python代码执行时自动打开浏览器

我正在 Python Flask 中实现 GUI Flask 的设计方式是必须手动打开本地主机以及端口号有没有一种方法可以使其自动化以便在运行代码时自动打开浏览器本地主机我尝试使用 webbrowser 包但它在会话终止后打
直接打开Spyder还是通过Pythonxy打开？

之前我一直在运行PythonSpyder 我总是开始Spyder直接双击其图标今天突然发现我还有一个东西叫Python x y 我注意到我也可以开始Spyder通过它这两种方法有什么区别吗如果不是的话有什么意义Python x y
Bottle 是否可以处理没有并发的请求？

起初我认为 Bottle 会并发处理请求所以我编写了如下测试代码 import json from bottle import Bottle run request response get post import time app B
当我打印“查询”时获取 PY_VAR1

我正在制作一个简单的网络抓取代码当我尝试打印一个值时它给了我其他东西 def PeopleSearch query SearchTerm query what is query print str query SearchTerm St
在Python中确定句子中2个单词之间的邻近度

我需要确定 Python 句子中两个单词之间的接近度例如在下面的句子中 the foo and the bar is foo bar 我想确定单词之间的距离foo and bar 确定之间出现的单词数foo and bar 请注意该词
如何使用 Selenium Webdriver (Python) 在上下文菜单中选择“将图像另存为...”来保存图像

我正在尝试使用 selenium webdriver 将特定图像保存到目录中我希望通过模拟右键单击 img 元素并选择将图像另存为来实现此目的使用以下代码我可以打开上下文菜单但无法选择正确的选项 browser WebDriver
Docker Build 找不到 pip

尝试关注一些 1 https aws amazon com blogs aws run docker apps locally using the elastic beanstalk eb cli 2 http docs aws amazo
与 GNU Make 等 Python 相关的并行任务并发

我正在寻找一种方法或者可能是一种哲学方法来如何在 python 中执行类似 GNU Make 的操作目前我们使用 makefile 来执行处理因为 makefile 非常擅长通过更改单个选项 j x 进行并行运行此外 gnu mak
无法在 Windows 服务器上使 SVN 预提交脚本失败

我正在编写一个 SVN pre commit bat 文件该文件调用 Python 脚本来查询我们的问题跟踪系统以确定用户提供的问题跟踪 ID 是否处于正确的状态例如打开状态并与正确的关联项目 SVN 服务器运行 Windows
Java 相当于 Python 的 urllib.urlencode（基于 HashMap 的 UrlEncode）

From https stackoverflow com questions 2018026 should i use urllib or urllib2 2018103 2018103 Java 中 Python 的 urllib url
在Python中打开网站框架或图像

所以我对 python 相当熟练并且经常使用 urllib2 和 Cookies 来实现网站自动化我刚刚偶然发现了 webbrowser 模块它可以在默认浏览器中打开一个网址我想知道是否可以从该 url 中仅选择一个对象并打开它具
使用Python的线程模块调用ctypes函数比使用多处理更快？

我一生都无法找出这个问题的答案我编写了一个可以执行数百次繁重计算的脚本我有一个绝妙的主意将这些计算任务编写为 C 然后使用 Python 的 ctypes 与它们交互我心想我什至可以使用并行性进一步优化它我最初的方法是使用线程

随机推荐

Android 地图 v2 在第二次充气时出现错误

我正在尝试在我的应用程序中使用新的 Android 地图我有一个 FragmentActivity 其布局包含除其他外
scoverage：结合 test 和 it:test 的覆盖率

我用过滤器分割了单元测试和集成测试 lazy val FunTest config it extend Test def funTestFilter name String Boolean name endsWith Spec def un
正则表达式选择多行字符串中的最后一行

我有一个 ANT 脚本它有一个属性其值可以是一行或多行例如财产 prop1 A 12 1 REL B121000 10 18 2011 1700 A 12 1 REL B121001 10 25 2011 6059 A 12 1 R
获取 NullPointerException：尝试在 Android 中读取字节数组时尝试获取 Parcelable 中空数组的长度

我有一个实现 Parcelable 的类我的所有值都通过 writeToParcel 方法设置正常但在构造函数中读取时我遇到了引发 NullPointerException 的字节数组问题 public final class Pro
字符串被分配给列表而没有编译错误[重复]

这个问题在这里已经有答案了据我所知 Java 中泛型的主要目的之一是提供编译时类型安全如果它被编译代码将毫无问题地运行那么为什么下面的代码会被编译呢 public static void main String args Strin
Python与selenium并行执行

我对使用 selenium 在 python 中并行执行感到困惑似乎有几种方法可以解决这个问题但有些似乎已经过时了有一个名为的 python 模块python wd parallel好像有一些功能可以做到这一点但这是 2013 年的
从 Pyspark 数据帧创建字典显示 OutOfMemoryError: Java 堆空间

我见过并尝试过很多existing https stackoverflow com questions 37335 how to deal with java lang outofmemoryerror java heap space er
DXF图像实体组代码解释

我正在开发一个 Delphi 类来从 DXF 文件导入导出某种实体我想添加对图像实体的支持但我不明白一些组代码我正在使用官方 DXF 指南参考 2002 http www autodesk com techpubs autocad
Entity Framework 6.1 本身支持 XML 数据类型吗？

某些 RDBMS 包括 SQL Server 支持 XML 列我不想将这样的列映射到string数据类型 Entity Framework 6 1 是否以任何方式原生支持 XML 更具体地说我可以映射一个xml NET 的 XML 数据
Spring data jpa存储库内存中测试用例

在我的项目中我编写了一个存储库类我需要编写内存中测试类我的存储库代码如下 package org jaap reference repository import java util List import org springfra
统一流畅的动作

我开始学习统一我面临着一个我无法摆脱的问题那就是但是我试图让动作平滑它不像通常的视频游戏无论 FPS 有多高或有多少不同我尝试实现逻辑的方法我尝试使用固定更新和固定增量时间但似乎没有什么区别 void Update movem
动态更新配置数据codeigniter

我创建了自定义配置文件来存储有关站点的信息例如它是在线还是离线为此我在 config 文件夹中创建了新文件并使用我自己的索引将默认值存储在全局 config 数组中我想通过管理员控制动态更新这些配置数据例如他可以选择将站点置于
不带标签的单选按钮样式

我现在面临这个问题我想样式单选按钮 and 复选框由系统生成并没有标签我正在使用 IBM SPSS Data Collection 进行在线调查这意味着它会根据我可以设置样式的某个模板主要是使用 CSS 样式生成所有页面问题我发
在应用程序中找不到传递库依赖项

假设我有一个库模块其中包含一些第三方库例如 OkHttp 当我在我的应用程序中包含这个库时我无法使用这些第三方库我阅读了以下文章第1条 https stackoverflow com questions 22795455 trans
CakePHP 管理部分路由和重定向

我正在努力解决在 CakePHP 项目中创建管理部分的概念 2 3 5版本我已取消注释 Config core php 中的行 Configure write Routing prefixes array admin 我在 Config
为什么 Angular 仍然将请求编码为 JSON？ ( $http, $httpParamSerializerJQLike )

我想要有角度的制作x www form urlencoded要求默认情况下不是 JSON angular 1 4 5 defaults paramSerializer仅用于 URL 构建不用于POST身体 defaults transf
MongoDB - 具有聚合的地理空间索引

我从 to 文档中读到不可能在 MongoDB 聚合上使用地理空间索引有替代方案吗我正在尝试运行一个查询获取特定半径内的所有活动然后按活动发生的次数对它们进行分组排序有办法解决这个问题吗您可以在地理查询上使用map redu
如何将复选框添加到 jQgrid 标题中

每个 jQgrid 行都有多个复选框因此我不能仅使用多选这就是该列的设置方式名称 ColName 标签宽度 50 可编辑 true 可排序 false edittype 复选框格式化程序复选框格式选项禁用 false 索
如何为打开表单的大量按钮创建可重用组件

使用的库 mui 5 4 1 创建一个TableCell含有一个IconButton打开一个Form 代码编写如下 const data id 001 name A price 2000 id 002 name B price 100 co
UnicodeEncodeError：“charmap”编解码器无法编码 - 字符映射到<未定义>，打印函数[重复]

这个问题在这里已经有答案了我正在编写一个 Python Python 3 3 程序使用 POST 方法将一些数据发送到网页主要用于调试过程我获取页面结果并将其显示在屏幕上使用print 功能代码是这样的 conn request

UnicodeEncodeError：“charmap”编解码器无法编码 - 字符映射到<未定义>，打印函数[重复]

UnicodeEncodeError：“charmap”编解码器无法编码 - 字符映射到<未定义>，打印函数[重复] 的相关文章

随机推荐

热门标签