Windows 上的 Python str 与 unicode，Python 2.7，为什么 'á' 变成 '\xa0'

2024-02-21

背景

我使用的是 Windows 机器。我知道不再支持 Python 2.*，但我仍在学习 Python 2.7.16。我还有Python 3.7.1。我知道Python 3.*"unicode被重命名为str" https://stackoverflow.com/a/18034409/1175496

我使用 Git Bash 作为我的主 shell。

I read 这个问题 https://stackoverflow.com/questions/18034272/python-str-vs-unicode-types。我觉得我理解 Unicode（代码点）和编码（不同的编码系统；字节）之间的区别。

Question

当我评价时'á'，我期望得到'\xc3\xa1' 如这个答案所示 https://stackoverflow.com/a/49138962/1175496
当我评价时len('á')，我期望得到2, 如这个答案所示 https://stackoverflow.com/a/18034409/1175496

但我没有得到预期的结果。运行 git bash C:\Python27\python.exe 时...：

Python 2.7.16 (v2.7.16:413a49145e, Mar  4 2019, 01:37:19) [MSC v.1500 64 bit (AMD64)] on win32

>>> 'á'
'\xa0'
#'\xc3\xa1' expected

>>> len('á') 
1
#2 expected

# one more for reference:
>>> 'à'
'\x85'
#'\xc3\xa0' expected

您能帮我理解为什么我会得到上面显示的输出吗？

具体为什么'á' become '\xa0'?

我尝试过的

我可以用unicode对象得到我期望的结果：

>>> u'á'.encode('utf-8')
'\xc3\xa1'
>>> len(u'á'.encode('utf-8'))
2

我可以打开IDLE我得到了不同的结果——不是expected结果，但至少我理解这些结果。

Python 2.7.16 (v2.7.16:413a49145e, Mar  4 2019, 01:37:19) [MSC v.1500 64 bit (AMD64)] on win32
>>> 'á'
'\xe1'
>>> len('á')
1
>>> 'à'
'\xe0'

IDLE结果出乎意料，但我仍然理解结果；马丁·彼得斯解释 https://stackoverflow.com/questions/18034272/python-str-vs-unicode-types#comment26380927_18034277 why 'á' become '\xe1' 采用拉丁 1 编码.

那么，为什么 IDLE 会给出与直接运行 Git Bash Python 2.7.1 可执行文件不同的结果呢？换句话说，如果 IDLE 为使用拉丁语 1对我的输入进行编码，我的 Git Bash Python 2.7.1 使用什么编码。可执行，这样'á'变成'\xa0'

我想知道什么

是我的默认编码有问题吗？我太害怕了更改默认编码。 https://stackoverflow.com/questions/5419/python-unicode-and-the-windows-console#comment36374776_2013263

>>> import sys; sys.getdefaultencoding()
'ascii'

我感觉这是我的终端的编码有问题吗？（我使用 git bash）我应该尝试吗改变PYTHONIOENCODING环境变量 https://stackoverflow.com/a/32176732/1175496?

我尝试检查一下git bashlocale https://stackoverflow.com/a/36692549/1175496，结果是：

LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_ALL=

另外，我正在使用交互式 Python ，我应该尝试使用这个文件吗？

# -*- coding: utf-8 -*- sets the source file's encoding, not the output encoding.

I know 升级到Python 3是一个解决方案。 https://stackoverflow.com/a/4637795/1175496，但我仍然好奇为什么我的 Python 2.7.16 的行为有所不同。

感谢@dan04、@MarkTolonen 和@（请参阅对上述问题的评论）。正如@MarkTolonen 所说：

命令提示符使用默认的 OEM 代码页（美国 Windows 的 cp437 ....）”

通过检查这似乎很清楚代码页 437 https://en.wikipedia.org/wiki/Code_page_437对于我尝试编码的值：

>>> 'á' #-> '\xa0' expected in code page 437
>>> 'à' #-> '\x85' expected in code page 437

I highlight those values in the screenshot below. $screenshot of code page 437 from https://en.wikipedia.org/wiki/Code_page_437 highlighting the characters à (mapping to byte \x85) and á (mapping to byte \xa0)$

我使用了 @MarkTolonen 的跑步建议the chcp command https://learn.microsoft.com/en-us/windows-server/administration/windows-commands/chcp获取或设置我的 shell/终端使用的编码。chcp是“的缩写”change code p年龄”。如果您使用Git Bash，使用chcp.com https://stackoverflow.com/a/36174752/1175496反而。果然，当我跑步时chcp，输出是Active code page: 437:

然后我尝试了 @juanpa.arrivilillaga 使用文件的建议。首先，我尝试了一个明确使用 437 代码页的文件。

我添加了“神奇评论” https://peps.python.org/pep-0263/指定编码 437：# -*- coding: cp437 -*-，但这还不足以对文件进行编码。神奇的评论向 Python 解释如何decode文件 https://stackoverflow.com/a/3170647/1175496.
我也不得不更改文件的编码 https://stackoverflow.com/questions/30082741/change-the-encoding-of-a-file-in-visual-studio-code（告诉我的编辑器 VS Code，如何encode在 CP437 中）。

一旦我用 Python 完成了这两件事file（用CP437编码和解码），我得到与我的操作相同的“意外”结果，这证实了 CP437 确实是我使用的编码终端/外壳.

一般来说，您必须both encode and包括“解码魔法注释”，以及确保您的 shell 使用相同的编码!

如果我在CP437中包含没有编码的cp437“魔法注释”（VS Code默认编码是UTF-8），则长度'á'是 2；就像 UTF-8 一样！（请注意，结果打印在我的 CP437 shell 中，因此它们看起来很奇怪；我看到了字符├，即\xc3在CP437！）
如果我使用 CP437 进行编码但不包含魔术注释，则会收到错误消息：(SyntaxError: Non-ASCII character '\xa0' in file 437_encoding.py on line 4)

如果我使用 utf-8 进行编码，并且包含 utf-8 的“神奇注释”，然后将 shell 更改为使用 utf-8 (chcp.com 65001），然后我得到了我期望的结果！

最后，如果我尝试使用 @MarkTolonen 的建议sys.stdout.encoding，它会告诉我结果“cp437”！

请注意sys.stdout.encoding（这对我来说具有价值cp437)...
is 不一样 as sys.getdefaultencoding()（这对我来说具有价值ascii...

如果我尝试检查sys.stdout.encoding当我使用chcp.com将代码页更改为 UTF-8（值 65001），出现错误LookupError: unknown encoding: cp65001这是这里有更详细的描述 https://stackoverflow.com/a/3259271/1175496

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Windows 上的 Python str 与 unicode，Python 2.7，为什么 'á' 变成 '\xa0' 的相关文章

Sublime Text 插件开发中的全局 Python 包

一总结我不知道 Sublime Text 插件开发人员如何使用 Sublime Text 查找全局 Python 包而不是 Sublime Text 目录的 Python 包 Sublime Text使用自己的Python环境而不是
补丁 - 为什么相对补丁目标名称不起作用？

我已经从模块导入了一个类但是当我尝试修补类名而不使用模块作为前缀时出现类型错误 TypeError Need a valid target to patch You supplied MyClass 例如以下代码给出了上述错误 imp
删除 Django 1.7 中的应用程序（和关联的数据库表）

是否可以使用 Django 1 7 迁移来完全删除卸载应用程序及其所有跟踪主要是其所有数据库表如果没有在 Django 1 7 中执行此操作的适当方法是什么 python manage py migrate
如何在Python中同时运行两只乌龟？

我试图让两只乌龟一起移动而不是一只接着另一只移动例如 a turtle Turtle b turtle Turtle a forward 100 b forward 100 但这只能让他们一前一后地移动有没有办法让它们同时移动有没有
Mac OS X 中文件系统的 Unicode 编码在 Python 中不正确？

在 OS X 和 Python 中处理 Unicode 文件名有点困难我试图在代码中稍后使用文件名作为正则表达式的输入但文件名中使用的编码似乎与 sys getfilesystemencoding 告诉我的不同采取以下代码 usr b
在没有模型的情况下将自定义页面添加到 django admin

我正在尝试在没有模型关联的情况下向管理员添加自定义页面这就是我迄今为止所取得的成就 class MyCustomAdmin AdminSite def get urls self from django conf urls import
Emacs 24.x 上的 IPython 支持

我对 IPython 与 Emacs 的集成感到困惑从 Emacs 24 开始 Emacs 附带了自己的python el 该文件是否支持 IPython 还是仅支持 Python 另外维基百科 http emacswiki org e
结构差异 sudo() run('sudo 命令')

我想知道函数之间有什么区别sudo 和函数run sudo u user smth 文档上有 sudo 在所有运行方式上都是相同的除了它总是换行调用 sudo 程序中的给定命令以提供超级用户特权但有几次 sudo cmd 提示我输入
Docker 警告：无法从守护进程获取默认注册表端点

在 Windows 10 上当我调用 docker 命令时 docker pull mongo windowsservercore 我得到以下输出 Warning failed to get default registry endpoi
使用Python计算目录的大小？

在我重新发明这个特殊的轮子之前有没有人有一个很好的例程来使用 Python 计算目录的大小如果例程能够很好地以 Mb Gb 等格式格式化大小那就太好了这会遍历所有子目录总结文件大小 import os def get size s
Vagrant 错误：无法挂载 VirtualBox 共享文件夹（Guest Additions、vboxsf）

问题我在 Windows 10 上安装了 Vagrant 这样我就可以在虚拟机中创建个人本地开发环境我读到的有关 Vagrant 的所有内容都表明我什至可以启动多个系统并通过 NAT 端口转发测试它们之间的通信但首先我只想在对其余部
ANTLR 获取并拆分词法分析器内容

首先对我的英语感到抱歉我还在学习我为我的框架编写 Python 模块用于解析 CSS 文件我尝试了 regex ply python 词法分析器和解析器但我发现自己在 ANTLR 中第一次尝试我需要解析 CSS 文件中的注释
返回表示每组内最大值的索引的一系列数字位置

考虑一下这个系列 np random seed 3 1415 s pd Series np random rand 100 pd MultiIndex from product list ABDCE list abcde One Two T
动态过滤 pandas 数据框

我正在尝试使用三列的阈值来过滤 pandas 数据框 import pandas as pd df pd DataFrame A 6 2 10 5 3 B 2 5 3 2 6 C 5 2 1 8 2 df df loc df A gt 0
当数据库不是 Django 模型时，是否可以使用数据库中的表？

是否可以从应用程序数据库中的表获取查询集该表不是应用程序中的模型如果我有一个不是名为 cartable 的模型的表从概念上讲我想这样做 myqueryset cartable objects all 有没有相对简单的方法来做到这一点
如何与其他用户一起使用 pyenv？

如何与其他用户一起使用 pyenv 例如如果我在用户 test 的环境中安装了 pyenv 则当我以 test 身份登录时可以使用 pyenv 但是当我以其他用户例如 root 身份登录时如何使用 pyenv 即使你这么做了我也会s
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此
多个对象以某种方式相互干扰[原始版本]

我有一个神经网络 NN 当应用于单个数据集时它可以完美地工作但是如果我想在一组数据上运行神经网络然后创建一个新的神经网络实例以在不同的数据集甚至再次同一组数据上运行那么新实例将产生完全错误的预测例如对 XOR 模式进行训练
如何为不同操作系统/Python 版本编译 Python C/C++ 扩展？

我注意到一些成熟的Python库已经为大多数架构 Win32 Win amd64 MacOS 和Python版本提供了预编译版本针对不同环境交叉编译扩展的标准方法是什么葡萄酒虚拟机众包我们使用虚拟机和Hudson http hud

随机推荐

Java中NoSuchMethodException和NoSuchMethodError的区别

我找不到两者之间的确切区别NoSuchMethodException and NoSuchMethodError在爪哇有人可以解释这两件事并举个例子吗当您通过反射调用方法并且该方法的名称来自程序中的变量时可能会引发 NoSuchMet
如何过滤（或替换）UTF-8 中占用超过 3 个字节的 unicode 字符？

我正在使用 Python 和 Django 但我遇到了由 MySQL 的限制引起的问题根据MySQL 5 1 文档 http dev mysql com doc refman 5 1 en charset unicode utf8 htm
如何在 angularjs 中单击按钮添加行和表格？

我需要一个表其行可以在单击按钮时动态添加并且表本身可以通过另一个按钮单击来重新创建并显示在页面上我创建了以下内容 HTML
Objective-c 布尔值的释放

我会怎样dealloc布尔值下面这种方式释放它给了我一个警告 Incompanypointer to integer conversion allocateing to BOOL aka signed char from void voi
数据触发器中的标记扩展

为了翻译我的 WPF 应用程序我使用了一个返回 Binding 对象的标记扩展这允许我在应用程序运行时切换语言我这样使用这个标记
三元运算表现得很奇怪[重复]

这个问题在这里已经有答案了我很难理解下面代码中三元运算的工作原理 public static void main String args try throw new ArithmeticException Exception Testin
如何为排列编写一个好的 hashCode() ？

在我的程序中我处理很多大小的列表n所有这些都是 1 n 我的问题是我把这些排列放在HashMaps and HashSets 我需要一个好的hashCode 这样可以避免太多的碰撞我想到的所有解决方案都会导致大量冲突或溢出如何为排列编
C# - 调用具有所有默认参数的结构构造函数

今天创建的时候遇到了这个问题struct保存一堆数据这是一个例子 public struct ExampleStruct public int Value get private set public ExampleStruct int
使用 CocoaPods 停止使用 ionic Project 构建 iOS

我创建了一个离子项目我使用 Ionic CIL 构建了该应用程序并完美运行现在使用 cocoapods 我创建了一个 pod 文件并加载了所需的 pod 并进行了 pod 安装现在当我尝试运行 ionic run build ios
如何将 React 中的默认端口从 3000 更改为另一个端口？

如何将React默认端口3000更改为其他端口默认情况下 ReactJS 应用程序在端口 3000 上运行 Express js 应用程序也在同一端口 3000 上运行如果您要同时运行这两个应用程序则会发生冲突您需要更改其中之一的端
未捕获的 ReferenceError：foobar 未定义（匿名函数）

我有这个 js 文件从某个域提供服务foobar com at http foobar com static js main js document ready function function foobar bar ajax url s
插件的 VueJS 反应式绑定 - 如何？

我正在为 Pouch CouchDB 开发一个 Vue 插件该插件将是开源的但只要我能找出我遇到的问题目前我正在尝试使该插件非常类似于 Vuex 它具有内部状态并检测更改并在发生更改时渲染视图在 Vue 实例中我正在初始化一
URI 中复杂类型的 WebAPI 帮助页面

我在用着WebAPI 帮助页面 http blogs msdn com b yaohuang1 archive 2012 08 15 introducing the asp net web api help page preview asp
如何将对象转换为字符串以便与 ActiveRecord 查询一起使用？

我有一个User 其中有一个String email属性但是当我在应用程序中处理电子邮件时我发现最好先将其转换为非持久 Email对象就像这样 class User lt ActiveRecord Base def email E
Cron：每 1 秒运行一次 cron？

如何让 cron 每 1 秒运行一次默认只有分钟选项让 cron 第一次开始这项工作将程序置于无限循环中每次循环结束时 sleep 1 秒像这样在C中 int main int argc char argv while 1 do
如何在 Android 中启用 Google Chrome 的“扫描新卡”选项？

Google Chrome 具有扫描信用卡以在付款期间填充字段的功能该功能适用于 Android Chrome 不适用于 Android 的所有版本和设备我已附上屏幕截图 It shows on other websites but
在 C++11 智能指针中存储 std::thread

In C 11 多于有什么优点或缺点当存储一个std thread直接作为班级成员如下所示 std thread my thread 与存储相反std shared ptr or std unique ptr像这样的线程 std shar
如何从 Google 版本地图中拖动的标记获取格式化地址

我制作了一个谷歌地图可以让你在文本字段中输入地址然后它会将您导航到您在文本字段中输入的地址并留下一个可拖动的标记拖动时会显示纬度和经度以及地理位置地址我不想显示上述地址而是希望当您拖动标记时在底角显示标记的地址而不是从文本字
纯 CSS 中基于复选框隐藏表格行

对于那些关心的人来说有一些背景故事不久前我偶然发现了这个 https medium com front end hacking how it feels to learn javascript in 2017 a934b801fbe h
Windows 上的 Python str 与 unicode，Python 2.7，为什么 'á' 变成 '\xa0'

背景我使用的是 Windows 机器我知道不再支持 Python 2 但我仍在学习 Python 2 7 16 我还有Python 3 7 1 我知道Python 3 unicode被重命名为str https stackoverflo

Windows 上的 Python str 与 unicode，Python 2.7，为什么 'á' 变成 '\xa0'

Windows 上的 Python str 与 unicode，Python 2.7，为什么 'á' 变成 '\xa0' 的相关文章

随机推荐

热门标签