Python open("x", "r") 函数，我如何知道或控制文件应该具有哪种编码？

2024-04-02

如果 python 脚本使用open("filename", "r")函数打开并随后读取文本文件的内容，我如何知道该文件应该具有哪种编码？

请注意，由于我是从自己的程序执行此脚本，因此如果有任何方法可以通过环境变量来控制它，那么这对我来说就足够了。

顺便说一句，这是 Python 2.7。

有问题的代码来自 Mercurial，它可以提供一个文件列表，例如通过磁盘上的文件添加到存储库，而不是在命令行上传递它们。

所以基本上，而不是这个：

hg add A B C

我可以将 A、B 和 C 写入一个文件，每个文件之间有换行符，然后执行以下命令：

hg add listfile:input.txt

最终读取该文件的代码是这样的：

files = open(name, 'r').read().split(delimiter)

因此我的问题。当我询问应该使用哪种编码时，IRC 上给出的答案是：

它与传递文件参数时在命令行上使用的编码相同

我认为这意味着它与我执行 Mercurial (hg) 时“使用”的编码相同。由于我不知道那是哪种编码，所以我只是将所有内容都交给 .NET Process 对象，我在这里询问。

你不能。读取文件与其编码无关；您需要提前知道编码才能正确解释您读入的字节。

例如，如果您知道文件采用 UTF-8 编码：

with open('filename', 'rb') as f:
    contents = f.read().decode('utf-8-sig')    # -sig deals with BOM, if present

或者，如果您知道该文件仅为 ASCII：

with open('filename', 'r') as f:
    contents = f.read()    # results in a str object

如果你确实不知道文件的编码，那么显然不能保证你可以正确读取它；但是，您可以使用类似的工具猜测编码chardet http://chardet.feedparser.org/.

UPDATE:

我想我现在明白你的问题了。我以为您有一个需要为其编写代码的文件，但似乎您有一个需要为其编写文件的代码;-)

有问题的代码可能只能正确处理纯 ASCII（字符串可能稍后会被转换，但我认为不太可能）。因此，您需要创建一个仅包含 ASCII（代码点

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

encoding

textfiles

Python open("x", "r") 函数，我如何知道或控制文件应该具有哪种编码？的相关文章

通过 boto3 承担 IAM 用户角色时访问被拒绝

Issue 我有一个 IAM 用户和一个 IAM 角色我正在尝试将 IAM 用户配置为有权使用 STS 承担 IAM 角色我不确定为什么收到访问被拒绝错误 Details IAM 角色 arn aws iam 123456789 r
如何删除 PyCharm 中的项目？

如果我关闭一个项目然后删除该项目文件夹则在 PyCharm 重新启动后会再次创建一个空的项目文件夹只需按顺序执行以下步骤即可他们假设您当前在 PyCharm 窗口中打开了该项目单击文件 gt 关闭项目关闭项目在 PyCha
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
使用 Python 3 动态插入到 sqlite

我想使用 sqlite 写入多个表但我不想提前手动指定查询有数十种可能的排列例如 def insert sqlite tablename data list global dbc dbc execute insert into tab
python array(10,1) 和 array(10,) 之间的区别

我正在尝试将 MNIST 数据集加载到数组中当我使用 X train y train X test y test mnist load data 我得到一个数组 y test 10000 但我希望它的形状为 10000 1 数组 1000
检查 python 中命令行参数的数量

我是蟒蛇新手还是把脚弄湿了我正在尝试做这样的事情 import sys if len sys argv lt 3 or lt len sys argv gt 3 print This script will compare two fi
为什么第二个 request.session cookies 返回空？

我想使用 requests Session post 登录网站但是当我已经登录主页然后进入帐户页面时看来cookies还没有保存因为cookies是空的而且我无法进入正确的帐户页面 import requests from bs4
如何获取numpy.random.choice的索引？ - Python

是否可以修改 numpy random choice 函数以使其返回所选元素的索引基本上我想创建一个列表并随机选择元素而不进行替换 import numpy as np gt gt gt a 1 4 1 3 3 2 1 4 gt gt
如何使用 opencv python 计算乐高积木上的孔数？

我正在开发我的 python 项目我需要计算每个乐高积木组件中有多少个孔我将从输入 json 文件中获取有关需要计算哪个程序集的信息如下所示 img 001 red 0 blue 2 white 1 grey 1 yellow 1 r
仅当某些值相等时，如何才能将一个文本文件中的值替换为另一个文本文件中的其他值？

我有一个名为finalscores txt我想创建一个 python 脚本它将打开它并从两个单独的列中读取值这是我的finalscores txt file Atom nVa predppm avgppm stdev delta QPr
更改QLineEdit的ClearButton图标

我想在Windows 10 1909 64位上的Python 3 8和PyQt5 5 15 0 上更改我的QLineEdit的ClearButton图标稍后我想在Linux上运行代码我尝试应用此处找到的代码如何在 QLineEdit
Python“非规范化”unicode 组合字符

我正在寻找标准化 python 中的一些 unicode 文本我想知道是否有一种简单的方法可以在 python 中获得组合 unicode 字符的非规范化形式例如如果我有序列u o xaf i e latin small lette
在 Mac OS X 上安装 libxml2 时出现问题

我正在尝试在我的 Mac 操作系统 10 6 4 上安装 libxml2 我实际上正在尝试在 Python 中运行 Scrapy 脚本这需要我安装 Twisted Zope 现在还需要安装 libxml2 我已经下载了最新版本 2 7 7
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
为什么这个 if 语句会导致语法错误

我正在尝试设置一个 elif 语句如果用户按下 Enter 键代码将继续但是我不断遇到语法错误 GTIN 0 while True try GTIN int input input your gtin 8 number if len
使用seaborn绘制简单线图

我正在尝试使用seaborn python 绘制ROC曲线对于 matplotlib 我只需使用该函数plot plt plot one minus specificity sensitivity bs where one minus s
使用 selenium 和 python 来提取 javascript 生成的 HTML？萤火虫？

这里是Python新手我遇到的是数据收集问题我在这个网站上当我用 Firebug 检查我想要的元素时它显示了包含我需要的信息的源然而常规源代码没有 Firebug 不会给我这个信息这意味着我也无法通过正常的 selenium
PyQt5：如何使QThread返回数据到主线程

I am a PyQt 5 4 1 1初学者我的Python是3 4 3 这是我尝试遵循的many https mayaposch wordpress com 2011 11 01 how to really truly use qthr
Python 中的 Unix cat 函数 (cat * > merged.txt)？ [复制]

这个问题在这里已经有答案了一旦建立了目录有没有办法在Python中使用Unix中的cat函数或类似的函数我想将 files 1 3 合并到 merged txt 我通常会在 Unix 中找到该目录然后运行 cat gt merged
使用 paramiko 运行 Sudo 命令

我正在尝试执行sudo使用 python paramiko 在远程计算机上运行命令我尝试了这段代码 import paramiko ssh paramiko SSHClient ssh set missing host key polic

随机推荐

从 CDN JS 导入 firebase firestore 不起作用

我正在从 CDN 导入 Firebase Firestore 以在本地服务器上运行我按照文档所述将其导入就在这里 https firebase google com docs web alt setup https firebase g
我应该如何使用 Hibernate 从 JPQL 查询引用内部枚举（在实体内定义）？

我有一个实体类如下 package stuff Entity class Thing Id GeneratedValue private Long id Basic Enumerated private State state public
如果不存在则创建文件夹路径（从 VBA 保存）

我在工作表中有一个项目列表如下所示我的代码遍历每一行并对供应商进行分组并将一些信息复制到每个供应商的工作簿中在此场景中有 2 个唯一的供应商因此将创建 2 个工作簿这有效接下来我想将每个工作簿保存在特定的文件夹路径中如果文
带有 nginx 的网络服务器一直工作到创建 .save 文件

在过去 48 小时内到处进行谷歌搜索以找出为什么我的服务器突然停止工作后最后我自己找到了答案我决定将其发布在这里供那些在整个周末都在谷歌上搜索如此琐碎事情的人使用在 nginx 上加载了所有内容 LEMP 工作完美但后来我尝试进
Excel 中的数据整理 - 重新排列列和行

我有一个巨大的 Excel 数据集我想重新排列行和列这是数据的片段它看起来是什么样子以及我希望它看起来是什么样子 Area Channel Unit Year1 Year2 Year3 Year4 bel dc share 25 36
使用 java11 构建和部署 javafx 应用程序

我按照以下步骤操作https blog jetbrains com idea 2013 03 packaging javafx 2 applications in intellij idea 121 https blog jetbrains
为什么 SQL Server SET DEADLOCK_PRIORITY HIGH 不被遵守？

我捕获了 SQL Server 2012 死锁图使用盖尔肖的 https www red gate com simple talk sql performance sql server deadlocks by example 查询显
MongoDB C# 连接/断开（官方驱动程序）

请告诉我如何通过官方 C 驱动程序连接断开到 MongoDB 问题很简单乍一看问题很微不足道但是 1 我是否需要自己调用Disconnect方法或者它会被诸如Dispose之类的方法关闭 2 每次需要向Mongo发出请求时都需要连接
statsmodel 预测开始和结束索引

我正在尝试实现 statsmodel 包中的预测功能 prediction results predict start 1 end len test exog test 输入测试和输出预测的日期不一致前者为2012年1月4日至2012年
getter 和 setter 的 Google 样式指南属性

我对其中的一项建议感到好奇有关属性的 Google Python 风格指南 https google github io styleguide pyguide html Properties 他们在其中给出了以下示例 class Squar
SQLite 与 Android NDK

是否可以在 Android 手机上将 SQLite 与 C 结合使用我还没有找到任何关于如何实现这一点的文档只需从以下位置下载 SQLite3 合并源文件 http www sqlite org download html http w
如何将 Xcode 项目转换为使用 ARC（自动引用计数）？

当我运行 Convert to Obj C 时它首先运行预检查我希望预检查忽略一些文件并且我认为可以在这些文件上设置编译器标志 fno objc arc 但预检查阶段似乎忽略了该标志并重置了它所以我真的不知道如何超越预检查预检查
按名称调用 Django celery 任务

我需要从models py调用一个celery任务在tasks py中唯一的问题是 tasks py导入models py 所以我无法从models py导入tasks py 有没有什么方法可以仅使用名称来调用 celery 任务而无
将多个数组作为参数传递给 Bash 脚本？

我看过但只看到了脚本中传递的一个数组的答案我想将多个数组传递给 bash 脚本该脚本将它们分配为单独的变量如下所示 myScript sh array1 array2 array3 这样 var1 array1 and var2 a
Java 和 C++ 中的简单变量

我在一些资料中看到这样一句话在 Java 中简单数据类型例如 int 和 char 的运行方式与 C 中一样我想知道 Java 和 C 中它们实际上是不同的在C 中像Java中的基元这样的简单变量也被分配了一个内存地址因此C
使用 SQL 获取每小时统计信息

我们有一张桌子名字员工注册有字段 employeeNo employeeName Registered on Here 注册日期是一个时间戳我们要求在几天内按小时进行注册例如 08 年 1 月 1 日 12 点下午 1 点 15
C# 为 ++ 运算符生成 IL - 前缀/后缀表示法何时以及为何更快

由于这个问题是关于增量运算符和前缀后缀表示法的速度差异我将非常仔细地描述这个问题以免 Eric Lippert 发现它并激怒我有关我为什么要问的更多信息和更多详细信息请访问http www codeproject com KB c
Silverlight：拉伸到 StackPanel 中的剩余空间

我有一个带有两个元素的垂直 StackPanel 一个按钮和一个列表框如何让列表框拉伸到剩余页面高度
将一个 Artifactory 连接到另一个 Artifactory

我们的设置包括一个全公司范围的 Artifactory 它保存内部构建的工件并出去获取公开可用的工件我正在尝试在我们的位置建立一个本地 Artifactory 它将通过常规互联网获取公开可用的工件但会连接到公司范围内的 Artifac
Python open("x", "r") 函数，我如何知道或控制文件应该具有哪种编码？

如果 python 脚本使用open filename r 函数打开并随后读取文本文件的内容我如何知道该文件应该具有哪种编码请注意由于我是从自己的程序执行此脚本因此如果有任何方法可以通过环境变量来控制它那么这对我来说就足够了顺便

Python open("x", "r") 函数，我如何知道或控制文件应该具有哪种编码？

Python open("x", "r") 函数，我如何知道或控制文件应该具有哪种编码？ 的相关文章

随机推荐

热门标签

Python open("x", "r") 函数，我如何知道或控制文件应该具有哪种编码？的相关文章