读取文件时不转换换行符

2024-02-07

我正在读取一个文本文件：

f = open('data.txt')
data = f.read()

然而换行符data当文件包含 CRLF ('\r\n') 时，变量被标准化为 LF ('\n')。

如何指示 Python 按原样读取文件？

在 Python 2.x 中：

f = open('data.txt', 'rb')

As the docs http://docs.python.org/2/library/functions.html#open say:

默认情况下是使用文本模式，该模式可以在写入时将“\n”字符转换为特定于平台的表示形式，并在读取时将其转换回来。因此，当打开二进制文件时，您应该附加'b'模式值以二进制模式打开文件，这将提高可移植性。（附加'b'即使在不以不同方式处理二进制文件和文本文件的系统上（它充当文档）也很有用。）

在 Python 3.x 中，有三种选择：

f1 = open('data.txt', 'rb')

这将使换行符保持不变，但也会返回bytes代替str，你必须明确地decode自己进行 Unicode。（当然，如果您想要 Unicode，2.x 版本也返回必须手动解码的字节，但在 2.x 中，这就是str对象是；在 3.x 中str是统一码。）

f2 = open('data.txt', 'r', newline='')

这将返回str，并保留换行符不翻译。然而，与 2.x 等效版本不同的是，readline和朋友会招待'\r\n'作为换行符，而不是后跟换行符的常规字符。通常这并不重要，但如果确实如此，请记住这一点。

f3 = open('data.txt', 'rb', encoding=locale.getpreferredencoding(False))

这与 2.x 代码处理换行符的方式完全相同，并返回str如果您只使用所有默认值，则使用相同的编码……但它在当前的 3.x 中不再有效。

从流中读取输入时，如果换行符为 None，则启用通用换行符模式。输入中的行可以以“\n”、“\r”或“\r\n”结尾，这些行在返回给调用者之前会被转换为“\n”。如果是 ''，则启用通用换行模式，但行结尾会以未翻译的形式返回给调用者。

您需要指定显式编码的原因f3以二进制模式打开文件意味着默认的“decode withlocale.getpreferredencoding(False)” 到 “不解码，并返回原始数据bytes代替str”。再次，从the docs http://docs.python.org/3/library/functions.html#open:

在文本模式下，如果未指定编码，则使用的编码取决于平台：调用 locale.getpreferredencoding(False) 来获取当前区域设置编码。（对于读取和写入原始字节，请使用二进制模式并保留未指定的编码。）

However:

'encoding' ...只能在文本模式下使用。

并且，至少从 3.3 开始，这是强制执行的；如果你尝试使用二进制模式，你会得到ValueError: binary mode doesn't take an encoding argument.

那么，如果您想编写同时适用于 2.x 和 3.x 的代码，您会使用什么？如果您想经营bytes，明显地f and f1are the same. But if you want to deal instr, as appropriate for each version, the simplest answer is to write different code for each, probablyfandf2`，分别。如果这种情况经常出现，请考虑编写任一包装函数：

if sys.version_info >= (3, 0):
    def crlf_open(path, mode):
        return open(path, mode, newline='')
else:
    def crlf_open(path, mode):
        return open(path, mode+'b')

编写多版本代码时要注意的另一件事是，如果您不编写区域设置感知代码，locale.getpreferredencoding(False)在 3.x 中几乎总是返回一些合理的东西，但它通常只会返回'US-ASCII'在 2.x 中。使用locale.getpreferredencoding(True)从技术上讲是不正确的，但如果您不想考虑编码，则可能更可能是您真正想要的。（尝试在 2.x 和 3.x 解释器中以两种方式调用它以了解原因，或者阅读文档。）

当然，如果您确实知道文件的编码，那总是比猜测要好。

无论哪种情况，'r'意思是“只读”。如果不指定模式，则默认为'r'，所以相当于默认的二进制模式是'rb'.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

读取文件时不转换换行符的相关文章

如何在Python中选择要写入(.csv)的列

import csv f csv reader open lmt csv r open input file for reading Date Open Hihh mLow Close Volume zip f s plit it into
MANIFEST.in、package_data 和 data_files 澄清吗？

我正在尝试创建一个 Python 包并且目录结构如下 mypkg init py module1 x py y py z txt module2 a py b py 然后我将所有文件添加到MANIFEST in当我检查创建的存档时它包含
如何让python优雅地失败？

我只是想知道如何让 python 在所有可能的错误中以用户定义的方式失败例如我正在编写一个处理大项目列表的程序并且某些项目可能不符合我定义的格式如果 python 检测到错误它目前只会输出一条丑陋的错误消息并停止整个过程但是
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
通用详细视图 ProfileView 必须使用对象 pk 或 slug 调用

我是 Django 2 0 的新手在访问我的个人资料页面视图时收到此错误它适用于像这样的网址path users
Django 不会以奇怪的错误“AttributeError: 'module' object has no attribute 'getargspec'”启动

我对 Django 的内部结构有点缺乏经验所以我现在完全陷入困境它昨天起作用了但我不记得我改变过任何重要的东西当我转身时DEBUG True任何恰好位于列表中第一个的模块上都有堆栈跟踪 Traceback most recent c
reStructuredText：README.rst 未在 PyPI 上解析

我有一个托管在 Github 和 PyPI 上的 Python 项目在 Github 上 https github com sloria TextBlob blob master README rst https github com s
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
Python 3在for循环中更改字典键的值不起作用

我的 python 3 代码没有按预期工作 def addFunc x y print x y def subABC x y z print x y z def doublePower base exp print 2 base exp d
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
uri 警告中缺少端口：使用 Python OpenCV cv2.VideoCapture() 打开文件时出错

当我尝试流式传输 ipcam 时出现了如下所示的错误 tcp 000000000048c640 uri 中缺少端口警告打开文件时出错 build opencv modules videoio src cap ffmpeg impl h
如何分析组合的 python 和 c 代码

我有一个由多个 python 脚本组成的应用程序其中一些脚本正在调用 C 代码该应用程序现在的运行速度比以前慢得多因此我想对其进行分析以查看问题所在是否有工具软件包或只是一种分析此类应用程序的方法有一个工具可以将 python
根据列索引重命名 Dataframe 列

是否有内置函数可以按索引重命名 pandas 数据框我以为我知道列标题的名称但事实证明第二列中有一些十六进制字符根据我接收数据的方式我将来可能会在第 2 列中遇到这个问题因此我无法将这些特定的十六进制字符硬编码到 datafram
更换壳牌管道[重复]

这个问题在这里已经有答案了在 subprocess 模块的 Python 2 7 文档中我找到了以下片段 p1 Popen dmesg stdout PIPE p2 Popen grep hda stdin p1 stdout stdo
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
Python 导入非常慢 - Anaconda python 2.7

我的 python import 语句变得非常慢我使用 Anaconda 包在本地运行 python 2 7 导入模块后我编写的代码运行得非常快似乎只是导入需要很长时间例如我使用以下代码运行了一个 tester py 文件 imp
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
如何更改matplotlib中双头注释的头大小？

Below figure shows the plot of which arrow head is very small 我尝试了下面的代码但它不起作用它说引发 AttributeError 未知属性 s k 属性错误未知属性头宽
如何使用 Python 3 正确显示倒计时日期

我正在尝试获取将显示的倒计时基本上就像一个世界末日时钟哈哈有人可以帮忙吗 import os import sys import time import datetime def timer endTime datetime datet

随机推荐

Javasound 不通过 JAAD（SPI）播放 .m4a 文件

我正在尝试播放一些 m4a 文件我明白JAAD http jaadec sourceforge net index php仅支持解码 AAC 但有些歌曲我可以从中获取 sourceDataLine 然后当我尝试播放它们时我会得到如下行为
如何使用 JSONStream 字符串化大对象

我想对一个大对象进行字符串化将其写入文件并且遇到了 v8 的字符串长度限制所以我想我要么需要找到一种将字符串化为 ArrayBuffer 的方法要么需要以块的形式创建字符串它似乎https github com dominicta
当我比较集成流基线时，为什么 Clearcase diffbl 包含来自我的开发流的活动？

我们使用 Clearcase UCM 并有一个集成流每个开发人员都有一个开发流当我进行基线比较时有时会包括开发流程中的活动有没有办法获得自特定基线以来集成流中的活动的简单列表注意在集成流中您将主要获得交付活动即记录开发流交付
ComboBox 中的默认值 DataSource C#

我有一个组合框这就是我在其中填充数据的方式 SectorCollection sectorCollection sectorController SearchAll comboSector DataSource null comboSec
如何编写 Sparc 程序集并在 Qemu 或 Simics 中运行其二进制文件？

我正在尝试开始编写一些 Sparc 程序集但我不知道如何汇编和运行代码我已经用 arcTools 编写了 arc 但这就是我对汇编的了解我已经下载了 simics 和 qemu 但我不知道从这里去哪里有人能指出我正确的方向吗谢谢
将 int 按位转换为 UInt32 的最快方法？

我有一些低级图像纹理操作其中 32 位颜色存储为 UInt32 或 int 并且我需要在两者之间进行非常快速的按位转换 e g int color 2451337 exception UInt32 cu UInt32 color 有任何
使用 JavaScript 切换复选框

我有这个工作但我没有保存并且无法复制我正在尝试使用切换复选框if else 我究竟做错了什么我认为可行的 function myForm var inputs document getElementsByTagName input f
运行 selenium ruby webdriver 脚本以从命令提示符 ruby 窗口输出文件时如何导出结果

目前我通过在 Start Command Prompt with Ruby 终端中使用 rake gem 一次性运行测试套件中的所有 selenium 脚本由 Selenium Ruby Webdriver 编写为此我必须创建一个名
AOSP ActivityManager 未运行

我正在尝试移植Android7 0进入定制硬件平台并拥有zygote运行背景但是当我尝试使用启动应用程序时am start lt gt 它给出错误无法连接到活动管理器系统正在运行吗之后我做了service list并发现activi
在 CSS 中设置 `` 元素的样式？

谁能向我解释一下为什么我们可以设置元素的样式html 它和有什么区别body 我通常会看到教程和多个网站使用body永不html 我是在使用的时候才发现的YUI 3 CSS 重置 http developer yahoo com yui 3
如何解决log4j中的警告？？？连续解析错误...元素类型“log4j：configuration”的内容必须匹配[重复]

这个问题在这里已经有答案了显示警告 log4j WARN Continuable parsing error 28 and column 23 log4j WARN The content of element type log4j co
更改 MySQL 表以在列上添加注释

我一直在检查ALTER TABLE 的 MySQL 文档 http dev mysql com doc refman 5 7 en alter table html并且它似乎不包括向列添加或修改评论的方法我怎样才能做到这一点 for ta
Google 地图 - ASP.Net 中的简单方法？

我想使用谷歌地图并在网络上查看一百万种方法有些是 javascript 方法有些是 asp net 服务器组件我对这些组件的使用时好时坏使用 c 和 asp net 最简单最可靠的方法是什么我的位置数据包括数据库中的地理编码我
避免 R 中的两个 for 循环

我有一个 R 代码可以对两个函数进行卷积 convolveSlow lt function x y nx lt length x ny lt length y xy lt numeric nx ny 1 for i in seq lengt
使用雄辩的一对多时如何在第二个表上“order_by”

当然我可以将 order by 与第一个表中的列一起使用但不能与第二个表中的列一起使用因为结果是部分的如果我使用加入一切都会完美但我需要以雄辩的方式实现这一点难道我做错了什么这是一个例子 with join data DB
仅当使用单击时做出选择时才需要选项

使用时click http click pocoo org 5 我知道如何定义多项选择选项 http click pocoo org 5 options choice options 我也知道如何将选项设置为required一但是我怎样
WordPress 多站点：子站点 wp-admin“err_too_many_redirects”

我安装了新的 WordPress 4 1 多站点我可以导航 Front 并访问主站点仪表板 http blog urlcorrect com wp admin 我创建了一个子网站但无法访问子网站仪表板 http blog urlcorr
UISearchController searchBar 显示取消按钮不被尊重

我已将 UISearchController 添加到我的应用程序中并将其 searchBar 设置为titleView of my navigationItem 这有效但我看到取消按钮尽管已经设置showsCancelButton t
Automapper - 忽略有条件的映射

我正在使用自动映射器我想知道当字段为空时是否可以忽略字段的映射这是我的代码 ForMember dest gt dest BusinessGroup Id opt gt opt MapFrom src gt int src Busine
读取文件时不转换换行符

我正在读取一个文本文件 f open data txt data f read 然而换行符data当文件包含 CRLF r n 时变量被标准化为 LF n 如何指示 Python 按原样读取文件在 Python 2 x 中 f open

读取文件时不转换换行符

读取文件时不转换换行符 的相关文章

随机推荐

热门标签

读取文件时不转换换行符的相关文章