从 csv 文件中删除换行符

2024-02-24

我正在尝试在 python 中处理一个 csv 文件，该文件在每行/行中间有 ^M 字符，这是一个换行符。我无法以“rU”以外的任何模式打开该文件。

如果我确实以“rU”模式打开文件，它会读取换行符并拆分文件（创建换行符）并为我提供两倍的行数。

我想完全删除换行符。如何？

请注意，如the docs http://docs.python.org/2/library/csv.html say:

csvfile可以是任何支持迭代器协议并每次返回一个字符串的对象next()方法被调用——文件对象和列表对象都适合。

因此，您始终可以在将文件交给您之前对其进行过滤reader or DictReader。而不是这个：

with open('myfile.csv', 'rU') as myfile:
    for row in csv.reader(myfile):

Do this:

with open('myfile.csv', 'rU') as myfile:
    filtered = (line.replace('\r', '') for line in myfile)
    for row in csv.reader(filtered):

That '\r'是 Python（和 C）的拼写方式^M。所以，这只是剥夺了所有^M字符，无论它们出现在哪里，通过用空字符串替换每个字符。

我想我想永久修改该文件而不是过滤它。

首先，如果您想在运行 Python 脚本之前修改该文件，为什么不从 Python 外部执行此操作呢？sed, tr、许多文本编辑器等都可以为您完成此操作。这是一个 GNU sed 示例：

gsed -i'' 's/\r//g' myfile.csv

但如果你想用 Python 来做，它并没有那么冗长，你可能会发现它更具可读性，所以：

首先，如果您想从中间插入或删除文件，则无法真正就地修改文件。通常的解决方案是写入一个新文件，然后将新文件移动到旧文件上（仅限 Unix）或删除旧文件（跨平台）。

跨平台版本：

os.rename('myfile.csv', 'myfile.csv.bak')
with open('myfile.csv.bak', 'rU') as infile, open('myfile.csv', 'wU') as outfile:
    for line in infile:
        outfile.write(line.replace('\r'))
os.remove('myfile.csv.bak')

不太笨重但仅限 Unix 的版本：

temp = tempfile.NamedTemporaryFile(delete=False)
with open('myfile.csv', 'rU') as myfile, closing(temp):
    for line in myfile:
        temp.write(line.replace('\r'))
os.rename(tempfile.name, 'myfile.csv')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

newline

从 csv 文件中删除换行符的相关文章

Python dict 到 DataFrame Pandas - 级别

几个月前 Romain X 在这个问题上帮了我很多忙 Python 字典到 DataFrame Pandas https stackoverflow com questions 32770359 python dict to datafra
Urllib 的 urlopen 在某些网站上被破坏（例如 StackApps api）：返回垃圾结果

我在用着urllib2 s urlopen函数尝试从 StackOverflow api 获取 JSON 结果我正在使用的代码 gt gt gt import urllib2 gt gt gt conn urllib2 urlopen h
JLabel.setText() 中的换行符

使用 JLabel setText 时如何插入换行符我尝试使用 Html 但似乎可以使其适用于 setText 仅适用于 jLabel 的初始声明最初声明 jlabel 时的方法是 label new JLabel Hello Worl
通过另一个指标数据框评估一个数据框

我有一个源数据框input df PatientID KPI Key1 KPI Key2 KPI Key3 0 1 C602 C603 C601 NaN 1 2 C605 C606 C602 NaN 2 3 75 L239 C602 NaN
来自 Pandas DataFrame 的用户定义的 Json 格式

我有一个 pandas dataFrame 打印 pandas DataFrame 后结果如下所示 country branch no of employee total salary count DOB count email x a
skpy 向包含用户提及的组发送消息

我需要在发送给 Skype 群组的消息中提及特定用户我可以使用 skpy 轻松发送消息但不知道如何在消息中提及某人 sk Skype userid paasword SendMsgTo sk chats group id SendMsg
Python矩阵问题[重复]

这个问题在这里已经有答案了这是从这个线程继续的 Python矩阵有什么解决方案吗 https stackoverflow com questions 5835583 python matrix any solution Input fr
拥有 n （2048 位数字），如何找到满足 n = p*q 的两个数字 p 和 q，其中 p = r||s （r 和 s 连接）和 q = s||r？

我正在使用 RSA 加密解密系统并且我有模数 n 这是一个 2048 位数字我需要找到 p 和 q 它们满足 n p q 并且都是素数给我的线索是 p 等于 q 但其位颠倒了正如我在本文标题中所说的那样具体来说 r 和 s 具有
如何在 Django Admin 中禁用事务？

I used transaction non atomic requests for 被超越的save in Person model如下所示 store models py from django db import models fro
如何实现带有 ([start ,] stop [ step]) 签名的 python 方法，即左侧的默认关键字参数

由于在 python 3 X 中 build idrange 函数返回的不再是一个列表而是一个可迭代的一些旧代码在我使用时失败range 方便地生成我需要的列表所以我尝试实现我自己的lrange像这样的函数 def lrange st
Netmiko OSError：在 send_command 中从未检测到搜索模式：

我被这个错误困住了任何人都可以帮助摆脱这个错误 import netmiko Device host xxxxxxxxxx device type cisco nxos username admin password xxxxxxxx c
在 pandas eval 中调用 round()、ceiling()、floor()、min()、max()

正如标题所说有没有办法在 pandas eval 中支持 round ceiling min max floor 函数数据框 import pandas as pd import numexpr as ne op d ID 1 2 3
argparse add_argument 别名

有没有办法使用 argparse 创建别名例如我想做这样的事情 parser add argument foo parser add argument alias bar foo 也就是说使用 bar应该相当于使用 foo 您可以简单
Python 特征向量：numpy.linalg、scipy.linalg 和 scipy.sparse.linalg 之间的差异

Scipy 和 Numpy 具有三个不同的函数来查找给定方阵的特征向量它们是 numpy linalg eig a http docs scipy org doc numpy reference generated numpy linal
Pandas 对 HDFStore 中的大数据进行“分组”查询？

我有大约 700 万行HDFStore有60多个柱子数据超出了我的记忆能力我希望根据 A 列的值将数据聚合到组中 pandas 的文档分割聚合组合 http pandas pydata org pandas docs stable
SQLAlchemy 是否会从同一连接重置 SQLAlchemy 会话之间的数据库会话？

SQLAlchemy 利用连接池这意味着相同的连接可以在不同的 SQLAlchemy 会话之间重复使用但是单个 SQLAlchemy 会话包含在其自身内并在关闭后被丢弃然而连接保持活动状态我想使用 set config 将一
Django populate() 不可重入

当我尝试在生产环境中加载 Django 应用程序时我不断收到此消息我尝试了所有的 stackoverflow 答案但没有任何解决办法任何其他想法我使用的是 Django 1 5 2 和 Apache Traceback most
无法使用 Python 3 编写的 gzip.open() 将压缩文件上传到云存储

当我尝试在 Cloud Shell 实例上使用 python 脚本将压缩的 gzip 文件上传到云存储时它总是上传一个空文件这是重现错误的代码 import gzip from google cloud import storage s
获取 TypeError：ord() 期望长度为 1 的字符串，但 int 发现错误 [重复]

这个问题在这里已经有答案了 Code is from PyPDF2 import PdfFileReader with open HTTP Book pdf rb as file pdf PdfFileReader file pagedd
使用 Python PuLP 混合整数规划的时间限制

我一直在使用PuLP http pythonhosted org PuLP 解决我感兴趣的特定混合整数线性规划 MIP 但是随着问题规模的增长 PuLP 花费的时间太长我希望能够运行求解器一段时间并在需要很长时间的情况下提前终止它并

随机推荐

Visual Studio 团队服务与 GitHub

我正在寻找为我的内部闭源项目设置 CI 工作流程我目前正在使用 GitHub 进行 git 问题跟踪我的应用程序是桌面应用程序没有云服务器部署因此工作流程应该是在 github 上提交 master 通过以下方式通知 CIg
NullInjectorError：没有 InjectionToken DocumentToken 的提供者

我正在为所有 Angular 5 项目设置一个通用库库是 GitHub 存储库的克隆角度库入门套件 https github com zurfyx angular library starter kit 一切正常直到我尝试使用HttpC
使用配置文件启动redis-server

我的配置文件位于 root config redis rb 我这样启动redis redis server 如何启动 redis 以便它使用我的配置文件另外我讨厌乱搞ps grep尝试找到一个 pid 来关闭它如何通过 cd 进入根目
ReplaceWith 自动关闭标签

我有 3 个 div 我想用另一个 div 的开始标签替换第一个 div 用结束标签替换第三个 div 这就是我的意思 div 1 div div 2 div div 3 div 当我尝试替换使用replaceWith 第一个div时 d
YouTube 数据 API v3 允许浏览器应用密钥的引荐来源网址未按预期工作

我正在努力尝试正确配置新的 YouTube Data API v3 我需要从 Google Chrome 扩展程序访问 API 我已经创建了一个 API 密钥Google API 控制台 https code google com apis
提交按钮正在下载 php 而不是运行它

我正在尝试为我的网站制作联系表单但是当我按提交时会下载 php 文件而不是运行我正在使用 chrome 但我认为这并不重要我认为存在语法错误但我已经搞乱了删除添加等内容即使没有语法错误它仍然会下载文件而不是运行它而且是的
如果输入值为空，则使用 Javascript 指定值“空”

所以我有一个输入字段如果它是空白的我希望它的值是空一词但是如果输入了任何值我希望该值是输入的值我想为此使用 javascript 知道如何做到这一点吗 UPDATE 抱歉我认为我解释得不太好我的意思不是占位符文本我的意思
Airflow Worker 没有监听默认的 RabbitMQ 队列

我已经使用rabbitmq代理配置了Airflow 服务 airflow worker airflow scheduler airflow webserver 正在运行没有任何错误调度程序正在推动任务执行default兔子MQ队列即使
JAVA Android APK发布模式错误无法下载kotlin-compiler.jar

当我在发布模式下构建新的 APK 或生成签名的 APK 时出现以下错误无法下载 kotlin compiler jar com android tools external com intellij kotlin compiler 26
C# 中的开源 C 编译器？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Qt中何时使用paintEvent和paintGL？

我在用QOpenGL控件 https doc qt io qt 5 qopenglwidget html并且不明白我应该把绘图代码放在哪里在覆盖的内部paintGL https doc qt io qt 5 qopenglwidget h
dict 子类中的自定义迭代行为

我有一个类是标准字典的子类 class Result dict Dict like object with special methods def content self return self getitem content def a
SwiftUI navigationBarBackButtonHidden 未按预期工作

我有一个问题navigationBarBackButtonHidden修饰符它不会隐藏导航后退按钮这是列表的源代码 import SwiftUI struct ContentView View State var showSheet f
在 Django 上调试神秘的“错误：无法导入名称 ”

有时当我跑步时manage py我收到一条红色的神秘消息上面写着Error cannot import name
使用 GCC 构建最小的独立可执行文件

我有几个程序用 C 编写实现一些算法我用它们来测量计算时间整个数据直接在代码中实现为静态库这些程序没有输入和输出也没有 C 库调用没有 printfs 等我想构建完全独立且最小的可执行文件我不想将我的程序与 libgcc
UITapGestureRecognizer 发送者是手势，而不是 ui 对象

我有一个被调用的按钮我给了它一个UIGestureRecognizer这样一个IBAction仅当长按按钮时运行您可以通过添加一个来做到这一点UILongPressGestureRecognizer到按钮本身然后您可以控制将该手势识
如何计算 C# 中两个给定日期之间的实际月份差异（日历年而不是近似值）？

示例给定以下两个日期结束日期始终大于或等于开始日期 start 2001 年 1 月 1 日完成 2002年3月15日所以从2001年1月1日到2002年2月底月 12 2 14 2002年3月 15 30 0 5 所以总计是14
如何在 TensorFlow 中从 XLA 获取 LLVM IR 转储？

我正在尝试获取 TensorFlow 中 XLA 编译器生成的 LLVM IR 我知道整个 LLVM 上下文包含在llvm module目的然后使用实用函数将其转换为字符串llvm ir DumpModuleToString llvm m
使用 RPostgreSQL 提取数据时，是否有特定的方法来处理 R 中的时间戳列？

我正在尝试从 PostgreSQL 数据库中提取数据但时间戳字段的结果不一致我不确定我是否正确处理 POSIXct 结果否则我想我在 RPostgreSQL 包中发现了一个错误这是复制该问题的方法假设 postgres 数据库中
从 csv 文件中删除换行符

我正在尝试在 python 中处理一个 csv 文件该文件在每行行中间有 M 字符这是一个换行符我无法以 rU 以外的任何模式打开该文件如果我确实以 rU 模式打开文件它会读取换行符并拆分文件创建换行符并为我提供两倍的行数

从 csv 文件中删除换行符

从 csv 文件中删除换行符 的相关文章

随机推荐

热门标签

从 csv 文件中删除换行符的相关文章