读取 pandas 中除最后一行之外的所有 CSV 文件

2023-12-28

我有 CSV 文件,我在 pandas 中读取这些文件:

#!/usr/bin/env python

import pandas as pd
import sys

filename = sys.argv[1]
df = pd.read_csv(filename)

不幸的是,这些文件的最后一行通常已损坏(逗号数量错误)。目前,我在文本编辑器中打开每个文件并删除最后一行。

是否可以删除加载 CSV 的同一 python/pandas 脚本中的最后一行,以节省必须执行此额外的非自动步骤?


Pass on_bad_lines='skip' https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html#pandas-read-csv它会自动跳过这一行

df = pd.read_csv(filename, on_bad_lines='skip')
  • 优点on_bad_lines='skip'它会跳过并且不会在任何错误的行上停顿吗?但如果最后一行总是很糟糕那么skipfooter=1更好。

  • 感谢@DexterMorgan 指出skipfooter选项强制引擎使用 python 引擎,该引擎比 c 引擎慢于解析 csv。


这是一个旧版本(不要使用 - 它已从 pandas2.0 中删除):

df = pd.read_csv(filename, error_bad_lines=False)

自版本 1.3.0 起已弃用:应使用 on_bad_lines 参数来指定遇到坏线时的行为。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

读取 pandas 中除最后一行之外的所有 CSV 文件 的相关文章

随机推荐

  • 在功能组件中使用回调来响应 setState

    我在类组件中编写了一个非常简单的示例 setErrorMessage msg this setState error message msg gt setTimeout gt this setState error message 5000
  • 更改 valueBoxes 的字体大小

    我想更改值的字体大小和副标题valueBoxes 以下是我的尝试 但对于如何以类似于默认外观的方式更改它的任何建议 我将不胜感激 下面是我的可重现的例子 require shinydashboard valueBox2 lt functio
  • 将表达式树解析为嵌套列表

    我对 F 比较陌生 在解析包含嵌套列表的表达式树时确实遇到了困难 根据网上的零碎资料 我拼凑了以下内容 我的标准类型定义为 type Return Real of float Func of string Return list 我对外部应
  • 将 bcrypt 添加到 package.json 时,如何解决使用 docker node alpine Image 时“找不到任何可使用的 Python 安装”的问题?

    在我将 bcrypt 添加到 package json 之前 一切正常 现在 我收到以下错误消息 这是我的 package json 的摘录 dependencies bcrypt 3 0 6 express 4 17 1 mongodb
  • 自定义属性:必须是明显我做错的事情

    我一直在添加不同实体的部分类 以毫无问题地添加各种有用的方法 根据我见过的示例 尝试添加属性似乎很简单 但我的失败得很惨 Updated例子 public List
  • 在javascript中识别firefox浏览器的选定选项卡URL

    我正在开发一个网络应用程序 我有兴趣获取选定的选项卡 URL 我正在使用火狐浏览器 我通过执行以下 javascript 语句实现了这一点 Get the URL of page which is currently loaded in a
  • 带 CASE 条件和 SUM() 的 SELECT 查询

    我目前正在使用这些sql语句 我的表有 CPaymentType 字段 其中包含 现金 或 支票 我可以通过执行 2 个 SQL 语句来汇总付款金额 如下所示 在这种情况下 用户甚至不会注意到执行2条sql语句或仅执行1条sql语句时的速度
  • JS原型与继承

    在业余时间我尝试学习一点 JS 但我还是坚持主题中的主题 var person new Person Bob Smith 52 var teacher new Teacher Adam Greff 209 function Humans f
  • 在 Unity C# WWW 中显示进度条

    我有这段代码可以从服务器下载视频 但我需要显示进度条 这可能吗 我知道我不能有 WriteAllBytes 的进度条 private IEnumerator DownloadStreamingVideoAndLoad string strU
  • App.config:用户与应用程序范围

    我已经在我的项目中添加了 App config 文件 我从 项目 gt 属性 gt 设置 面板创建了两个设置 我注意到 当我添加设置时 我可以将范围定义为User or Application User 应用 如果我将设置定义为User它去
  • 在派生类中扩展枚举[重复]

    这个问题在这里已经有答案了 我有一个类层次结构 其中的每个类都有一个异常类 在并行层次结构中派生 因此 class Base class Derived public Base class BaseException public std
  • C# 用韩文编码保存文件

    具有以下代码块 用于使用所选编码保存文件 当文件在文本编辑器中打开时 它显示编码为 ASCII StringBuilder sb new StringBuilder sb Append Lots of korean text here En
  • 在接收器发生故障后,如何强制 Flume-NG 处理积压的事件?

    我正在尝试设置 Flume NG 从一组服务器 主要运行 Tomcat 实例和 Apache Httpd 收集各种日志 并将它们转储到 5 节点 Hadoop 集群上的 HDFS 中 设置如下所示 每个应用程序服务器将相关日志跟踪到一个执行
  • 以zend形式添加img标签

    我正在构建一个带有扩展 Zend Form 的类的表单 如何在表单中添加 img 标签 我还需要向其添加一个类并对齐属性 这是我想要达到的最终结果 span class myElement img src myPath align left
  • jQuery $('html, body').not()

    here http jsfiddle net m2eqS 1 我希望当您单击任意位置但不在 div 上时发出警报 当我单击 div 时 也会显示警报 JS 您可以使用事件参数来查看单击了哪个目标并返回 false html body cli
  • ksoap2 铸造 getResponse()

    使用 ksoap2 lib 从 android 调用 net SOAP1 1 Web 服务时 我遇到了将响应转换为自定义对象的问题 例如 下面的代码在 httpTransport call soapAction soapEnvelope 之
  • 复制依赖项,排除某些配置

    假设项目布局如下 allprojects apply plugin java configurations provided compile extendsFrom provided project a dependencies compi
  • C# PropertyGrid 拖放

    我正在尝试使用 VS2005 NET 2 0 在 C 中实现对 propertygrid 的拖 放支持 propertygrid 可以处理 Dragenter 等事件 但似乎没有办法在拖动事件期间获取指针下的 griditem 到目前为止
  • Style.Triggers 与 ControlTemplate.Triggers

    我应该什么时候选择Style Triggers我应该什么时候选择ControlTemplate Triggers 使用其中一种比另一种有什么好处吗 假设我有这些样式可以达到相同的结果
  • 读取 pandas 中除最后一行之外的所有 CSV 文件

    我有 CSV 文件 我在 pandas 中读取这些文件 usr bin env python import pandas as pd import sys filename sys argv 1 df pd read csv filenam