我有 CSV 文件,我在 pandas 中读取这些文件:
#!/usr/bin/env python
import pandas as pd
import sys
filename = sys.argv[1]
df = pd.read_csv(filename)
不幸的是,这些文件的最后一行通常已损坏(逗号数量错误)。目前,我在文本编辑器中打开每个文件并删除最后一行。
是否可以删除加载 CSV 的同一 python/pandas 脚本中的最后一行,以节省必须执行此额外的非自动步骤?
Pass on_bad_lines='skip' https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html#pandas-read-csv它会自动跳过这一行
df = pd.read_csv(filename, on_bad_lines='skip')
这是一个旧版本(不要使用 - 它已从 pandas2.0 中删除):
df = pd.read_csv(filename, error_bad_lines=False)
自版本 1.3.0 起已弃用:应使用 on_bad_lines 参数来指定遇到坏线时的行为。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)