查找 CSV 文件/Pandas Dataframe 中标题行的行号

2023-12-07

我正在尝试获取 CSV 文件中包含标题的行的索引或行号。 问题是,标题行可以根据我们系统的报告输出上下移动(我无法控制更改此设置)

code:

ht = pd.read_csv(file.csv)
test = ht.get_loc('Code') #Code being header im using to locate the header row
csv1 = read_csv(file.csv, header=test)
df1 = df1.append(csv1) #Appending as have many files

如果我要打印测试,我会期望一个大约 4 或 5 的数字,这就是我输入到第二个读取“read_csv”的内容

我收到的错误是它需要 1 个标题列,但我有 26 列。我只是想使用第一个标题字符串来获取行号

谢谢 :-)

Edit:

CSV 格式

This file contains the data around the volume of items blablalbla
the deadlines for delivery of items a - z is 5 days
the deadlines for delivery of items aa through zz are 3 days
the deadlines for delivery of items aaa through zzz are 1 days
code,type,arrived_date,est_del_date
a/wrwgwr12/001,kids,12-dec-18,17-dec-18
aa/gjghgj35/030,pet,15-dec-18,18-dec-18

正如您将看到的“截止日期”行是相同的,根据代码 ID,这可以是 3 或 5,因此标题行可以向上或向下更改。

我也没有写出所有 26 个列标题,不确定这是否重要。

想要 DF 格式

index |    code         |   type   | arrived_date | est_del_date
1     | a/wrwgwr12/001  |   kids   |   12-dec-18  | 17-dec-18
2     | aa/gjghgj35/030 |  Pet     |  15-dec-18   | 18-dec-18

希望这是有道理的..

Thanks,


您可以使用csv模块查找包含分隔符的第一行,然后将该行的索引作为skiprows参数为pd.read_csv:

from io import StringIO
import csv
import pandas as pd

x = """This file contains the data around the volume of items blablalbla
the deadlines for delivery of items a - z is 5 days
the deadlines for delivery of items aa through zz are 3 days
the deadlines for delivery of items aaa through zzz are 1 days
code,type,arrived_date,est_del_date
a/wrwgwr12/001,kids,12-dec-18,17-dec-18
aa/gjghgj35/030,pet,15-dec-18,18-dec-18"""

# replace StringIO(x) with open('file.csv', 'r')
with StringIO(x) as fin:
    reader = csv.reader(fin)
    idx = next(idx for idx, row in enumerate(reader) if len(row) > 1)  # 4

# replace StringIO(x) with 'file.csv'
df = pd.read_csv(StringIO(x), skiprows=idx)

print(df)

              code  type arrived_date est_del_date
0   a/wrwgwr12/001  kids    12-dec-18    17-dec-18
1  aa/gjghgj35/030   pet    15-dec-18    18-dec-18
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

查找 CSV 文件/Pandas Dataframe 中标题行的行号 的相关文章

随机推荐

  • 如何从html页面中提取文本?

    例如网页是链接 https www architecture com FindAnArchitect FAAPractices aspx display 50 我必须知道公司名称及其地址和网站 我尝试了以下方法将 html 转换为文本 im
  • 无法在模块的类中声明具有公共访问权限的变量

    我正在制作一个基于 GUI 的应用程序 表单 并遇到以下错误 首先 我在模块中声明以下内容 Module test mod Public Structure sub struct Public test int As Integer Pub
  • 从远程读取h5文件

    我有一个问题 我无法从我的服务器读取 h5 文件 我的服务器上有 ssh 服务器也是本地的 所以我有两种类型的代码 store1 pd HDFStore os system scp newrow data copy h5 email pro
  • 如何使用量角器或硒测试@media print?

    我已经在我的网站上实现和打印功能 我想通过量角器 硒来测试它 有任何方法可以 应用 下面的样式 media print测试期间 我只看到一个相关的question 但没有任何好的答案 例如在那个样本中我想要 hiddendiv 将在测试过程
  • Javascript Date.ToLocaleTimeString() 与计算机的时间格式不匹配

    我的电脑定义为使用 24 小时格式 但是 当我使用var date new Date 10 25 2020 19 32 进而date toLocaleTimeString I get a 12h format 当没有提供选项时 输出到区域设
  • RuntimeError:当我附加 hdf5 文件时无法创建链接(名称已存在)?

    我正在尝试将 hdf5 数据集附加到之前的 hdf5 数据集发生以下错误 h5o link obj id self id 名称 lcpl lcpl lapl self lapl 文件 h5py objects pyx 第 54 行 在 h5
  • Angular4异常:无法绑定到“ngClass”,因为它不是“input”的已知属性

    在我的项目中我使用延迟加载所以 在我的注册模块中我使用 ngClass 指令添加无效类时formGroup我的注册表上有一些验证错误 但我的代码在尝试添加时抛出异常 ngClass 我的表格上的指令 无法绑定到 ngClass 因为它不是
  • 添加一列,该列是 pandas 中连续行的差异结果

    假设我有一个像这样的数据框 A B 0 a b 1 c d 2 e f 3 g h 0 1 2 3是时间 a c e g是一个时间序列 b d f h是另一个时间序列 我需要能够向原始数据帧添加两列 这是通过计算某些列的连续行的差异而获得的
  • Facebook 群组文档 API

    我是否可以使用 facebook group api 发布和检索群组文档 我已经浏览了文档 但找不到任何解释如何实现这一点的内容 如果有人知道我可以在哪里获得此内容 请提供链接网址 以便我可以自己阅读 简而言之 我想检索文档并能够通过 fa
  • 是否可以从 Spring 应用程序属性中获取自定义对象?

    是否可以从 application yaml 获取自己的对象并将其与 Value 绑定到我的组件 Model Data public class CurrencyPlan private String id private String b
  • PHP 提交后保留选择选项

    我有一个 html 选择框 其中包含国家 地区列表 当我选择一个时 它会毫无问题地发送到 PHP 方法 但选择框会重置到顶部 如何保留用户在此处选择的值 我的代码在这里 为了简洁起见 我已经删除了大多数其他国家 地区
  • 在arm-linux中打印堆栈跟踪

    我按照这篇文章打印堆栈跟踪当我的 gcc C 应用程序崩溃时如何生成堆栈跟踪 它在 x86 linux 上运行良好 谁能教我如何让它在arm linux上运行 我使用的是arm linux gcc 4 4 3 root FriendlyAR
  • 使用 Sinatra 更改 HTTP 状态消息

    我正在编写一个简单的 Sinatra 应用程序 并且给定用户发布包含特定数据的请求 我想返回错误 453 自定义错误代码 以及消息 CLIENT ERROR 或类似的内容 问题是 查看 Sinatra 文档并进行一些测试 我找不到设置响应错
  • 如何检测鼠标指针是否击中 HTML 5 画布上已绘制的线条

    我试图弄清楚如何使用 jQuery 检测用户的鼠标是否点击了 HTML 5 画布上的一行 这是生成画布线的代码
  • R 中的空间自相关分析 (Global Moran's I)

    我有一个点列表 我想使用 Moran s I 并通过将感兴趣的区域除以 4 x 4 样方来检查自相关性 现在我在谷歌上找到的每个例子 例如http www ats ucla edu stat r faq morans i htm 使用某种测
  • 噩梦 JS 不工作

    我知道问题的标题看起来很模糊 但仅此而已 我在我的生产服务器上安装了nodejs 其中phantomjs工作正常 然后我通过安装了噩梦npm install nightmare 我可以在node modules中看到它 我尝试了开发人员在g
  • 如何在选择时突出显示菜单项? [复制]

    这个问题在这里已经有答案了 如何在选择时突出显示菜单项 我尝试使用各种属性修改 styles xml 例如colorPressedHighlight colorActivatedHighlight等 有没有办法让菜单项保持焦点 直到选择其他
  • 在脚本仍在执行时显示结果

    现在为了看到结果 我必须等到整个代码执行完毕 它会挂起直到完成并保持加载状态 一旦完成 它就会显示我正在寻找的所有信息 在脚本仍在运行时是否有办法显示此信息 所以说 如果我在代码顶部的某个地方有一个打印 我希望它在调用时显示 而不是在脚本执
  • 更新 imageView swift 4 的高度约束时无法同时满足约束

    我有一个stack view如下图所示 所以我改变了高度image以编程方式使其适合从我的服务器下载的图像 如果没有图像 则高度限制image将设置为零 这是我这样做的代码 let imageUrl URL string imageStri
  • 查找 CSV 文件/Pandas Dataframe 中标题行的行号

    我正在尝试获取 CSV 文件中包含标题的行的索引或行号 问题是 标题行可以根据我们系统的报告输出上下移动 我无法控制更改此设置 code ht pd read csv file csv test ht get loc Code Code b