假设我有以下 Excel 文件:
A B C
0 - - -
1 Start - -
2 3 2 4
3 7 8 4
4 11 2 17
我想读取数据框中的文件,确保我开始读取它行下方哪里的Start
值是。
注意力: the Start
值并不总是位于同一行,所以如果我要使用:
import pandas as pd
xls = pd.ExcelFile('C:\Users\MyFolder\MyFile.xlsx')
df = xls.parse('Sheet1', skiprows=4, index_col=None)
这会失败,因为skiprows
需要修复。有什么解决方法可以确保xls.parse
查找字符串值而不是行号?
df = pd.read_excel('your/path/filename')
This https://stackoverflow.com/questions/42386629/pandas-find-index-of-value-anywhere-in-dataframe答案有助于找到 df 中“start”的位置
for row in range(df.shape[0]):
for col in range(df.shape[1]):
if df.iat[row,col] == 'start':
row_start = row
break
有了 row_start 后,您可以使用 pandas 的子框架
df_required = df.loc[row_start:]
如果您不需要包含“start”的行,只需将 row_start 加 1
df_required = df.loc[row_start+1:]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)