我有一个 Excel 工作簿,它在打开时运行一些 vba,刷新数据透视表并执行其他一些操作。
然后我希望将数据透视表刷新的结果导入到 python 中的数据框中以进行进一步分析。
import xlrd
wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')
文件的刷新和打开工作正常。但是我如何从第 5 行的第一张表中选择数据,包括标题到最后一条记录 n。
您可以使用 pandas 的 ExcelFileparse http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.ExcelFile.parse.html读取Excel表格的方法,参见io docs http://pandas.pydata.org/pandas-docs/stable/io.html#excel-files:
xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')
df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA'])
skiprows
将忽略前 4 行(即从行索引 4 开始),还有几行其他选项 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.ExcelFile.parse.html.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)