导入Excel文件
导入xlsx文件可以使用read_excel()
-
基本导入:
为避免文件路径里的 “\” 被转义,需要在路径前面加转义符 r。
import pandas as pd
df = pd.read_excel(r"C:\Users\13513\Desktop\Python.xlsx")
df
-
指定导入sheet页
当文件有多个sheet页时,可以通过sheet_name 参数来指定具体sheet页。
import pandas as pd
df = pd.read_excel(r"C:\Users\13513\Desktop\Python.xlsx",
sheet_name = "sheet1")
df
python 也可以通过指定sheet的顺序,来导入具体文件,sheet页从0开始计数。
import pandas as pd
df = pd.read_excel(r"C:\Users\13513\Desktop\Python.xlsx",
sheet_name = 0)
df
-
指定行索引
将本地文件导入DataFrame时,可以通过index_col参数来设置,从0开始计数
import pandas as pd
df = pd.read_excel(r"C:\Users\13513\Desktop\Python.xlsx",
sheet_name = 0,
index_col = 0)
df
-
指定列索引
Python 默认使用源数据表的第一行作为列索引,也可以通过header参数来进行设置
import pandas as pd
df = pd.read_excel(r"C:\Users\13513\Desktop\Python.xlsx",
sheet_name = 0,
index_col = 0,
header = 0)
df
导入表没有列索引时,header参数可以设置为None
import pandas as pd
df = pd.read_excel(r"C:\Users\13513\Desktop\Python.xlsx",
sheet_name = 0,
index_col = 0,
header = None)
df
-
指定导入列
我们可以通过设定usecols参数来指定要导入的列
#导入第一列
import pandas as pd
df = pd.read_excel