Excel格式数据导入
文件格式 |
读取方法 |
Excel 文件 |
read_excel() |
CSV 文件 |
read_csv() |
txt 文件 |
read_table() |
Json 文件 |
read_json() |
MySQL 文件 |
read_sql_table() |
- 对于上述这些方法,只需要一行代码就可以实现不同格式数据的导入,唯一区别在于他们拥有不同的参数
read_excel()
-
不添加任何参数,会默认将Excel表格种的第一行识别为标题行
df = pd.read_excel("表格.xlsx")
df
学号 姓名
0 1 张三
1 2 李四
2 3 王五
-
sheet_name参数,在一个Excel表格中,可能会有一个或多个Sheet,设置了sheet_name="Sheet1"
表示我们想要读取Sheet1
这个表格
df = pd.read_excel('表格.xlsx',sheet_name='Sheet1')
df
学号 姓名
0 1 张三
1 2 李四
2 3 王五
-
index_col参数,指定将Excel表格的第几列当作行索引。设置为0时,表示将Excel表格种的学号列设置为了行索引,原始索引被替换
df = pd.read_excel("表格.xlsx",index_col=0)
df
学号 姓名
1 张三
2 李四
3 王五
-
header参数,将指定表格的第几行当作标题行
- 利用
read_excel()
读取excel表格,总是默认将第一行数据识别为标题行,由于表格Sheet1
自带标题行,我们可以不用做任何设置。但是Sheet2
表格没有标题行,我们需要设置header=None
,告诉Python程序该表格没有标题行
df = pd.read_excel('表格.xlsx',sheet_name='Sheet1')
df
学号 姓名
0 1 张三
1 2 李四
2 3 王五
df = pd.read_excel('表格.xlsx',sheet_name='Sheet2',header=None)
df
0 1
0 1 张三
1 2 李四
2 3 王五
-
usecols
参数,指定导入Excel表格中的哪几列
df = pd.read_excel("表格.xlsx",usecols=["姓名","语文"])
df
姓名 语文
0 张三 99
1 李四 88
2 王五 77
Excel格式数据的导出
-
在Pandas模块中,利用to_excel()
方法可以将数据导出为Excel文件,利用to_csv()
方法可以将数据导出为CSV
文件
df = pd.read_excel("表格.xlsx")
df
学号 姓名 语文 数学
0 1 张三 88 99
1 2 李四 77 88
2 3 王五 66 90
df.to_excel(
excel_writer="导出.xlsx",
index=False,
sheet_name="成绩表",
columns=["姓名","语文","数学"],
na_rep=0,
encoding="gbk"
)
-
excel_writer参数用于指明文件的保存路径
-
index参数为False表示隐藏序列号,否则会自动生成一个序列号
-
sheet_name用于设置表格的名称
-
columns参数可以指定导出哪些列
- **
na_rep
**参数可以将表格中的缺失值用指定值填充
-
encoding参数用于设置文件编码,一般根据自己的系统环境来设置
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)