一、创建Dataframe
1.创建空dataframe
import pandas as pd
# 这里创建dataframe时就指定列
dataframe = pd.DataFrame(columns=['列名1','列名2','列名3'])
2.从list [ ]创建dataframe
把list当做一列
import pandas as pd
list_data = ['a', 'b', 'c',]
df = pd.DataFrame(data=list_data,columns=['列名称'])
结果:
把list当做一行
import pandas as pd
list_data = [['a', 'b', 'c',]] # 使用二维数组
df = pd.DataFrame(data=list_data)
结果:
3.从 dict{ key : value } 创建dataframe
dict_data = {'a':1,'b':2,'c':3}
dict_df = pd.DataFrame(data=dict_data, index=['行标签'])
结果:
4.从 CSV 创建dataframe
读取csv并指定列名:
df = pd.read_csv('CSV文件位置',names=['列名1','列名2','列名3'])
对于没有header的数据,使用 0,1,2,3…等取代列名:
df = pd.read_csv('CSV文件位置',header=None)
二、保存Dataframe
保存到csv就 dataframe.to_csv() ;保存到excel就dataframe.to_excel() ;这些
保存时常用参数选项
- header:是否保存维度的名称,即 dataframe.columns 作为第一行,若不需要,可以设置header=None;若header=1,则使用第一行作为表头;若header=-1,则header会自动从0开始01234填充,适合读取无表头数据。
- index:是否保存index这一列,若不需要可以设置index=False
- mode:默认覆盖保存,若需增量保存,可以使用 mode=‘a’
增量保存
dataframe.to_csv('保存.csv', index=False,mode='a')