DataFrame 简介
DataFrame是Pandas中的一个表格型的数据结构,包含一组有序的列,每列的值的类型都可不同(整型、浮点型、布尔型、字符串等),DataFrame既有行索引也有列索引,可以被看作是由Series组成的字典
DataFrame也可以理解为带了行和列标签的二维数组:
其中行标签为序号 0,1,2,列标签为 Name, Age, Sex. DataFrame 是最常用的Pandas对象, 与Series一样,DataFrame支持多种类型的输入数据:
- 列表、一维ndarray、字典、Series字典
- 二维ndarray
- Series
- DataFrame
除了数据,还可以有选择地传递 index(行标签)和 columns(列标签)参数。传递了index或clolumns,就可以确保生成的 DataFrame 里包有索引或列。Series 字典加上指定索引时,会丢弃与传递的索引不匹配的所有数据。
没有传递轴标签时,按常规依据输入数据进行构建。
DataFrame 实例化
DataFrame 可以使用字典、列表等实例化。
如果传入的数据全部是标量值(譬如字典:{‘a’:1, ‘b’:2}),那么必须传入index参数
df = pd.DataFrame({
'name': ['lihua', 'lilei', 'hanmeimei', 'xiaoming', 'xiaohong'],
'math': [99, 100, 80, 50, 118],
'english': [94, 83, 99, 79, 108],
'chinese': [107, 82, 76, 100, 113]
})
Output:
name math english chinese
0 lihua 99 94 107