1.pandas的Series对象
pandas的Series对象是一个带索引数据构成的一维数组。可以用一个数组创建Series对象
import pandas as pd
data=pd.Series([0.25,0.5,0.75,1.0])
print(data)
# output:0 0.25
# 1 0.50
# 2 0.75
# 3 1.00
# dtype: float64
在上面的运行结果中,Series对象将一组数据和一组索引绑定在一起,我们可以通过values属性和index属性获取数据。
data.values
#output;[0.25 0.5 0.75 1. ]
data.index
#output:RangeIndex(start=0, stop=4, step=1)
另外,数据可以通过python的中括号索引标签获取:
data[1]
#output:0.5
data[:3]
#output:1 0.50
# 2 0.75
# dtype: float64
1.1 Series是通用的Numpy数组
从上面的例子看出来,Numpy的一维数组和Series对象基本可以等价交换,但是两者的本质差异是存在于索引:Numpy数组是通过隐式定义的整数索引获取数值,而pandas的Series对象是用一种显式定义的索引与数值关联。
显式索引的定义让Series对象拥有了更强的定义。例如:索引不再仅仅是整数,还可以是任意想要的类型。
data=pd.Series([0.25,0.5,0.75,1.0],index=['a','b','c','d'])
print(data)
print(data['a'])
#output:a 0.25
# b 0.50
# c 0.75
# d 1.00
# dtype: float64
# 0.25
注意:也可以使用不连续或不按顺序的索引。
data=pd.Series([0.25,0.5,0.75,1.0],index=[2,5,3,7])
1.2 Series是特殊的字典
Series对象看成是一种特殊的Python字典。字典是一种将任意键映射到一组任意值的数据结构,而Series对象其实是一组类型键映射到一组类型值的数据结构。
import pandas as pd
population_dict={&