当您使用这样的结构化数组时,您会失去一些原本拥有的灵活性。不过,您可以在选择适当的部分后取平均值:
>>> ifile
array([(3.385, 44.5), (0.48, 15.5), (1.35, 8.1), (465.0, 423.0),
(36.33, 119.5), (27.66, 115.0), (14.83, 98.2), (1.04, 5.5)],
dtype=[('brainwt', '<f8'), ('bodywt', '<f8')])
>>> ifile["brainwt"].mean()
68.759375000000006
>>> ifile["bodywt"].mean()
103.66249999999999
I use numpy
几乎每天,但是当处理我想要命名列的数据时,我认为pandas http://pandas.pydata.org库使事情变得更加方便,并且互操作性非常好。值得一看。例子:
>>> import pandas as pd
>>> df = pd.read_csv("brainandbody.csv", skipinitialspace=True)
>>> df
Brain Weight Body Weight
0 3.385 44.5
1 0.480 15.5
2 1.350 8.1
3 465.000 423.0
4 36.330 119.5
5 27.660 115.0
6 14.830 98.2
7 1.040 5.5
>>> df.mean()
Brain Weight 68.759375
Body Weight 103.662500
dtype: float64