是否有直接开箱即用的方法为 pandas 系列的每个值分配百分位数?
我通过排名和重新调整来实现此计算,如下所示:
values = pd.Series(np.random.normal(0,1,100))
percentiles = values.rank()/values.shape
例如系列:[0,2,4,2,10,8,6,1]
应该收到百分位数:[0.125, 0.4375, 0.625, 0.4375, 1.0, 0.875, 0.75, 0.25]
然而,令我感到非常惊讶的是,没有本地解决方案(例如qcut
, quantile
etc...)
有没有明确的计算方法?
您可以使用以下方法执行此操作rank https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.rank.html, where pct=True
选项显示排名percentile
form.
In [1551]: v = pd.Series([0,2,4,2,10,8,6,1])
In [1556]: v.rank(pct=True)
Out[1556]:
0 0.1250
1 0.4375
2 0.6250
3 0.4375
4 1.0000
5 0.8750
6 0.7500
7 0.2500
dtype: float64
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)