我有一个带有一列的 pandas 数据框,我想知道中位数的索引。也就是说,我这样确定中位数:
df.中位数()
这给了我中值,但我想知道该行的索引。这个可以确定吗?对于长度不均匀的列表,我可以搜索具有该值的索引,但对于均匀的列表长度,这是行不通的。有人可以帮忙吗?
这个问题是在另一篇文章中提出的,答案基本上是搜索与中位数具有相同值的行。但就像我说的,这对于偶数长度的列表不起作用。
下面是一个最小示例(我在下面包含了 Wen 的建议):
df = pd.DataFrame(np.random.randn(6, 1), columns=list('A'))
df.median()
df.loc[df[0]==df[0].median()]
Out[120]:
Empty DataFrame
Columns: [0]
Index: []
您可以将 Wen 的答案用于奇数长度的数据帧。
对于偶数长度的数据帧,这个问题实际上没有意义。正如您所指出的,数据框中不存在中位数。但是,您可以按感兴趣的列对数据框进行排序,然后找到两个“中值”值的索引。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(6, 1), columns=list('A'))
df.median()
df.loc[df['A']==df['A'].median()]
df.sort_values(by='A', inplace=True)
df[df['A'] > df['A'].median()].iloc[0]
df[df['A'] < df['A'].median()].iloc[-1]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)