Python:根据计数条件删除行

2023-12-07

我在过滤时遇到问题pandas数据框。

city 
NYC 
NYC 
NYC 
NYC 
SYD 
SYD 
SEL 
SEL
...

df.city.value_counts()

我想删除计数频率小于 4 的城市行,例如 SYD 和 SEL。

在不手动将它们逐个城市投放的情况下,该怎么做呢?


在这里你可以使用过滤器

df.groupby('city').filter(lambda x : len(x)>3)
Out[1743]: 
  city
0  NYC
1  NYC
2  NYC
3  NYC

解决方案二transform

sub_df = df[df.groupby('city').city.transform('count')>3].copy() 
# add copy for future warning when you need to modify the sub df
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python:根据计数条件删除行 的相关文章

随机推荐