所以我有一个数据框,df1
,看起来如下所示:
A B C
1 foo 12 California
2 foo 22 California
3 bar 8 Rhode Island
4 bar 32 Rhode Island
5 baz 15 Ohio
6 baz 26 Ohio
我想按列分组A
然后求和列B
同时保留列中的值C
。像这样的事情:
A B C
1 foo 34 California
2 bar 40 Rhode Island
3 baz 41 Ohio
问题是,当我说
df.groupby('A').sum()
column C
被删除,返回
B
A
bar 40
baz 41
foo 34
我怎样才能解决这个问题并保留专栏C
当我分组并求和时?
执行此操作的唯一方法是将 C 包含在您的 groupby 中(groupby 函数可以接受列表)。
尝试一下:
df.groupby(['A','C'])['B'].sum()
另一件需要注意的事情是,如果您需要在聚合后使用 df ,您还可以使用as_index=False
返回数据框对象的选项。当我第一次使用 Pandas 时,这个问题给我带来了问题。例子:
df.groupby(['A','C'], as_index=False)['B'].sum()
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)