我的数据框如下所示:
SKU # GRP CATG PRD
0 54995 9404000 4040 99999
1 54999 9404000 4040 99999
2 55037 9404000 4040 1556894
3 55148 9404000 4040 1556894
4 55254 9404000 4040 1556894
5 55291 9404000 4040 1556894
6 55294 9404000 4040 1556895
7 55445 9404000 4040 1556895
8 55807 9404001 4040 1556896
9 49021 9404002 4040 1556897
10 49035 9404002 4040 1556897
11 27538 9404000 4040 1556898
12 27539 9404000 4040 1556899
13 27540 9404000 4040 1556894
14 27542 9404000 4040 1556900
15 27543 9404000 4040 1556900
16 27544 9404003 4040 1556901
17 27546 9404004 4040 1556902
18 99111 9404005 4040 1556903
19 99112 9404006 4040 1556904
20 99113 9404007 4040 1556905
21 99116 9404008 4040 1556906
22 99119 9404009 4040 1556907
23 99122 94040010 4040 1556908
24 99125 94040011 4040 1556909
25 86007 94040012 4040 1556910
26 86010 94040013 4040 1556911
当我尝试对上述数据帧执行分组操作时,出现“无法从重复轴重新索引”错误。
df.groupby(['GRP','CATG'],as_index=False)['PRD'].min()
我尝试使用以下方法找出重复索引:
df[df.index.duplicated()]
但没有返回任何东西。
我该如何解决这个问题?
由于列名重复(不一定是值),通常会引发此错误
首先,只需使用以下代码检查列名称中是否有重复:df.columns.duplicated().any()
如果是 true,则删除重复的列
df.loc[:,~df.columns.duplicated()]
删除重复的列后,您应该能够运行您的groupby
手术。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)