ValueError：groupby Pandas 中的“无法从重复轴重新索引”

2024-02-29

我的数据框如下所示：



    SKU #    GRP    CATG   PRD
0   54995  9404000  4040  99999
1   54999  9404000  4040  99999
2   55037  9404000  4040  1556894
3   55148  9404000  4040  1556894
4   55254  9404000  4040  1556894
5   55291  9404000  4040  1556894
6   55294  9404000  4040  1556895
7   55445  9404000  4040  1556895
8   55807  9404001  4040  1556896
9   49021  9404002  4040  1556897
10  49035  9404002  4040  1556897
11  27538  9404000  4040  1556898
12  27539  9404000  4040  1556899
13  27540  9404000  4040  1556894
14  27542  9404000  4040  1556900
15  27543  9404000  4040  1556900
16  27544  9404003  4040  1556901
17  27546  9404004  4040  1556902
18  99111  9404005  4040  1556903
19  99112  9404006  4040  1556904
20  99113  9404007  4040  1556905
21  99116  9404008  4040  1556906
22  99119  9404009  4040  1556907
23  99122  94040010 4040  1556908
24  99125  94040011 4040  1556909
25  86007  94040012 4040  1556910
26  86010  94040013 4040  1556911

当我尝试对上述数据帧执行分组操作时，出现“无法从重复轴重新索引”错误。

df.groupby(['GRP','CATG'],as_index=False)['PRD'].min()

我尝试使用以下方法找出重复索引：

df[df.index.duplicated()]

但没有返回任何东西。我该如何解决这个问题？

由于列名重复（不一定是值），通常会引发此错误

首先，只需使用以下代码检查列名称中是否有重复：df.columns.duplicated().any()

如果是 true，则删除重复的列

df.loc[:,~df.columns.duplicated()]

删除重复的列后，您应该能够运行您的groupby手术。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pandasgroupby

ValueError：groupby Pandas 中的“无法从重复轴重新索引” 的相关文章

Keras ZeroDivisionError：整数除法或以零为模

我正在尝试使用 Keras 和 Tensorflow 实现卷积神经网络我有以下代码 from keras models import Sequential from keras layers import Conv2D MaxPoolin
Python设置1和True的解释

在 IPython 3 交互式 shell 中 In 53 set2 1 2 True hello In 54 len set2 Out 54 3 In 55 set2 Out 55 hello True 2 是因为 1 和 True 得到
sy.sympify(str(表达式)) 不等于表达式

据我了解 str将 SymPy 表达式转换为字符串并sympify将字符串转换为 SymPy 表达式因此我希望以下内容成立对于合理的表达 gt gt gt sy sympify str expr expr True 我尝试过这个确实
绝对导入不起作用，但相对导入起作用

这是我的应用程序结构 foodo setup py foodo init py foodo py models py foodo foodo foodo py从导入类models py module from foodo models im
计算熊猫数据帧几个月的总和

我有一个 pandas 数据框如下所示 ID Year R1 R1 f KAR1 20201001 1 5 KAR1 20201101 2 6 KAR1 20201201 3 7 KAR1 20210101 4 8 KAR1 202102
当我从本地计算机更改为虚拟主机时，从 python 脚本调用 pdftotext 不起作用

我编写了一个小的 python 脚本来解析提取 PDF 中的信息我在本地机器上测试了它我有 python 2 6 2 和 pdftotext 版本 0 12 4 我正在尝试在我的虚拟主机服务器 dreamhost 上运行它它有 py
如何在 numpy 数组中查找并保存重复的行？

我有一个数组例如 Array 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 1 1 1 2 2 2 我想要输出以下内容的东西 Repeated 1 1 1 2 2 2 保留重复行的数量也可以例如 Repeated 1 1
将多索引转换为行式多维 NumPy 数组。

假设我有一个类似于以下示例的 MultiIndex DataFrame多索引文档 http pandas pydata org pandas docs stable advanced html gt gt gt df 0 1 2 3 fir
烧瓶 - 404 未找到

我是烧瓶开发的新手这是我在烧瓶中的第一个程序但它向我显示了这个错误在服务器上找不到请求的 URL 如果您输入了网址请手动检查拼写并重试这是我的代码 from flask import Flask app Flask name ap
Karasuba算法递归过多

我正在尝试用 c 实现 Karasuba 乘法算法但现在我只是想让它在 python 中工作这是我的代码 def mult x y b m if max x y lt b return x y bm pow b m x0 x bm x1
无法在我的程序中使用 matplotlib 函数

我正在 Windows 10 中运行 Anaconda 安装 conda 版本 4 3 8 这是我尝试在 python 命令行中运行的代码 import matplotlib pyplot as plt x 1 2 3 4 y 5 6 7
打印一份拥有多个家庭的人员名单，每个家庭都有多个电话号码

我有一类 Person 它可以有多个 Home 每个 Home 都有一个或多个电话号码我已经定义了类但现在我正在尝试创建一个视图其中列出每个人的所有家庭以及每个家庭地址的所有电话号码类似于 john smith 123 fake s
同一台机器上有多个Python版本？

Python 网站上是否有关于如何在 Linux 上的同一台计算机上安装和运行多个版本的 Python 的官方文档我可以找到无数的博客文章和答案但我想知道是否有标准官方方法可以做到这一点或者这一切都取决于操作系统我认为它是完全独
导入目录下的所有模块

有没有办法导入当前目录中的所有模块并返回它们的列表例如对于包含以下内容的目录 mod py mod2 py mod3 py 它会给你
我可以在 if 语句中使用“as”机制吗

是否可以使用as in if类似的声明with我们使用的例如 with open tmp foo r as ofile do something with ofile 这是我的代码 def my list rtrn lst True if
如何全局安装 Python（开发）依赖项，以便我不必在每个 venv 中重新安装它们？

我希望在为每个项目创建的每个 venv 虚拟环境中都可以使用一些 Python 依赖项例如 black flake8 和 pytest 这可能吗如果可以如何实现我想安装这三个once在我的主要 Python 安装下我必须在启动新
在 anaconda 环境下运行 qsub

我有一个程序通常在 Linux 的 conda 环境中运行因为我用它来管理我的库指令如下 source activate my environment python hello world py 我怎样才能跑你好世界 py在与 PBS
使用 Numpy 进行多维批量图像卷积

在图像处理和分类网络中一个常见的任务是输入图像与一些固定滤波器的卷积或互相关例如在卷积神经网络 CNN 中这是一种极其常见的操作我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W
在 python 中使用高精度时间戳

嘿我正在使用 python 处理日期时间我想知道解析这个时间戳的最佳方法是什么时间戳是ISO标准这里是一个例子 2010 06 19T08 17 14 078685237Z 现在到目前为止我已经使用过 time datetime d
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过

随机推荐

在子菜单qt中创建滚动条？

我有一个地图应用程序和一个子菜单其中动态添加的对象即地图上的点添加到子菜单中具体取决于加载的图层我可以通过单击相应的子菜单项来隐藏每个单独的对象即一个点有什么办法可以组织子菜单吗当有很多点即 100 时整个子菜单会占据屏
在 Oracle 数据库中使用 JdbcTemplate 插入时间戳 (ORA-01858)

我已经阅读了很多有关此错误的内容但仍然没有发现错误我正在使用 JdbcTemplate 在某个带有时间戳列的表中插入一行我很确定时间戳是问题所在就好像从插入中删除它工作正常一样 My code private static fina
如何将SVN中的分支与所有提交历史合并回主干？

如何将SVN中的分支与所有提交历史合并回主干我知道在 Git 中我可以使用 merge squash SVN中有类似的命令吗我使用的是SVN 1 6 对于 Subversion 1 5 或更高版本合并记录在本地工作副本的 svn me
Python中的嵌入层：如何正确使用Torchsummary？

这是一个最低限度工作可重现的示例 import torch import torch nn as nn from torchsummary import summary class Network nn Module def init s
Django OperationalError：没有这样的列：在 pythonanywhere 上

首先我能够修复导入错误我发现这是因为pythonanywhere的Django版本没有更新所以我将pythonanywhere上的Django从1 x x升级到2 0 9 错误是这样的导入错误无法导入名称路径 django ve
调用未定义的函数 ssh2_connect()

connection ssh2 connect SFTP SERVER 22 ssh2 auth password connection SFTP USERNAME SFTP PASSWORD sftp ssh2 sftp connecti
如何比较 Joda DateTime 对象与可接受的偏移量（容差）？

我想知道有没有标准的APIJodaTime比较 2DateTime具有指定公差的物体我正在寻找一种最好使用的单线Joda标准API 不适用于时间算术表达式例如这个帖子 https stackoverflow com questions
将变量从 PHP 传递到 Smarty

我有两个脚本一个在 php 中一个在 tpl 中我需要将 php 中的变量传递给 tpl 我尝试了这个但没有任何作用但不知何故它可以工作一两天然后显示空白如果我创建另一个PHP脚本只是为了回显变量它起作用了 PHP代码
Angular2 - 带有语言的路线

您好我想使用以下格式的语言创建路线 www domain com lang sometimes Example www domain com en sometimes www domain com de sometimes 是否可以编写类
如何将 React 应用程序捆绑到服务器上的子目录中？

我有一个在本地主机上开发的 React 应用程序我想将其复制到服务器上名为 vensa 的子目录中我的 webpack 配置文件看起来像这样 const ExtractTextPlugin require extract text we
将 null 传递给首选 String 而不是 Object 的方法

我的程序中遇到了一个问题我用下面的一个小代码片段澄清了这一问题谁能解释为什么会发生这种情况 class ObjectnullTest public void printToOut String string System out pri
如何使用纯 Javascript 和文档查询选择器实现 jQuery .on() 函数

jquery on 函数 http api jquery com on 允许 DOM 事件在将来可能插入的元素上触发如何使用纯 Javascript 来实现这一点尤其是mouseenter具有特定类的元素上的事件无需 jQuery 并
如何复制部分或骨架 h5py 文件

我对这个问题有几个疑问我意识到这可能是一篇复杂的文章可以提供额外的细节我使用的代码包可以生成大型 h5 文件 source h5 100 Gb 其中几乎所有数据都驻留在 1 个数据集 group2 D 中我想使用 Python 创建
从 URL 获取 Instagram 用户名 - 使用正则表达式忽略句点

我已经能够使用正则表达式从 instagram 个人资料 URL 检索用户名但是一旦达到句号它就会停止完整网址 https www instagram com username test uk https www instagram
PostgreSQL 如何查找最近 n 分钟内的任何更改

我正在编写一个同步 PostgreSQL 和 MS SQL 服务器数据库的程序并在此转换中添加一些更改对于数百万条记录需要很长时间并且服务器负载非常糟糕select 它还需要更多资源来解析未更改的记录并根据 MS SQL 服务器验证
告诉 SBT 将我所有的依赖项收集在一起

构建 Web 应用程序时 SBT 能够将所有 jar 依赖项收集到 WAR 文件中是否可以让 SBT 将我在非 Web 应用程序中依赖的所有 jar 放入一个目录中以便我在运行应用程序时可以轻松地将它们放入我的类路径中是的您可以在项
在父子表单无序列表中打印分层数据php？

我在父子层次结构中的 mysql 表中有数据例如 msg id parent id msg 1 NULL msg1 2 NULL msg2 3 NULL msg3 4 1 msg1 child1 5 1 msg1 child2 6 3 m
为asp.net中的慢速页面添加实时进度更新

我正在尝试向我的 c asp net 4 0 应用程序添加一个实时进度报告以解决加载缓慢的页面我查看了 UpdatePanel 和 UpdateProgress Ajax 控件但我认为它们不合适基本上当用户单击按钮时页面会执行许
确定当前粘贴板内容的源应用程序

AppStore 中的多个 OSX 剪贴板管理器显示了确定复制到剪贴板的内容的源应用程序的能力我正在编写一些简单的剪贴板观察器并希望在内容附近显示源应用程序图标存储在通用 NSPasteboard 中我想知道如何实现这一目标据我所
ValueError：groupby Pandas 中的“无法从重复轴重新索引”

我的数据框如下所示 SKU GRP CATG PRD 0 54995 9404000 4040 99999 1 54999 9404000 4040 99999 2 55037 9404000 4040 1556894 3 55148 94

ValueError：groupby Pandas 中的“无法从重复轴重新索引”

ValueError：groupby Pandas 中的“无法从重复轴重新索引” 的相关文章

随机推荐

热门标签