pandas：按多列分组后创建单一大小和总和列

2024-05-16

我有一个数据框，我在 3 列上进行 groupby 并聚合数字列的总和和大小。运行代码后

df = pd.DataFrame.groupby(['year','cntry', 'state']).agg(['size','sum'])

我得到如下内容：

现在，我想将尺寸子列与主列分开，并仅创建单个尺寸列，但希望将总和列保留在主列标题下。我尝试过不同的方法但没有成功。这些是我尝试过但无法让事情为我工作的方法：

如何按对象计算 pandas 组中的行数？ https://stackoverflow.com/questions/19384532/how-to-count-number-of-rows-in-a-group-in-pandas-group-by-object

将 Pandas GroupBy 对象转换为 DataFrame https://stackoverflow.com/questions/10373660/converting-a-pandas-groupby-object-to-dataframe

如果有人能帮助我解决这个问题，我将不胜感激。

Regards,

Setup

d1 = pd.DataFrame(dict(
        year=np.random.choice((2014, 2015, 2016), 100),
        cntry=['United States' for _ in range(100)],
        State=np.random.choice(states, 100),
        Col1=np.random.randint(0, 20, 100),
        Col2=np.random.randint(0, 20, 100),
        Col3=np.random.randint(0, 20, 100),
    ))

df = d1.groupby(['year', 'cntry', 'State']).agg(['size', 'sum'])
df

Answer
最简单的方法就是只跑size after groupby

d1.groupby(['year', 'cntry', 'State']).size()

year  cntry          State        
2014  United States  California       10
                     Florida           9
                     Massachusetts     8
                     Minnesota         5
2015  United States  California        9
                     Florida           7
                     Massachusetts     4
                     Minnesota        11
2016  United States  California        8
                     Florida           8
                     Massachusetts    11
                     Minnesota        10
dtype: int64

要使用计算出的df

df.xs('size', axis=1, level=1)

如果size每列都不同。但因为size列是相同的['Col1', 'Col2', 'Col3']，我们可以这样做

df[('Col1', 'size')]

year  cntry          State        
2014  United States  California       10
                     Florida           9
                     Massachusetts     8
                     Minnesota         5
2015  United States  California        9
                     Florida           7
                     Massachusetts     4
                     Minnesota        11
2016  United States  California        8
                     Florida           8
                     Massachusetts    11
                     Minnesota        10
Name: (Col1, size), dtype: int64

组合视图1

pd.concat([df[('Col1', 'size')].rename('size'),
           df.xs('sum', axis=1, level=1)], axis=1)

组合视图2

pd.concat([df[('Col1', 'size')].rename(('', 'size')),
           df.xs('sum', axis=1, level=1, drop_level=False)], axis=1)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pandas：按多列分组后创建单一大小和总和列的相关文章

为什么 .setGeometry() 不改变 QWidget 实例的大小？

我想使用 QWidget 更改 QPushButton 的大小 setGeometry https doc qt io qtforpython 5 PySide2 QtWidgets QWidget html PySide2 QtWidge
在 Numpy 中切片后确定结果数组的形状

我很难理解在 numpy 中切片后如何确定结果数组的形状例如我使用以下简单代码 import numpy as np array np arange 27 reshape 3 3 3 slice1 array 1 2 1 slice2
如何确定非阻塞套接字是否真正连接？

这个问题不仅限于Python 这是一个一般的套接字问题我有一个非阻塞套接字想要连接到一台可访问的机器在另一端该端口不存在为什么 select 仍然成功我预计会超时 sock send 因管道损坏而失败 select 之后如何确定
Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
python - 是否可以扩展 xml-rpc 可以序列化的事物集？

我看到几个问题询问如何发送numpy ndarray通过 xml rpc 调用这不能开箱即用因为正如 xml rpc 中所述docs https docs python org 2 library xmlrpclib html 有一组固
如何从 PyCharm 项目中获取我的“exe”[重复]

这个问题在这里已经有答案了通过 PyCharm 在 Python 上编写一些项目我想从中获取一个exe文件我尝试过另存为 gt XXX exe 但是当我尝试执行它时出现错误此类操作系统不支持该文件附注我有win7 x64 它
python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
PIL Image.size 返回相反的宽度/高度

使用PIL确定图像的宽度和高度在特定图像上幸运的是只有这一个但这很麻烦从 image size 返回的宽度高度是相反的图片 http storage googleapis com cookila 533ebf752b9d1f7c
sudo pip install python-Levenshtein 失败，错误代码 1

我正在尝试在 Linux 上安装 python Levenshtein 库但每当我尝试通过以下方式安装它时 sudo pip install python Levenshtein 我收到此错误命令 usr bin python c 导入
matplotlib matshow 标签

我一个月前开始使用 matplotlib 所以我仍在学习我正在尝试用 matshow 制作热图我的代码如下 data numpy array a reshape 4 4 cax ax matshow data interpolation
如何使用Python的super()来更新父值？

我对继承很陌生之前所有关于继承和 Python 的 super 函数的讨论都有点超出我的理解我当前使用以下代码来更新父对象的值 usr bin env python test py class Master object mydata
如何列出 python PDB 中的当前行？

在 perl 调试器中如果重复列出离开当前行的代码段可以通过输入命令返回到当前行点我无法使用 python PDB 模块找到任何类似的东西如果我list如果我自己离开当前行并想再次查看它似乎我必须记住当前正在执行的行号对我来说
Django 在选择列表更改时创建毫无意义的迁移

我正在尝试使用可调用创建一个带有选择字段的模型以便 Django 在选择列表更改时不会创建迁移如中所述this https stackoverflow com questions 31788450 stop django from cr
在 MacO 和 Linux 上安装 win32com [重复]

这个问题在这里已经有答案了我的问题很简单我可以安装吗win32com蟒蛇API pywin32特别是在非 Windows 操作系统上我一直在Mac上尝试多个版本pip install pywin32 都失败了下面是一个例子如果你
查找给定节点的最高权重边

我在 NetworkX 中有一个有向图边缘的权重从 0 到 1 表示它们发生的概率网络连通性非常高所以我想修剪每个节点的边缘只保留最高概率的节点我不确定如何迭代每个节点并仅保留最高权重in edges在图中有没有一个networ
Flask WTForms 使用变量自动填充 StringField

我有一个表格我想用上一页收到的信息自动填充一些字段但如果他们想调整它它需要是可更改的我正在为我的 SelectField 使用动态创建的列表但添加 StringField 并不成功请参阅下面的我的代码 forms py clas
Python - 如何查询定义方法的类？

我的问题有点类似于this one https stackoverflow com questions 5520580 how do you get all classes defined in a module but not impor
全局变量是 None 而不是实例 - Python

我正在处理Python 中的全局变量代码应该可以正常工作但是有一个问题我必须使用全局变量作为类的实例Back 当我运行应用程序时它说 back is None 这应该不是真的因为第二行setup 功能 back Back Back
如何在sphinx中启用数学？

我在用sphinx http sphinx pocoo org index html与pngmath http sphinx pocoo org ext math html module sphinx ext pngmath扩展来记录我的代
Django South - 将 null=True 字段转换为 null=False 字段

我的问题是转变的最佳做法是什么null True场变成null False使用 Django South 的字段具体来说我正在与ForeignKey 你应该先写一个数据迁移 http south aeracode org docs t

随机推荐

Android：如何从输入流创建 9patch 图像？

我使用下面的代码实例化 9patch 图像并将其设置为按钮的背景下图显示了不理想的结果 InputStream MyClass class getResourceAsStream images btn default normal 9 p
celery可以分配任务给指定worker吗

Celery 会将任务发送给空闲的工人我有一个任务每 5 秒运行一次我希望这个任务只发送给一个指定的工作人员其他任务可以共享剩余的工人芹菜可以这样做吗我想知道这个参数是什么 CELERY TASK RESULT EXPIRES这是
如何在 C# 中获取该月的最后一天？ [复制]

这个问题在这里已经有答案了如何在 C 中找到该月的最后一天另一种方法 DateTime today DateTime Today DateTime endOfMonth new DateTime today Year today Mon
哪种 Javascript 解决方案（不是 .htc）可以真正在 IE7 和 8 中实现抗锯齿圆角？

哪种 JavaScript 解决方案不是 htc 确实可以在 IE7 和 8 中实现抗锯齿圆角CSS3在支持的浏览器中给出我尝试了很多 http www ruzee com blog ruzeeborders http www ruze
PostgreSQL round(v numeric, s int)

Which method http en wikipedia org wiki Rounding Tie breakingPostgres 吗round v numeric s int http www postgresql org doc
IntentService、Service 或 AsyncTask

实现这一点的最佳方法是什么我有一个 Android 应用程序它将使用我的 python 服务器来允许两部手机之间进行轮流通信回合意味着他们在一轮开始之前不能互相交谈一旦他们发送一条消息他们就不能发送另一条消息直到对方做出回应然
Blazor WASM OIDC 指出无论我做什么，重定向 uri 都未定义

因此我遵循了和这个中等文章 https medium com marcodesanctis2 securing blazor webassembly with identity server 4 ee44aa1687ef它建议将 OIDC
如何使用本地安装的gems执行Ruby程序？

我已经使用安装了我的依赖项 bundle package 然后将它们传输到离线服务器并运行 gt bundle install local Using mime types 1 19 Using rest client 1 6 7 Usin
无法更改 Xampp 中的 Apache 端口号

我刚刚下载了Xampp服务器xampp win32 1 8 2 0 VC9 zip http www apachefriends org en xampp windows html 641文件 Windows 并尝试启动 apache 服务
Sql Server 的夏令时

我们正在使用一个以 C Unix 格式存储日期的旧应用程序 C 时间基本上是自 1970 年 1 月 1 日以来的秒数日期以整数形式存储在 SQL Server 数据库中我正在为使用这些日期的报告编写视图到目前为止我正在使用以下命令
FB登录：登录成功后不知道如何获得响应

我在我的网站上添加了一个 fblogin 按钮工作正常放置一个按钮当用户单击它时将打开一个用于登录的对话框但我不知道登录成功后如何获得响应请建议您可以使用JS SDK来订阅该类型的事件看看Facebook JavaScrip
TFS 自动构建：Nuget Pack 失败并显示代码(1)

我正在尝试在 TFS 中为 WPF 项目实现自动构建自动构建效果很好但我无法为该项目准备 nuget 包这是我在 TFS 中的构建过程如果我删除 NuGet 包和 NuGet 推送它就可以正常工作以下是我通过 TFS 收到的消息
在 ios 版 Ionic 中接收 URL

我正在使用离子框架我正在尝试设置一种从另一个应用程序接收网址的方法就像您在浏览器中单击共享然后将链接发送到另一个应用程序我的应用程序我找到了这个cordova https stackoverflow com questions
删除 json 对象字符串中的“\”

如何删除下面字符串中的特殊字符 String x message content toom recipients id 1000001865 room subject room 我使用了 x replaceAll 但它不起作用您必须转义正
JAX-RS 和 JAX-WS 有什么区别？

阅读了几篇有关 JAX RS 和 JAX WS 的文章后我有几个问题想确认一下 JAX RS可以像JAX WS一样做异步请求吗 JAX RS 能否访问不在 Java 平台上运行的 Web 服务反之亦然 REST 对于配置文件有限的设备
Django 将所有未捕获的 url 路由到包含的 urls.py

我希望每个不以 api 开头的网址都使用 foo urls py urls py from django conf urls import include url from foo import urls as foo urls urlpa
使用 Python NLTK 对大型 (>70MB) TXT 文件进行标记。连接并将数据写入流错误

首先我是 python nltk 的新手所以如果问题太基本我深表歉意我有一个大文件我正在尝试对其进行标记我遇到内存错误我读过的一种解决方案是一次一行读取文件这是有道理的但是在这样做时我收到错误cannot concat
如何使用 Blazor 在 ASP.NET CORE 中更新数据库后刷新网页

我正在制作一个小型房间预订网络应用程序我希望在给定的时间间隔内刷新网页即给定的一分钟或对数据库进行更改时我发现StateHasChanged 但我真的不知道如何实现它这里是新手一克诺比我尝试将其放在将约会添加到日程表的函数中 va
拉拉维尔； “SQLSTATE[HY000] [2002] 连接被拒绝”

我在 OSX 主机上设置了 homestead 2 0 并使用 Sequel Pro 我可以进行迁移并确认数据已在Sequel Pro中迁移因此看起来数据库连接没有问题但是一旦我尝试从 Laravel 4 2 应用程序获取数据它就无
pandas：按多列分组后创建单一大小和总和列

我有一个数据框我在 3 列上进行 groupby 并聚合数字列的总和和大小运行代码后 df pd DataFrame groupby year cntry state agg size sum 我得到如下内容现在我想将尺寸子列与主列

pandas：按多列分组后创建单一大小和总和列

pandas：按多列分组后创建单一大小和总和列 的相关文章

随机推荐

热门标签

pandas：按多列分组后创建单一大小和总和列的相关文章