pandas.groupby 的 group_keys 参数实际上是做什么的？

2024-01-30

In pandas.DataFrame.groupby http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html，有一个论证group_keys，我收集的应该是做一些与如何将组键包含在数据帧子集中有关的事情。根据文档：

组键 : 布尔值，默认 True

调用apply时，将组键添加到索引中以识别棋子

但是，我真的找不到任何例子group_keys产生实际差异：

import pandas as pd

df = pd.DataFrame([[0, 1, 3],
                   [3, 1, 1],
                   [3, 0, 0],
                   [2, 3, 3],
                   [2, 1, 0]], columns=list('xyz'))

gby = df.groupby('x')
gby_k = df.groupby('x', group_keys=False)

它对输出没有影响apply:

ap = gby.apply(pd.DataFrame.sum)
#    x  y  z
# x         
# 0  0  1  3
# 2  4  4  3
# 3  6  1  1

ap_k = gby_k.apply(pd.DataFrame.sum)
#    x  y  z
# x         
# 0  0  1  3
# 2  4  4  3
# 3  6  1  1

即使您随时打印出分组的子集，结果仍然相同：

def printer_func(x):
    print(x)
    return x

print('gby')
print('--------------')
gby.apply(printer_func)
print('--------------')

print('gby_k')
print('--------------')
gby_k.apply(printer_func)
print('--------------')

# gby
# --------------
#    x  y  z
# 0  0  1  3
#    x  y  z
# 0  0  1  3
#    x  y  z
# 3  2  3  3
# 4  2  1  0
#    x  y  z
# 1  3  1  1
# 2  3  0  0
# --------------
# gby_k
# --------------
#    x  y  z
# 0  0  1  3
#    x  y  z
# 0  0  1  3
#    x  y  z
# 3  2  3  3
# 4  2  1  0
#    x  y  z
# 1  3  1  1
# 2  3  0  0
# --------------

我考虑了默认参数实际上是的可能性True，但是切换group_keys明确地False也没有什么区别。这个论点究竟是为了什么？

(Run on pandas版本0.18.1)

Edit:我确实找到了一种方法group_keys改变行为，基于这个答案 https://stackoverflow.com/a/34282449/467366:

import pandas as pd
import numpy as np

row_idx = pd.MultiIndex.from_product(((0, 1), (2, 3, 4)))
d = pd.DataFrame([[4, 3], [1, 3], [1, 1], [2, 4], [0, 1], [4, 2]], index=row_idx)

df_n = d.groupby(level=0).apply(lambda x: x.nlargest(2, [0]))
#        0  1
# 0 0 2  4  3
#     3  1  3
# 1 1 4  4  2
#     2  2  4

df_k = d.groupby(level=0, group_keys=False).apply(lambda x: x.nlargest(2, [0]))

#      0  1
# 0 2  4  3
#   3  1  3
# 1 4  4  2
#   2  2  4

但是，我仍然不清楚背后的可理解原理group_keys is 应该做的。这种行为似乎并不直观@piRSquared的回答。

group_keys参数输入groupby http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html期间派上用场apply http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.apply.html创建与分组列相对应的附加索引列的操作（group_keys=True）并消除这种情况（group_keys=False）尤其是在尝试对各个列执行操作的情况下。

一个这样的例子：

In [21]: gby = df.groupby('x',group_keys=True).apply(lambda row: row['x'])

In [22]: gby
Out[22]: 
x   
0  0    0
2  3    2
   4    2
3  1    3
   2    3
Name: x, dtype: int64

In [23]: gby_k = df.groupby('x', group_keys=False).apply(lambda row: row['x'])

In [24]: gby_k
Out[24]: 
0    0
3    2
4    2
1    3
2    3
Name: x, dtype: int64

其预期应用之一可能是通过将层次结构的某一级别转换为Multi-index数据框对象。

In [27]: gby.groupby(level='x').sum()
Out[27]: 
x
0    0
2    4
3    6
Name: x, dtype: int64

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pandas.groupby 的 group_keys 参数实际上是做什么的？的相关文章

使用 Marshmallow 中的数据更新行 (SQLAlchemy)

我正在使用 Flask Flask SQLAlchemy Flask Marshmallow marshmallow sqlalchemy 尝试实现 REST api PUT 方法我还没有找到任何使用 SQLA 和 Marshmallow
如何配置散景图以具有响应宽度和固定高度

我使用通过组件功能嵌入的散景实际上我使用 plot sizing mode scale width 它根据宽度进行缩放并保持纵横比但我想要一个响应宽度但固定或最大高度这怎么可能实现呢有stretch both and scale b
如何将经度和纬度转换为国家或城市？

我需要将经度和纬度坐标转换为国家或城市 python中有这样的例子吗提前致谢我使用谷歌的API from urllib2 import urlopen import json def getplace lat lon url http
01 无效令牌[重复]

这个问题在这里已经有答案了嘿学习 python3有一段时间了遇到字典和dictionary name get 方法并尝试获取随机键值问题 data data get key 1 它有效并且返回 1 但如果我使用data get ke
代理阻止网络套接字？如何绕行

我有一个用 Python 编写的正在运行的 websocket 服务器来自https github com opiate SimpleWebSocketServer https github com opiate SimpleWebSoc
Python：如何重构循环导入

我有件事可以帮你做engine setState
Python3模拟用另一个函数替换函数

如何使用 python 中的另一个函数来模拟一个函数该函数也将提供一个模拟对象我有类似以下操作的代码 def foo arg1 arg2 r bar arg1 does interesting things 我想替换的实现bar函数让
python 语言环境奇怪的错误。这究竟是怎么回事？

所以今天我升级到了 bazaar 2 0 2 我开始收到这条消息顺便说一句我在雪豹上 bzr warning unknown locale UTF 8 Could not determine what text encoding to
Python/Flask：应用程序在关闭后正在运行

我正在开发一个简单的 Flask Web 应用程序我使用 Eclipse Pydev 当我开发该应用程序时由于代码更改我必须经常重新启动该应用程序这就是问题所在当我运行该应用程序时我可以在本地主机上看到该框架这很好但是当我想
获取 zeep.exceptions.ValidationError：缺少与 suds 一起使用的方法的元素

我正在移植开发的代码suds 0 6到zeep 2 4 0 以前的泡沫代码 client Client WSDLfile proxy proxy faults True config client factory create perUse
keras 预测内存交换无限期增加

我使用keras实现了一个分类程序我有一大组图像我想使用 for 循环来预测每个图像然而每次计算新图像时交换内存都会增加我尝试删除预测函数内部的所有变量并且我确信该函数内部存在问题但内存仍然增加 for img in ima
如何在Python中正确声明ctype结构+联合？

我正在制作一个二进制数据解析器虽然我可以依靠 C 但我想看看是否可以使用 Python 来完成该任务我对如何实现这一点有一些了解我当前的实现如下所示 from ctypes import class sHeader Structure
将带有两层分隔符的字符串转换为字典 - python

给定一个字符串 s x t1 ny t2 nz t3 我想转换成字典 sdic x 1 y 2 z 3 我通过这样做让它工作 sdic dict tuple j split t for j in i for i in s split n F
将 ASCII 字符转换为“”unicode 表示法的脚本

我正在对 Linux 区域设置文件进行一些更改 usr share i18n locales like pt BR 并且需要格式化字符串例如 d m Y H M 必须以 Unicode 指定其中每个在本例中为 ASCII 字符表示为
如何从c++调用python

我是Python新手我尝试像这样从 C 调用 python 脚本在 Raspberry Pi 中 std string pythonCommand python Callee py a b int res system pythonCo
if/else 在 while 循环内正确缩进[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我开始学习 Python 编程大约几周了我遇到了一些麻烦下面的代码是一个小程序用于检查列表中是否有偶数如果找到第一个偶数
带有整数的 np.sqrt 和 where 条件返回错误结果

当我将 numpy sqrt 方法应用于带有 a 的整数数组时我得到了奇怪的结果where健康状况见下文对于整数 a np array 1 4 9 np sqrt a where a gt 5 Out 3 array 0 0 5 3
如何在 Pandas 数据框中用 NaN 替换一系列值？

我有一个巨大的数据框我应该如何用 NaN 替换一系列值 200 100 数据框您可以使用pd DataFrame mask https pandas pydata org pandas docs stable generated pan
在 Gensim 中通过 ID 检索文档的字符串版本

我正在使用 Gensim 进行一些主题建模并且已经达到使用 LSI 和 tf idf 模型进行相似性查询的程度我取回 ID 集和相似点例如 299501 0 64505910873413086 如何获取与 ID 在本例中为 29950
将笔记本生成的 HTML 片段转换为 LaTeX 和 PDF

在我的笔记本里有时会有 from IPython display import display HTML display HTML h3 The s is important h3 question of the day 但当我后来将笔记本

随机推荐

输出端口“tcp_inet”上的值错误

我正在使用 Phoenix 框架它在下面运行 Cowboy 我偶尔会在日志中看到以下一对错误 Bad value on output port tcp inet GenServer PID lt 0 8423 1 gt terminati
如何仅在经过一定时间后才显示消息 jquery - 阻止表单提交

我有一个结账页面其中有一些 ajax 调用例如当用户更改送货国家地区时这些调用会更新隐藏字段大多数时候这工作得很好页面有时间在用户单击提交之前更新隐藏字段但有时由于连接速度慢或其他原因 ajax 无法及时返回隐藏字段并
使用 uibutton ios 的表视图公开指示符样式

我有一个自定义视图我想模仿表视图单元格中的公开指示器这可能吗有没有办法提取该图像这完全可以通过放置一个代码来完成UITableViewCell披露指标在UIButton UITableViewCell disclosure UITa
实际上，渐进增强和优雅降级是一回事吗？

Are 渐进增强 and 优雅降级基本上是同一件事不完全的他们解决类似的问题但角度不同优雅降级意味着您拥有出色的功能并且可以在不支持它的浏览器中处理不太出色的功能但仍然需要它以某种方式工作图像上的 alt 属性以及
将多个png转换为gif作为R中的动画

我的目录中有一堆 png 文件我想通过 R 将它们转换为 gif 动画文件您能告诉我该怎么做吗这是一些您可以使用的虚拟代码首先使用magickGIF 包使用magrittr包或dplyr包为 gt library magick
Google Deploy Manager（无效的配置文件：模板获取失败/无法找到资源）

使用 Google Deploy Manager 时 gcloud deployment manager deployments create my environment config my environment jinja 我收到以下
使用干净的 url 在 yii2 中的超链接中传递多个参数，Html::a() 不会生成干净的 url

我正在尝试通过中提到的方法生成超链接http www yiiframework com doc 2 0 guide helper html html hyperlinks http www yiiframework com doc 2 0
BroadFileSystemAccess UWP

我正在尝试使用broadFileSystemAccessUWP 应用程序的功能但是broadFileSystemAccess功能未列在我的 Package appxmanifest 的功能列表中我的最小和最大目标版本是 1803 内部版
Laravel 中的 Ajax 419 状态错误

I tried to upload images using AJax Jquery Laravel Here I tried with so many solutions still I am getting 419 error and
NullPointerException-：尝试在空对象引用上调用接口方法“android.view.View android.view.MenuItem.getActionView()”

我试图在 Actionbar 上添加搜索栏并在 getActionView 上发现空指针异常请帮我解决这个问题我已经提供了所需的详细信息我的 MainActivity 扩展了 AppCompatActivity 并在这行代码上返回错
spring boot mvc - 不支持内容类型“application/json;charset=UTF-8”

In 这个春季启动项目 https github com MaxHoefl springboot jpademo当我得到一个错误POSTing 使用 Postman 一个新的Item资源 Resolving exception from h
P/调用传递给 StringBuilder 的函数

在 C 文件中我有一个 class Archiver DllImport Archiver dll public static extern void archive string data StringBuilder response 字
ob_clean 不清理头文件之前的输出吗？

我面临这个问题我更改了 db php 文件不幸的是我在 php 标记之前和之后放置了空格我在 image php 文件中使用了它我收到已发送的错误标头我知道它是因为db php中有空间但我在image php中使用了ob cle
在 React.js 中隐藏组件的正确方法

假设你正在传递一个名为show到一个组件如果 prop 值为 true 您应该正常渲染完整组件如果为 false 则不应显示任何内容您可以通过两种方式执行此操作在组件的 render 方法中返回 null 应用包含以下内容的 CSS
PHP 5.3 自动加载器

我想使用 PSR 0 标准方式自动加载类而不需要添加包含例如如何用自动加载机制替换下面的代码 namespace Example use MyLib Controller include once library MyLib Contr
如何捕获包含多个表单的页面上按下的回车键？

我继承了一个网络应用程序其中在任何输入字段中按回车键的通常功能已被禁用因为页面包含多个表单并且应用程序将无法确定或者所以我被告知采取哪种形式采取行动该应用程序的设计没有提交按钮如输入类型提交相反设计者采用了 oncli
在react中使用axios获取数据

我是反应新手所以我尝试使用 axios 与服务进行反应来发出获取请求以从中获取赛道和相应的比赛但我得到的赛道就像一个空对象我需要知道如何有效地发出获取请求 trackUtils js import AppDispatcher fro
HtmlAgilityPack基本如何获取标题和链接？

Html div class col a class video box title En son haber href http en son haber img class img responsive alt en son haber
为什么运行 npm test 会产生：“.”不被识别为内部或外部命令、可操作程序或批处理文件。？

我安装了以下内容 Windows 10 Git bash mingw64 Node js v8 7 0 npm 版本 5 4 2 套餐柴4 4 1 摩卡3 5 0 我有一个示例摩卡测试当它实际运行时总是会通过我在 shell 中运行的
pandas.groupby 的 group_keys 参数实际上是做什么的？

In pandas DataFrame groupby http pandas pydata org pandas docs stable generated pandas DataFrame groupby html 有一个论证group

pandas.groupby 的 group_keys 参数实际上是做什么的？

pandas.groupby 的 group_keys 参数实际上是做什么的？ 的相关文章

随机推荐

热门标签

pandas.groupby 的 group_keys 参数实际上是做什么的？的相关文章