在 groupby agg 中使用列名列表？

2023-12-22

Summary:

我有许多带有数据（data_cols）和文本（text_cols）的列，我想通过引用列名列表来执行以下操作，但无法弄清楚：df.groupby('id', as_index=False).agg({data_cols: 'sum', text_cols: 'first'})

解释：

我有一个包含约 30 列的数据框，其中一些列包含值，其他列包含文本。我想对具有相同 id 的所有值进行求和，并让文本使用第一个条目。我可以通过使用 groupby 来实现这一点：

d = {'id': ['a', 'a', 'b', 'c'], 'value1': [1, 2, 3, 4], 'value2': [5, 6, 7, 8], 'text1': ['w', 'x', 'y', 'z']}
df = pd.DataFrame(d)

  id  value1  value2 text1
0  a       1       5     w
1  a       2       6     x
2  b       3       7     y
3  c       4       8     z

df.groupby('id', as_index=False).agg({'value1': 'sum', 'value2': 'sum', 'text1': 'first'})

  id  value1  value2 text1
0  a       3      11     w
1  b       3       7     y
2  c       4       8     z

这正是我想要实现的目标，只是我有很多列并且不希望写出所有列名称。因此，我尝试了不同的方法来引用多个列，但没有任何效果。

data_cols = df.columns[1:3]
text_cols = set(df.columns) - set(data_cols)

df.groupby('id', as_index=False).agg({data_cols: 'sum', text_cols: 'first'})

在这里，我得到TypeError: unhashable type: 'Index'，所以我想我可以通过使用来避免这种情况tuple:

data_cols = tuple(df.columns[1:3])
text_cols = tuple(set(df.columns) - set(data_cols)) #I have many data columns and some text columbs before and after them

这给了我：SpecificationError: Column(s) [('text1', 'id'), ('value1', 'value2')] do not exist我认为它的观点('value1', 'value2')作为单个列，而不是将其解压缩为两列。有什么方法或格式可以避免这种情况吗？

或者，我可以将 df 分成 2 个 df：df_values 和 df_text，对 df_values 进行分组，然后将它们重新连接在一起，但这似乎很麻烦，我想有更好的方法。

创建字典通过dict.fromkeys并合并它们，最后传递到agg:

data_cols = df.columns[1:3]
text_cols = set(df.columns) - set(data_cols)
d1 = dict.fromkeys(data_cols, 'sum')
d2 = dict.fromkeys(text_cols, 'first')

#https://stackoverflow.com/questions/38987
d = {**d1, **d2}

df.groupby('id', as_index=False).agg(d)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pandasgroupby

在 groupby agg 中使用列名列表？的相关文章

为什么 .setGeometry() 不改变 QWidget 实例的大小？

我想使用 QWidget 更改 QPushButton 的大小 setGeometry https doc qt io qtforpython 5 PySide2 QtWidgets QWidget html PySide2 QtWidge
一次将Python dict的内容分配给多个变量？

我想做这样的事情 def f return a 1 b 2 c 3 a b f or a b f IE 这样 a 被分配为 1 b 被分配为 2 并且 c 是未定义的这与此类似 def f return 1 2 a b f 依赖于变量名称
从字符串到类型的词法转换

最近我尝试用Python存储和读取文件中的信息遇到了一个小问题我想从文本文件中读取类型信息从 string 到 int 或 float 的类型转换非常有效但从 string 到 type 的类型转换似乎是另一个问题当然我尝试了
即使使用 .loc[row_indexer,col_indexer] = value 时也会设置 WithCopyWarning

这是我的代码中得到的行之一SettingWithCopyWarning value1 Total Population value1 Total Population replace to replace value 4 然后我将其更改为
可以在 TensorFlow 中使用排名相关作为成本函数吗？

我正在处理偶尔充满异常值的极其嘈杂的数据因此我主要依靠相关性来衡量我的神经网络的准确性是否可以明确使用诸如等级相关性斯皮尔曼相关系数之类的东西作为我的成本函数到目前为止我主要依赖 MSE 作为相关性的代理我现在面临三个主要障碍
错误：permission_manager_qt.cpp(82) 不支持的权限类型：13

我正在开发具有内置浏览器功能的 python 代码 PyQt 5 13 import sys from PyQt5 QtCore import from PyQt5 QtGui import from PyQt5 QtWidgets imp
为什么 Python 中的“pip install”会引发语法错误？

我正在尝试使用 pip 安装软件包我试着跑pip install从Python shell 但我得到了SyntaxError 为什么我会收到此错误如何使用 pip 安装软件包 gt gt gt pip install selenium
如何限制Django CreateView中ForeignKey字段的选择？

我有一个沿着这些思路的模型结构 models py class Foo models Model class Bar models Model foo models ForeignKey Foo class Baz models Model
如何使用 python urllib 在 HTTP/1.1 中保持活力

现在我正在这样做 Python3 urllib url someurl headers HOST somehost Connection keep alive Accept Encoding gzip deflate opener urll
在径向（树）网络x图中查找末端节点（叶节点）

给定下图是否有一种方便的方法来仅获取末端节点我所说的端节点是指那些具有一个连接边的到节点我认为这些有时被称为叶节点 G nx DiGraph fromnodes 0 1 1 1 1 1 2 3 4 5 5 5 7 8 9 10 ton
如何在 Python 中将彩色输出打印到终端？

是否有与 Perl 等效的 Python 语言 print color red print
如何在python中检索aws批处理参数值？

流程 Dynamo DB gt Lambda gt 批处理如果将角色 arn 插入动态数据库它是从 lambda 事件中检索的然后使用submit job角色 arn 的 API 被传递为 parameters role arn ar
具有多个元素的数组的真值是二义性错误吗？ Python

from numpy import from pylab import from math import def TentMap a x if x gt 0 and x lt 0 5 return 2 a x elif x gt 0 5 a
获取列表中倒数第二个元素[重复]

这个问题在这里已经有答案了我可以通过以下方式获取列表的倒数第二个元素 gt gt gt lst a b c d e f gt gt gt print lst len lst 2 e 有没有比使用更好的方法print lst len lst
如何使用Python的super()来更新父值？

我对继承很陌生之前所有关于继承和 Python 的 super 函数的讨论都有点超出我的理解我当前使用以下代码来更新父对象的值 usr bin env python test py class Master object mydata
为什么实现 __iter__ 的对象不被识别为可迭代的？

假设您使用包装对象 class IterOrNotIter def init self self f open tmp toto txt def getattr self item try return self getattribute
全局变量是 None 而不是实例 - Python

我正在处理Python 中的全局变量代码应该可以正常工作但是有一个问题我必须使用全局变量作为类的实例Back 当我运行应用程序时它说 back is None 这应该不是真的因为第二行setup 功能 back Back Back
TypeError：无法使用抽象方法实例化抽象类 <...>

这是我的代码 from abc import ABC from abc import abstractmethod class Mamifiero ABC docstring for Mamifiero def init self self
使用 Python 生成类似于 Messenger 或 kik 代码的圆形二维码

我可以使用 Python 生成圆形 QR 码就像 Facebook Messenger 或 kik 使用的那样吗我访问了很多网站但找不到这种类型的二维码默认情况下 Python 生成方形 QR 码但在我的项目中我想要圆形 QR 码
Django South - 将 null=True 字段转换为 null=False 字段

我的问题是转变的最佳做法是什么null True场变成null False使用 Django South 的字段具体来说我正在与ForeignKey 你应该先写一个数据迁移 http south aeracode org docs t

随机推荐

在python中创建具有一定宽度边框的图像

我用过PIL back color width for x in range w for y in range h if x 0 or y 0 or x w 1 or y h 1 pixels x y back color 我需要向图像添加
合并 pandas 数据框列表

我有一个数据框列表我需要使用唯一的列将它们合并在一起 date 字段名称不同因此不能使用 concat 我可以手动使用df 0 merge df 1 on Date merge df 3 on Date 等等将每个df一一合并但问题是
即使用户允许，Gmail 也会隐藏外部电子邮件图像

我正在尝试在 html 电子邮件中插入带有图像的签名我在使用 GMail 时遇到一些问题它在 iPhone 客户端上运行良好在用户接受图像之前它们的大小正确并且替代文本可见每个图像的 HTML 为 img alt Bonne w
警告主要版本 52 比该编译器支持的最高主要版本 51 更新

基本上我是超级新手开始在IT公司实习我用 Xamarin 安装了 VS 我面临的问题非常令人沮丧因此即使我创建空项目我也无法编译它并收到如下错误严重性代码说明项目文件行抑制状态警告主要版本 52 比该编译器支持的最高主要版
如何让 Eclipse 记住 Android SDK 位置？

每当我尝试使用 Eclipse 创建新的 Android 项目在空工作区中时构建目标列表都是空的因此我需要取消新建 Android 项目对话框然后转到首选项并重新输入 Android 的 SDK 位置完成此操作后我可以
Android：使用自定义视图从对话框中检索 EditText 值

我使用 AlertDialog Builder 类创建了一个对话框并调用 builder setView int resource 为其提供文本输入的自定义布局当用户点击确定时我试图从布局上的 EditText 检索值但是当调用
如何从div中删除class属性？

我正在使用 JavaScript 如果单击按钮我想添加删除 Class 属性我可以添加该类但我不知道如何删除它我怎样才能做到这一点 window onload function var buttonGo document getE
何时使用表运算符 APPLY

我试图理解表运算符APPLY 这是示例 CREATE TABLE y Name char 8 hoursWorked int GO INSERT INTO y VALUES jim 4 INSERT INTO y VALUES michae
类型错误：无法读取 Proxy.$_setUpEditorEvents 处未定义的属性（读取“模型”）

我正在尝试将 CKEditor 5 与 Laravel 中的 Inertia 应用程序一起使用但在遵循文档后我收到以下错误索引 vue file
将证书导入 VisualSVN 服务器

是否可以将安装了VisualSVN的Windows Server的有效证书导入到VisualSVN中阅读文章KB134 为 VisualSVN 服务器配置 SSL 证书 https www visualsvn com support to
clojure.lang 真的只是实现细节吗？

在 Clojure 中一些任务例如实例化PersistentQueue https github com clojure clojure blob master src jvm clojure lang PersistentQueue
如何在控制台应用程序中使用 System.Web.Caching.Cache？

上下文 Net 3 5 C 我想在我的控制台应用程序中拥有缓存机制我不想重新发明轮子而是想使用System Web Caching Cache 这是最终决定我不能使用其他缓存框架不要问为什么然而看起来像System Web Ca
learnyounode Node.js 教程的 console.log 以错误顺序打印语句

我正在做一个GET请求存储数据然后注意到响应已结束我有一个console log一条语句表示我完成接收数据时的情况另一条语句表示程序完成时的情况见下文 var a 1 var b 10e9 http get process arg
WebDriverIO Selenium 将命令行参数从 config.js 文件传递到 Chrome

我需要 chrome 来运行我的 UI 测试的禁用网络安全标志如何使用 wdio config 文件注入任何命令 http webdriver io http webdriver io capabilities browserName c
如何按枚举值对对象进行排序？

我有Workout与一起上课Difficulty财产 enum Difficulty String case easy easy case moderate moderate case hard hard class Workout va
Cloud 9 IDE 中有离线模式吗

我现在工作的地方网络一直断线 Cloud 9 IDE 中是否有离线模式通过该模式我可以提前缓存预下载所有源文件如果网络暂时中断我可以继续工作并在网络恢复时同步更改 Thanks 这是一个重要的用例我们尚未提供此功能并且正在考
为了获得最快的速度，应该按什么顺序列出 CSS 属性？

让我们获取一些 CSS 属性并将它们随机放置在 CSS 文件中 outline伪元素颜色属性背景和边框属性框属性灵活的盒子布局文本属性文本装饰属性字体属性书写模式表属性 Lists动画片如果您想最大限度地提高渲染速度您应该按什么顺序列出
如何从编辑器脚本更新预制件属性并使实例获得更新？

这是后续这个问题 https stackoverflow com questions 38785607 how to edit a monobehaviours properties on a prefab in the unityedit
使用 loc 方法获取 DataFrame 的视图

我正在尝试使用以下方法获取 pandas 数据框的视图loc方法但当我修改原始 DataFrame 时它没有按预期工作我想使用提取 DataFrame 的行切片loc方法以便当对 DataFrame 进行修改时切片会反映更改让我
在 groupby agg 中使用列名列表？

Summary 我有许多带有数据 data cols 和文本 text cols 的列我想通过引用列名列表来执行以下操作但无法弄清楚 df groupby id as index False agg data cols sum text

在 groupby agg 中使用列名列表？

Summary:

解释：

在 groupby agg 中使用列名列表？ 的相关文章

随机推荐

热门标签

在 groupby agg 中使用列名列表？的相关文章