Pandas：使用多个函数聚合多个列

2024-01-11

Python 中的 Pandas 和 R 中的 Dplyr 都是灵活的数据整理工具。例如，在 R 中，使用 dplyr 可以执行以下操作：

custom_func <- function(col1, col2) length(col1) + length(col2)

ChickWeight %>% 
  group_by(Diet) %>% 
  summarise(m_weight = mean(weight), 
            var_time = var(Time), 
            covar = cov(weight, Time),
            odd_stat = custom_func(weight, Time))

注意如何在一个声明中；

我可以在一行中聚合多个列。
我可以在一行中对这些多列应用不同的函数。
我可以使用考虑两列的函数。
我可以为其中任何一个添加自定义函数。
我可以为这些聚合声明新的列名称。

这种模式在熊猫身上也可能吗？请注意，我有兴趣在简短的声明中执行此操作（因此不会创建三个不同的数据帧然后加入它们）。

与熊猫groupby.apply() http://pandas.pydata.org/pandas-docs/stable/generated/pandas.core.groupby.GroupBy.apply.html您可以在 groupby 聚合中运行多个函数。请注意您需要的统计功能scipy安装。对于自定义函数，需要运行类似的聚合sum()对于分组数据：

def customfct(x,y):
    data = x / y
    return data.mean()

def f(row):  
    row['m_weight'] = row['weight'].mean()
    row['var_time'] = row['Time'].var()
    row['cov'] = row['weight'].cov(row['Time'])
    row['odd_stat'] = customfct(row['weight'], row['Time'])
    return row

aggdf = df.groupby('Diet').apply(f)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

r

pandas

dplyr

Pandas：使用多个函数聚合多个列的相关文章

使用 Poetry 创建的 Python 项目：如何在 Visual Studio Code 中调试它？

我有一个根据基本 Poetry 创建的 Python 项目指示 https python poetry org docs basic usage 项目文件夹是这样的 my project my project my project py F
如何同时有效地运行多个 Pytorch 进程/模型？ Traceback：分页文件太小，无法完成此操作

背景我有一个非常小的网络我想用不同的随机种子进行测试该网络几乎只使用了我的 GPU 计算能力的 1 因此理论上我可以同时运行 50 个进程来同时尝试许多不同的种子 Problem 不幸的是我什至无法在多个进程中导入 pytorch 当
清理 MongoDB 的输入

我正在为 MongoDB 数据库程序编写 REST 接口并尝试实现搜索功能我想公开整个 MongoDB 接口我确实有两个问题但它们是相关的所以我将它们放在一篇文章中使用 Python json 模块解码不受信任的 JSON 是否
关于具有自定义损失的 3 输出 ANN 的加权

我正在尝试定义一个自定义损失函数它在回归模型中接收 3 个输出变量 def custom loss y true y pred y true c K cast y true float32 Shape batch size 3 y pre
Flask 和 Reactjs 抛出 JSX 转换错误

我已经开始将 ReactJS 与 Python Flask 后端结合使用通过 Flask 渲染模板时我在 Chrome 控制台中收到以下客户端错误错误找不到模块 jstransform visitors es6 templates
将其他数据集的点添加到ggplot2

关于这个主题已经有很多问题但我找不到能回答我的具体问题的问题我有一个barplot see testplot1 and testplot3如下绘制数据集 bardata如下并希望从另一个数据集向其添加点 pointdata 请参阅简
私有属性，但却是一个神秘的领域

我想将属性设为私有但带有 pydantic 字段 from pydantic import BaseModel Field PrivateAttr validator class A BaseModel a str I want a py
使用最新值进行采样

考虑以下系列 created at 2014 01 27 21 50 05 040961 80000 00 2014 03 12 18 46 45 517968 79900 00 2014 09 05 20 54 17 991260 636
如何在使用 Flask for Python 3 的同时使用 Bootstrap 4？

我检查过发现默认安装时 Flask Bootstrap 原生使用 Bootstrap 3 3 7 但实际上我想通过使用 Flask Bootstrap 包在我的项目中使用 Bootstrap 4 任何有关如何更新它或类似内容的帮助将不胜感
在 R 中，为什么 sum 与其他方法（例如 cumsum）相比如此慢？

我正在尝试实现一个需要非常快的函数主要是因为它一遍又一遍地处理巨大的数据帧 R 总是让我感到困惑为什么它有时有点慢而有时又慢得离谱不幸的是它从来都不快不管怎样我一直认为如果可能的话当以某种方式推入 apply sapply
在基本 Tensorflow 2.0 中运行简单回归

我正在学习 Tensorflow 2 0 我认为在 Tensorflow 中实现最基本的简单线性回归是一个好主意不幸的是我遇到了几个问题我想知道这里是否有人可以提供帮助考虑以下设置 import tensorflow as tf 2
如何在 R 中解析堆叠多个 JSON 的文件？

我在 R 中有以下堆叠 JSON 对象 example1 json ID 12345 Timestamp 20140101 Usefulness Yes Code event1 A result 1 ID 1A35B Timestamp
PySpark DataFrame 上分组数据的 Pandas 式转换

如果我们有一个由一列类别和一列值组成的 Pandas 数据框我们可以通过执行以下操作来删除每个类别中的平均值 df DemeanedValues df groupby Category Values transform lambda g
如何在 R 中“推断”面板数据的值？

我有一个带有 NA 值的面板数据如下所示 uid year month day value 1 1 2016 8 1 NA 2 1 2016 8 2 NA 3 1 2016 8 3 30 4 1 2016 8 4 NA 5 1 2016
Python：如何“杀死”类实例/对象？

我希望 Roach 类在达到一定量的饥饿时死亡但我不知道如何删除该实例我的术语可能有误但我的意思是窗户上有大量蟑螂我希望特定的蟑螂完全消失我会向您展示代码但它很长我将蟑螂类添加到策划者类蟑螂种群列表中一般来说每个
我应该在哪里对对象和字段进行 django 验证？

我正在创建一个 Django 应用程序它使用 Django Rest Framework 和普通的 django views 作为用户的入口点我想对模型的独立字段以及整个对象进行验证例如字段根据正则表达式函数输入的车牌是否正确与
安装 gplots 时出错

我正在 OSX v 10 9 2 上运行 R v 3 0 3 当尝试使用以下命令在 R studio 中安装 gplots 包时出现错误 gt library gplots Error in library gplots there is
R：中断 for 循环

你能确认下一个break是否取消了内部for循环吗 for out in 1 n old id velho lt old table df id out for in in 1 n id novo lt new table df ID in
无法将 librosa 与 python 3 一起使用

我已经在 Windows 上的 ubuntu 子系统上使用 pip3 正确安装了 librosa 但是当我尝试执行像这样的简单程序时 import librosa data sr librosa load sound mp3 print d
基于 Web 请求在 Airflow 上运行作业

我想知道是否可以在通过 HTTP 收到请求时执行气流任务我对 Airflow 的调度部分不感兴趣我只是想用它来代替芹菜因此示例操作如下所示用户提交一份表格请求某些报告后端接收请求并向用户发送请求已收到的通知然后后端使用 Ai

随机推荐

Slim - 修改中间件内的 POST 请求正文

我在用Slim v3 https www slimframework com and justinrainbow 的 json 模式验证器 https github com justinrainbow json schema对于我的 API
Infinispan 初始状态传输超时

我正在为两个节点 server1 和 server2 设置复制的 infinispan 9 4 16 Final Wildfly 18 1 缓存并且遇到初始状态传输在启动时超时的问题仅当我升级应用程序时才会发生这种情况 ERROR 20
如何使用 jQuery 检查 HTML 元素是否为空？

我尝试仅在 HTML 元素为空时使用 jQuery 调用函数像这样的事情 if isEmpty element do something if element is empty do something 欲了解更多信息请参阅http a
我的 CORDIC 算法出了什么问题？

改编自 JavaCORDIC 的维基百科页面 http en wikipedia org wiki CORDIC class MathFunctions final static double angles 0 78539816339745
org.apache.http.NameValuePair 不再适用于compileSdkVersion 23

我有一个执行请求函数的帮助器类我正在使用的一种方法如下 private String buildQueryString String url List
如何使用 Laravels Blade 添加动态图像 src

我的问题很简单我在 laravel 中使用 Blade 来显示图像例如 img src 但如果我的图像是动态的例如 img src 我不能使用 img src 因为那时我将以 img src 如何在 Blade 调用中调用 varia
如何计算运动中的 UIScrollView 的目标 contentOffset

我使用 UIScrollView 作为使用核心动画的组件的基础当用户滑动视图时我想根据滚动视图的目标静止位置来定位元素为此我需要在scrollViewWillBeginDecelerating 方法或类似方法中计算UIScrol
手动实例化 ActiveRecord 模型及其关系？

如果我有从多个表返回记录的 T SQL 或存储过程可能使用 DBI 是否有办法手动实例化 ActiveRecord 模型及其关联显然我在这里追求的是数据库性能我希望能够构建自己的对象层次结构模型及其关系但是当我全部完成后我希望
我试图在 javascript 中列出数组的所有嵌套值，但只获取数组中每个值的第一个值

我是模板文字映射和 javascript 方面的新手我有一个数组我正在使用模板文字将 div 插入到 html 中我正在映射 4 张专辑的数组在数组中我有每个专辑的曲目列表我试图一次列出每张专辑的一个曲目列表当我运行代码时
varargs 何时开始与 no-arg 不冲突？

今天我发现以下代码编译并运行时没有任何警告 public class Try MultipleArguments2 public static void main String args myfunction myfunction 1 2
如果最后一个和下一个非 NA 值相同，则替换 NA 值

我试图根据前一个和最后一个 NA 值是否相同来填充缺失的数据例如这是虚拟数据集 df lt data frame ID c rep 1 6 rep 2 6 rep 3 6 rep 4 6 rep 5 6 rep 6 6 rep 7 6
更改表视图插入时 UITableView 中的节标题

我在我的 tableView 中实现了拉动刷新就像 iPhone 应用程序 Twitter 或 Facebook 一样我的 tableView 有带有头部视图的部分当tableView处于刷新模式时所以当我拉动tableVie
WaitAll 和 WhenAll 之间有什么区别？ [复制]

这个问题在这里已经有答案了我有这个代码 List
如何在不安装 Microsoft Office 的情况下用 C# 创建 Excel（.XLS 和 .XLSX）文件？

如何使用 C 创建 Excel 电子表格而不需要在运行代码的计算机上安装 Excel 您可以使用名为 ExcelLibrary 的库这是一个发布在 Google Code 上的免费开源库 Excel图书馆 https code goog
`:is()` 不适用于伪元素

下面 is https developer mozilla org en US docs Web CSS is用法不适用于伪元素有人可以解释吗
静态单元格上的复选标记 uitableview

我正在使用 UITableView 有 3 个部分静态单元格 Currency Language Social 它们有不同的行数货币有 3 行美元欧元日元语言有 2 行 EN JP 社交有 3 行 Twitter FB Line
为 HEAD 和 GET 动词预签名 Amazon S3 URL

我在 Amazon S3 上托管文件我想使用这些文件进行访问预签名网址 http docs aws amazon com AmazonS3 latest dev RESTAuthentication html RESTAuthentica
错误 C2440：“static_cast”：无法从“UINT (__thiscall CImportProjectDlg::*)(CPoint)”转换为“LRESULT (__thiscall CWnd::*)(CPoint)”

我正在将 VC 6 0 项目转换为 Visual Studio 2008 正在转换为 2014 年我遇到了上述错误这是我的代码片段 BEGIN MESSAGE MAP CImportProjectDlg CDialog AFX MSG
需要递增计时器，iPhone 编程

我是 iPhone 编程新手所以希望有人能帮助我我在网上搜索过但只能找到有关倒计时器的信息我想做的是在按下按钮时启动一个计数计时器然后在某个值下降时停止它比如 5 最后显示该时间一旦获得值我就可以在屏幕上显示它们但事实证明
Pandas：使用多个函数聚合多个列

Python 中的 Pandas 和 R 中的 Dplyr 都是灵活的数据整理工具例如在 R 中使用 dplyr 可以执行以下操作 custom func lt function col1 col2 length col1 lengt

Pandas：使用多个函数聚合多个列

Pandas：使用多个函数聚合多个列 的相关文章

随机推荐

热门标签

Pandas：使用多个函数聚合多个列的相关文章