将分组 zscore 列添加到 pandas 数据框中

2023-11-25

我可以将一列插入到数据框中，对另一列进行 z 评分，如下所示：

[1] df.insert(<loc>, column='ZofA', value=(df['A']-df['A'].mean())/df['A'].std())

我可以对由另外 2 列分组的列进行简单的缩减，如下所示：

[2] df.groupby(['C1', 'C2'])['A'].mean()

我尝试用 [1] 中的 zscore 函数替换 [2] 中的简单的mean()函数，但不知道如何做到这一点，包括使用 .apply ——例如这失败了：

[3] df.groupby(['C1', 'C2']).apply((df['A']-df['A'].mean())/df['A'].std())

所以我的第一个问题是我显然不知道如何创建带有分组的 zscore 列。

我的第二个问题是我想结合（1）将新列插入到数据框（“ZofA”）中，该数据框保存来自另一列（“A”）的z分数，与（2）在定义的组内计算这些z分数由另外两列（'C1'，'C2'）。 (3) 我想在一个 df.insert() 语句中完成所有这些操作。我是否只是搞乱了我的括号和方括号之类的东西，或者我是否试图在一个声明中做太多事情？谢谢！

感谢您指向文档的指针。对于任何好奇的人，我想我会发布解决方案。首先，将 zscore 计算放入 lambda 中：

zscore = lambda x: (x - x.mean()) / x.std()

神奇的成分是.transform。只需要这样写插入语句：

df.insert(<loc>, 'ZofA', df.groupby(['C1', 'C2'])['A'].transform(zscore))

解决方案确实在“Group By: split-apply-combine”文档中。您只需向下滚动大约一半到“转换”部分。我忽略了有关日期键的内容，只是将分组列直接插入到 groupby 语句中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python27

pandas

DataFrame

将分组 zscore 列添加到 pandas 数据框中的相关文章

使用 Pandas 解析时避免 Excel 的科学记数法舍入

我有一个自动生成的 Excel 文件其中偶尔包含非常大的数字例如135061808695 在 Excel 文件中当您单击单元格时它会显示完整的数字135061808695然而在视觉上使用自动常规格式数字显示为1 35063
NoneType 类型的对象没有 len

def medianeven L while len L gt 2 L L 1 len L 1 return average L def medianodd L while len L gt 1 L L 1 len L 1 return L
scrapy蜘蛛如何将值返回给另一个蜘蛛

我正在爬行的网站包含许多玩家当我点击任何玩家时我都可以进入他的页面网站结构是这样的
将 pandas DataFrame 写入 unicode 中的 JSON

我正在尝试将包含 unicode 的 pandas DataFrame 写入 json 但是内置的 to json函数对字符进行转义我该如何解决 Example import pandas as pd df pd DataFrame a
使用 scipy.io 将 python pandas dataframe 转换为 matlab 结构

我正在尝试使用 scipy io 将 pandas 数据帧保存到 matlab mat 文件我有以下内容 array1 np array 1 2 3 array2 np array a b c array3 np array 1 01 2
识别左侧由 delta 链接的簇，右侧由不同 delta 链接的簇

考虑排序后的数组a a np array 0 2 3 4 5 10 11 11 14 19 20 20 如果我指定了左增量和右增量 delta left delta right 1 1 这就是我期望的集群分配方式 a 0 2 3 4 5 1
Pandas - 过滤器和正则表达式搜索 DataFrame 的索引

我有一个 DataFrame 其中列是 MultiIndex 索引是名称列表即index Andrew Bob Calvin 我想创建一个函数来返回数据帧中使用名称 Bob 或以字母 A 开头或以小写字母开头的所有行如何才能做到这一点
xts 函数不将我的 POSIXct 日期视为适当的基于时间的对象

我创建了一个包含两列的数据框 gt head data frame Date Rainfall 1 1992 01 06 14 00 00 0 3 2 1992 01 06 15 00 00 0 2 3 1992 01 06 16 00 0
sapply 函数从命名向量中的值填充数据帧的列，需要很长时间。有更快的方法吗？

这是我正在做的一个例子 x lt c a 2 b 4 c 2 d 9 df lt data frame names c d c a b x是一个命名向量其值的顺序与它们在中出现的顺序不同df names 我需要在数据框中形成一个新列该列
Theano导入错误

我正在尝试在 CPU 机器上安装 Theano 运行 intel HD 显卡没有 NVIDIA 在 python 中测试时出现以下导入错误 WARNING theano configdefaults g not detected Thea
ModuleNotFoundError：没有名为“pandas.io.formats.csvs”的模块

我正在尝试创建一个简单的 csv dataframe to csv psv file name encoding utf 8 header True sep doublequote True quoting csv QUOTE ALL in
如何在javascript中解压二进制文件？

我正在尝试将一些现有代码从 python 移植到 javascript 并且不确定如何处理以下行 var1 var2 struct unpack
MAMP Python-MySQLdb 问题：调用 Python 文件后 libssl.1.0.0.dylib 的路径发生变化

我正在尝试使用 python MySQLdb 访问 MAMP 服务器上的 MySQL 数据库当我最初尝试使用 python sql 调用 Python 文件来访问 MAMP 上的数据库时我得到了image not found关于错误li
在循环中动态添加方法时的范围问题

我有一个 API 用于分析我的锻炼数据我抓取的数据跑卫 http runkeeper com 的网站我的主类是一个子类pandas DataFrame 它基本上是表格数据的容器它支持按列名索引返回列值的数组我想根据数据中存在的
标记 pandas 系列中连续的 True 元素组

我有一系列的 pandas 布尔值我想标记连续的 True 值组怎么可能做到这一点是否可以以矢量化的方式做到这一点任何帮助将不胜感激 Data A 0 False 1 True 2 True 3 True 4 False 5 Fal
pandas df.to_parquet 写入多个较小的文件

是否可以使用 Pandas 的DataFrame to parquet将写入拆分为多个大约所需大小的文件的功能我有一个非常大的 DataFrame 100M x 100 并且正在使用df to parquet data snappy en
为什么我无法从多处理队列中捕获 Queue.Empty 异常？

我试图捕获 multiprocessing Queue 为空时引发的 Queue Empty 异常以下不起作用 import multiprocessing f multiprocessing Queue try f get True 0
读取大文件并制作字典

我有一个大文件我需要读取它并从中制作字典我希望这一切能够尽可能快然而我的Python代码太慢了这是一个显示问题的最小示例首先制作一些假数据 paste lt seq 20000000 lt seq 2 20000001 gt la
获取每行最后 150 行中所有正值的计数 - pandas

我有以下数据集其中有列Date and Values对于每一行它两者都有 ve and ve价值观我必须计算最后 150 行的所有正值在每一行因此前 150 行将具有空值然后以下行将具有最后 150 行的计数 ve行类似地
df.style.apply 在显示中居中显示多索引值

当我跑步时 import pandas as pd from IPython display import display df pd DataFrame a index pd MultiIndex from product 0 1 3 c

随机推荐

PySpark 根据名称将列表分解为多列

您好我正在处理一种稍微困难的文件格式我正在尝试清理该格式以供将来处理我一直在使用 Pyspark 将数据处理成数据帧该文件看起来类似于 AA 1234 ZXYW BB A 890 CC B 321 AA 1234 LMNO BB D
将文件夹从主包复制到 iPhone 中的文档目录

我有一个应用程序其中我的主包中有一个名为 Images 的文件夹在此文件夹中还有另一个名为 Images1 的文件夹其中包含一些图像当我的应用程序启动时我想要文档目录中的文件夹图像我想从文件夹 Images1 中获取图像但我
弦乐实习

在下面的代码中我正在检查对象引用的相等性 string x Some Text string y Some Other Text string z Some Text Console WriteLine object ReferenceE
转换为 ARC - LLVM 编译器 3.0 错误

我打开了我的一个旧项目并选择Convert to Objective C ARC从编辑重构菜单我收到以下错误 Apple LLVM compiler 3 0 Error Error in format of file Users myU
XPath：从子节点获取父节点

我需要获取子节点的父节点title 50 目前我只使用 title 50 我怎样才能得到它的父母结果应该是store node
如何使用 Webpack 和 Angular2 包含外部 css 文件？

我正在尝试使用 Webpack 添加对 Angular2 中 CSS 文件的外部引用我的CSS定义为 test css loader style loader css loader 在我的 webpack config js 文件中在打
Ruby：将转义字符串写入 YAML

下列 require yaml test I m a b d string File open test yaml w do out out write test to yaml end 输出 this is a b d string 我怎
Lucene.Net 写/读同步

我可以写与IndexWriter 在打开阅读时将新文档放入索引使用IndexReader 或者我必须在写作之前关闭阅读我可以阅读搜索文档吗使用IndexReader 在索引中当它打开用于写入时与IndexWriter 或者我必
扭曲应用程序的 Web 界面

我有一个用 Twisted 编写的应用程序我想添加一个 Web 界面来控制和监视它我需要大量的动态页面来显示当前状态和配置因此我希望有一个框架至少提供一种具有继承和一些基本路由的模板语言因为我正在使用 Twisted 无论如何我想使
Firebase 更改显示在谷歌登录警报上的应用程序名称？

我有一个 firebase 项目但不知何故我输错了应用程序名称有没有办法更改谷歌登录警报上显示的应用程序名称您应该更改项目中的产品名称
如何在 ASP.NET Core 中的自定义 TagHelper 中渲染 Razor 模板？

我正在创建一个自定义 HTML 标记帮助程序 public class CustomTagHelper TagHelper HtmlAttributeName asp for public ModelExpression DataModel
如何删除名称以“-”开头的文件[重复]

这个问题在这里已经有答案了在脚本中出现错误后我最终得到了一个名称以破折号开头的文件 myfile txt 到目前为止我尝试过 rm myfile txt rm illegal option m usage rm f i dPRrvW f
使用 this-> 访问成员是否有任何开销？

当访问某个类的成员时我可以使用例如 this gt myVar 10 或者我可以写 myVar 10 我喜欢用this gt 因为它显式声明该变量是此类的成员但是与仅使用变量名本身相比它是否会导致任何开销作为替代方案我可以向变量添
从 data.frame 或 data.table 构建方形邻接矩阵

我正在尝试建立一个方形邻接matrix from a data table 这是我已经拥有的可重现的示例 require data table require plyr require reshape2 Build a mock data
Locale.ITALY 和 Locale.ITALIAN 有什么不同

和有什么区别Locale国家和语言例如Locale ITALY and Locale ITALIAN 我在哪里可以找到其他语言环境的所有这些差异我应该什么时候使用每一个是否可以开发我们所需的语言环境如何 Locale ITALIAN
Laravel 4 Illuminate \ Database \ Eloquent \ MassAssignmentException 错误

嘿我已经在那里搜索了很多答案但无法解决这个问题这是我的迁移代码
在 ASP.NET c# 中查找日期 10 月的最后一个星期日

嗨有没有办法找出 ASP NET C 中十月最后一个星期日的日期我正在使用 net 2 0 不需要为此运行循环 private static DateTime GetLastWeekdayOfMonth DateTime date Da
在 .NET 中创建和部署 ActiveX 控件

由于显然没有可以接受位图粘贴的 Flash 控件我想考虑自己写一个但我不想使用 Flash 所以我考虑使用 NET 现在我相信可以在浏览器中下载并运行的本机代码控件的正确术语是 ActiveX 控件所以我的问题是我可以用 NET 创
FBSDK 空登录视图

自从升级到最新的 Xcode 后我在尝试通过 FBSDK 登录时遇到了一些问题FBSDKLoginManager Safari 中的登录窗口会弹出但它保持白色空视图没有导航项或内容控制台返回以下内容 ViewService 无法获
将分组 zscore 列添加到 pandas 数据框中

我可以将一列插入到数据框中对另一列进行 z 评分如下所示 1 df insert

将分组 zscore 列添加到 pandas 数据框中

将分组 zscore 列添加到 pandas 数据框中 的相关文章

随机推荐

热门标签

将分组 zscore 列添加到 pandas 数据框中的相关文章