使用 groupby 就地转换 pandas

2023-11-22

是否可以改变 DataFrameinplace with groupby陈述？

import pandas as pd
dt = pd.DataFrame({
                   "LETTER": ["a", "b", "c", "a", "b"],
                   "VALUE" : [10 , 12 , 13,  0,  15]
                   })
def __add_new_col(dt_):
    dt_['NEW_COL'] = dt_['VALUE'] - dt_['VALUE'].mean()
    return dt_
pass


dt.groupby("LETTER").apply(__add_new_col)
  LETTER  VALUE  NEW_COL
0      a     10      5.0
1      b     12     -1.5
2      c     13      0.0
3      a      0     -5.0
4      b     15      1.5


dt
  LETTER  VALUE
0      a     10
1      b     12
2      c     13
3      a      0
4      b     15

在 R data.table 中，可以使用:=运算符例如dt[, col := ... , by ='LETTER']

我想你可以使用transform返回Series相同的长度和相同的索引df加上减法：

print (dt.groupby("LETTER")['VALUE'].transform('mean'))
0     5.0
1    13.5
2    13.0
3     5.0
4    13.5
Name: VALUE, dtype: float64

dt['NEW_COL'] = dt['VALUE'] - dt.groupby("LETTER")['VALUE'].transform('mean')
print (dt)
  LETTER  VALUE  NEW_COL
0      a     10      5.0
1      b     12     -1.5
2      c     13      0.0
3      a      0     -5.0
4      b     15      1.5

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

inplace

使用 groupby 就地转换 pandas 的相关文章

opencv水印周围的轮廓

我想在图像中的水印周围画一个框我已经提取了水印并找到了轮廓但是不会在水印周围绘制轮廓轮廓是在我的整个图像上绘制的请帮我提供正确的代码轮廓坐标的输出为 array 0 0 0 634 450 634 450 0 dtype int
Python - 来自 .进口

我第一次尝试图书馆我注意到解决图书馆内导入问题的最简单方法是使用如下结构 from import x from some module import y 我觉得这件事有些糟糕也许只是因为我不记得经常看到它尽管公平地说我还没有深入研究
工作日重新订购 Pandas 系列

使用 Pandas 我提取了一个 CSV 文件然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来但当然它按照与该系列相同的排名顺序绘制
如何在 Python 中加密并在 Java 中解密？

我正在尝试在 Python 程序中加密一些数据并将其保存然后在 Java 程序中解密该数据在Python中我像这样加密它 from Crypto Cipher import AES KEY 1234567890123456789012
如何使用文本相似性删除 pandas 数据框中相似（不重复）的行？

我有数千个数据这些数据可能相似也可能不相似使用 python 的默认函数 drop duplicates 并没有真正的帮助因为它们只检测相似的数据例如如果我的数据包含类似以下内容怎么办嗨早上好嗨早上好 Python 不会将
Django send_mail SMTPSenderRefused 530 与 gmail

一段时间以来我一直在尝试使用 Django 从我正在开发的网站接收电子邮件现在我还没有部署它并且我正在使用Django开发服务器我不知道这是否会影响它这是我的 settings py 配置 EMAIL BACKEND djang
使用Python计算目录的大小？

在我重新发明这个特殊的轮子之前有没有人有一个很好的例程来使用 Python 计算目录的大小如果例程能够很好地以 Mb Gb 等格式格式化大小那就太好了这会遍历所有子目录总结文件大小 import os def get size s
SMTP_SSL SSLError: [SSL: UNKNOWN_PROTOCOL] 未知协议 (_ssl.c:590)

此问题与 smtplib 的 SMTP SSL 连接有关当与 SMTP 无 ssl 连接时它正在工作在 SMTP SSL 中尝试相同的主机和端口时出现错误该错误仅基于主机 gmail 设置也工作正常请检查下面的示例如果 Out
Matplotlib 中 x 轴标签的频率和旋转

我在下面编写了一个简单的脚本来使用 matplotlib 生成图形我想将 x tick 频率从每月增加到每周并轮换标签我不知道从哪里开始 x 轴频率我的旋转线产生错误 TypeError set xticks got an unexp
Jython 和 SAX 解析器：允许的实体不超过 64000 个？

我做了一个简单的测试xml saxJython 中的解析器在处理大型 XML 文件 800 MB 时遇到以下错误 Traceback most recent call last File src project xmltools py li
使用“默认”环境变量启动新的子进程

我正在编写一个构建脚本来解析依赖的共享库及其共享库等这些共享库在正常情况下是不存在的PATH环境变量为了使构建过程正常工作让编译器找到这些库 PATH已更改为包含这些库的目录构建过程是这样的加载器脚本更改 PATH gt 基于
在 keras 中保存和加载权重

我试图从我训练过的模型中保存和加载权重我用来保存模型的代码是 TensorBoard log dir output model fit generator image a b gen batch size steps per epoch
Mac OSX 10.6 上的 Python mysqldb 不工作

我正在使用 Python 2 7 并尝试让 Django 项目在 MySQL 后端运行我已经下载了 mysqldb 并按照此处的指南进行操作 http cd34 com blog programming python mysql pyth
Anaconda 无法导入 ssl 但 Python 可以

Anaconda 3 Jupyter笔记本无法导入ssl 但使用Atom终端导入ssl没有问题我尝试在 Jupyter 笔记本中导入 ssl 但出现以下错误 C ProgramData Anaconda3 lib ssl py in
动态过滤 pandas 数据框

我正在尝试使用三列的阈值来过滤 pandas 数据框 import pandas as pd df pd DataFrame A 6 2 10 5 3 B 2 5 3 2 6 C 5 2 1 8 2 df df loc df A gt 0
Python SSL X509：KEY_VALUES_MISMATCH

Python HTTPS server from http server import HTTPServer SimpleHTTPRequestHandler import ssl https stackoverflow com a 408
如何根据第一列创建新列，同时考虑Python Pandas中字母和列表的大小？ [复制]

这个问题在这里已经有答案了我在 Python Pandas 中有 DataFrame 如下所示 col1 John Simon prd agc Ann White BeN and Ann bad list Ben Wayne 我需要这样做
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此
查找总和为给定数字的值组合的函数

这个帖子查找提供的 Sum 值的组合 https stackoverflow com a 20194023 1561176呈现函数subsets with sum 它在数组中查找总和等于给定值的值的组合但由于这个帖子已经有6年多了我发这

随机推荐

如何在依赖作业正在构建时阻止 Jenkins 2.x Pipeline 作业

我的问题相当简单对于高级项目选项下的 Freestyle Jenkins 项目我可以选择两个配置选项以帮助防止不同项目之间的冲突例如当一个项目更新一组头文件而另一个项目包含这些头文件时可能会出现冲突上游项目构建时进行块构
使用 FQL 进行 Facebook 查询

获取时 https api facebook com method fql query query Select page id page url 名称图片网站类型位置 fan count 电话 from page where na
如何在 MVC 5 中使用 Visual Studio 2015 设置 angular-cli？

我正在寻找一些关于如何在 Visual Studio 2015 中设置和集成 angular cli webpack 的最佳实践和说明MVC 5 不是核心我意识到这里有一个类似的问题如何在 Visual Studio 2015 中使用
Java/DOM：获取节点的XML内容

我正在使用 W3C DOM 解析 Java 中的 XML 文件我陷入了一个特定的问题我不知道如何获取节点的整个内部 XML 该节点看起来像这样 td b this b is a b test b td 我必须使用什么函数才能得到它 b
HTTP 请求至少需要什么？

我正在尝试使用以下命令向本地服务器发出 GET 命令netcat通过执行以下操作 echo e GET HTTP 1 1 nHost localhost nc localhost 80 不幸的是我得到了一个HTTP 1 1 400 Bad
是否允许增加结束迭代器？

是否允许迭代器变量递增it那已经是在end i e auto it v end 一般情况下允许吗如果不是的话是不是不允许vector 如果是的话是 it maybe 幂等的 if it v end 我问因为我偶然发现了这样的代码 s
如何在networkx中找到图的所有连通子图？

我正在开发一个 python 应用程序我想列出所有可能的任何大小的连接子图并使用 NetworkX 从每个节点开始我只是尝试使用 itertools 库中的combinations 来查找所有可能的节点组合但它太慢了因为它还会搜索
DocumentDB REST API：从文档中提取的 PartitionKey 不匹配

我正在尝试使用 PHP 缺少官方 API 包装器通过 REST 将 JSON 文档插入到 DocumentDB 中现在分区键似乎已成为 DocumentDB 中任何集合的必需项但我找不到记录的 REST API 我收到以下错误返回
Django 路由 - 空路径与其中任何一个都不匹配

非常基本的问题我很惊讶我找不到答案我刚刚开始研究 django 并进行了开箱即用的安装创建了一个项目并创建了一个应用程序 urls py 的默认内容非常简单 urlpatterns path admin admin site urls
类型错误为空？

这是我经常看到的 Firebug 中的错误 TypeError gallery nav button is null Break On This Error gallery nav button addClass animated fade
Web应用程序使用窗口域帐户进行身份验证

如果您有一个将在网络内运行的 Web 应用程序那么它支持 Windows 身份验证活动目录是有意义的使用 AD 安全模型是否有意义或者我是否可以创建自己的角色安全模块某些管理员必须为每个用户进行配置我以前从未处理过 Wind
将哈希表导出为 CSV，并将键作为列标题

我有一个脚本来创建一个哈希表其中用户名作为键其组的数组作为值它看起来是这样的 Name Value user1 Domain Users group2 group3 user2 Domain Users group4 user3 Do
从 git 存储库中删除未引用的提交

我有这样的 git 提交历史记录 U A B C D E master 没有任何内容指向提交U 但我知道它的哈希值如何从我的存储库中完全删除此提交就好像它从未存在过一样我是唯一使用此存储库的人我尝试使用git rebase 但这可以
在意大利 App Store 上发布应用程序后，iAd 未在设备上显示

大家好我遇到了问题中所述的问题在意大利 iAd 网络可用但当我从 App Store 下载应用程序时 iAd 未显示在测试模拟器中它运行良好这是一款仅限 iPhone 的应用程序可能是什么问题我知道重复的问题在 App St
Ruby 将 XML 中的单引号转换为双引号

尽管可以使用单引号或双引号定义 XML 属性但我的用户正在尝试将我的软件与另一个不接受单引号属性值的软件集成我使用 REXML 来生成 XML REXML 有没有办法生成双引号属性值如果没有有什么办法可以轻松转换吗 Thanks 截
没有时间在窗口卸载时发送获取请求

我想在用户关闭浏览器窗口时通知服务器我尝试了所有的 window bind beforeunload function get contextPath notify direction logout and window unload f
如何向 d3 图中的边添加标签

请参见http bl ocks org rkirsling 5001347 它显示了一些节点以及它们之间的边你能告诉我要在其中添加什么代码以及在哪里添加以便边缘有标签吗您可以假定标签的任何合适位置也可以假定任何标签文本谢谢您可以像
Android：处理多个屏幕的图像大小

我发现用 Android 处理图像真的很难我认为这是 Android 开发中最难的部分 1 我有一个图像我希望它作为我的应用程序的背景所以我这样做
路由模型绑定可以与 RESTful 控制器一起使用吗？

我一直在使用RESTful 控制器在我的 Laravel 项目中通过包括 Route controller things ThingController 在我的routes php中我可以在中定义函数ThingController li
使用 groupby 就地转换 pandas

是否可以改变 DataFrameinplace with groupby陈述 import pandas as pd dt pd DataFrame LETTER a b c a b VALUE 10 12 13 0 15 def add

使用 groupby 就地转换 pandas

使用 groupby 就地转换 pandas 的相关文章

随机推荐

热门标签