使用 groupby 就地转换 pandas

2023-11-22

是否可以改变 DataFrameinplace with groupby陈述?

import pandas as pd
dt = pd.DataFrame({
                   "LETTER": ["a", "b", "c", "a", "b"],
                   "VALUE" : [10 , 12 , 13,  0,  15]
                   })
def __add_new_col(dt_):
    dt_['NEW_COL'] = dt_['VALUE'] - dt_['VALUE'].mean()
    return dt_
pass


dt.groupby("LETTER").apply(__add_new_col)
  LETTER  VALUE  NEW_COL
0      a     10      5.0
1      b     12     -1.5
2      c     13      0.0
3      a      0     -5.0
4      b     15      1.5


dt
  LETTER  VALUE
0      a     10
1      b     12
2      c     13
3      a      0
4      b     15

在 R data.table 中,可以使用:=运算符例如dt[, col := ... , by ='LETTER']


我想你可以使用transform返回Series相同的长度和相同的索引df加上减法:

print (dt.groupby("LETTER")['VALUE'].transform('mean'))
0     5.0
1    13.5
2    13.0
3     5.0
4    13.5
Name: VALUE, dtype: float64

dt['NEW_COL'] = dt['VALUE'] - dt.groupby("LETTER")['VALUE'].transform('mean')
print (dt)
  LETTER  VALUE  NEW_COL
0      a     10      5.0
1      b     12     -1.5
2      c     13      0.0
3      a      0     -5.0
4      b     15      1.5
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 groupby 就地转换 pandas 的相关文章

  • opencv水印周围的轮廓

    我想在图像中的水印周围画一个框 我已经提取了水印并找到了轮廓 但是 不会在水印周围绘制轮廓 轮廓是在我的整个图像上绘制的 请帮我提供正确的代码 轮廓坐标的输出为 array 0 0 0 634 450 634 450 0 dtype int
  • Python - 来自 .进口

    我第一次尝试图书馆 我注意到解决图书馆内导入问题的最简单方法是使用如下结构 from import x from some module import y 我觉得这件事有些 糟糕 也许只是因为我不记得经常看到它 尽管公平地说我还没有深入研究
  • 工作日重新订购 Pandas 系列

    使用 Pandas 我提取了一个 CSV 文件 然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来 但当然它按照与该系列相同的排名顺序绘制
  • 如何在 Python 中加密并在 Java 中解密?

    我正在尝试在 Python 程序中加密一些数据并将其保存 然后在 Java 程序中解密该数据 在Python中 我像这样加密它 from Crypto Cipher import AES KEY 1234567890123456789012
  • 如何使用文本相似性删除 pandas 数据框中相似(不重复)的行?

    我有数千个数据 这些数据可能相似也可能不相似 使用 python 的默认函数 drop duplicates 并没有真正的帮助 因为它们只检测相似的数据 例如 如果我的数据包含类似以下内容怎么办 嗨 早上好 嗨 早上好 Python 不会将
  • Django send_mail SMTPSenderRefused 530 与 gmail

    一段时间以来 我一直在尝试使用 Django 从我正在开发的网站接收电子邮件 现在 我还没有部署它 并且我正在使用Django开发服务器 我不知道这是否会影响它 这是我的 settings py 配置 EMAIL BACKEND djang
  • 使用Python计算目录的大小?

    在我重新发明这个特殊的轮子之前 有没有人有一个很好的例程来使用 Python 计算目录的大小 如果例程能够很好地以 Mb Gb 等格式格式化大小 那就太好了 这会遍历所有子目录 总结文件大小 import os def get size s
  • SMTP_SSL SSLError: [SSL: UNKNOWN_PROTOCOL] 未知协议 (_ssl.c:590)

    此问题与 smtplib 的 SMTP SSL 连接有关 当与 SMTP 无 ssl 连接时 它正在工作 在 SMTP SSL 中尝试相同的主机和端口时 出现错误 该错误仅基于主机 gmail 设置也工作正常 请检查下面的示例 如果 Out
  • Matplotlib 中 x 轴标签的频率和旋转

    我在下面编写了一个简单的脚本来使用 matplotlib 生成图形 我想将 x tick 频率从每月增加到每周并轮换标签 我不知道从哪里开始 x 轴频率 我的旋转线产生错误 TypeError set xticks got an unexp
  • Jython 和 SAX 解析器:允许的实体不超过 64000 个?

    我做了一个简单的测试xml saxJython 中的解析器在处理大型 XML 文件 800 MB 时遇到以下错误 Traceback most recent call last File src project xmltools py li
  • 使用“默认”环境变量启动新的子进程

    我正在编写一个构建脚本来解析依赖的共享库 及其共享库等 这些共享库在正常情况下是不存在的PATH环境变量 为了使构建过程正常工作 让编译器找到这些库 PATH已更改为包含这些库的目录 构建过程是这样的 加载器脚本 更改 PATH gt 基于
  • 在 keras 中保存和加载权重

    我试图从我训练过的模型中保存和加载权重 我用来保存模型的代码是 TensorBoard log dir output model fit generator image a b gen batch size steps per epoch
  • Mac OSX 10.6 上的 Python mysqldb 不工作

    我正在使用 Python 2 7 并尝试让 Django 项目在 MySQL 后端运行 我已经下载了 mysqldb 并按照此处的指南进行操作 http cd34 com blog programming python mysql pyth
  • Anaconda 无法导入 ssl 但 Python 可以

    Anaconda 3 Jupyter笔记本无法导入ssl 但使用Atom终端导入ssl没有问题 我尝试在 Jupyter 笔记本中导入 ssl 但出现以下错误 C ProgramData Anaconda3 lib ssl py in
  • 动态过滤 pandas 数据框

    我正在尝试使用三列的阈值来过滤 pandas 数据框 import pandas as pd df pd DataFrame A 6 2 10 5 3 B 2 5 3 2 6 C 5 2 1 8 2 df df loc df A gt 0
  • Python SSL X509:KEY_VALUES_MISMATCH

    Python HTTPS server from http server import HTTPServer SimpleHTTPRequestHandler import ssl https stackoverflow com a 408
  • 如何根据第一列创建新列,同时考虑Python Pandas中字母和列表的大小? [复制]

    这个问题在这里已经有答案了 我在 Python Pandas 中有 DataFrame 如下所示 col1 John Simon prd agc Ann White BeN and Ann bad list Ben Wayne 我需要这样做
  • 从 pandas DataFrame 中删除少于 K 个连续 NaN

    我正在处理时间序列数据 我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题 我尝试查看一些链接 例如 标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que
  • 将上下文管理器的动态可迭代链接到单个 with 语句

    我有一堆想要链接的上下文管理器 第一眼看上去 contextlib nested看起来是一个合适的解决方案 但是 此方法在文档中被标记为已弃用 该文档还指出最新的with声明直接允许这样做 自 2 7 版起已弃用 with 语句现在支持此
  • 查找总和为给定数字的值组合的函数

    这个帖子查找提供的 Sum 值的组合 https stackoverflow com a 20194023 1561176呈现函数subsets with sum 它在数组中查找总和等于给定值的值的组合 但由于这个帖子已经有6年多了 我发这

随机推荐

  • 如何在依赖作业正在构建时阻止 Jenkins 2.x Pipeline 作业

    我的问题相当简单 对于 高级项目选项 下的 Freestyle Jenkins 项目 我可以选择两个配置选项 以帮助防止不同项目之间的冲突 例如 当一个项目更新一组头文件 而另一个项目包含这些头文件时 可能会出现冲突 上游项目构建时进行块构
  • 使用 FQL 进行 Facebook 查询

    获取时 https api facebook com method fql query query Select page id page url 名称 图片 网站 类型 位置 fan count 电话 from page where na
  • 如何在 MVC 5 中使用 Visual Studio 2015 设置 angular-cli?

    我正在寻找一些关于如何在 Visual Studio 2015 中设置和集成 angular cli webpack 的最佳实践和说明MVC 5 不是核心 我意识到这里有一个类似的问题 如何在 Visual Studio 2015 中使用
  • Java/DOM:获取节点的XML内容

    我正在使用 W3C DOM 解析 Java 中的 XML 文件 我陷入了一个特定的问题 我不知道如何获取节点的整个内部 XML 该节点看起来像这样 td b this b is a b test b td 我必须使用什么函数才能得到它 b
  • HTTP 请求至少需要什么?

    我正在尝试使用以下命令向本地服务器发出 GET 命令netcat通过执行以下操作 echo e GET HTTP 1 1 nHost localhost nc localhost 80 不幸的是 我得到了一个HTTP 1 1 400 Bad
  • 是否允许增加结束迭代器?

    是否允许迭代器变量递增it那已经是在end i e auto it v end 一般情况下允许吗 如果不是的话 是不是不允许vector 如果是的话 是 it maybe 幂等的 if it v end 我问 因为我偶然发现了这样的代码 s
  • 如何在networkx中找到图的所有连通子图?

    我正在开发一个 python 应用程序 我想列出所有可能的任何大小的连接子图 并使用 NetworkX 从每个节点开始 我只是尝试使用 itertools 库中的combinations 来查找所有可能的节点组合 但它太慢了 因为它还会搜索
  • DocumentDB REST API:从文档中提取的 PartitionKey 不匹配

    我正在尝试使用 PHP 缺少官方 API 包装器 通过 REST 将 JSON 文档插入到 DocumentDB 中 现在 分区键似乎已成为 DocumentDB 中任何集合的必需项 但我找不到记录的 REST API 我收到以下错误返回
  • Django 路由 - 空路径与其中任何一个都不匹配

    非常基本的问题 我很惊讶我找不到答案 我刚刚开始研究 django 并进行了开箱即用的安装 创建了一个项目并创建了一个应用程序 urls py 的默认内容非常简单 urlpatterns path admin admin site urls
  • 类型错误为空?

    这是我经常看到的 Firebug 中的错误 TypeError gallery nav button is null Break On This Error gallery nav button addClass animated fade
  • Web应用程序使用窗口域帐户进行身份验证

    如果您有一个将在网络内运行的 Web 应用程序 那么它支持 Windows 身份验证 活动目录 是有意义的 使用 AD 安全模型是否有意义 或者我是否可以创建自己的角色 安全模块 某些管理员必须为每个用户进行配置 我以前从未处理过 Wind
  • 将哈希表导出为 CSV,并将键作为列标题

    我有一个脚本来创建一个哈希表 其中用户名作为键 其组的数组作为值 它看起来是这样的 Name Value user1 Domain Users group2 group3 user2 Domain Users group4 user3 Do
  • 从 git 存储库中删除未引用的提交

    我有这样的 git 提交历史记录 U A B C D E master 没有任何内容指向提交U 但我知道它的哈希值 如何从我的存储库中完全删除此提交 就好像它从未存在过一样 我是唯一使用此存储库的人 我尝试使用git rebase 但这可以
  • 在意大利 App Store 上发布应用程序后,iAd 未在设备上显示

    大家好 我遇到了问题中所述的问题 在意大利 iAd 网络可用 但当我从 App Store 下载应用程序时 iAd 未显示 在测试模拟器中它运行良好 这是一款仅限 iPhone 的应用程序 可能是什么问题 我知道重复的问题 在 App St
  • Ruby 将 XML 中的单引号转换为双引号

    尽管可以使用单引号或双引号定义 XML 属性 但我的用户正在尝试将我的软件与另一个不接受单引号属性值的软件集成 我使用 REXML 来生成 XML REXML 有没有办法生成双引号属性值 如果没有 有什么办法可以轻松转换吗 Thanks 截
  • 没有时间在窗口卸载时发送获取请求

    我想在用户关闭浏览器窗口时通知服务器 我尝试了所有的 window bind beforeunload function get contextPath notify direction logout and window unload f
  • 如何向 d3 图中的边添加标签

    请参见http bl ocks org rkirsling 5001347 它显示了一些节点以及它们之间的边 你能告诉我要在其中添加什么代码以及在哪里添加以便边缘有标签吗 您可以假定标签的任何合适位置 也可以假定任何标签文本 谢谢 您可以像
  • Android:处理多个屏幕的图像大小

    我发现用 Android 处理图像真的很难 我认为这是 Android 开发中最难的部分 1 我有一个图像 我希望它作为我的应用程序的背景 所以我这样做
  • 路由模型绑定可以与 RESTful 控制器一起使用吗?

    我一直在使用RESTful 控制器在我的 Laravel 项目中 通过包括 Route controller things ThingController 在我的routes php中 我可以在中定义函数ThingController li
  • 使用 groupby 就地转换 pandas

    是否可以改变 DataFrameinplace with groupby陈述 import pandas as pd dt pd DataFrame LETTER a b c a b VALUE 10 12 13 0 15 def add