为什么在 Pandas 中使用 apply 时会出现额外的索引

2024-04-23

当我使用apply对于 Pandas 中的用户定义函数，看起来 python 正在创建一个附加数组。我怎样才能摆脱它呢？这是我的代码：

def fnc(group):
    x = group.C.values
    out = x[np.where(x < 0)]
    return pd.DataFrame(out)

data = pd.DataFrame({'A':np.random.randint(1, 3, 10),
                     'B':3,
                     'C':np.random.normal(0, 1, 10)})

data.groupby(by=['A', 'B']).apply(fnc).reset_index()

有这个奇怪的Level_2索引已创建。有没有办法避免在运行我的函数时创建它？

    A   B   level_2   0
0   1   3   0        -1.054134802
1   1   3   1        -0.691996447
2   2   3   0        -1.068693768
3   2   3   1        -0.080342046
4   2   3   2        -0.181869799

因此，你将无法避免 level_2 的出现。这是因为分组的结果是一个包含多个项目的数据帧：pandas 足够酷，可以理解您的愿望是跨分组的键广播这些项目，但它会将数据帧的索引作为附加级别来保证一致的输出数据。因此，预计在处理结束时明确删除 level=-1 。

如果您想避免重置额外的索引，但仍然需要进行一些后期处理，另一种方法是调用transform而不是apply，并从fnc是你放置的整个组向量np.nan要排除的结果。然后，您的数据框将不会有额外的级别，但您需要调用dropna()然后。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么在 Pandas 中使用 apply 时会出现额外的索引的相关文章

TensorFlow：带有轴选项的 bincount

在 TensorFlow 中我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
Pandas dataframe：每批行的操作

我有一个熊猫数据框df我想计算每批行的一些统计信息例如假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框我怎样才能做这样的事情呢这是我想要的一个例子 prin
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
更改 x 轴比例

我使用 Matlab 创建了这个图使用 matplotlib x 轴绘制大数字例如 100000 200000 300000 我想要 1 2 3 和 10 5 之类的值来指示它实际上是 100000 200000 300000 有没有一
如何使用正则表达式在 pandas 数据框中选择一行以及包含特定子字符串的行后面的固定行数

Problem 我有一个 pandas 数据框我试图从中提取特定行我感兴趣的行是包含日期的行以及紧随日期行之后的行重要的是我想将信息从日期后面的行移动到包含日期的行中的新列通过这样做我将在同一行上获得一个人的信息需要明确
揭秘sharedctypes性能

在 python 中可以在多个进程之间共享 ctypes 对象然而我注意到分配这些对象似乎非常昂贵考虑以下代码 from multiprocessing import sharedctypes as sct import ctypes
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
Python：我不明白 sum() 的完整用法

当然我明白你使用 sum 与几个数字然后它总结所有但我正在查看它的文档我发现了这一点 sum iterable start 第二个参数 start 的作用是什么这太尴尬了但我似乎无法通过谷歌找到任何示例并且对于尝试学习该语言的
Werkzeug 中的线程和本地代理。用法

首先我想确保我正确理解了功能的分配分配本地代理功能以通过线程内的模块包共享变量对象我对吗其次用法对我来说仍然不清楚也许是因为我误解了作业我用烧瓶如果我有两个或更多模块 A B 我想将对象C从模块A导入到模块B 但我
使用 NLP 进行地址分割

我目前正在开发一个项目该项目应识别地址的每个部分例如来自 str Jack London 121 Corvallis ARAD ap 1603 973130 输出应如下所示 street name Jack London no 121
Flask 应用程序的测试覆盖率不起作用

您好想在终端的 Flask 应用程序中测试删除路由我可以看到测试已经过去它说 test user delete test app LayoutTestCase ok 但是当我打开封面时它仍然是红色的这意味着没有覆盖它请有人向我
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
Python对象初始化性能

我只是做了一些快速的性能测试我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍这些可能是错误的术语我不确定这里的行话例如 gt gt gt import timeit gt gt gt print timeit timeit
字符串列表，获取n个元素的公共子串，Python

我的问题可能类似于this https stackoverflow com questions 37514193 count the number of occurrences of n length not given string in
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
如何使用Python保存“完整的网页”而不仅仅是基本的html

我正在使用以下代码来使用 Python 保存网页 import urllib import sys from bs4 import BeautifulSoup url http www vodafone de privat tarife r
python 中的 after() 与 update()

我是 python 新手开始使用 tkinter 作为画布到目前为止我使用 update 来更新我的画布但还有一个 after 方法谁能给我解释一下这个函数请举个例子两者之间有什么区别 root after integer c

随机推荐

AWS IAM——使用条件

我是 AWS 中的 IAM 新手而且我希望将各种用户的查询限制为仅主键与 cognito id 匹配的表条目为了实现这一目标我制定了政策 Version 2012 10 17 Statement Sid AllowAccessToO
“流不包含有效的 UTF-8”是什么意思？

我正在创建一个简单的 HTTP 服务器我需要读取请求的图像并将其发送到浏览器我正在使用这段代码 fn read file mut file name String gt String file name file name replac
这个使用的简单 C++ 程序正确吗？

这段代码似乎在 gcc 和 clang 的 ubuntu 可信版本中工作正常并且通过 mingw 在 VM 上的 Win 7 中工作正常最近我升级到 Wily 并使用 clang 构建的版本始终崩溃 include
使用 bootstrap 更改表标题颜色

我有一个使用引导程序的 MVC5 应用程序表列名称为黑色在白色背景上我想将其更改为蓝色背景和列名字将是白色的我该怎么做我尝试使用 CSS 类但没有成功
安装 rpy2 时 Visual Studio cl.exe 错误

我在 Django 中安装 rpy2 并收到以下错误 C Program Files x86 Microsoft Visual Studio 2017 Enterprise VC Tools MSVC 14 15 26726 bin Hos
Django 是否有立即 http 响应的异常？

Django Tastypie 有ImmediateHttpResponse允许立即向客户端返回响应的异常 raise ImmediateHttpResponse response a message 姜戈有Http404 https do
如何读取长度未知的输入字符串？

如果我不知道这个词有多长我就无法写char m 6 这个词的长度可能有十到二十长我该如何使用scanf从键盘获取输入 include
Postgres 物化路径 - 使用 ltree 有什么好处？

物化路径是一种在 SQL 中表示层次结构的方法每个节点包含路径本身及其所有祖先 grandparent parent self The django treebeard实施MP docs https django treebeard re
如何在 angularjs 单元测试中触发 keyup/keydown 事件？

我想对模拟占位符的指令进行单元测试其中输入值仅在 keyup down 事件上清除您需要以编程方式创建一个事件并触发它为此使用 jQuery 进行单元测试是非常有用的例如您可以编写一个像这样的简单实用程序 var trigger
Drive Rest API V3 中的断点续传上传

我正在尝试使用 Android 中的 Drive Rest API 创建可恢复上传会话根据文档需要遵循的 3 个步骤是启动可恢复会话保存可恢复会话 URI 上传文件第 1 步我使用以下代码来启动可恢复会话 File body n
如何获取十六进制02的STX字符

我有一个设备试图通过套接字连接根据手册我需要十六进制 02 的 STX 字符我如何使用 C 来做到这一点只是对 GeoffM 的答案的评论我没有足够的观点来以正确的方式发表评论您绝对不应该仅使用两位数字来嵌入 STX 或其他字
windows 7下如何强制删除硬盘上的文件

我有一个硬盘但里面有一个坏文件当我想删除文件时窗口说您指定的文件名无效或太长指定不同的文件名但文件没有重命名我该怎么办当正在运行的进程拥有资源句柄时您无法修改该资源解决方案是结束所有拥有您的资源句柄的进程如下所示 1
Ant Design Collapse - 关闭按钮

我是 Ant Design 的初学者在使用 Ant Design 库中的 Collapse 和 Form 时遇到了这个问题我已经设置了我的页面其中添加新项目的表单位于折叠中并且折叠下方有一个项目列表
在ios中使用Google Plus进行图像共享

我想在 google plus 上分享图片我使用过 google api AppDelegate m GPPSignIn sharedInstance clientID MyClientID GPPDeepLink setDelegate
重命名access vba中的字段

我需要重命名 VBA 访问代码中的字段名称以实现自动化以便运行得更快我正在使用一个按钮来移动一些数据因此需要更改列名称来清理数据我正在使用表格但我需要更改的表格根本没有链接到表格我尝试使用一些 VBA 代码但不断收到变量未定义
需要在Windows Phone 7屏幕上显示大量文字

我想要在屏幕上显示大约 800 KB 的文本有人可以让我知道这个问题的可能解决方案吗由于文本块的 2048X2048 限制我已经尝试将文本拆分为多个文本块并且也尝试过http blogs msdn com b priozersk a
在 FFI 中使用 ptr::NonNull 是否有效？

铁锈具有ptr NonNull https doc rust lang org beta std ptr struct NonNull html代表非的类型NULL指针在 FFI 中使用这种类型安全吗是否保证具有相同的二进制表示形式忽
捕获文件似乎在数据包中间被缩短 - 如何防止此错误？

在我的应用程序中我打开 Tshark 进程并开始捕获当我想完成捕获时我会终止 Tshark 进程因此有时捕获文件已损坏当我尝试打开此文件时我收到错误捕获文件似乎在数据包中间被剪短如何防止此错误有没有更好的方法来关闭 Tshar
来自 .meta .info .data 的 Tensorflow 冻结推理图并组合冻结推理图

我是张量流新手目前正在努力解决一些问题如何在没有管道配置的情况下从 meta data info 获取冻结推理图我想实时检查预先训练的交通标志检测模型模型包含 3 个文件 meta data info 但我找不到信息如何在没有管道
为什么在 Pandas 中使用 apply 时会出现额外的索引

当我使用apply对于 Pandas 中的用户定义函数看起来 python 正在创建一个附加数组我怎样才能摆脱它呢这是我的代码 def fnc group x group C values out x np where x lt 0

为什么在 Pandas 中使用 apply 时会出现额外的索引

为什么在 Pandas 中使用 apply 时会出现额外的索引 的相关文章

随机推荐

热门标签

为什么在 Pandas 中使用 apply 时会出现额外的索引的相关文章