在 Pandas 中对行和列 MultiIndex 使用布尔索引

2024-02-26

问题在最后，在bold。但首先，让我们设置一些数据：

import numpy as np
import pandas as pd
from itertools import product

np.random.seed(1)

team_names = ['Yankees', 'Mets', 'Dodgers']
jersey_numbers = [35, 71, 84]
game_numbers = [1, 2]
observer_names = ['Bill', 'John', 'Ralph']
observation_types = ['Speed', 'Strength']

row_indices = list(product(team_names, jersey_numbers, game_numbers, observer_names, observation_types))
observation_values = np.random.randn(len(row_indices))

tns, jns, gns, ons, ots = zip(*row_indices)

data = pd.DataFrame({'team': tns, 'jersey': jns, 'game': gns, 'observer': ons, 'obstype': ots, 'value': observation_values})

data = data.set_index(['team', 'jersey', 'game', 'observer', 'obstype'])
data = data.unstack(['observer', 'obstype'])
data.columns = data.columns.droplevel(0)

this gives: data

我想提取这个 DataFrame 的子集以供后续分析。假设我想切掉其中的行jersey号码是 71。我不太喜欢使用这个想法xs去做这个。当你通过做横截面时xs您将丢失所选的列。如果我运行：

data.xs(71, axis=0, level='jersey')

然后我找回正确的行，但我失去了jersey column.

Also, xs对于我想要一些不同值的情况，这似乎不是一个很好的解决方案jersey柱子。我认为找到了一个更好的解决方案here https://stackoverflow.com/questions/11941492/selecting-rows-from-a-pandas-dataframe-with-a-compound-hierarchical-index#comment15917600_11942697:

data[[j in [71, 84] for t, j, g in data.index]]

您甚至可以过滤球衣和球队的组合：

data[[j in [71, 84] and t in ['Dodgers', 'Mets'] for t, j, g in data.index]]

Nice!

所以问题是：我怎样才能做类似的事情来选择列的子集。例如，假设我只想要代表 Ralph 数据的列。我怎样才能做到这一点而不使用xs？或者如果我只想要包含以下内容的列怎么办observer in ['John', 'Ralph']？再说一次，我真的更喜欢一个在结果中保留行和列索引的所有级别的解决方案......就像上面的布尔索引示例一样。

我可以做我想做的事，甚至可以组合行索引和列索引中的选择。但我发现的唯一解决方案涉及一些真正的体操：

data[[j in [71, 84] and t in ['Dodgers', 'Mets'] for t, j, g in data.index]]\
    .T[[obs in ['John', 'Ralph'] for obs, obstype in data.columns]].T

因此第二个问题是：有没有更紧凑的方法来完成我上面所做的事情？

从 Pandas 0.18（可能更早）开始，您可以使用以下命令轻松地对多索引 DataFrame 进行切片pd.IndexSlice https://pandas.pydata.org/pandas-docs/stable/generated/pandas.IndexSlice.html.

对于您的具体问题，您可以使用以下内容按球队、球衣和比赛进行选择：

data.loc[pd.IndexSlice[:,[71, 84],:],:] #IndexSlice on the rows

IndexSlice 需要足够的级别信息才能明确，这样您就可以删除尾随的冒号：

data.loc[pd.IndexSlice[:,[71, 84]],:]

同样，您可以对列进行 IndexSlice：

data.loc[pd.IndexSlice[:,[71, 84]],pd.IndexSlice[['John', 'Ralph']]]

这为您提供了问题中的最终数据框。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Pandas 中对行和列 MultiIndex 使用布尔索引的相关文章

python 中的代表

我实现了这个简短的示例来尝试演示一个简单的委托模式我的问题是这看起来我已经理解了委托吗 class Handler def init self parent None self parent parent def Handle self
如何正确地将 MIDI 刻度转换为毫秒？

我正在尝试将 MIDI 刻度增量时间转换为毫秒并且已经找到了一些有用的资源 MIDI Delta 时间刻度到秒 http www lastrayofhope co uk 2009 12 23 midi delta time ticks
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
如何迭代按值排序的 Python 字典？

我有一本字典比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
将数据帧行转换为字典

我有像下面的示例数据这样的数据帧我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典但是当我使用 to dict 时我得到了索引和列值有谁知道如何将行转换为像所需输出那样的字典任何提示都非常感激 Sample data pri
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data
无法在前端使用 JavaScript Fetch API 将文件上传到 FastAPI 后端

我正在尝试弄清楚如何将图像发送到我的 API 并验证生成的token那是在header的请求到目前为止这就是我所处的位置 app post endreProfilbilde async def endreProfilbilde requ
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1
您可以使用关键字参数而不提供默认值吗？

我习惯于在 Python 中使用这样的函数方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default

随机推荐

将 ipynb 文件与 Windows 10 (Anaconda) 中的 Jupyter 笔记本关联

我在 Windows 10 计算机上安装了 Anaconda 我的电脑上有一些 Jupyter 笔记本我想将它们与 Jupyter 关联这样就可以通过双击文件来打开它们以避免每次都打开 Jupyter 并导航到笔记本文件夹这可能吗
Python 的 setup.py 安装的 CLI 脚本不允许导入相同的模块

我想创建一个名为 Knife 的 python 应用程序可以从 CLI 执行问题是它无法导入模块我遵循与 Django 项目相同的文件夹结构以供参考我的目录结构是这样的 knife knife bin knife cli py co
替换由“.”编码的缺失值在 R 数据框中

我有一个数据框其中缺少由编码的值并且我想将这些值重新编码为 NA df lt data frame h c 1 1 我尝试以下操作 df h df h lt NA But the NA显示为
使用 Java 将 HTML 文件转换为包含图片和样式的 PDF [重复]

这个问题在这里已经有答案了可能的重复将 HTML 文件转换为 PDF https stackoverflow com questions 633780 converting html files to pdf 我想使用 Java 将 H
有条件的 pandas 中两个数据帧的复杂 Map 操作

我在 pandas df 有一张桌子 id prod1 prod2 count 1 10 30 100 2 10 20 200 3 20 10 200 4 30 10 100 5 30 40 300 我还在 df2 有另一张桌子 produ
如何使用 Zebra 打印机在标签上打印徽标并向其发送 ZPL 指令

我想将 ZPL 指令发送到 Zebra 打印机目前为 GK420t 我正在打印 50mm x 20mm 标签我想要在标签的左上角打印一个徽标小 5 毫米 x 5 毫米图像我想知道我应该遵循的步骤来做到这一点我一直在阅读并尝试 ZP
如何使用 asp.net mvc 3 和 c# 清除 cookie？

好吧我真的认为我这样做是正确的但 cookie 没有被清除 Session Clear HttpCookie c Request Cookies MyCookie if c null c new HttpCookie MyCookie
选择带有 JPA 的非实体？

JPA 是否可以使用本机查询检索非实体类的实例我有一个包装两个实体的非实体类 class Wrap Entity1 ent1 Entity2 ent2 Entity class Entity1 Entity class Entity2 我
垃圾收集器如何比显式内存释放更快？

我正在读这个这里是原始 ps 文件 http www hpl hp com personal Hans Boehm gc myths ps GC 误区 3 垃圾收集器总是比显式内存释放慢 GC 误区 4 垃圾收集器总是比显式内存释放更快
如何从用户空间访问当前读取/写入的线程数？

我编写了一个模块用户可以在其中读取或写入 proc 文件如何确定在内核级编程中读取或写入的用户进程中的线程数 Use current作为指向当前任务的指针当前task struct 在你的读写函数中 include
itext 正确获取页面或文档中的每个图像位置

试验 itext 我正在从 pdf 文件中提取文本和图像出于我的目的我使用文本和图像构建了一个 html 文件目标是将提取的图像放置在整个文本中而不是像我目前那样将它们放置在末尾经过一番研究后 itext renderInfo g
如何以编程方式使用 localstack s3 端点设置 Airflow 1.10 日志记录？

为了尝试将气流日志记录到 localstack s3 存储桶对于本地和 kubernetes 开发环境我遵循用于记录到 s3 的气流文档 https airflow apache org docs 1 10 1 howto write
如何从范围中获取百分比[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我有一个基本的数学问题我试图从一系
如何将我的 2 路数据绑定从代码隐藏移动到 XAML

对于 WFP 和 C 来说相对较新长期 PHP 程序员我成功地在文本框和对象的属性之间设置了 2 WAY 数据绑定我能够在代码隐藏中建立绑定但无法在 XAML 中建立绑定我想学习如何在 XAML 中进行 BINDING 也就是下面
Odata V4 中的流支持

处理文件流 GET POST 和 DELETE 操作的推荐方法是什么我得到了关于如何执行此操作的以下链接但它适用于 V3 版本在将此解决方案移植到 OData V4 时伊朗遇到了一系列问题引发了以下问题 Odata V4 是否支持
单元测试辅助方法？

我的类以前有大量方法因此我将此方法的工作细分为辅助方法这些辅助方法已声明private强制封装但是我想对大型公共方法进行单元测试对辅助方法也进行单元测试是否很好因为如果其中一个方法失败调用它的公共方法也会失败这样我们就可以
将 .scn 文件从带有纹理的 URL 导入场景

我正在为我的应用程序使用 ARKit 并尝试从网络服务器动态加载 scn 文件这是我的代码的一部分 let url URL string http 192 168 0 31 1234 5a27e09cbad20a7a03ad5d80 bo
更新到 Node v4.0.0 后运行 gulp-sass 时出错

我更新到 Node v4 0 0 当我在项目中运行 gulp 时我收到有关 gulp sass node sass 的错误如下所示 Error libsass未找到绑定尝试重新安装node sass 我尝试删除项目中的所有节点模块并重
使用 Tensorflow 2 中保存的模型进行推理：如何控制输入/输出？

将我的代码从 TF1 调整为 TF2 6 我遇到了麻烦我正在尝试向 inception resnet 添加一些自定义层保存模型然后加载并运行它 from tensorflow keras layers import Dense fro
在 Pandas 中对行和列 MultiIndex 使用布尔索引

问题在最后在bold 但首先让我们设置一些数据 import numpy as np import pandas as pd from itertools import product np random seed 1 team nam

在 Pandas 中对行和列 MultiIndex 使用布尔索引

在 Pandas 中对行和列 MultiIndex 使用布尔索引 的相关文章

随机推荐

热门标签

在 Pandas 中对行和列 MultiIndex 使用布尔索引的相关文章