Pandas Multiindex 从索引的第一个条目获取值

2024-01-07

我有以下多索引数据框：

from io import StringIO
import pandas as pd
datastring = StringIO("""File,no,runtime,value1,value2
    A,0, 0,12,34
    A,0, 1,13,34
    A,0, 2,23,34
    A,1, 6,23,38
    A,1, 7,22,38
    B,0,17,15,35
    B,0,18,17,35
    C,0,34,23,32
    C,0,35,21,32
    """)    
df = pd.read_csv(datastring, sep=',')
df.set_index(['File','no',df.index], inplace=True)


>> df
               runtime  value1  value2
File   no               
A      0    0     0       12      34
            1     1       13      34
            2     2       23      34
       1    3     6       23      38
            4     7       22      38
B      0    5     17      15      35
            6     18      17      35
C      0    7     34      23      32
            8     35      21      32

我想要得到的只是带有新文件和不同数字的每个条目的第一个值

我能找到的最相似的问题在哪里

仅知道结果测量计数的对 pandas 数据框进行重新采样 https://stackoverflow.com/questions/20107958/resample-pandas-dataframe-only-knowing-result-measurement-count/20108446#20108446

pandas 中基于 MultiIndex 的索引 https://stackoverflow.com/questions/14964493/multiindex-based-indexing-in-pandas

在 pandas MultiIndex DataFrame 中选择行 https://stackoverflow.com/questions/53927460/select-rows-in-pandas-multiindex-dataframe

但我无法从它们中构建解决方案。我得到的最好的是ix操作，但由于技术上的值仍然存在（只是不显示），结果是

idx = pd.IndexSlice
df.loc[idx[:,0],:]

例如，可以过滤0值，但仍会返回数据帧的整个其余部分。

多重索引是否是完成当前任务的正确工具？怎么解决这个问题呢？

Use GroupBy.first http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.GroupBy.first.html按第一级和第二级MultiIndex:

s = df.groupby(level=[0,1])['value2'].first()
print (s)
File  no
A     0     34
      1     38
B     0     35
C     0     32
Name: value2, dtype: int64

如果需要一栏DataFrame使用一个元素list:

df1 = df.groupby(level=[0,1])[['value2']].first()
print (df1)
         value2
File no        
A    0       34
     1       38
B    0       35
C    0       32

另一个想法是删除3rd水平由DataFrame.reset_index http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.reset_index.html并按以下条件过滤Index.get_level_values http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.get_level_values.html with boolean indexing http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#boolean-indexing:

df2 = df.reset_index(level=2, drop=True)
s = df2.loc[~df2.index.duplicated(), 'value2']
print (s)
File  no
A     0     34
      1     38
B     0     35
C     0     32
Name: value2, dtype: int64

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas Multiindex 从索引的第一个条目获取值的相关文章

按每个元素中出现的数字对字符串列表进行排序[重复]

这个问题在这里已经有答案了我有一个脚本其目的是对不断下载到服务器上的空间数据集文件进行排序和处理我的列表目前大致如下 list file t00Z wrff02 grib2 file t00Z wrff03 grib2 file t0
如何在Python + Selenium中获取元素的值

我在我的 Python 3 6 3 代码中得到了这个 HTML 元素作为 Selenium网页元素当然 span class ocenaCzastkowa masterTooltip style color 000000 alt 5 sp
Discord.py 斜线命令在 cogs 中不起作用

我正在构建一个不和谐的机器人并且想要在 cogs 内使用斜杠命令但这些命令不显示或工作这是代码 cog guild ids 858573429787066368 861507832934563851 class Slash comma
NumPy 数组与 SQLite

我在 Python 中见过的最常见的 SQLite 接口是sqlite3 但是有什么东西可以很好地与 NumPy 数组或 rearray 配合使用吗我的意思是它可以识别数据类型不需要逐行插入并提取到 NumPy rec 数组中有点
获取字符串模板中所有标识符列表的函数（Python）

对于标准库string template在Python中有没有一个函数可以获取所有标识符的列表例如使用以下 xml 文件
如何在Python中手动对数字列表进行排序？

规格 Ubuntu 13 04 Python 3 3 1 背景 Python的初学者遇到了这个手动排序问题我被要求做的事情让用户输入 3 个数值并将它们存储在 3 个不同的变量中不使用列表或排序算法手动将这 3 个数字从小到大
Pandas 中每列的曲线拟合 + 外推值

我有一个包含大约 300 列的数据集每一列都与深度相关 Pandas DataFrame 的简化版本看起来像这样 import matplotlib pyplot as plt import numpy as np import pand
使用 Python-VLC 的 PyInstaller：无属性“media_player_new”错误

我使用 Python VLC 创建视频播放器并使用 PyInstaller 在 Windows 10 计算机上生成可执行文件最初它给了我错误 Import Error Failed to load dynlib dll libvlc
类变量：“类列表”与“类布尔值”[重复]

这个问题在这里已经有答案了我不明白以下示例的区别一次类的实例可以更改另一个实例的类变量而另一次则不能示例1 class MyClass object mylist def add self self mylist append 1
Kivy TextInput 水平和垂直对齐（文本居中）

如何在 Kivy 的 TextInput 中水平居中文本 I have the following screen But I want to centralize my text like this 这是我的 kv 语言的一部分 BoxLa
在python中使用编解码器utf-8打开文件错误

我在 windows xp 和 python 2 6 4 上执行以下代码但它显示 IOError 如何打开名称带有 utf 8 编解码器的文件 gt gt gt open unicode txt euc kr encode utf 8 T
为什么我无法杀死 k8s pod 中的 python 进程？

我试图杀死一个 python 进程 ps aux grep python root 1 12 6 2 1 2234740 1332316 Ssl 20 04 19 36 usr bin python3 batch run py root 4
在Python中随机交错2个数组

假设我有两个数组 a 1 2 3 4 b 5 6 7 8 9 我想将这两个数组交错为变量 c 注意 a 和 b 不一定具有相同的长度但我不希望它们以确定性的方式交错简而言之仅仅压缩这两个数组是不够的我不想要 c 1 5 2 6 3
如何将 django ModelForm 字段显示为不可编辑

接受我的初步教训django ModelForm 我想让用户能够编辑博客中的条目 BlogEntry has a date postedTime title and content 我想向用户展示一个编辑表单其中显示所有这些字段但仅包含
为什么我会在 Python 字符串格式中使用除 %r 之外的其他内容？

我偶尔会使用 Python 字符串格式这可以像这样完成 print int i Float f String s 54 34 434 some text 但是这也可以这样做 print int r Float r String r 54
python 中的 F 字符串前缀给出语法错误[重复]

这个问题在这里已经有答案了我有一个名为 method 的变量它的值是 POST 但是当我尝试运行时print f method method is used 它不断在最后一个双引号处给出语法错误我找不到它这样做的原因我正在使用 py
本地主机上的 Google App Engine GQL 查询

我正在 Google App Engine Windows 上的 SDK 版本 1 7 0 上开发一个应用程序我需要经常测试该应用程序并且此测试涉及数据存储上的大量 GQL 查询您可以在 App Engine 管理界面的浏览器中在线运
尝试 numba 时出现巨大错误

我在使用 numba 时遇到了大量错误讽刺的是正确的结果是在错误之后打印的我正在使用最新的 Anaconda python 并安装了 numba conda install numba 一次在 Ubuntu 13 64 位和 anac
在自定义 keras 层的调用函数中传递附加参数

我创建了一个自定义 keras 层目的是在推理过程中手动更改前一层的激活以下是基本层它只是将激活值乘以一个数字 import numpy as np from keras import backend as K from keras
将函数按元素应用于两个 DataFrame

如何应用函数z ij f x ij y ij 来自数据框X and Y相同大小并将结果保存到 DataFrameZ 这取决于你有什么样的功能很多功能已经被矢量化为数据框例如等等所以对于这些功能你可以简单地做Z X Y or Z X

随机推荐

网页中允许的最大 div 数

您好我想知道网页上允许的 div 数量是否有限制例如当 Internet Explorer 必须渲染具有一千个 div 的网页时它会开始感到窒息吗我知道这是一篇旧文章但我最近做了一个与该主题直接相关的测试我想分享我的结果我创
Socket.io 在 Express Route 上发出

我想在调用某些 API 路由时向客户端发送一些数据我必须遵循 server js 上的代码 var app express var http require http Server app var io require socket io
为什么此代码在到达 StreamReader 的第一个 ReadLine 时挂起？

我在第一个参数中将一个大文件传递给下面的 SendXMLFile 但由于它导致手持设备挂起冻结我暂时硬编码了一个小得多的文件 3 KB 而不是 1121 KB 供测试用该文件确实存在与 exe dll 位于同一文件夹中如以下代码
Iframe 和同源策略以及反向代理黑客

我一直在阅读具有不同域的 Iframe 然后是父文档我有点困惑据我了解如果 iframe 与其父文档来自同一域则父文档可以访问 iframe 的文档看来我可以通过以下技巧来规避这个问题我在以下位置设置了一个网络服务器mydoma
Android：处理ListView回收

我正在开发一个音板应用程序在其中使用 Listview Activity 但是由于Android的Listview具有回收其listview的属性滚动列表视图时我对所选文本视图所做的更改会反映在所有页面中我不希望这种事发生那么我该
J2ME 的 JSON 解析器

我需要一个与 J2ME CLDC 1 1 配合使用的基本 JSON 解析器 Google 搜索返回了大量关于此问题的答案有些甚至在 stackoverflow 上但似乎所有内容都指向不再可用的库和解决方案例如很多都指向应该位于 js
过滤负时间增量

考虑一系列持有timedelta64 ns 测量两个事件 A 和 B 之间的时间差 gt time deltas 499900 1 days 23 45 13 499916 1 days 23 50 57 499917 00 03 27 4
VB 6：如何执行 .bat 文件但等到其运行完成后再继续？

VB 6 如何执行 bat 文件但等到其运行完成后再继续您将需要使用 Win32 API 调用Shell执行Ex http msdn microsoft com en us library bb762154 VS 85 aspx和从SHE
如何处理自动模块中的拆分包？

我目前正在测试将现有应用程序迁移到 Jigsaw Modules 我的模块之一使用 ElasticSearch 及其 Groovy 插件 org elasticsearch elasticsearch org elasticsearch m
boost::spirit 替代解析器返回重复项

我正在研究https github com F Bergemann RegexSplitter https github com F Bergemann RegexSplitter 目的解析正则表达式字符串并创建可破坏和不可破坏的顶级子
将整数数组转换为字符串的最佳方法是什么？

我想转换一个 int 数组像这样 1 1 2 1 转换为字符串 1121 最好的最Pythonic的方法是什么我总是可以这样做然后删除多余的括号 gt gt gt str 1 2 1 1 1 2 1 1 或者我可以这样做 s fo
Oracle 数据库变更通知

我是 DCN 新手我可以使用它来检测表中列的更新以及该表中的插入吗我指的是this https docs oracle com cd E11882 01 java 112 e16548 dbchgnf htm JJDBC28815 是的
如何修复div高度

我正在开发一个聊天控制应用程序我的问题是这样的我输入文本这用于拨打休息电话获取响应并将其添加到聊天窗口目前我的问题是这样的聊天窗口变大页面随着聊天框 div 一起滚动有人可以告诉我如何停止整个页面的这种增量吗简单来说我的
如何停止R中的for循环并保留数据

我的代码在日期的 for 循环中运行该代码需要一段时间才能运行还剩几天时间但我迫切需要任何结果有没有办法打破代码 for 循环但保留到目前为止已生成的所有数据是的您可以按 escape 检查结果然后重新启动循环 for ii
扩展协议，其中 Self：Swift 中的通用类型（需要 <...> 中的参数）

我有一个需要泛型的类class Collection
如何将 csv 字符串转换为 pandas 中的列表？

我正在使用具有以下格式的 csv 文件 Id Sequence 3 1 3 13 87 1053 28576 2141733 508147108 402135275365 1073376057490373 97003854893559701
Jquery - 使用 .load 和选择器加载页面不会执行脚本？

我正在尝试使用 load 方法将一个页面加载到另一页面中此加载的页面包含一个我想在加载完成后执行的脚本我整理了一个简单的示例来演示索引 html
MVC：存储库和服务

我对存储库中定义的内容以及留给服务的内容的限制感到困惑存储库应该只创建与数据库中的表匹配的简单实体还是可以使用这些实体的组合创建复杂的自定义对象换句话说服务是否应该在存储库上进行各种 Linq to SQL 查询或者所有的查询都应
GSON 将布尔值序列化为 0 或 1

All 我正在尝试执行以下操作 public class SomClass public boolean x public int y public String z SomClass s new SomClass s x true s y
Pandas Multiindex 从索引的第一个条目获取值

我有以下多索引数据框 from io import StringIO import pandas as pd datastring StringIO File no runtime value1 value2 A 0 0 12 34 A 0

Pandas Multiindex 从索引的第一个条目获取值

Pandas Multiindex 从索引的第一个条目获取值 的相关文章

随机推荐

热门标签

Pandas Multiindex 从索引的第一个条目获取值的相关文章