Pandas：从多索引中的日期中选择

2024-01-07

假设我有 MultiIndex 系列

date        foo
2006-01-01  1         12931926.310
            3         11084049.460
            5         10812205.359
            7          9031510.239
            9          5324054.903
2007-01-01  1         11086082.624
            3         12028419.560
            5         11957253.031
            7         10643307.061
            9          6034854.915

如果它不是 MultiIndex，我可以选择带有年份的那些2007通过df.loc['2007']。我在这里该怎么做？我的自然猜测是df.loc['2007', :]，但这给了我一个空的Series([], name: FINLWT21, dtype: float64).

最终目标

最终，我也有兴趣替换不同日期的所有行2007与年份的行2007.

也就是说，我的预期输出是

date        foo
2006-01-01  1         11086082.624
            3         12028419.560
            5         11957253.031
            7         10643307.061
            9          6034854.915
2007-01-01  1         11086082.624
            3         12028419.560
            5         11957253.031
            7         10643307.061
            9          6034854.915

我尝试实施@unutbu的解决方案，但是

mySeries.loc[dateIndex.year != 2007] = mySeries.loc[dateIndex.year == 2007]

自然会将这些值（由于 RHS 上不存在）设置为NaN。通常，这些问题可以通过以下方式解决

mySeries.loc[dateIndex.year != 2007] = mySeries.loc[dateIndex.year == 2007].values

，但考虑到我有10值（以及我的真实数据集中的更多值）位于左侧，但仅5在右边，我得到

ValueError: cannot set using a list-like indexer with a different length than the value

现在我想到的唯一选择是迭代第一个索引，然后对每个子组使用前面的命令，但这似乎不是最有效的解决方案。

鉴于该系列

In [207]: series
Out[212]: 
date        foo
2006-01-01  1      12931926.310
            3      11084049.460
            5      10812205.359
            7       9031510.239
            9       5324054.903
2007-01-01  1      11086082.624
            3      12028419.560
            5      11957253.031
            7      10643307.061
            9       6034854.915
Name: val, dtype: float64

你可以提取date索引与

dateindex = series.index.get_level_values('date')
# Ensure the dateindex is a DatetimeIndex (as opposed to a plain Index)
dateindex = pd.DatetimeIndex(dateindex)

现在可以选择年份等于 2007 的行布尔条件：

# select rows where year equals 2007
series2007 = series.loc[dateindex.year == 2007]

If the foo每个日期的值以相同的顺序循环使用相同的值，那么您可以将系列中的所有值替换为 2007 年的值

N = len(series)/len(series2007)
series[:] = np.tile(series.loc[dateindex.year == 2007].values, N)

使用的优点np.tile and .values是它会相对快速地生成所需的值数组。一个（可能的）缺点是，这忽略了索引，因此它依赖于以下假设：foo对于每个日期，值以相同的顺序循环使用相同的值。

更稳健（但更慢）的方法是使用联接：

df = series.reset_index('date')
df2007 = df.loc[dateindex.year==2007]
df = df.join(df2007, rsuffix='_2007')
df = df[['date', 'val_2007']]
df = df.set_index(['date'], append=True)
df = df.swaplevel(0,1).sort_index()

yields

In [304]: df.swaplevel(0,1).sort_index()
Out[304]: 
                    val_2007
date       foo              
2006-01-01 1    11086082.624
           3    12028419.560
           5    11957253.031
           7    10643307.061
           9     6034854.915
2007-01-01 1    11086082.624
           3    12028419.560
           5    11957253.031
           7    10643307.061
           9     6034854.915
2008-01-01 1    11086082.624
           3    12028419.560
           5    11957253.031
           7    10643307.061
           9     6034854.915

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas：从多索引中的日期中选择的相关文章

在python中合并3个dict()

如果多个字典之间有公共字符串是否有逻辑合并多个字典的方法即使这些公共字符串在一个 dict 的值与另一个 dict 的键之间匹配我在 SO 上看到了很多类似的问题但似乎没有一个问题能解决我将较低级别文件中的多个键与较高键值中的
为什么any (True for ... if cond) 比any (cond for ...) 快得多？

检查列表是否包含奇数的两种类似方法 any x 2 for x in a any True for x in a if x 2 计时结果与a 0 10000000 每次尝试五次次数以秒为单位 0 60 0 60 0 60 0 61 0 6
在 Windows 上的 python2.5 上安装 Openpyxl

我努力了easy install install openpyxl and python setup install 两者都失败了我也尝试过easy install openpyxl并再次失败我包括了我得到的输出当我尝试时easy i
拥有 n （2048 位数字），如何找到满足 n = p*q 的两个数字 p 和 q，其中 p = r||s （r 和 s 连接）和 q = s||r？

我正在使用 RSA 加密解密系统并且我有模数 n 这是一个 2048 位数字我需要找到 p 和 q 它们满足 n p q 并且都是素数给我的线索是 p 等于 q 但其位颠倒了正如我在本文标题中所说的那样具体来说 r 和 s 具有
Python int和float在64位系统中的内存消耗

我正在 Python 3 4 的 64 位系统中尝试以下代码以了解不同原始数据类型的内存消耗 import sys print sys getsizeof 45 prints 28 print sys getsizeof 45 2 pri
Python：当为变量分配新内容时，“旧”内存是否被释放？

如果为变量分配了任何新内容为旧内容分配的内存是否会正确释放例如在以下脚本中在为 a 分配一些新内容后变量 a 作为零数组的内存是否会被释放 import numpy a numpy zeros 1000 a a 1 我想象
更改散景图中选项卡的样式

我想知道是否有办法更改散景图上生成的选项卡的属性诸如增加文本字体更改制表符宽度等更改以下是用于生成具有两个选项卡的绘图的简单代码 from bokeh models widgets import Panel Tabs from bok
在 Windows 上安装 PyGIMP

在网上我可以找到有关使用 python 编写 gimp 脚本的各种示例 http www jamesh id au software pygimp http www jamesh id au software pygimp http ww
Python 调试器是否会介入生成器？

我目前正在使用 NetBeans IDE 和 Jython 2 5 1 当逐步调试我的项目时一旦遇到生成器的迭代调试器就会直接转到代码末尾输出工作正常但是一旦满足第一个生成器就无法进行逐步调试这是所有 Python IDE 中 P
iter(fp.readline, '') 中的行而不是 fp 中的行：

我读了内置函数iter的例子在内置函数 Python 3 7 0 文档 https docs python org 3 library functions html iter with open mydata txt as fp for l
matplotlib 中矩形面片之间存在不需要的空间

以下代码绘制两个红色矩形红色矩形应该彼此相邻之间没有空间在 python 图中这是可以的在导出的 pdf 中矩形之间有一个细长但明显的空白有什么方法可以解决这个问题吗 import matplotlib pyplot as p
如何在 django 中发出 post 请求后获取表单的名称？
ModuleNotFoundError：没有名为“googleapiclient”的模块

如果这是一个愚蠢的问题我深表歉意我在 stackoverflow 上搜索过但没有找到解决办法我正在致力于从 Python 2 7 迁移到 Python 3 8 我收到一个程序的以下错误请帮我 Traceback most rece
连接 Flask Socket.IO Server 和 Flutter

基本上我有一个套接字 io 烧瓶代码 import cv2 import numpy as np from flask import Flask render template from flask socketio import Soc
使用 python pyad 访问对象 [] 时出现问题

我在尝试使用 pyad 访问活动目录用户属性时遇到问题这是我的代码 user pyad aduser ADUser from cn tuser print user get attribute lastLogonTimestamp 这些是
获取 TypeError：ord() 期望长度为 1 的字符串，但 int 发现错误 [重复]

这个问题在这里已经有答案了 Code is from PyPDF2 import PdfFileReader with open HTTP Book pdf rb as file pdf PdfFileReader file pagedd
计算列表中的子列表

L 2 4 5 6 2 1 6 6 3 2 4 5 3 4 5 我想知道任意子序列出现了多少次 s 2 4 5 例如会返回2次 I tried L count s 但它不起作用因为我认为它期望寻找类似的东西 random numbers
WTforms 表单未提交但不输出验证错误

我正在尝试使用以下方式上传文件flask uploads工作和遇到一些障碍我会告诉你我的flask查看函数 html 希望有人能指出我缺少的内容基本上发生的情况是我提交了表格但失败了if request method POST and
将 PySpark RDD 作为新列添加到 pyspark.sql.dataframe

我有一个 pyspark sql dataframe 其中每一行都是一篇新闻文章然后我有一个 RDD 来表示每篇文章中包含的单词我想将单词的 RDD 作为名为单词的列添加到我的新文章数据框中我试过 df withColumn wo
python生成器太慢，无法使用它。我为什么要使用它？什么时候？

最近我收到一个问题哪一个是最快的 iterator list comprehension iter list comprehension and generator 然后编写简单的代码如下 n 1000000 iter a iter ra

随机推荐

在 DB2 中显示表的定义

大家好我正在学习DB2 想知道如何创建表后查看表的特征类似于MySQL中的EXPLAIN TABLE命令谢谢此外DESCRIBE TABLE 您可以使用下面的命令 DESCRIBE INDEXES FOR TABLE tablen
发送多个 HTTP 请求

我需要编写使用项目 ID 查找有关项目的信息的程序该 API 一次仅获取一项因此我只能对每项执行一次查询 API 仅限于五个同时请求任何额外的结果都会给出 HTTP 429 错误如果有一个 JavaScript 对象其中包含所有带
WordPress：重置密码始终无效密钥

我有一个很大的问题找不到解决方案我已经安装了 Ultimate Member Plugin 并激活了它当我现在重置用户的密码时我会从我的页面收到一封电子邮件其中包含在class password phpUM函数调用触发的插件文件u
ember.js 中是否有一个回调，我可以在状态转换后渲染所有视图后使用它来运行代码？

我有由三个出口组成的应用程序视图提出自己的观点简化
为什么 CSS :not 伪类不能按预期工作？

考虑以下 HTML div class a div class b Hello div div div class c div class b World div div 按照预期添加以下 CSS 颜色仅世界为红色 c b color
将输入文本字段从 HTML 获取到 JavaScript 并转到 URL

如何将输入文本字段从 HTML 转换为 JavaScript 并转到 URL 我正在构建一个网页您可以在输入字段中输入一些单词 Java 会获取该字符串并检查该字符串是否与另一个字符串相等如果它转到某个 URL 我的代码是
Android 相机视频意图返回 null URI

我最近更新到了 Android 4 3 每当我从应用程序中使用 Intent 启动它时库存摄像机就开始表现得有点奇怪起初它只是崩溃并说图库停止响应过了一会儿我能够录制视频但是单击完成会向我的应用程序返回一个空 URI 这导致
Perl 中的编译时间和运行时间

我在读这个文件 http oreilly com catalog pperl3 chapter ch18 html了解 Perl 程序的生命周期 When do run时间和什么时候做compile在命令行上运行 Perl 脚本时发生时间事
几秒钟后清除通知

当您打开消息活动并且手机收到新消息时状态栏上会显示一条通知短时间后通知将被删除是否可以对我的活动执行相同的操作而不使用计时器在几秒钟后清除通知我不相信有一种方法可以仅使用NotificationManager来取消通知但您可以
Jboss as 7 使用 HTTP 管理 api 进行部署

如何使用 HTTP 管理 api 将存档部署到 Jboss as 7 我尝试使用从 RHQ 插件类创建的以下代码公共类Main2 public static final String MANAGEMENT management publi
硬盘序列号可以/为什么会改变

我们的反盗版软件根据硬盘序列号来识别人员我相信这是一个恒定的功能除非用户更改其主要物理驱动器否则不会改变如果我错了请纠正我我们使用WMIpython模块获取用户的硬盘序列号我们的 2 台测试计算机的硬盘序列号已更改但我们根本
为什么我们必须定义一个在类中初始化的 const 静态成员

我们知道可以在类结构内部初始化整型 const 静态成员这在初始化后在类结构中使用常量时很有用例如它可以用作 int 数组的大小看下面的代码 class MyClass static const int num 100 int e
多个线程在同一全局内存位置写入相同的值

这个问题与以下问题密切相关this one https stackoverflow com questions 8315931 does writing the same value to the same memory location
在文本区域内建议/自动完成的 jQuery 插件 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有一个 jQuery 插件可以在文本区域内建议自动完成我想要的是在文本区域中向用户提供建议的单
现代 C 和 C++ 中是否已弃用 f(void)？ [复制]

这个问题在这里已经有答案了我目前正在重构整理 C 项目中使用的一些旧 C 代码并经常看到以下函数 int f void 我倾向于写成 int f 是否有任何理由不在整个代码库中将 void 替换为以提高一致性或者两者之间是否存在我
如何使用 cassandra-cli 更新 gc_grace_seconds？

更新列族并更改其列族的命令是什么gc grace seconds价值利用cassandra cli 对于CQLSH alter table
为反应式管道编写方面

我正在为返回承诺的方法编写方面考虑以下方法 public Mono
更新现有的 JobDataMap

我有一份已经安排好的 Quartz 工作我想更新与之关联的 JobDataMap 如果我得到一个 JobDataMapJobDataMap jobDataMap scheduler getJobDetail getJobDataMap 那
防止 window.open 聚焦

我想使用 window open 在 Google Chrome 的新选项卡中打开页面但我不希望该窗口在打开后获得焦点而是留在后台这可能吗它只需要在 Google Chrome 上运行它还可以使用 Google Chrome 扩展
Pandas：从多索引中的日期中选择

假设我有 MultiIndex 系列 date foo 2006 01 01 1 12931926 310 3 11084049 460 5 10812205 359 7 9031510 239 9 5324054 903 2007 01

Pandas：从多索引中的日期中选择

最终目标

Pandas：从多索引中的日期中选择 的相关文章

随机推荐

热门标签

Pandas：从多索引中的日期中选择的相关文章