熊猫重新索引日期索引按组重新访问

2024-03-31

之前已经问过这个问题，这里已经提出了一个可行的解决方案Pandas 在 Groupby 中重新索引日期 https://stackoverflow.com/questions/32275540/pandas-reindex-dates-in-groupby，这过去对我有用，但现在不再有用了。

因此，回顾一下，我需要使用日期重新索引数据帧以创建“平衡面板” - 不要在任何组中缺少日期值组合。这是一个例子：

import pandas as pd
from datetime import datetime

date1 = datetime.strptime('2023-01-01', '%Y-%m-%d').date()
date2 = datetime.strptime('2023-01-02', '%Y-%m-%d').date()
date3 = datetime.strptime('2023-01-03', '%Y-%m-%d').date()

df = pd.DataFrame({'Date':[date1] * 3 + [date2]  + [date3] * 3,
'Group':['A', 'B', 'C', 'A', 'A', 'B', 'C'],
'Value':[20, 10, 23, 45, 60, 14, 25]})
 
df.set_index('Date', inplace=True)

期望的输出是：

df_target = pd.DataFrame({'Date':[date1] * 3 + [date2] * 3  + [date3] * 3,
'Group':['A', 'B', 'C', 'A', 'B', 'C', 'A', 'B', 'C'],
'Value':[20, 10, 23, 45, 0, 0, 60, 14, 25]})

df_target.set_index('Date', inplace=True)

尝试的解决方案（注意断言）：

def reindex_by_date(df, freq):
    dates = pd.date_range(start=df.index.min(), end=df.index.max(), freq=freq)
    idx = pd.Index(dates, name='Dates')
    assert dates.duplicated().sum()==0
    return df.reindex(dates, fill_value=0)

df.groupby('Group').apply(reindex_by_date(df, freq='D'))

# this has also been added: .reset_index(drop=True)

产生错误：

ValueError: cannot reindex from a duplicate axis

我什至检查了标志（这里是True):

df.flags.allows_duplicate_labels

您错误地调用了该函数apply（您不传递该组，而是传递整个 DataFrame）。

这应该是：

df.groupby('Group').apply(lambda g: reindex_by_date(g, freq='D'))

Or:

df.groupby('Group').apply(reindex_by_date, freq='D')

Output:

                 Group  Value
Group                        
A     2023-01-01     A     20
      2023-01-02     A     45
      2023-01-03     A     60
B     2023-01-01     B     10
      2023-01-02     0      0
      2023-01-03     B     14
C     2023-01-01     C     23
      2023-01-02     0      0
      2023-01-03     C     25

请注意，您必须放弃Group and reset_index以避免使用 0 重新索引Group作为列：

(df.groupby('Group').apply(reindex_by_date, freq='D')
   .drop(columns='Group').reset_index('Group')
 .rename_axis('Date')
)

Output:


           Group  Value
Date                   
2023-01-01     A     20
2023-01-02     A     45
2023-01-03     A     60
2023-01-01     B     10
2023-01-02     B      0
2023-01-03     B     14
2023-01-01     C     23
2023-01-02     C      0
2023-01-03     C     25

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

datetime

groupby

reindex

熊猫重新索引日期索引按组重新访问的相关文章

Windows 7 64位 libsvm 和 python 错误：找不到函数“svm_get_sv_indices”

我正在使用 Windows 7 64 位我已经安装了 Python 2 7 3 32 位版本和 libsvm 3 13 当我尝试启动导入 svmutil 的简单 py 文件时出现错误 C libsvm 3 13 python gt p
ValueError：无法将 DatetimeIndex 转换为 dtype datetime64[us]

我正在尝试为 S P 500 ETF 创建一个包含 30 分钟数据的 PostgreSQL 表 spy30new 用于测试新插入的数据来自具有 15 分钟数据的多个股票的表全部 15 个 all15 在 dt 时间戳和 instr 股
AttributeError：模块“tensorflow.python.summary.summary”没有属性“FileWriter”

我收到此错误尽管我到处都看过file writer tf summary FileWriter path to logs sess graph 被提到为正确的实施this https github com tensorflow tenso
Redis 队列工作程序在 utcparse 中崩溃

我正在尝试按照以下教程获得基本的 rq 工作 https blog miguelgrinberg com post the flask mega tutorial part xxii background jobs https blog m
Flask-admin 内联建模传递表单参数会抛出 AttributeError

Flask 开发者们大家好在 Flask admin 中我目前尝试在模型视图中实现内联模型编辑在模型方面我有一个简单的树结构表示一组内容页面每个节点都有多个子节点以及与其关联的多个内容数据模型模型被命名为ContentNode
根据另一个非索引数组中的值从 numpy 数组中选择元素

假设我有以下两个数组 a array 1 L 74 423088306605 5 H 128 05441039929008 2 L 68 0581377353869 0 H 88 15726964130869 4 L 97 45015825
使用 isdigit 表示浮点数？

a raw input How much is 1 share in that company while not a isdigit print You need to write a number n a raw input How m
if(interactive()) 是否相当于 Python 中的“if __name__ == ”__main__“: main()”？

我希望 R 脚本有一个 main 函数可以在交互模式下执行但在获取文件时不应执行 main 函数已经有一个关于这个的问题了 https stackoverflow com questions 2968220 is there an r
与 GridSearchCV 的并行错误，与其他方法一起工作正常

我使用 GridSearchCV 时遇到以下问题它在使用时给我一个并行错误n jobs gt 1 同时n jobs gt 1与 RadonmForestClassifier 等单一模型配合良好下面是一个显示错误的简单工作示例 train
创建 Pyomo 约束的性能

我正在用 pyomo 设置一个更大的能量优化问题正如其他中提到的设置花费了不合理的时间问题 https stackoverflow com questions 43413067 performance of pyomo to gener
pyqt4窗口调整大小事件

我正在使用 python3 和 pyqt4 我希望每次运行时都会运行一些代码QMainWindow已调整大小我想要这样的东西 self window resized connect self resize but resized不是内置函
Magento - 无法重新索引产品价格 - 外键约束失败

我最近刚刚将我的 magento 商店从 1 4 2 升级到 1 7 0 2 升级进行得很顺利但是当我尝试在升级后重新索引数据时产品价格失败了我尝试过使用php shell indexer php reindexall来自 SSH 它
使用字典时如何避免 KeyError？

现在我正在尝试编写汇编程序但我不断收到此错误 Traceback most recent call last File Users Douglas Documents NeWS py line 44 in if item in regis
CTRL-C 在 Python 中的行为有所不同

I ve recently started learning Python long time Java programmer here and currently in the process of writing some simple
将日期（系列）列从一个 DataFrame 添加到其他 Pandas，Python

我正在尝试将日期列从 df1 广播到 df2 在 df1 中我有所有用户的姓名及其基本信息在 df2 中我有一个用户购买的列表 df1 和 df2 代码 https i stack imgur com sN0uJ png 假设我有一
ValueError：设置 random_state 无效，因为 shuffle 为 False。您应该将 random_state 保留为默认值（无），或设置 shuffle=True

当我尝试在 pycaret 中训练某些内容时我收到此错误消息 ValueError Setting a random state has no effect since shuffle is False You should leave
将 tf.contrib.layers.xavier_initializer() 更改为 2.0.0

我该如何改变 tf contrib layers xavier initializer tf 版本 gt 2 0 0 所有代码 W1 tf get variable W1 shape self input size h size initi
在 Python 中，如果我有 unix 时间戳，如何将其插入 MySQL 日期时间字段？

我正在使用 Python MySQLDB 我想将其插入 Mysql 中的 DATETIME 字段我该如何使用cursor execute 来做到这一点要将 UNIX 时间戳转换为 Python 日期时间对象请使用datetime fr
使用 Python 3.x 基本获取 URL 的 HTML 正文

我是Python新手我对 Python 2 x 中的旧 urllib 和 urllib2 与 Python 3 中的新 urllib 之间的差异有点困惑除此之外我不确定数据在发送到 urlopen 之前何时需要编码我一直在尝试使用
如何仅更改 DateTime 的日期部分，同时保留时间部分？

我在代码中使用了很多 DateTime 我想将这些日期时间更改为我的特定日期并保留时间 1 2012 02 02 06 00 00 gt 2015 12 12 06 00 00 2 2013 02 02 12 00 00 gt 2015

随机推荐

如何在不使用 zip() 的情况下将不同类型的 Future 组合成一个 Future

我想创造一个类型的未来Future Class1 Class2 Class3 从下面的代码然而我发现做到这一点的唯一方法是使用 zip 我发现这个解决方案很丑陋而且不是最佳的谁能启发我 val v for a lt val f0 Fu
如何把照片贴在墙上？

有人成功地将图片发布到当前用户的墙上吗这是行不通的如果图片参数是现有的图片 url 则不会显示我正在使用最新的 FB C SDK 5 0 8 Beta var args new Dictionary
如何重新加载 vue 组件？

我知道解决方案是像这样更新道具数据 this selectedContinent 但我想使用另一种解决方案在我阅读了一些参考资料后解决方案是 this forceUpdate 我尝试了一下但不起作用演示和完整代码如下 https j
向 Google 仪表添加 % 符号

我正在使用 Google 仪表并且想在仪表中的值后面添加一个符号我的值显示良好没有百分比符号整数 0 100 但是当我开始尝试添加百分比符号时事情变得不稳定这是我尝试过的 Format the data to include
iPhone CoreText：查找子字符串的像素坐标

这是 Twitter 应用程序的屏幕截图供参考 http screencast com t YmFmYmI4M http screencast com t YmFmYmI4M 我想要做的是将浮动弹出窗口放置在可以跨越多行的 NSAttrib
如何在 Puppeteer 中选择 iframe 元素内的元素

由于 ESPN 不提供 API 因此我尝试使用 Puppeteer 来抓取有关我的 Fantasy Football League 的数据但是由于登录表单嵌套在 iframe 元素中我很难尝试使用 puppeteer 登录我已经去了
Next12 中带有 Prisma 适配器的 NextAuth 凭证提供程序不执行任何操作

我已经设置了我的Nextjs Next12 with NextAuth 凭证提供者并使用棱镜适配器将用户会话保留在数据库中我跟着这个文档 https next auth js org adapters prisma来自 NextAuth
求解混合互补模型时出错

直接使用 PATH 求解器我无法解决下面提出的问题最初的问题来源于https prod sandia gov techlib noauth access control cgi 2015 155584 pdf https prod sa
以良好的质量和内存效率缩小资源中的位图

我想缩小 500x500px 资源以始终适合由屏幕宽度确定的特定尺寸目前我使用 Android 开发者网站高效加载大位图 http developer android com training displaying bitmaps lo
on_message() 和 @bot.command 问题

当我有on message 在我的代码中它会停止所有其他的 bot command来自工作的命令我尝试过await bot process commands message 但这也行不通这是我的代码 bot event command
SQL Server - PIVOT - 两列转换为行

我在一个专栏中看到了很多关于 PIVOT 的问题每个问题都比其他问题更复杂但是我找不到我需要的任何内容老实说我什至不知道pivot在这种情况下是否能帮助我假设我的源表中有这些数据 SELECT 1 as RowId Random
混淆 .fmt 行为与嵌套列表

The docs https docs raku org routine fmt比如说fmt 返回一个字符串其中列表中的每个元素都已根据以下格式进行格式化 format 第一个参数并且每个元素由 separator 第二个论点根据该描
EmguCV (OpenCV) ORBDetector 仅发现不良匹配

Problem 所以总的来说我对计算机视觉还很陌生我目前正在尝试通过分析 2 个图像来计算单应性我想使用单应性来校正 1 个图像的视角以匹配另一个图像但我得到的比赛却很糟糕而且错误所以我所做的单应性扭曲完全关闭了当前状态我正在
在“data.table”中使用动态列名

我想计算 data table 中每一列的平均值并按另一列分组我的问题与另外两个问题类似 one https stackoverflow com questions 12391950 variably selecting assigni
创建 IEnumerable.Find()

我想写 IEnumerable
Hibernate Envers：检索具有集合属性的实体的正确修订

我有两个经过审计的实体 A 和 B 实体 A 拥有实体 B 的集合注释为一对多关系将 A 的新实例插入数据库时 A 和 B 的所有行都处于同一修订版假设为修订版 1 然后 A 上有一个更新仅影响实体 B 的实例因此更新后实体
WiX RemoveRegistryKey 元素的行为不符合广告

卸载时我似乎无法删除注册表项请注意这不是重复this https stackoverflow com questions 3317281 wix doesnt remove registrykey on uninstall问题因为我不
scikit-learn - 将管道预测转换为原始值/规模

我创建了一个管道如下所示使用Keras Scikit Learn API https keras io scikit learn api estimators estimators append standardize Standard
如何使用 jquery 禁用列表框中的多重选择？或者JavaScript？

我的页面中有一个列表框 td 我需要禁止从列表框中选择多个项目吗我正在做一些事情比如选择一个项目然后单击删除按钮我的页面会从列表框中删除一项但是如果我选择多个项目则会抛出一条错误消息任何人都可以帮我解决如何停用或禁用列表框
熊猫重新索引日期索引按组重新访问

之前已经问过这个问题这里已经提出了一个可行的解决方案Pandas 在 Groupby 中重新索引日期 https stackoverflow com questions 32275540 pandas reindex dates in g

熊猫重新索引日期索引按组重新访问

熊猫重新索引日期索引按组重新访问 的相关文章

随机推荐

热门标签

熊猫重新索引日期索引按组重新访问的相关文章