按月计算 cumsum() 但如果该月没有数据则重复这些值

2023-12-28

我有数据：df

    date    col1    col2
0   1/16/2016   apple   20
1   2/1/2016    apple   40
2   2/2/2016    pear    60
3   3/13/2016   apple   10
4   5/4/2016    apple   50
5   6/15/2016   pear    5

With cumsum()我可以获得这些值的累积和。但如果某个月没有值，则该值不重复。

df.set_index('date', inplace=True)
df = df.groupby([df.index.month, 'col1']).sum()
df['cumsum'] = df.groupby('col1')['cumsum'].cumsum()

date    col1    cumsum
Jan-16  apple   20
Feb-16  apple   60
Feb-16  pear    60
Mar-16  apple   70
May-16  apple   120
Jun-16  pear    65

但我想得到以下结果：重复 cumsumcol1即使该特定月份没有数据，也会显示该值。

date    col1    cumsum
Jan-16  apple   20
Feb-16  apple   60
Feb-16  pear    60
Mar-16  apple   70
Mar-16  pear    60
Apr-16  apple   70
Apr-16  pear    60
May-16  apple   120
May-16  pear    60
Jun-16  apple   120
Jun-16  pear    65

在此先感谢您的帮助。

Use:

#create month period column  for correct ordering
df['months'] = df['date'].dt.to_period('m')
#aggregate month
df1 = df.groupby(['months', 'col1'])['col2'].sum()

#MultiIndex with all possible combinations
mux = pd.MultiIndex.from_product([pd.period_range(df['months'].min(),
                                                  df['months'].max(), freq='M'),
                                  df['col1'].unique()], names=df1.index.names)

#add missing values with reindex reshape, cumulative sum
#forward fill missing values and reshape back
df2 = (df1.reindex(mux)
          .unstack()
          .cumsum()
          .ffill()
          .stack()
          .astype(int)
          .reset_index(name='cumsum')
         )
print (df2)
     months   col1  cumsum
0   2016-01  apple      20
1   2016-02  apple      60
2   2016-02   pear      60
3   2016-03  apple      70
4   2016-03   pear      60
5   2016-04  apple      70
6   2016-04   pear      60
7   2016-05  apple     120
8   2016-05   pear      60
9   2016-06  apple     120
10  2016-06   pear      65

最后，如果需要，将日期时间转换为自定义字符串：

df2['months'] = df2['months'].dt.strftime('%b-%y')
print (df2)
    months   col1  cumsum
0   Jan-16  apple      20
1   Feb-16  apple      60
2   Feb-16   pear      60
3   Mar-16  apple      70
4   Mar-16   pear      60
5   Apr-16  apple      70
6   Apr-16   pear      60
7   May-16  apple     120
8   May-16   pear      60
9   Jun-16  apple     120
10  Jun-16   pear      65

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

pandas

pandasgroupby

cumsum

按月计算 cumsum() 但如果该月没有数据则重复这些值的相关文章

使用 InlineKeyboardButton python telegram bot 发送命令

在Python电报机器人中是否有可能InlineKeyboardButton发送类似命令 cancel当它被按下时例如当用户按下取消按钮时他们将自动发送 cancel 命令然后由机器人处理从这里的例子来看 https githu
AttributeError：'function'对象在pandas中没有属性'bar'

我有一个 pandas 数据框它是 pandas 数据框类型如下所示 type df Out 176 pandas core frame DataFrame 但是当我尝试在此数据框上使用任何绘图函数如条形图时会出现如下错误 df
Pandas如何按时间段过滤DataFrame

我有一个包含下表的文件 Name AvailableDate totalRemaining 0 X3321 2018 03 14 13 00 00 200 1 X3321 2018 03 14 14 00 00 200 2 X3321 20
如何在python 3.6.5中通过变量创建子元素

我的代码是 import xml etree ElementTree as ET from lxml import etree var1
如何在 Python 3 中获取当前语言环境的字母表？

在 Python 2 中您可以执行以下操作来获取当前语言环境的字符集 import string print string letters 然而在 Python 3 中字符串模块的区域设置相关常量例如string letters s
如何在 python 中将最佳概率分布模型拟合到我的数据？

我有大约 20 000 行这样的数据 Id value 1 30 2 3 3 22 n 27 我对我的数据进行了统计平均值33 85 中位数30 99 最小值2 8 最大值206 95 置信区间0 21 所以大多数值在33左右并且有一些
Pandas DataFrame.hist Seaborn 等效项

在探索时我经常使用 Pandas 的 DataFrame hist 方法来快速显示数据框中每个数字列的直方图网格例如 import matplotlib pyplot as plt import pandas as pd from sk
使用一次递归调用实现递归

给定一个函数如下 f n f n 1 f n 3 f n 4 f 0 1 f 1 2 f 2 3 f 3 4 我知道使用递归来实现它并在一个函数内进行三个递归调用但我想在函数内仅使用一次递归调用来完成此操作怎样才能做到呢要实现使用
使用 Tabula 通过 Python 读取 pdf 时出现 Java 错误

我已经安装了 tabula 库用于使用 python 将 pdf 读取到 pandas 数据框中但是当我运行代码时 import tabula df tabula read pdf sample1 pdf pages 1 我得到了例外
在 pandas 条形图中设置 xticks

我在下面的第三个示例图中遇到了这种不同的行为为什么我能够正确编辑 x 轴的刻度pandas line and area 情节但不与bar 修复一般第三个示例的最佳方法是什么 import numpy as np import pan
pandas Wide_to_long 后缀参数

我对在 pandas 中使用 Wide to long 时的参数有疑问有一个参数叫suffix我不明白在文档中它说后缀 str 默认 d 捕获所需后缀的正则表达式 d 捕获数字后缀没有数字的后缀可以用否定字符类 D 指定您还可以进
python 3 argparse 调用函数

我想在 python3 中创建一个类似命令行类似 shell 的界面 Argparse 似乎负责解析和显示帮助错误消息根据argparse 的 python3 文档 https docs python org 3 5 library
Pandas 连接问题：列重叠但未指定后缀

我有以下数据框 print df a mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 print df b
在 iPython/pandas 中绘制多条线会生成多个图

我试图了解 matplotlib 的状态机模型但在尝试在单个图上绘制多条线时遇到错误据我了解以下代码应该生成包含两行的单个图 import pandas as pd import pandas io data as web aapl
如何从 pandas 数据框中的列中删除字符串值

我正在尝试编写一些代码以逗号分隔数据帧列中的字符串因此它成为一个列表并从该列表中删除某个字符串如果存在删除不需要的字符串后我想再次以逗号加入列表元素我的数据框如下所示 df Column1 Column2 0 a a b c
将 pandas 数据帧拆分为子数据帧列表的最快方法

我有一个大数据框df我有完整的清单indices中的独特元素df index 我现在想创建一个由元素索引的所有子数据帧的列表indices 具体来说 list df df loc x for x in indices 运行这个命令需要很长时
Django 2.0 haystack 更新索引，重建索引抛出错误

我使用 django 2 0 和 haystack whoosh 作为搜索我按照文档中的说明进行配置发生的问题是当我跑步时 manage py rebuild index它显示此错误 Traceback most recent call
使用 pandas.date_range() 生成多个日期时间，每周两个日期

我在用着pd date range start date end date freq W MON 每周一生成每周频率日期时间start date 2017 01 01 and end date 2017 12 31 这意味着每月大约生成 4
从字典的元素创建 Pandas 数据框

我正在尝试从字典创建一个 pandas 数据框字典设置为 nvalues y1 1 2 3 4 y2 5 6 7 8 y3 a b c d 我希望数据框仅包含 y1 and y2 到目前为止我可以使用 df pd DataFrame fr
使用 Python 3 动态插入到 sqlite

我想使用 sqlite 写入多个表但我不想提前手动指定查询有数十种可能的排列例如 def insert sqlite tablename data list global dbc dbc execute insert into tab

随机推荐

Numpy 图像数组：如何有效地从 RGB 切换到 Hex

我一直在使用嵌套 for 循环将 RGB 图像转换为十六进制值的图像数组但对于大图像来说太慢了有谁知道可以帮助我从 RGB 切换回 HEX 的快速方法和或库编辑 ragingSloth 这是我想出的但对于我的需要来说太慢了 def
如何在 Travis CI 上安装某些东西而不超时？

我正在尝试测试 travis ci org 上构建的包但 pip install scipy 遇到超时 Installing collected packages scipy Running setup py install for sc
如何从 Excel 单元格获取完整值，而不是显示的（四舍五入）值？

我在从工作表的单元格检索确切值时遇到问题如果我打开文件单元格有一个十进制数仅显示 4 位小数但如果我单击特定单元格则该值会不同有 6 位小数我知道这是应用于单元格的设置以便仅显示 4 位小数现在我尝试使用 ClosedXM
WPF中如何移动焦点？

我想知道是否有办法将焦点从当前控件移至 WPF 中 TabIndex 分配的控件上的其他控件例子我有 TabIndex 1 到 5 的控件有没有办法将焦点从 1 跳转到 5
从 C# 类设置 Gridview“标题”的样式

我正在尝试在 C 文件中设置 ASP Net GridView 标题的样式这是我返回样式化 GridView 的方法 private GridView setupGridView string caption var gview new
检查context.Request.Body的条件是azure api管理策略中的JArray或JObject

我正在使用 Azure API 管理策略表达式将供应商值发送到每个帖子对后端 API 的放置和删除请求我编写了一个代码当请求类型为 JObject 时该代码工作正常但我有一些请求可以是 JArray 类型的情况在这种情况下它会抛
如何在IIS7中禁用应用程序池空闲超时？

如果我将空闲超时设置为0 它会被禁用吗是的将空闲超时值设置为零将禁用空闲超时奇怪的是这没有记录在 MS 文档中但我的证据来自 IIS 设置架构如果您查看了 IIS 设置架构 C Windows System32 inetsrv
如何安装：OpenSSL + WAMP

这里有人有关于如何在我的本地开发计算机上获取 SSL 的清晰详细的步骤吗我已在 c wamp 上安装了最新版本的 WAMP 2 2c 我在网上找到的说明在大多数情况下似乎已经过时并且缺乏正确完成工作所需的详细信息指南 WampServ
wl-pprint-extras 中的可选空格和多个替代项

是否有一种好的可接受的方法来获得两种以上的替代布局特别是支持可选空间的方式特别是我可能想通过以下三种方式之一打印列表 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 按照该优先顺序您可以先尝试一种替代方案然后再尝试另
从 FireWire 获取视频流

我正在尝试通过 FireWire 将摄像机 Sony HVR Z1E 中的视频流式传输到我的计算机传入的图片流应由一些期望 CVMat 格式来自 openCV 的函数进一步处理好吧我现在的问题是我不知道如何获取流好吧 openC
Istio 分布式跟踪与 Jaeger 不起作用

我正在尝试设置本地 k8s 集群minikube已安装istio我在使用 Jaeger 启用分布式跟踪时遇到问题我有3个微服务A gt B gt C 我正在传播所需的所有标头 x request id x b3 traceid x b3
escapeshellarg 和 escapeshellcmd 有什么区别？

PHP 有 2 个密切相关的函数 escapeshellarg http php net escapeshellarg and escapeshellcmd http php net escapeshellcmd 它们似乎都做类似的事情即
super() 并更改协作方法的签名

在多重继承设置中例如所列出的我该如何使用super 并处理层次结构中的类之间函数签名发生变化的情况即我可以重写这个例子在 python3 中来使用super 例子取自文章super 被视为有害文章 https fuhm net s
为什么在这个 Perl 示例中，defineed sdf 返回 true？

我在 Perl 中尝试了这个例子有人可以解释为什么这是真的吗 if defined sdf print true 它打印true sdf 可以是任何名称另外如果定义了 sdf 函数并且返回 0 则不会打印任何内容 print sdf
C++ 中的赋值运算符返回右值还是左值？

C 中的赋值运算符返回右值还是左值如果它是左值那么两个参数中的哪一个将在这里递增 a b 它返回一个lvalue 根据第 5 17 条赋值运算符和复合赋值运算符从右到左分组全部都需要一个可修改的左值作为他们的左边操作数并返回引
SQLServer连接预登录

在 SQL Server 2000 中使用 Hibernate 时出现以下错误 Dec 12 2015 12 54 20 AM com microsoft sqlserver jdbc SQLServerConnection Prelogi
sys.dm_exec_sql_text 如何工作？

你能解释一下原因吗 select from sys dm exec sql text sql handle 抛出错误无效的列名 sql handle 但是 select from sys sysprocesses cross apply
如何定义具有多个 OR 运算符的正则表达式，其中每个术语都包含空格前缀和后缀？

我正在准备数据提取任务我需要删除一组术语每个源记录字符串中可以没有部分或全部出现有超过 100 000 条目标记录我想避免执行单个术语匹配替换操作因为 a 要删除的术语列表可能会增长并且 b 一次执行一个术语的当前匹配替换
如何在 R 中获得特定的彩色比例？

我想使用看起来有点常见的色标看看here https stackoverflow com questions 8421536 a true heat map in r and here http tctechcrunch2011 file
按月计算 cumsum() 但如果该月没有数据则重复这些值

我有数据 df date col1 col2 0 1 16 2016 apple 20 1 2 1 2016 apple 40 2 2 2 2016 pear 60 3 3 13 2016 apple 10 4 5 4 2016 apple

按月计算 cumsum() 但如果该月没有数据则重复这些值

按月计算 cumsum() 但如果该月没有数据则重复这些值 的相关文章

随机推荐

热门标签

按月计算 cumsum() 但如果该月没有数据则重复这些值的相关文章