数据操作 startdate enddate python pandas

2024-05-03

我有一个促销描述数据集，其中包含有关正在运行的各种促销活动及其开始日期-结束日期的信息：

promo        item      start_date      end_date 

Buy1-get 1     A        2015-01-08    2015-01-12

Buy1-get 1     A        2015-02-16    2015-02-20

Buy1-40% off   B        2016-05-08      2016-05-09

现在我想组织我的数据以供后续分析，这样我只有单个变量日期及其促销信息。

date            item       Promo

2015-01-08       A         Buy1-get 1 

2015-01-09       A         Buy1-get 1 
2015-01-10       A         ......
2015-01-11       ....
2015-01-12

2015-02-16       A         Buy1-get 1 
2015-02-17       A         Buy1-get 1 
2015-02-18       ....      .......
2015-02-19       .....

..........
2016-05-09       B         Buy1-40% off

任何帮助将非常感激。

您可以使用concat http://pandas.pydata.org/pandas-docs/stable/generated/pandas.concat.html all Series是由创建的date_range http://pandas.pydata.org/pandas-docs/stable/generated/pandas.date_range.html with itertuples http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.itertuples.html进而join http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.join.html列promo and item:

df1 = pd.concat([pd.Series(r.Index,
                           pd.date_range(r.start_date,r.end_date)) for r in df.itertuples()])
        .reset_index()
df1.columns = ['date','idx']
df1 = df1.set_index('idx')
df1 = df1.join(df[['item','promo']]).reset_index(drop=True)
print (df1)
         date item         promo
0  2015-01-08    A    Buy1-get 1
1  2015-01-09    A    Buy1-get 1
2  2015-01-10    A    Buy1-get 1
3  2015-01-11    A    Buy1-get 1
4  2015-01-12    A    Buy1-get 1
5  2015-02-16    A    Buy1-get 1
6  2015-02-17    A    Buy1-get 1
7  2015-02-18    A    Buy1-get 1
8  2015-02-19    A    Buy1-get 1
9  2015-02-20    A    Buy1-get 1
10 2016-05-08    B  Buy1-40% off
11 2016-05-09    B  Buy1-40% off

另一种解决方案是melt http://pandas.pydata.org/pandas-docs/stable/generated/pandas.melt.html and 通过重采样进行分组 http://pandas.pydata.org/pandas-docs/stable/whatsnew.html#groupby-syntax-with-window-and-resample-operations:

df1 = df.reset_index().rename(columns={'index':'idx'})
df1 = pd.melt(df1, id_vars='idx', value_vars=['start_date','end_date'], value_name='date')
        .set_index('date')
df1 = df1.groupby('idx')
         .resample('d')
         .ffill()
         .reset_index(level=1)
         .drop(['idx','variable'], axis=1)
df1 = df1.join(df[['item','promo']]).reset_index(drop=True)
print (df1)
         date item         promo
0  2015-01-08    A    Buy1-get 1
1  2015-01-09    A    Buy1-get 1
2  2015-01-10    A    Buy1-get 1
3  2015-01-11    A    Buy1-get 1
4  2015-01-12    A    Buy1-get 1
5  2015-02-16    A    Buy1-get 1
6  2015-02-17    A    Buy1-get 1
7  2015-02-18    A    Buy1-get 1
8  2015-02-19    A    Buy1-get 1
9  2015-02-20    A    Buy1-get 1
10 2016-05-08    B  Buy1-40% off
11 2016-05-09    B  Buy1-40% off

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

数据操作 startdate enddate python pandas 的相关文章

Python 中的舍入浮点问题

我遇到了 np round np around 的问题它没有正确舍入我无法包含代码因为当我手动设置值而不是使用我的数据时返回有效但这是输出 In 177 a Out 177 0 0099999998 In 178 np rou
处理 Python 行为测试框架中的异常

我一直在考虑从鼻子转向行为测试摩卡柴等已经宠坏了我到目前为止一切都很好但除了以下之外我似乎无法找出任何测试异常的方法 then It throws a KeyError exception def step impl contex
Python getstatusoutput 替换不返回完整输出

我发现了这个很棒的替代品getstatusoutput Python 2 中的函数在 Unix 和 Windows 上同样有效不过我觉得这个方法有问题output被构建它只返回输出的最后一行但我不明白为什么任何帮助都是极好的 def
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
Pandas Merge (pd.merge) 如何设置索引和连接

我有两个 pandas 数据框 dfLeft 和 dfRight 以日期作为索引 dfLeft cusip factorL date 2012 01 03 XXXX 4 5 2012 01 03 YYYY 6 2 2012 01 04 XX
在Python中连接反斜杠

我是 python 新手所以如果这听起来很简单请原谅我我想加入一些变量来生成一条路径像这样 AAAABBBBCCCC 2 2014 04 2014 04 01 csv Id TypeOfMachine year month year
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
从Python中的字典列表中查找特定值

我的字典列表中有以下数据 data I versicolor 0 Sepal Length 7 9 I setosa 0 I virginica 1 I versicolor 0 I setosa 1 I virginica 0 Sepal
如何通过 TLS 1.2 运行 django runserver

我正在本地 Mac OS X 机器上测试 Stripe 订单我正在实现这段代码 stripe api key settings STRIPE SECRET order stripe Order create currency usd em
如何通过索引列表从 dask 数据框中选择数据？

我想根据索引列表从 dask 数据框中选择行我怎样才能做到这一点 Example 假设我有以下 dask 数据框 dict A 1 2 3 4 5 6 7 B 2 3 4 5 6 7 8 index x1 a2 x3 c4 x5 y6 x
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
Cython 和类的构造函数

我对 Cython 使用默认构造函数有疑问我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
加快网络抓取速度

我正在使用一个非常简单的网络抓取工具抓取 23770 个网页scrapy 我对 scrapy 甚至 python 都很陌生但设法编写了一个可以完成这项工作的蜘蛛然而它确实很慢爬行 23770 个页面大约需要 28 小时我看过scr
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
Python3 在 DirectX 游戏中移动鼠标

我正在尝试构建一个在 DirectX 游戏中执行一些操作的脚本除了移动鼠标之外我一切都正常是否有任何可用的模块可以移动鼠标适用于 Windows python 3 Thanks I used pynput https pypi or
如何在 pygtk 中创建新信号

我创建了一个 python 对象但我想在它上面发送信号我让它继承自 gobject GObject 但似乎没有任何方法可以在我的对象上创建新信号您还可以在类定义中定义信号 class MyGObjectClass gobject GO
将 Python 中的日期与日期时间进行比较

所以我有一个日期列表 datetime date 2013 7 9 datetime date 2013 7 12 datetime date 2013 7 15 datetime date 2013 7 18 datetime date
使用for循环时如何获取前一个元素？ [复制]

这个问题在这里已经有答案了可能的重复 Python 循环内的上一个和下一个值 https stackoverflow com questions 1011938 python previous and next values inside
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s

随机推荐

System.out 什么时候不会出现在 Java 控制台中？

我明白任何要标准化的东西 System out 将出现在 Java 控制台窗口中启用时我在某个地方发现在某些情况下可能无法尝试这样做例如在 Swing 应用程序中是这样吗基本上什么情况或设置我不希望在控制台中看到标准输出例
用户空间栈和堆的内存布局

最近在研究OS 网上有一张图展示了用户空间和内核空间的内存布局以及栈堆等的布局在这个图中我看到栈位于用户空间的最高内存地址高于堆数据段等为了检查这一点我在调试视图下使用了 vs2012 中的内存观察器窗口这是我的代码 in
Java并发中的AbstractQueuedSynchronizer

What is AbstractQueuedSynchronizer在Java中concurrent locks包用来做什么有人可以阐明它的方法吗doAcquireInterruptibly and parkAndCheckInterru
在 Go 中将 float 转换为 int 时如何舍入到最近的 int

将 float 转换为 int 时小数点将被丢弃有什么干净的方法可以将其四舍五入到最接近的整数 x int 3 6 应等于 4 而不是 3 int f 0 5 如果 gt 5 将导致向上舍入
让线程休眠的更好方法

我一直在编写有关 Java 8 中 2D 图形的教程当时 NetBeans 给了我一个提示 Thread Sleep会影响性能然而尽管我已经找到了几种更好的方法但我还没有找到一种方法来包含它们而不弄乱代码 package platf
SQL Server 超时是否被记录？

SQL Server 超时特别是 SELECT 查询是否记录在 ERRORLOG 文件中背景是一位客户的网站偶尔会出现请求超时消息我认为超时是由数据库超时引起的相关错误日志中没有超时错误不可以您需要使用 SQL Profi
如何快速使用 CoreLocation？

我尝试过将 CoreLocation 与我的 Swift 应用程序一起使用但没有运气我有以下非常简单的代码我已经链接了 CoreLocation 库 import UIKit import CoreLocation UIApplica
如何在此彩票功能中显示所有猜中的号码？

我用 JS 创建了一些简单的彩票功能一切正常我面临的唯一问题是如何显示所有已猜到的数字我有 6 个独立的空间其中必须提供数字我的目标是显示随机空间中的滚动数字它必须仅在 6 个空间之一中提供这对我有用但只显示 1 个数字我
Phonegap html5视频无法播放

我正在尝试在 iPad 上的phonegap 应用程序中播放视频该视频给了我错误 MEDIA ERR SRC NOT SUPPORTED 我尝试播放的视频不是本地的当我在该视频上使用curl I 时这是它带来的信息 HTTP 1 1
如何使错误冒泡，以便可以在同一个 try/catch 块中捕获它们？

我有一个带有抛出错误的函数的对象 myObj ini function this f f function throw new Error 但我只想捕获创建对象的异常 try var o new myObj catch err alert
音频端播放新文件

我有一个webapp https radio repjesus com当您使用 ajax jquery 单击链接时加载并播放音轨一切正常但当曲目结束时曲目将设置为循环并且这种情况可以永远持续下去我希望播放器从数据库中自动加载随机曲
撤消 git merge（尚未推送）

我只是将一些更改提交到我的功能分支之一 feedback tab 然后签出 master 并将它们合并到那里我实际上打算将它们合并到我的开发分支中现在 master 领先于 origin master 其远程 17 个提交我还没有
git commit 给出错误：空提交集已通过

当尝试恢复到以前的提交时我尝试了 git revert no commit 0766c053 HEAD 然而这给出了一个错误 empty commit set passed 问题该错误是什么意思以及出了什么问题revert命令删除
app_offline.htm 文件不起作用

我已经为此奋斗了很多年但我就是无法让它发挥作用我去过的每个博客网站都说您无需在 IIS 中执行任何操作但这并不正确因为有多个网站配置例如应用程序虚拟目录简单的 php asp 网站虚拟网站有人可以向我解释一下 IIS7
是否可以从 Visual Studio Online (VS Team Services) 编辑我的代码？

I have 视觉工作室在线 http www visualstudio com products visual studio online overview vs 现在是 VS Team Services 帐户作为我的 MSDN 订阅的一
如何在 Perl 中访问名称包含在变量中的常量？

我有一组用 Perl 声明的常量 use constant C1 gt 111 use constant C2 gt 222 use constant C9 gt 999 my which constant C2 我如何构造一个 Perl
WiX - 根据环境将编译后的 web.config 复制到网站根目录

作为 WiX 安装的一部分我将所有转换编译的 web config 文件复制到安装目录编译后的 web config 的名称格式为 web ENV config 在我的安装 UI 中我创建了一个自定义对话框在其中解析 ENV 并填
Bash 变量：区分大小写？

Bash shell 脚本区分大小写吗是可变的date与DATE 是的它区分大小写就像 UNIX 的其余部分一样 date and DATE是两个不同的变量 makefile and Makefile是两个不同的文件 h and H是
前导点的自动完成功能无法快速工作

当我尝试在 swift 中使用前导点语法时我没有得到任何自动完成建议是否没有实现此自动完成功能或者是我的 Xcode 版本 6 3 1 有问题例如当我尝试这样的事情时 let col UIColor whiteColor 在我
数据操作 startdate enddate python pandas

我有一个促销描述数据集其中包含有关正在运行的各种促销活动及其开始日期结束日期的信息 promo item start date end date Buy1 get 1 A 2015 01 08 2015 01 12 Buy1 get 1

数据操作 startdate enddate python pandas

数据操作 startdate enddate python pandas 的相关文章

随机推荐

热门标签