如何根据时间条件进行 cumsum - 对 pandas 进行重新采样？

2024-03-06

我有一个如下所示的数据框

df = pd.DataFrame({
   'subject_id':[1,1,1,1,1,1],
   'time_1' :['2173-04-03 10:00:00','2173-04-03 10:15:00','2173-04-03 
              10:30:00','2173-04-03 10:45:00','2173-04-03 11:05:00','2173- 
              04-03 11:15:00'],
   'val' :[5,6,5,6,6,6]
})

我想找到按顺序出现的值的总持续时间。下面的例子将帮助您理解

从上面的截图可以看出6依次发生从10:45 to 23:59而其他值（尽管可以是任何实时值）根本不按顺序排列。

我做了这样的事情但没有给出预期的输出。它汇总了所有值

df['time_1'] = pd.to_datetime(df['time_1'])
df['seq'] = df['val'] == df['val'].shift(-1)

s=pd.to_timedelta(24,unit='h')-(df.time_1-df.time_1.dt.normalize())
df['tdiff'] =df.groupby(df.time_1.dt.date).time_1.diff().shift(-1).fillna(s).dt.total_seconds()/3600
df.groupby([df['seq'] == True])['tdiff'].cumsum() # do cumulative sum only when the values are in sequence

如何根据条件对组进行累计求和？

我希望我的输出如下所示。你看13:15因为我们在接下来的数据中看不到任何其他价值13:15从第一次出现开始的小时6这是在10:45 (24:00 hr - 10:45 gives 13:15)

测试数据框

df = pd.DataFrame({
     'subject_id':[1,1,1,1,1,1,1,1,1,1,1],
     'time_1' :['2173-04-03 12:35:00','2173-04-03 12:50:00','2173-04-03 
     12:59:00','2173-04-03 13:14:00','2173-04-03 13:37:00','2173-04-04 
     11:30:00','2173-04-05 16:00:00','2173-04-05 22:00:00','2173-04-06 
     04:00:00','2173-04-06 04:30:00','2173-04-06 08:00:00'],
     'val' :[5,5,5,5,10,5,5,8,3,4,6]
   })

IIUC，尝试使用：

m=df.groupby(df.val.ne(df.val.shift()).cumsum()).first().rename_axis(None)
c=pd.to_timedelta(24,unit='h')-(m.time_1-m.time_1.dt.normalize())
final=m.assign(cumsum=m.time_1.diff().shift(-1).fillna(c))

   subject_id              time_1  val   cumsum
1           1 2173-04-03 10:00:00    5 00:15:00
2           1 2173-04-03 10:15:00    6 00:15:00
3           1 2173-04-03 10:30:00    5 00:15:00
4           1 2173-04-03 10:45:00    6 13:15:00

Details:

df.val.ne(df.val.shift()).cumsum()评估每行的值是否发生变化，并将相同的值分组到一个组中。

基于这个组，我们进行分组并获得每个组的第一个条目。然后我们发现diff() from time_1并在上方移动 1 个位置以与顶部索引对齐。 fillna 与 24 小时的差异。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

pandas

pandasgroupby

pythondatetime

如何根据时间条件进行 cumsum - 对 pandas 进行重新采样？的相关文章

使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
立体太阳图 matplotlib 极坐标图 python

我正在尝试创建一个与以下类似的简单的立体太阳路径图 http wiki naturalfrequent com wiki Sun Path Diagram http wiki naturalfrequency com wiki Sun Pa
datetime.datetime.now() 返回旧值

我正在通过匹配日期查找 python 中的数据存储条目我想要的是每天选择今天的条目但由于某种原因当我将代码上传到 gae 服务器时它只能工作一天第二天它仍然返回相同的值例如当我上传代码并在 07 01 2014 执行它时它
Python 2：SMTPServerDisconnected：连接意外关闭

我在用 Python 发送电子邮件时遇到一个小问题 me my email address you recipient s email address me email protected cdn cgi l email protectio
Python beautifulsoup 仅限 1 级文本

我看过其他 beautifulsoup 得到相同级别类型的问题看来我的有点不同这是网站我正试图拿到右边那张桌子请注意表的第一行如何展开为该数据的详细细分我不想要那个数据我只想要最顶层的数据您还可以看到其他行也可以展开但在本例
从Python中的字典列表中查找特定值

我的字典列表中有以下数据 data I versicolor 0 Sepal Length 7 9 I setosa 0 I virginica 1 I versicolor 0 I setosa 1 I virginica 0 Sepal
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
Docker 中的 Python 日志记录

我正在 Ubuntu Web 服务器上的 Docker 容器中测试运行 python 脚本我正在尝试查找由 Python Logger 模块生成的日志文件下面是我的Python脚本 import time import logging
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
pip 列出活动 virtualenv 中的全局包

将 pip 从 1 4 x 升级到 1 5 后pip freeze输出我的全局安装系统软件包的列表而不是我的 virtualenv 中安装的软件包的列表我尝试再次降级到 1 4 但这并不能解决我的问题这有点类似于这个问题 http
从 NumPy ndarray 中选择行

我只想从 a 中选择某些行NumPy http en wikipedia org wiki NumPy基于第二列中的值的数组例如此测试数组的第二列包含从 1 到 10 的整数 gt gt gt test numpy array nump
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
在本地网络上运行 Bokeh 服务器

我有一个简单的 Bokeh 应用程序名为app py如下 contents of app py from bokeh client import push session from bokeh embed import server do
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
使用for循环时如何获取前一个元素？ [复制]

这个问题在这里已经有答案了可能的重复 Python 循环内的上一个和下一个值 https stackoverflow com questions 1011938 python previous and next values inside
Django-tables2 列总计

我正在尝试使用此总结列中的所有值文档 https github com bradleyayers django tables2 blob master docs pages column headers and footers rst 但页
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street
在 JavaScript 函数的 Django 模板中转义字符串参数

我有一个 JavaScript 函数它返回一组对象 return Func id name 例如我在传递包含引号的字符串时遇到问题 Dr Seuss ABC BOOk 是无效语法 I tried name safe 但无济于事有什么解

随机推荐

C# foreach - 每次迭代都会计算集合吗？ [复制]

这个问题在这里已经有答案了可能的重复 foreach 在循环函数结果时如何工作 https stackoverflow com questions 1632810 how does foreach work when looping th
erlang - 如何将元组内容与 qlc 和 mnesia 匹配？

我有一个记录该记录的记忆表 record peer peer key key is the tuple FileId PeerId last seen last event uploaded 0 downloaded 0 left 0 ip
Flutter 为 AppLocalization.of(context) 返回 null

我正在使用 Flutter 构建一个 Web 应用程序我想在我的新应用程序上使用 flutter 的国际化功能我正在关注Flutter 教程 https flutter dev docs development accessibilit
C++ 11 获取 std::function 的指针

我想存储和识别std function中的对象std map 为了识别我想使用std function target 我无法从中获取指针std function target如果我使用std bind绑定到类的成员函数 include
StickyHeaderIndices 在倒置的 FlatList 中无法正常工作

我对本机反应还是个新手正在开发一个聊天应用程序我在用
当特定属性更改时如何更新 NSManagedObject？

想象一下我有一个核心数据对象产品每个产品都有一个quantity price and total属性 Total 是为了提高从表中检索项目时的效率我知道可能有一种有效的方法可以使用获取的属性来获取计算值但这只是一个示例这个答案不是
EF Code First 和数据库视图

我刚刚开始使用 Code First 查看数据库视图并尝试决定是否应该使用它们 Here https stackoverflow com a 10102679 1600894Ladislav 建议对表和 Db View 使用 NotMap
确定 .class 文件是否使用调试信息进行编译？

如何确定任何 Java class 文件是否使用调试信息进行编译我如何准确判断使用了哪个 g source lines vars 选项如果您在命令行上那么 javap l 将显示 LineNumberTable 和 LocalVari
如何设计可扩展的软件（插件架构）？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我需要一些资源来讨论如何设计可扩展的软件即以便其他人可以编写为其添加功能的附加组件插件你有什么建议吗有没有讨论这个主题的书我
发布了未知的位图参考 - 在 android 中设置标记

CODE Update marker position and icon private void setMarker synchronized OBJ LOCK if mLatitude 0 0 mLongitude 0 0 mRotat
Erlang：如何在控制Erlang进程崩溃时使连接的外部操作系统进程自动终止？

我正在使用 Erlang 端口读取 Linux 进程的输出我希望每当我连接的 Erlang 进程终止时 Linux 进程就会自动终止从文档来看在我看来这应该自动发生但事实并非如此最小的例子将其放入文件 test erl 中 mo
在 MATLAB 中使用颜色直方图进行基于内容的图像检索和精确召回图

到目前为止我已经能够在 CBIR 系统中绘制灰度图像的精确召回图但是我想知道如何对 RGB 图像执行相同的过程 My code Inp1 rgb2gray imread D visionImages c1 1 ppm figure i
如何使用最新R8 Shrinker版本

由于错误我使用了 R8 Shrinker 的本地 jar 文件如 R8 团队推荐并将类路径添加到顶部gradle build classpath files R8 jar 现在无论 Android Studio 有何更新 Gradl
Rails Chartkick Gem 加载图表时出错，未找到适配器

我有一个 Rails 3 2 14 应用程序我正在使用chartkick and groupdategem 尝试生成一些基本图表当我加载视图时出现错误 Error Loading Chart No adapter found 我的视图代
SignalR - 建立连接需要相当长的时间

我刚刚开始使用 SignalR 进行实时更新建立连接后我需要执行一些操作所以我在 done 方法中编写了该代码我面临的问题是建立连接需要一些时间因此我无法执行我想要执行的操作以下是我的 js 代码片段 function Prox
如何通过 Google 应用程序脚本将一位拥有多个孩子的父母发送到 firebase？

我有 G AppScript 代码应该将项目批次作为父文章代码的子项如下图所示谷歌表格数据表目标结果我尝试写下面的链接 G AppS脚本 function writeDataToFirebase var ss Spreadsh
javax.naming.AuthenticationException

我正在尝试使用我的 Windows 凭据和 NTLM 为 ActiveDirectory 创建上下文客户端和服务器都是 Windows 这是我的代码 public void func try URL configURL getClass
Resttemplate 在 GET 请求后挂起。经过多次测试后，我怀疑标题，也许特别是内容长度

最新编辑经过对许多不同服务的多次测试后我怀疑挂起是标头的原因也许是内容长度标头但是我不知道为什么它会这样我非常需要建议我尝试使用返回较少标头的服务但它不会挂起我有一个奇怪的问题我正在使用 Resttemplate 通过 G
AngularJS 两个具有相同模块名称的指令

是否可以创建两个具有相同模块名称的指令有了这两个文件 angular module fabTemplate directive fabGallery function and angular module fabTemplate dire
如何根据时间条件进行 cumsum - 对 pandas 进行重新采样？

我有一个如下所示的数据框 df pd DataFrame subject id 1 1 1 1 1 1 time 1 2173 04 03 10 00 00 2173 04 03 10 15 00 2173 04 03 10 30 00 2

如何根据时间条件进行 cumsum - 对 pandas 进行重新采样？

如何根据时间条件进行 cumsum - 对 pandas 进行重新采样？ 的相关文章

随机推荐

热门标签

如何根据时间条件进行 cumsum - 对 pandas 进行重新采样？的相关文章