Pandas 按持续时间删除行

2024-01-03

I would like to drop dataframe rows by time condition (ignoring date). My data contains around 100 million rows. I have around 100 columns and each column has different sampling frequency.

我准备了以下考虑到不同采样频率的代码片段：

import pandas as pd

# leave_duration=0.01 seconds
# drop_duration=0.1 seconds

i = pd.date_range('2018-01-01', periods=1000, freq='2ms')
i=i.append(pd.date_range('2018-01-01', periods=1000, freq='3ms'))
i=i.append(pd.date_range('2018-01-01', periods=1000, freq='0.5ms'))
df = pd.DataFrame({'A': range(len(i))}, index=i)
df=df.sort_index()
print(df)
# drop by duration....

在这个简单的示例中，数据持续约 1 秒，并具有 3 个不同的采样频率。目标是删除持续时间（例如）0.1 秒的行并留下持续时间（例如）0.01 秒的行。我怎样才能用一条线做到这一点？

by df=df.loc['2018-01-01 00:00:00.000000 ':'2018-01-01 00:00:00.000500 ']你将得到新的 df ，数据介于两者之间2018-01-01 00:00:00.000000 and 2018-01-01 00:00:00.000500现在您可以应用过滤器来查找所需的日期

import pandas as pd

# leave_duration=0.01 seconds
# drop_duration=0.1 seconds

i = pd.date_range('2018-01-01', periods=1000, freq='2ms')
i=i.append(pd.date_range('2018-01-01', periods=1000, freq='3ms'))
i=i.append(pd.date_range('2018-01-01', periods=1000, freq='0.5ms'))
df = pd.DataFrame({'A': range(len(i))}, index=i)
df=df.sort_index()
print(df)

#filter data between 2018-01-01 00:00:00.000000 ':'2018-01-01 00:00:00.000500
df=df.loc['2018-01-01 00:00:00.000000 ':'2018-01-01 00:00:00.000500 ']
print(df)

输出：应用数据过滤器之前

                               A
2018-01-01 00:00:00.000000     0
2018-01-01 00:00:00.000000  2000
2018-01-01 00:00:00.000000  1000
2018-01-01 00:00:00.000500  2001
2018-01-01 00:00:00.001000  2002
...                          ...
2018-01-01 00:00:02.985000  1995
2018-01-01 00:00:02.988000  1996
2018-01-01 00:00:02.991000  1997
2018-01-01 00:00:02.994000  1998
2018-01-01 00:00:02.997000  1999

[3000 rows x 1 columns]

应用日期过滤器后：


                               A
2018-01-01 00:00:00.000000     0
2018-01-01 00:00:00.000000  2000
2018-01-01 00:00:00.000000  1000
2018-01-01 00:00:00.000500  2001

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

datetime

Pandas 按持续时间删除行的相关文章

Jupyter Notebooks 不显示进度条

我正在尝试在 Jupyter 笔记本中显示进度条这是一台新电脑我通常做的事情似乎不起作用 from tqdm import tqdm notebook example iter 1 2 3 4 5 for rec in tqdm not
将 numpy 数组写入文本文件的速度

我需要将一个非常高的两列数组写入文本文件而且速度非常慢我发现如果我将数组改造成更宽的数组写入速度会快得多例如 import time import numpy as np dataMat1 np random rand 1000
为什么我的代码不能根据字典解码加密字符串？

我有一本字典其中包含代表字母的键和值例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码并将该字符串转换为一个列表其中每个项目都是一个单词我需要根据字典中的项目来解决它代码示例是 wo
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
从服务器获取当前日期时间并将其转换为 C# 中的本地时间

帮助我有一台服务器其运行时间为 GMT 07 00 我的当地时间是 GMT 05 30 小时我需要从服务器获取当前日期和时间并将该日期和时间转换为我的当地时间我已经尝试了很多代码但仍然没有找到连续的方法来做到这一点有人可以帮我
查找模块中显式定义的函数 (python)

好的我知道您可以使用 dir 方法列出模块中的所有内容但是有什么方法可以仅查看该模块中定义的函数吗例如假设我的模块如下所示 from datetime import date datetime def test return Thi
如何在 Python 3 中循环遍历集合，同时从集合中删除项目

这是我的情况我有一个list set 哪个并不重要 movieplayer我想调用的对象 preload 功能开启该预加载函数可以立即返回但希望将来返回一点我想存储这个电影播放器集合表明它们尚未预加载然后循环它们调用prel
WindowsError：[错误 126] 使用 ctypes 加载操作系统时

python代码无法在Windows 7平台上运行 def libSO lib ctypes cdll LoadLibrary ConsoleApplication2 so lib cfoo2 1 3 当我尝试运行它时得到来自python
Python Fabric - 未找到主机。请指定用于连接的（单个）主机字符串：

如何获取找不到主机请指定用于连接的单个主机字符串面料如何解决 def bootstrap host ec2 54 xxx xxx xxx compute 1 amazonaws com env hosts host env use
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
Pandas 滚动窗口 Spearman 相关性

我想使用滚动窗口计算 DataFrame 两列之间的 Spearman 和或 Pearson 相关性我努力了df corr df col1 rolling P corr df col2 P为窗口尺寸但我似乎无法定义该方法添加meth
与 while 循环一样，如何跳过 for 循环中的步骤？

我尝试像 while 循环一样跳过 for 循环中的几个步骤在 while 循环中步骤根据特定条件进行调整如下面的代码所示 i 0 while i lt 10 if i 3 i 5 else print i i i 1 result
在Python中计算内存碎片

我有一个长时间运行的进程不断分配和释放对象尽管正在释放对象但 RSS 内存使用量会随着时间的推移而增加如何计算发生了多少碎片一种可能性是计算 RSS sum of allocations 并将其作为指标即便如此我该如何计算分母
Python 惰性迭代器

我试图了解迭代器表达式如何以及何时被求值以下似乎是一个懒惰的表达 g i for i in range 1000 if i 3 i 2 然而这个在构造上失败了 g line strip for line in open xxx r if
Pandas style.bar 颜色基于条件？

如何渲染其中一列的 Pandas dfstyle bar color属性是根据某些条件计算的 Example df style bar subset before after color ff781c vmin 0 0 vmax 1 0 而
将文本注释到轴并对齐为圆

我正在尝试在轴上绘制文本并将该文本与圆对齐更准确地说有一些具有不同坐标 x y 的点位于该圆内并使用以下命令创建 ax scatter x y s 100 我想用圆圈连接并标记每个点 Cnameb 文本的坐标由 xp yp 定义因此
解析根元素内元素之间的 XML 文本

我正在尝试用 Python 解析 XML 以下是 XML 结构的示例 a aaaa1 b bbbb b aaaa2 a
对数据帧的每 2 小时数据进行 Groupby

我有一个数据框 Time T201FN1ST2010 T201FN1VT2010 1791 2017 12 26 00 00 00 854 69 0 87 1792 2017 12 26 00 20 00 855 76 0 87 1793
如何使用 matplotlib 为圆柱体的每个单独面添加颜色

我正在尝试为圆柱体的每个面着色但是我不确定如何进行我尝试了以下方法 for i in range 10 col append for i in range 10 for j in range 20 col i append plt cm
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014

随机推荐

如何在iPhone的phonegap应用程序中的javascript中读取sqlite3的数据

我正在 iPhone 的phonegap 中开发一个应用程序其中我有一个sqlite3 数据库其中包含纬度和经度值以及相应的区域名称我已在应用程序中复制了 sqlite 数据文件我需要从sqlite中获取数据并将表中的数据显示在视图
重载运算符<<以接受模板函数

我试图能够使用函数编写可扩展语法但似乎找不到接受模板函数的正确语法我使用的是 Visual C 2008 它将接受与模板函数相同类型的变量或类似的非模板函数但不接受模板函数本身错误 1 错误 C2679 二进制 class Gram
所有运行的单元测试都以代码 0 (0x0) 退出，甚至没有命中断点

我正在运行 Visual Studio 2017 15 9 程序已成功构建但每次我右键单击调试测试时编译器都会退出并显示以下消息程序 xxxxx testhost x86 exe 已退出代码为 0 0x0 调试输出屏幕和测试输出
使用不连续索引进行 pyomo 优化

我正在使用 pyomo 在 python 中进行优化我计划使用 t start t end 范围内的索引现在这些 t start 和 t end 值是 EV 的函数使得 m pyo ConcreteModel m EV pyo Ra
AMQP/RabbitMQ - 顺序处理消息

我有一个direct交换还有一个队列与该交换器绑定该队列有两个消费者消费者完成相应的处理后将手动确认消息消息按逻辑顺序排序并且应按该顺序进行处理是否可以强制要求消费者 A 和消费者 B 按顺序接收和处理所有消息换句话说阻
WIX 中的指南语法？

为 WIX 的 wxs 文件中的组件提供 guid 的正确语法是什么在我发现的大多数样本中 Guid 00AD2D6E BF8A 4EA8 BE9A 57380DECD0E6 但在一些样本中我发现 Guid 00AD2D6E BF8A 4
在Python中根据标签将一个大的xml文件分割成多个

我有一个非常大的 xml 文件我需要根据特定标签将其拆分为多个文件 XML 文件是这样的
php 的 glob 函数返回路径名的顺序是什么？

The 文档 https www php net globfor glob 没有提到它返回路径名数组的顺序如果有但是它确实提到了一个允许您禁用排序的标志 GLOB NO排序返回目录中出现的文件无排序数组是如何排序的glob当当
如何在 Symfony 2 中验证依赖于另一个属性的属性

是否可以验证依赖于同一类的另一个属性的模型类的属性例如我有这样的课程 class Conference startDate datetime protected startDate endDate datetime protected
无法构造“FormData”[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案当我在拖放区上传文件时它不起作用通常它工作得很好但自 1 个月以来我遇到了这个 JS 错误 Uncaught TypeErr
如何从 Rust 调用原始地址？

我正在用 Rust 编写一个操作系统需要直接调用我正在计算的虚拟地址类型为u32 我预计这会相对简单 let code virtual address as extern C fn code 然而这抱怨演员阵容不原始它建议我使用Fr
Polymer Web Component Tester 无法连接到 selenium

我在简单的 Polymer 2 x 应用程序模板上运行 Polymer Web Component Tester 并获得以下输出 hook prepare hook prepare selenium Starting Selenium se
当剪贴板内容在java之外发生变化时是否可以得到通知

我想做的是当用户在任何程序 firefox 记事本 pdfReader 等中复制文本时我已经运行的 java 应用程序将收到通知并立即显示弹出窗口我认为为了能够做到这一点只要系统剪贴板发生更改就应该调用我的java应用程序 ja
在一次调用中交换向量的两个元素

我有一个向量c 9 6 3 4 2 1 5 7 8 我想交换向量中索引 2 和索引 5 处的元素但是我不想创建临时变量并且希望在一次调用中进行切换我该怎么做呢就这样怎么样x c i j lt x c j i 如同replace 但
Flutter：计划通知不起作用

我正在使用 Flutter 开发一个应用程序要显示通知我使用flutter local notifications https pub dartlang org packages flutter local notifications包
添加交货信息以在 SAP Crystal Reports 中查询

以下是将采购订单链接到销售订单的查询我的理解是为了将交付文档包含到此报告中我需要再添加一张表 ODLN 因此会有一个标题为 Delivery Doc 又名 ODLN DocNum 的附加字段我的问题是我不确定如何在下面的查询中加入
const 在 Edge 15 开发者工具中不起作用

我正在运行 Edge 15 15063 我可以使用吗说 const 应该可以工作 http caniuse com search const Running const x woo Then console log x Returns x
python-2.6 中从 float 到 Decimal 的转换：如何做到以及为什么他们不这样做

从 float 到 Decimal 的直接转换在 python 2 7 中实现无论是在 Decimal 的构造函数中还是使用 Decimal from float 类方法 Python 2 6 相反会抛出 TypeError 建议首先转换
列表视图每一行的滑动检测

我的 SD 卡中有一个视频列表此时我只需要帮助为列表视图中的每一行创建手势或滑动检测感谢 stackoverflow 上的这个问题网格布局上的滑动手势检测 https stackoverflow com questions 93731
Pandas 按持续时间删除行

I would like to drop dataframe rows by time condition ignoring date My data contains around 100 million rows I have arou

Pandas 按持续时间删除行

Pandas 按持续时间删除行 的相关文章

随机推荐

热门标签

Pandas 按持续时间删除行的相关文章