从 pandas 数据框中删除“重叠”日期

2024-03-09

我有一个 pandas 数据框，如下所示：

ID  date       close
1   09/15/07   123.45
2   06/01/08   130.13
3   10/25/08   132.01
4   05/13/09   118.34
5   11/07/09   145.99
6   11/15/09   146.73
7   07/03/11   171.10

我想删除任何重叠的行。

重叠行定义为另一行 X 天内的任何行。例如，如果 X = 365，则结果应为：

ID  date       close
1   09/15/07   123.45
3   10/25/08   132.01
5   11/07/09   145.99
7   07/03/11   171.10

如果 X = 50，结果应为：

ID  date       close
1   09/15/07   123.45
2   06/01/08   130.13
3   10/25/08   132.01
4   05/13/09   118.34
5   11/07/09   145.99
7   07/03/11   171.10

我已经看了这里的几个问题，但还没有找到正确的方法。例如，Pandas 检查多行中的重叠日期 https://stackoverflow.com/questions/36654198/pandas-check-for-overlapping-dates-in-multiple-rows and 从 pandas 数据框中消除特定日期的最快方法 https://stackoverflow.com/questions/37307796/fastest-way-to-eliminate-specific-dates-from-pandas-dataframe很相似，但不太能满足我的需要。

我今天有以下丑陋的代码，适用于较小的 X 值，但当 X 变大时（例如，当 X = 365 时），它会删除除原始日期之外的所有日期。

filter_dates = []
for index, row in df.iterrows():
     if observation_time == 'D':
        for i in range(1, observation_period):
            filter_dates.append((index.date() + timedelta(days=i)))
df = df[~df.index.isin(filter_dates)]

任何帮助/指示将不胜感激！

澄清：

解决这个问题需要查看每一行，而不仅仅是第一行。

您可以添加新列来过滤结果：

df['filter'] = df['date'] - df['date'][0]
df['filter'] = df['filter'].apply(lambda x: x.days)

然后要按 365 进行过滤，请使用以下命令：

df[df['filter']%365==0]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

从 pandas 数据框中删除“重叠”日期的相关文章

ca 证书 Mac OS X

我需要在emacs 上安装offlineimap 和mu4e 问题是配置当我运行 Offlineimap 时我得到 OfflineIMAP 6 5 5 Licensed under the GNU GPL v2 v2 or any la
正则表达式，选择最接近的匹配

假设以下单词序列 BLA text text text text text text BLA text text text text LOOK text text text BLA text text BLA 我想做的是将 BLA 中的文本
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
Paramiko SSHException 通道已关闭

我一直在使用 Paramiko 在 Linux Windows 机器上发送命令它可以很好地在 Ubuntu 机器上远程执行测试但是它不适用于 Windows 7 主机以下是我收到的错误 def unit for event self
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
通用详细视图 ProfileView 必须使用对象 pk 或 slug 调用

我是 Django 2 0 的新手在访问我的个人资料页面视图时收到此错误它适用于像这样的网址path users
如何在Python代码中查找列号

简短问题当按上述方式调用函数时我可以找到行号here https stackoverflow com questions 3056048 filename and line number of python script 同样如何找到
NumPy 和 SciPy - .todense() 和 .toarray() 之间的区别

我想知道使用是否有什么区别优点缺点 toarray vs todense 在稀疏 NumPy 数组上例如 import scipy as sp import numpy as np sparse m sp sparse bsr mat
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
按多个键分组并对字典列表的值进行汇总/平均值

在Python中按多个键进行分组并对字典列表进行汇总平均值的最Pythonic方法是什么假设我有一个字典列表如下所示 input dept 001 sku foo transId uniqueId1 qty 100 dept 001
Python 3在for循环中更改字典键的值不起作用

我的 python 3 代码没有按预期工作 def addFunc x y print x y def subABC x y z print x y z def doublePower base exp print 2 base exp d
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
pandas 中连续数据的平行坐标图

pandas 的 parallel coordinates 函数非常有用 import pandas import matplotlib pyplot as plt from pandas tools plotting import par
将列表中的 None 替换为最左边的非 none 值

Given a None 1 2 3 None 4 None None I d like a None 1 2 3 3 4 4 4 目前我已经用以下方法强制它 def replaceNoneWithLeftmost val last Non
在seaborn中对箱线图x轴进行排序

我的数据框round data看起来像这样 error username task path 0 0 02 n49vq14uhvy93i5uw33tf7s1ei07vngozrzlsr6q6cnh8w 39 png 1 0 10 n49vq
在Python中连续解析文件

我正在编写一个脚本该脚本使用 HTTP 流量行解析文件并取出域目前仅将它们打印到屏幕上我正在使用 httpry 将流量连续写入文件这是我用来删除域名的脚本 usr bin python import re input open r
如何使用 os.chdir 转到减去最后一步的路径？

例如一个方法传递了一个路径作为参数这个路径可能是 C a b c d 如果我想使用 os chdir 更改为 C a b 怎么办 c 没有最后一个文件夹 os chdir 可以接受命令吗 os chdir 可以采取作为论点是的然
在 HDF5 (PyTables) 中存储 numpy 稀疏矩阵

我在使用 PyTables 存储 numpy csr matrix 时遇到问题我收到此错误 TypeError objects of type csr matrix are not supported in this context so
沿轴 0 重复 scipy csr 稀疏矩阵

我想重复 scipy csr 稀疏矩阵的行但是当我尝试调用 numpy 的重复方法时它只是将稀疏矩阵视为对象并且只会将其作为 ndarray 中的对象重复我浏览了文档但找不到任何实用程序来重复 scipy csr 稀疏矩阵的行我
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt

随机推荐

输入大数以避免 NumberFormatException

我必须控制从1到9999999999的输入代表学校的注册号原始类型 long 只能容纳大约 2 000 000 000 我如何存储这个大小的数字根据this http docs oracle com javase tutorial j
www.sandbox.itunes.apple.com 已关闭

在此先感谢您的帮助具体问题由于在沙盒环境中测试应用内购买时出现错误 1001 无法连接到 iTunes 商店知道是否重要吗 www sandbox itunes apple com下降了吗如果没有我怎么知道苹果的沙盒是否已关闭背
如何创建一个所有字段都是公共的公共结构，而无需为每个字段重复“pub”？

如何在 Rust 中定义一个公共结构其中所有字段都是公共的而不必重复pub每个字段前面的修饰符 A pub struct宏将是理想的 pub struct Foo a i32 b f64 这相当于 pub struct Foo pub
如何创建动画切换按钮？

是的我可以创建带有 2 张图片的 ToggleButton 开关但我想创建带有 3 5 张图片的 ToggleButton 例如什么时候关闭我单击关闭图片中图图片上它什么时候开启我点击图片上中图关闭图片所以它就像
带有 postgres 的游标，数据存储在哪里以及对数据库的调用次数

您好我正在使用 psycopg2 进行 postgres 访问我试图了解光标存储返回的行的位置是将其作为临时表存储在数据库中还是存储在客户端游标当您指定获取多行时是否一次命中数据库一个查询或者它是否命中数据库一次获取第一
android - 无需root即可将字体安装到android平台

我开发了一个新的应用程序它是一种古老的埃及语言科普特语我需要在 Android 平台上安装特定的字体使这种语言可读我搜索是否找到应用程序执行相同的功能iFont 另外当我访问字体文件夹时我发现它允许安装字体在线获取字体那么
Javascript 数组分页

我正在尝试编写一个 Javascript 函数该函数需要array page size and page number作为参数并返回一个模仿分页结果的数组 paginate function array page size page nu
我可以用64位jre运行使用32位jdk开发的java程序吗？应用程序使用32位非java系统库

我正在 64 位 Windows 7 安装上使用 64 位 eclipse 开发一个 java 应用程序我被迫使用 32 位 JDK 1 7 0 因为应用程序使用Jpcap http netresearch ics uci edu kfu
iPhone X如何处理View Controller inputAccessoryView？

我有一个消息应用程序它具有典型的 UI 设计即全屏表格视图底部的文本字段我将该文本字段设置为视图控制器的inputAccessoryView并打电话ViewController becomeFirstResponder 以使该字段显示
Javascript 文字处理器/编辑器（或 Google Docs 架构）[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我认为像 Google 文档那样推出
如何简单计算从一点到另一点的旅行时间？（无剧情）

我花了很多时间阅读和测试OSMnx 的示例笔记本 https github com gboeing osmnx examples但我无法找到一种方法来简单地计算从给定点 GPS 坐标到另一个点的旅行时间我想估计对于列表中的每个点到达
必须转义哪些字符才能防止 (My)SQL 注入？

我正在使用 MySQL API 的功能 mysql real escape string 根据文档它转义了以下字符 0 n r Z 现在我查看了 OWASP org 的 ESAPI 安全库在 Python 端口中它有以下代码 http
WeakHashMap 在完整 GC 期间是否被清除？

我在使用 Wea kHashMap 时遇到了一些麻烦考虑这个示例代码 List
“using”应该在命名空间内部还是外部？ [复制]

这个问题在这里已经有答案了可能的重复使用应该在命名空间内部还是外部 https stackoverflow com questions 125319 should usings be inside or outside the name
如何修复 NoSuchMethodError？

我得到了一个NoSuchMethodError运行我的 Java 程序时出错出了什么问题以及如何修复它如果没有更多信息很难查明问题但根本原因是您很可能针对缺少方法的类的不同版本编译了一个类而不是运行该类时使用的版本查看堆栈跟踪
使用 python 在远程 Windows 计算机上运行命令

这次我询问有关在远程 Windows 计算机上运行命令的问题让我在这里更详细地描述一下我有一台安装了 python 的机器我想运行一些 powershell 和 cmd 命令或者我想将 cmd 文件发送到远程 Windows 机器
在线程中获取正确的 WPF 调度程序 [重复]

这个问题在这里已经有答案了在对象的构造函数中我需要创建一个 WPF mediaElement 对象 m videoMedia new MediaElement 但该类也可以从其他线程实例化所以我需要使用 Dispatcher Invo
Asp.net MVC FileContentResult - 阻止在浏览器中打开

我的控制器操作之一将文件返回给用户我希望向用户显示下载打开保存对话框无论文件类型如何当文件类型为 doc docx xlsx 等时此方法工作正常但当文件为 txt xps pdf 有时或 html 时它会在浏览器中打开
大熊猫数据框并行处理

我正在访问一个非常大的 Pandas 数据框作为全局变量该变量通过并行访问joblib https pythonhosted org joblib parallel html Eg df db query select id a lot
从 pandas 数据框中删除“重叠”日期

我有一个 pandas 数据框如下所示 ID date close 1 09 15 07 123 45 2 06 01 08 130 13 3 10 25 08 132 01 4 05 13 09 118 34 5 11 07 09 14

从 pandas 数据框中删除“重叠”日期

从 pandas 数据框中删除“重叠”日期 的相关文章

随机推荐

热门标签

从 pandas 数据框中删除“重叠”日期的相关文章