仅当索引为日期和时间时，如何根据时间选择 pandas 数据框中的行

2024-03-03

我有一个如下所示的数据框：

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 2016910 entries, 2009-01-02 04:51:00 to 2012-11-02 20:00:00
Freq: T
Data columns:
X1    2016910  non-null values
X2    2016910  non-null values
X3    2016910  non-null values
X4    2016910  non-null values
X5    2016910  non-null values
dtypes: float64(5)

我想通过仅访问整个日期范围内的某些时间来“过滤”它。例如，我想返回一个数据帧，其中包含时间在 13:00:00 和 14:00:00 之间的所有行，但包含所有日期。我正在从 CSV 文件读取数据，日期时间是一列，但我可以轻松地使输入 CSV 文件包含单独的日期和时间。我尝试了单独的日期和时间路线，并创建了一个多重索引，但是当我这样做时，我最终得到了两个索引列——其中一个包含正确的日期和错误的时间，而不仅仅是日期，第二个包含错误的日期，然后是正确的时间，而不仅仅是时间。我的多索引尝试的输入数据如下所示：

 20090102,04:51:00,89.9900,89.9900,89.9900,89.9900,100
 20090102,05:36:00,90.0100,90.0100,90.0100,90.0100,200
 20090102,05:44:00,90.1400,90.1400,90.1400,90.1400,100
 20090102,05:50:00,90.0500,90.0500,90.0500,90.0500,500
 20090102,05:56:00,90.1000,90.1000,90.1000,90.1000,300
 20090102,05:57:00,90.1000,90.1000,90.1000,90.1000,200

我尝试使用以下代码阅读：

 singledf = pd.DataFrame.from_csv("inputfile",header=None,index_col=[0,1],parse_dates=True)

这导致了一个如下所示的数据框：

singledf.sort()
singledf

<class 'pandas.core.frame.DataFrame'>
MultiIndex: 716244 entries, (<Timestamp: 2009-01-02 00:00:00>, <Timestamp: 2012-11-04      04:51:00>) to (<Timestamp: 2012-11-02 00:00:00>, <Timestamp: 2012-11-04 20:00:00>)
Data columns:
X2    716244  non-null values
X3    716244  non-null values
X4    716244  non-null values
X5    716244  non-null values
X6    716244  non-null values
dtypes: float64(4), int64(1)

也许多索引方法是完全错误的，但这是我尝试过的一件事。似乎它坚持使用日期时间对象，并且想要强制索引列具有日期时间而不仅仅是日期或时间。我的非多索引尝试的源 CSV 文件如下所示：

20090102 04:51:00,89.9900,89.9900,89.9900,89.9900,100
20090102 05:36:00,90.0100,90.0100,90.0100,90.0100,200
20090102 05:44:00,90.1400,90.1400,90.1400,90.1400,100
20090102 05:50:00,90.0500,90.0500,90.0500,90.0500,500
20090102 05:56:00,90.1000,90.1000,90.1000,90.1000,300

我正在使用 pandas .9。任何建议表示赞赏！

常规 DatetimeIndex 允许使用 Between_time 方法。

In [12]: data = """\
 20090102,04:51:00,89.9900,89.9900,89.9900,89.9900,100
 20090102,05:36:00,90.0100,90.0100,90.0100,90.0100,200
 20090102,05:44:00,90.1400,90.1400,90.1400,90.1400,100
 20090102,05:50:00,90.0500,90.0500,90.0500,90.0500,500
 20090102,05:56:00,90.1000,90.1000,90.1000,90.1000,300
 20090102,05:57:00,90.1000,90.1000,90.1000,90.1000,200
"""

In [13]: singledf = pd.DataFrame.from_csv(StringIO(data), header=None, parse_dates=[[0,1]])

In [14]: singledf
Out[14]:
                        X2     X3     X4     X5   X6
X0_X1
2009-01-02 04:51:00  89.99  89.99  89.99  89.99  100
2009-01-02 05:36:00  90.01  90.01  90.01  90.01  200
2009-01-02 05:44:00  90.14  90.14  90.14  90.14  100
2009-01-02 05:50:00  90.05  90.05  90.05  90.05  500
2009-01-02 05:56:00  90.10  90.10  90.10  90.10  300
2009-01-02 05:57:00  90.10  90.10  90.10  90.10  200

In [15]: singledf.between_time('5:30:00', '5:45:00')
Out[15]:
                        X2     X3     X4     X5   X6
X0_X1
2009-01-02 05:36:00  90.01  90.01  90.01  90.01  200
2009-01-02 05:44:00  90.14  90.14  90.14  90.14  100

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

DataFrame

pandas

仅当索引为日期和时间时，如何根据时间选择 pandas 数据框中的行的相关文章

在 pandas 数据框中使用 Replace 和 str.startswith() 来重命名值

我有一个名为源的列其中包含数百行文本问题是其中一些可以组合在一起而我正在努力在 Pandas 数据框中做到这一点这是我的代码 df source replace df source str startswith share n
pandas：根据总和和平均值过滤列

我有一个时间序列数据的数据框其中包含列中的数值数据在绘制这些数据时我只想绘制某些被认为不足的系列以下是我选择要绘制的列的方法 df loc df iloc 1 gt 100 df sum gt 1000 换句话说显着的标准是一系
选择一个单元格内的最小值或最大值（分隔字符串）

我有一个数据框其中每个样本的列可以有多个值例如 Gene Pvalue1 Pvalue2 Pvalue3 Beta Ace 0 0381 0 00357 0 01755 0 001385 0 0037 NA 0 039 0 03 1 1
按最小值分组并用另一列中的值填充 NA

我有一个如下所示的示例数据框 df pd DataFrame data uid 1 1 1 2 2 3 pagename home blah blah home blah blah startpage NA NA NA home home
Python Pandas DateOffset 使用另一列中的值

我以为这会很容易但下面的内容并不适合我想要的只是尝试通过使用另一列中的值将天数添加到预先存在的日期时间列来计算新的日期列我下面的偏移列只有 1 位数字 df new date df orig date apply lambda x
计算 R 中数据帧的每一行中特定值的连续出现次数

我有一个data frame许多位置这么多行的变量的每月值我想计算值为零的连续月份即连续单元格的数量如果只是从左到右阅读这很容易但增加的复杂性是年底与年初是连续的例如在下面的缩短示例数据集中用季节而不是月份位置 1
获取 pandas 中最后一次出现特定值之后的所有行

我的数据框看起来像 ID colA 1 B 1 D 2 B 2 D 2 C 我已返回每组中事件 B 最后一次出现后的所有行输出将是 ID colA 1 D 2 D 2 C 我试过 a df colA str contains B grou
按列分组的数据帧上 R 中的行之间的差异

我希望通过 app name 获得不同版本的计数差异我的数据集如下所示 app name version id count difference 这是数据集 data structure list app name structure c
在嵌套 tibbles 上应用 ntile

我正在尝试申请ntile在一些嵌套的小标题上但我似乎无法让它工作你能看出我错在哪里吗 data iris iris gt group by Species gt mutate quintile ntile Petal Length 5
Python Pandas to_datetime AttributeError：'tuple'对象没有属性'lower'

我有一个由 6 列组成的 csv 第一列具有特定的日期格式因此我需要将其转换为美国格式 YYYY mm dd 阅读 CSV 文件的内容后我继续修改日期列但不断收到以下错误 CSV Gmt time Open High Low Cl
为什么 pandas.to_datetime 对于非标准时间格式（例如“2014/12/31”）很慢

我有一个这种格式的 csv 文件 timestmp p 2014 12 31 00 31 01 9200 0 7 2014 12 31 00 31 12 1700 1 9 当通过阅读时pd read csv并将时间字符串转换为日期时间使用p
使用管道语法处理模型列表

我经常喜欢拟合和检查与 R 数据框中的两个变量相关的多个模型我可以使用如下语法来做到这一点 require tidyverse require broom models lt list hp exp cyl hp cyl map df m
使用 matplotlib 散布条件颜色

我有以下 Pandas Dataframe 其中 a 列代表虚拟变量我想做的是给我的标记一个cmap jet 列值后面的颜色b 除非列中的值a等于 1 在本例中我希望它的颜色为灰色知道我该怎么做吗您必须标记等于 1 的值并绘制 imp
Pandas 连接问题：列重叠但未指定后缀

我有以下数据框 print df a mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 print df b
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
根据列索引重命名 Dataframe 列

是否有内置函数可以按索引重命名 pandas 数据框我以为我知道列标题的名称但事实证明第二列中有一些十六进制字符根据我接收数据的方式我将来可能会在第 2 列中遇到这个问题因此我无法将这些特定的十六进制字符硬编码到 datafram
用 Pandas 计算该月的最后一个星期五

我编写了这个函数来获取该月的最后一个星期四 def last thurs date date month date dt month year date dt year cal calendar monthcalendar year mon
从另一列的子字符串创建列

我有一个 Pandas 数据框对象我想从现有列的子字符串创建新列我的数据如下所示 Date variable want1 want2 want3 0 02 01 08 Australia Sydney A Australia Sydne
对 Pandas DataFrame 进行类型检查

我想对 Pandas DataFrames 进行类型检查即我想指定 DataFrame 必须具有哪些列标签以及哪种数据类型 dtype 存储在其中一个粗略的实现受此启发question https stackoverflow com
如何从列表类别中对 pandas 数据框进行排序？

所以我在下面有这个数据集我想根据我的列表从名称列进行排序以及按 A 升序和按 B 降序排序 import pandas as pd import numpy as np df1 pd DataFrame from items A 1

随机推荐

如何在点击后隐藏横幅并使用本地存储保存？

我是 Java 脚本新手在用户单击 Cookie 横幅上的接受后我不知道如何保存信息本地存储一旦他单击接受 Cookie 横幅就会消失我想保存因此当他进入下一页或重新加载页面时他不会再次收到 Cookie Banner
Bash - HTML 内容的正则表达式

我正在学习 Bash 脚本并且需要一些帮助来理解正则表达式我有一个基本上是网页 html 的变量使用 wget 导出 currentURL https www example com currentPage wget q O curr
嵌套 TextBlock 和超链接，如何在 C# 中复制此 XAML？

我有这个 XAML
创建自定义 Object3D 类

我是来自 AS3 Away3D 背景的 THREE js 新手我正在尝试创建一个扩展 THREE Object3D 的自定义对象类以添加到我的场景中 CustomObject会封装很多行为属性和方法理想情况下我想传递每个 Custom
Android 下载管理器所有下载完成后如何通知

我正在使用 Android 下载管理器类所有下载完成后我需要写下载完成我尝试过一些东西并且它有效但在这里它是在逐个文件完成后写入的我只需要写一次全部完成后我也尝试过没有光标但我没能实现 public class Downl
XCode 链接到 OpenSSL 库

我有一个需要链接 openssl 库的项目尽管在编译时遇到了一些问题 include
Netbeans 7.2.1 损坏的参考：dist.jar（在 JavaFX 文件上编码时）

我试图通过阅读一些教程来学习 JavaFX 但是我什至无法实现 helloworld 应用程序 NetBeans 说道错误无法找到或加载主类 helloworld NewFXMain Java 结果 1 然后当我检查属性 gt 库
pdf.js 只适用于某些 pdf 文件吗？

我正在尝试使用将 pdf 页面转换为画布pdf js 我使用了答案使用 pdf js 和 ImageData 将 pdf 渲染到单个 Canvas https stackoverflow com questions 15341010 ren
在 pandas 数据框中添加缺失的时间

我有一个pandas DataFrame在列中带有时间戳这些值以纪元为单位间隔 0 1 秒价值观如1488771900 100000 1488771900 200000等等但是存在缺失值所以我有1488794389 500000
将文件编码为 Base64 时内存不足

使用 Apache commons 中的 Base64 public byte encode File file throws FileNotFoundException IOException byte encoded try FileI
C++：C 字符串集

我想创建一个以便我可以使用 set find 检查某个单词是否在集合中然而 C 字符串是指针因此默认情况下该集合将通过指针值来比较它们为了正确运行必须取消引用它们并比较字符串我可以只向构造函数传递一个指向 strcmp 函数的指
Python Moviepy安装问题（Windows 7x64）

美好的一天我在为 python 64 位和 Windows 64 位安装 moviepy 时遇到问题库安装成功文件ffmpeg下载每次我运行它或使用 video VideoFileClip path OSError WinError
FirebaseobserveSingleEvent 保留在内存中

我的应用程序相当多地使用 firebase 的observeSingleEventOfType 我开始意识到我的应用程序的内存随着时间的推移而增加我已经注释掉了所有代码除了调用以下函数的测试按钮 func loadPostsTest F
Windows 版 Git 中的文件名太长

我在用着Git 1 9 0 preview20140217对于 Windows 据我所知这个版本应该可以解决文件名太长的问题但不适合我我肯定做错了什么我做错了git config core longpaths true and gi
OnTriggerEnter() 未调用

我有一个玩家球体和 4 个敌人胶囊所有敌人都添加了角色控制器它们还有一个子 GameObject 它具有一个 RigidBody 无质量无重力和一个附加的 Box Collider 盒子碰撞器足够大因此您可以看到盒子内部的球
yocto 中的机器特定层

我想为一台新机器称之为 A 添加一些从上游获取的层主要是为了使用这些层提供的机器 A 配置文件内核和 u boot 然而新层有几个 bbappend 文件还有 bb 文件其版本与我的 yocto 项目中其他机器的层不同例如机
如何让 Org-mode 在当前窗口中打开像 [[file://file.org]] 这样的链接而不是在其他窗口中默认打开？

我希望使用 C c C o 打开一个链接例如 file filename org filename 在当前窗口中而不是在其他窗口中的默认值如何更改此组织模式默认行为似乎是默认的 C u C c C o 是在其他窗口中强制打开链接这
从具有相同方法签名的多个接口继承的类

假设我有三个接口 public interface I1 void XYZ public interface I2 void XYZ public interface I3 void XYZ 继承这三个接口的类 class ABC I1 I
在 bookdown 文档中使用 R/exams（特别是 HTML 输出）

我使用 bookdown 创建了一本书我希望能够添加交互式测验而不需要闪亮等是否可以使用 R exams http www R exams org http www R exams org 与预订我主要对 HTML 输出感兴趣 P
仅当索引为日期和时间时，如何根据时间选择 pandas 数据框中的行

我有一个如下所示的数据框

仅当索引为日期和时间时，如何根据时间选择 pandas 数据框中的行

仅当索引为日期和时间时，如何根据时间选择 pandas 数据框中的行 的相关文章

随机推荐

热门标签

仅当索引为日期和时间时，如何根据时间选择 pandas 数据框中的行的相关文章