根据时间戳间隔创建 csv 文件的数据框

2024-04-14

我相信我的问题非常简单，并且一定有一个非常简单的方法来解决这个问题，但是由于我对Python，特别是pandas很陌生，我无法自己解决它。

我有数百个 csv 文件，格式如下：text_2014-02-22_13-00-00

所以格式是str_YY-MM-DD_HH-MI-SS。总而言之，每个文件代表一小时的间隔。

我想根据我将设置的间隔创建一个数据框Start_Time and End_Time，从该区间开始。所以，例如，如果我设置Start_Time如 2014-02-22 21:40:00 和End_Time如 2014-02-22 22:55:00 （我使用的时间格式只是为了说明示例），那么我将得到一个数据帧，它包含上述间隔之间的数据，该数据来自两个不同的文件。

所以，我认为这个问题可以分为两部分：

1 - 仅读取文件名中的日期

2 - 根据我设置的时间间隔创建一个数据帧。

希望我能够做到简洁和准确。我非常感谢您在这方面的帮助！也欢迎提供有关查找内容的建议

该解决方案有几个不同的部分。

创建文件夹路径
手动创建 3 个 csv 文件
将 csv 文件保存到列表中
编写自定义函数将文件名解析为日期时间对象
将所有内容放在一起，循环浏览文件夹中的 csv 文件

import os
import pandas as pd
import datetime

# step 1: create the path to folder
path_cwd = os.getcwd()

# step 2: manually 3 sample CSV files
df_1 = pd.DataFrame({'Length': [10, 5, 6],
                     'Width': [5, 2, 3],
                     'Weight': [100, 120, 110]
                    }).to_csv('text_2014-02-22_13-00-00.csv', index=False)
df_2 = pd.DataFrame({'Length': [11, 7, 8],
                     'Width': [4, 1, 2],
                     'Weight': [101, 111, 131]
                    }).to_csv('text_2014-02-22_14-00-00.csv', index=False)
df_3 = pd.DataFrame({'Length': [15, 9, 7],
                     'Width': [1, 4, 2],
                     'Weight': [200, 151, 132]
                    }).to_csv('text_2014-02-22_15-00-00.csv', index=False)

# step 3: save the contents of the folder to a list
list_csv = os.listdir(path_cwd)
list_csv = [x for x in list_csv if '.csv' in x]

print('here are the 3 CSV files in the folder: ')
print(list_csv)

# step 4: extract the datetime from filenames
def get_datetime_filename(str_filename):
    '''
    Function to grab the datetime from the filename.

    Example: 'text_2014-02-22_13-00-00.csv'
    '''
    # split the filename by the underscore
    list_split_file = str_filename.split('_')

    # the 2nd part is the date
    str_date = list_split_file[1]

    # the 3rd part is the time, remove the '.csv'
    str_time = list_split_file[2]
    str_time = str_time.split('.')[0]

    # combine the 2nd and 3rd parts
    str_datetime = str(str_date + ' ' + str_time)

    # convert the string to a datetime object
    # https://chrisalbon.com/python/basics/strings_to_datetime/
    # https://stackoverflow.com/questions/10663720/converting-a-time-string-to-seconds-in-python
    dt_datetime = datetime.datetime.strptime(str_datetime, '%Y-%m-%d %H-%M-%S')

    return dt_datetime

# Step 5: bring it all together

# create empty dataframe
df_master = pd.DataFrame()

# loop through each csv files 
for each_csv in list_csv:

    # full path to csv file
    temp_path_csv = os.path.join(path_cwd, each_csv)

    # temporary dataframe
    df_temp = pd.read_csv(temp_path_csv)

    # add a column with the datetime from filename
    df_temp['datetime_source'] = get_datetime_filename(each_csv)

    # concatenate dataframes
    df_master = pd.concat([df_master, df_temp])

# reset the dataframe index
df_master = df_master.reset_index(drop=True)

# examine the master dataframe
print(df_master.shape)
# print(df_master.head(10))
df_master.head(10)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

timestamp

根据时间戳间隔创建 csv 文件的数据框的相关文章

在 django ORM 中查询时如何将 char 转换为整数？

最近开始使用 Django ORM 我想执行这个查询 select student id from students where student id like 97318 order by CAST student id as UNSIG
如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
Python getstatusoutput 替换不返回完整输出

我发现了这个很棒的替代品getstatusoutput Python 2 中的函数在 Unix 和 Windows 上同样有效不过我觉得这个方法有问题output被构建它只返回输出的最后一行但我不明白为什么任何帮助都是极好的 def
删除flask中的一对一关系

我目前正在使用 Flask 开发一个应用程序并且在删除一对一关系中的项目时遇到了一个大问题我的模型中有以下结构 class User db Model tablename user user id db Column db String
Pandas 日期时间格式

是否可以用零后缀表示 pd to datetime 似乎零被删除了 print pd to datetime 2000 07 26 14 21 00 00000 format Y m d H M S f 结果是 2000 07 26 14
使用 kivy textinput 的 'input_type' 属性的问题

您好我在使用 kivy 的文本输入小部件的 input type 属性时遇到问题问题是我制作了两个自定义文本输入其中一个称为 StrText 其中设置了 input type text 然后是第二个文本输入名为 NumText 其
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
加快网络抓取速度

我正在使用一个非常简单的网络抓取工具抓取 23770 个网页scrapy 我对 scrapy 甚至 python 都很陌生但设法编写了一个可以完成这项工作的蜘蛛然而它确实很慢爬行 23770 个页面大约需要 28 小时我看过scr
Python3 在 DirectX 游戏中移动鼠标

我正在尝试构建一个在 DirectX 游戏中执行一些操作的脚本除了移动鼠标之外我一切都正常是否有任何可用的模块可以移动鼠标适用于 Windows python 3 Thanks I used pynput https pypi or
import matplotlib.pyplot 给出 AttributeError: 'NoneType' 对象没有属性 'is_interactive'

我尝试在 Pycharm 控制台中导入 matplotlib pyplt import matplotlib pyplot as plt 然后作为回报我得到 Traceback most recent call last File D Pr
python import inside函数隐藏现有变量

我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量问题并将其精简为这个片段使用标准库中的日志记录模块 import logging def foo logging info fo
Django 模型：默认日期时间未转换为 SQL CURRENT_TIMESTAMP

我正在使用 Django 模型创建 PostgreSQL DB 我有一个 DateTimeField 我想将当前时间戳设置为默认值我知道有多个消息来源建议如何做到这一点但是当我在 Django 之外检查数据库时默认时间戳不会显示我
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
将 Python 中的日期与日期时间进行比较

所以我有一个日期列表 datetime date 2013 7 9 datetime date 2013 7 12 datetime date 2013 7 15 datetime date 2013 7 18 datetime date
使用for循环时如何获取前一个元素？ [复制]

这个问题在这里已经有答案了可能的重复 Python 循环内的上一个和下一个值 https stackoverflow com questions 1011938 python previous and next values inside
Django-tables2 列总计

我正在尝试使用此总结列中的所有值文档 https github com bradleyayers django tables2 blob master docs pages column headers and footers rst 但页
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s

随机推荐

REST API 设计：是否可以在 PUT 调用期间更改资源标识符？

我很想了解有关 PUT 调用的 RESTful 设计模式的更多信息具体来说我在 PUT 调用中更改资源 ID 是否违反规范考虑以下 POST api event returns the resource ID eventid of t
如何在 XML 中显示活动的整数？

我在我的应用程序中使用 XML 输出所以基本上主要的活动只是告诉android显示main的XML布局但是如果我在活动代码中定义了整型变量并且我希望该整型变量也显示在显示屏上该怎么办如何将整型变量推送到 XML 从主 XML 引用
Scala 闭包如何转换为 Java 对象？

我目前正在研究不同语言的闭包实现然而当谈到 Scala 时我找不到任何有关如何将闭包映射到 Java 对象的文档 Scala 函数映射到 FunctionN 对象是有据可查的我假设对闭包的自由变量的引用必须存储在该函数对象中的某个位
java.lang.ClassNotFoundException：com.mysql.jdbc.Driver（在jre的库中）

我已将 mysql connector java 5 1 18 bin jar 添加到 jre 和 jdk 库中这是 C Windows system32 gt javap java io Bits Compiled from Bits
未找到类，使用 Android Studio 3.0.1、Room、Kotlin 的 androidTest 中的空测试套件

我在运行 androidTest 时遇到问题这是我在 gradle 中的设置 apply plugin com android application apply plugin kotlin android apply plugin ko
如何更改选择选项的字体大小？ [复制]

这个问题在这里已经有答案了我正在尝试设置选择选项下拉列表的样式是否可以使选项的字体大小与默认值不同例如默认 Select Country 尺寸为 7pt 和选项之一 Georgia 尺寸为 13pt 这是我的下拉列表 select
Swift 3 照片捕捉

我正在使用这段代码 func capturePhoto blockCompletion escaping blockCompletionCapturePhoto guard let connectionVideo self stillCam
Symfony2 响应 - 清除后退按钮上的缓存标头

当按下后退按钮时我遇到了清除缓存的问题我的标头信息表明我是从缓存加载的 Status Code 200 OK from cache 我的回复设置为 response new Response response gt expire res
JQuery：如果表头有类，则将类添加到表单元格

假设我有以下 html table thead tr th class alignRight Header1 th th Header2 th th class alignLeft Header3 th tr thead tbody tr
探索用户时，如何查看他们浏览过的页面的 url？

在用户资源管理器中我看到默认的 page view 事件但当我单击它们时它们不会显示页面路径 GA4 新手需要任何建议我期望显示默认参数 page location page referrer 但我只看到自定义参数我的一个想法是
我如何计算 @foreach 中 mvc3 中的循环

我怎样才能关闭 tr 并打开 tr 3次循环迭代后我在 NET 4 0 中有 MVC 3 如何计算 MVC 3 中的循环迭代次数当前代码 foreach var articleOnFirstPage in Model ArticlesO
ModuleNotFoundError：没有名为“skimage.util.montage”的模块

我正在尝试导入montage2d来自 scikit image 的模块 from skimage util montage import montage2d 但弹出了这个错误 ModuleNotFoundError No module na
输入单个记录条目

我正在寻找一个 TypeScript 类型定义它描述具有单个属性具有任何值的对象我知道有索引签名例如 type X key string any 或者替代地 type X Record
R Data.table 根据另一列划分列中的值

我有一个maindata table 有 364 行和 3 列 Date Weekday Weight 2012 01 01 Monday 100 2013 01 02 Tuesday 200 and a helpdata table 有
Django ORM：我如何实时查看最后执行的查询

假设我们有一个使用 django orm 的简单查询 filterd User objects exclude id request user id filter username data username 这应该返回一些对象但它没有返
如何在 Autofac 中使用工厂模式？

目前我有以下内容 public interface IService void Start public class FirstService IService 我通过执行以下操作来解决该服务 using var scope lifetim
RMarkdown PDF 输出中未显示某些 Unicode 字符

我正在尝试将一些课程笔记整理为 PDF 但无法正确显示某些 Unicode 字符使用xelatex https en wikipedia org wiki XeTeXLatex 引擎对于渲染文档是必需的使用默认引擎会因无法识别的字符而导
挂钩 Win32 窗口创建/调整大小/查询大小

我正在尝试扩展现有的应用程序 The goal就是在不更改应用程序代码的情况下使现有应用程序变得更大一个约束拉伸的应用程序不会注意到它因此如果应用程序查询创建的窗口大小它将看到原始大小而不是调整后的大小我设法使用调整窗口
Mayavi (Python) 中的 TVTK 错误

我正在运行 Fedora 17 x64 机器并且我尝试通过以下方式安装 Mayavi for python yum install mayavi 工作得很好除了每次我编写调用 mayavi 模块如 mlab 的代码时 from ent
根据时间戳间隔创建 csv 文件的数据框

我相信我的问题非常简单并且一定有一个非常简单的方法来解决这个问题但是由于我对Python 特别是pandas很陌生我无法自己解决它我有数百个 csv 文件格式如下 text 2014 02 22 13 00 00 所以格式是str

根据时间戳间隔创建 csv 文件的数据框

根据时间戳间隔创建 csv 文件的数据框 的相关文章

随机推荐

热门标签

根据时间戳间隔创建 csv 文件的数据框的相关文章