从数据集的给定日期范围中提取属于一天的数据

2024-06-21

我有一个数据集，日期范围为 2018 年 1 月 12 日到 8 月 3 日，其中包含一些值：

维数为my_df数据框是：

my_df.shape 
(9752, 2)

每行包含半小时频率

第一行开始于2018-01-12

my_df.iloc[0]
Date:       2018-01-12 00:17:28
Value                      1
Name: 0, dtype: object

最后一行结束于2018-08-03

my_df.tail(1)
                  Date:     Value
9751    2018-08-03 23:44:59  1

我的目标是选择每天对应的数据行并将其导出到 CSV 文件。

为了仅获取 1 月 12 日的数据并保存到可读文件，我执行：

# Selecting data value of each day
my_df_Jan12 = my_df[(my_df['Fecha:']>='2018-01-12 00:00:00') 
              & 
              (my_df['Fecha:']<='2018-01-12 23:59:59')
                                   ]
my_df_Jan12.to_csv('Data_Jan_12.csv', sep=',', header=True, index=False)

从1月12日到8月3日共有203天（28周）

我不想每天手动执行此查询，那么我正在尝试以下基本分析：

我需要生成 203 个文件（每天 1 个文件）
1月12日开始的那一天（1月12日）
一月是第一个月（01），八月是第八个月（08）

Then:

I need to iterate over the 203 days totality
- 并且是必要的在每个日期行值中查看订单的月份和日期起息日以检查更改他们每一个人

根据上述，我正在尝试这种方法：

# Selecting data value of each day (203 days)
for i in range(203):
    for j in range(1,9): # month
        for k in range(12,32): # days of the month
            values = my_df[(my_df['Fecha:']>='2018-0{}-{} 00:00:00'.format(j,k)) 
            &  
            (my_df['Fecha:']<='2018-0{}-{} 23:59:59'.format(j,k))]
            values.to_csv('Values_day_{}.csv'.format(i), sep=',', header=True, index=False)

但当我迭代时我遇到了问题range(12,32)在这几个月的日子里，这range(12,32)只适用于一月的第一个月，我想是这样......

最后，由于我做错了一些事情，我得到了 203 个空的 CSV 文件......

我怎样才能以合适的方式解决这个小挑战？任何方向都受到高度赞赏

像这样的东西吗？我把你原来的专栏改名为Date: to Timestamp。我还假设Date:你的系列是熊猫DateTime series.

my_df.columns = ['Timestamp', 'Value']
my_df['Date'] = my_df['Timestamp'].apply(lambda x: x.date())
dates = my_df['Date'].unique()
for date in dates:
    f_name = str(date) + '.csv'
    my_df[my_df['Date'] == date].to_csv(f_name)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

extract

从数据集的给定日期范围中提取属于一天的数据的相关文章

如何使用 django (python) 和 s3 上传文件？

我正在寻找一种将文件上传到 s3 的方法我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
蜘蛛内的Scrapyd jobid值

Scrapy 框架 Scrapyd 服务器我在获取蜘蛛内部的 jobid 值时遇到一些问题将数据发布到后http localhost 6800 schedule json http localhost 6800 schedule jso
我应该为 MySQL 使用什么 python 3 库？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案据我所知 MySQLdb 仍然没有移植到 Python 3 pypy 上似乎有另一个名为 PyMySQL
小数缓存是Python规范中定义的还是一个实现细节？

Python 似乎有一个所谓的小数字缓存用于存储 5 到 256 范围内的数字我们可以使用以下程序来演示这一点 for i in range 7 258 if id i id i 0 print i is cached else pr
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
Flask 中的 import 和 extends 有什么区别？

我正在阅读 Flask Web 开发在例4 3中 extends base html import bootstrap wtf html as wtf 我想知道 extends 和 import 有什么区别我认为它们在用法上很相似在什
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
如何为 Python 中的应用程序设置专用屏幕区域？

MS OneNote 就是一个很好的例子它可以选择固定在屏幕的一侧并将所有其他窗口推到一侧当最大化或调整其他窗口大小时它们只能扩展到 OneNote 的边缘 Python 使用 Tkinter 或其他模块是否具有此功能感谢您的帮助
如何删除 pandas 数据框中的唯一行？

我遇到了一个看似简单的问题在 pandas 数据框中删除唯一的行基本上相反drop duplicates https pandas pydata org pandas docs stable generated pandas Data
使 np.loadtxt 使用多个可能的分隔符

我有一个程序可以读取数据文件用户可以选择他们想要使用的列我希望它对于输入文件更加通用有时列可能如下所示 10 34 24 58 8 284 6 121 有时它们可能看起来像这样 10 34 24 58 8 284 6 121 我希
如何绘制多类分类器的精度和召回率？

我正在使用 scikit learn 我想绘制精度和召回曲线我正在使用的分类器是RandomForestClassifier scikit learn 文档中的所有资源都使用二元分类另外我可以绘制多类的 ROC 曲线吗另外我只找到
Celery：每个工作人员的 task_acks_late 的不同设置/向 celery 添加自定义选项

这个问题是后续问题django celery 禁用一个工作者的预取有错误吗 https stackoverflow com questions 58290045 django celery disable prefetch for one
如何修改 contenteditable 元素的innerHTML

我使用 Selenium 与 Chrome driver 和 python3 6 来测试网站我在网页中有代码片段如下 div class 3F6QL 2WovP div class 39LWd Type a message div div
使用 statsmodels.formula.api 中的 ols - 如何删除常数项？

我正在遵循第一个例子statsmodels教程 http statsmodels sourceforge net devel http statsmodels sourceforge net devel 如何指定在 ols 中不使用常数项进
Python 队列 get()/task_done() 问题

我的消费者端队列 m queue get queue task done
Scrapy 抓取并跟踪 href 中的链接

我对 scrapy 很陌生我需要从 url 的主页跟踪 href 到多个深度再次在 href 链接内我有多个 href 我需要遵循这些href 直到到达我想要抓取的页面我的页面的示例 html 是初始页 div class page
如何配置 Eclipse 在使用 Pydev 插件选择“运行”或“调试”时启动浏览器

我正在使用 Eclipse Pydev 插件学习 Python 和 Django 当我按运行或调试时我希望内部或外部浏览器使用 URL http 127 0 0 1 启动或刷新我见过用 PHP 插件完成的但没有用 Pydev
部署 Flask 应用程序时如何检测额外文件的更改并重新加载应用程序？ [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我在 Flask 中构建了一个小型 Web 应用程序并尝试将其部署在 Pythonanywhere 上在开发过程中
django admin 中内联模型的分页器

我有这个简单的 django 模型由一个传感器和特定传感器的值组成每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

Delphi XE2，vcl样式重新创建窗口句柄

在运行时应用新样式后我的应用程序的 MainForm 创建一个新的窗口句柄有什么方法可以阻止此操作或重新分配句柄因为我收到了大量以下错误系统错误代码 1400 无效的窗口句柄有什么方法可以操纵强制分配新句柄的进程吗我通过执行以
Xcode 中的 Prefix.pch 文件是什么？

许多开发人员正在向其中添加各种方便的宏Prefix pch 但我的问题是那是什么Prefix pch file 如果我删除它Prefix pch来自我的文件Xcode 那么我的应用程序会运行吗或者会显示什么错误吗或者它会在构建过程中崩溃
使用 ActiveRecord 和 Yii2 记录实际的 SQL 查询？

我正在这样做 students Student find gt all return this gt render process array students gt students 然后在视图中 foreach students as
如何从 Excel 加载项内识别 Office 365 用户帐户

我想了解是否有任何 API 可以帮助我们从我的 Excel 加载项 javascript 代码中查找 Office 365 用户帐户信息例如假设用户拥有 Office 电子邮件帐户电子邮件受保护 cdn cgi l email pro
初始化Object中的空字符串？

有人使用以下方法来初始化 NSstring NSString astring NSString alloc init 我想知道为什么不直接使用 NSString atring nil or NSString astring 没有semant
通知管道右侧左侧故障？

我越来越喜欢在 shell 脚本中的函数之间使用类似于生成器的模式像这样的事情 parse commands da cmd file process commands 然而这种模式的基本问题是如果 parse command 遇到错误
Aurelia - click.delegate 错误 - 说该函数不是函数

Novice 我有一个视图模型它有一个简单地切换值的函数 import autoinject from aurelia framework import bindable from aurelia templating import Lo
Mercurial：移植、记录、qrecord、搁置、移植、dirstate、队列

我是 Mercurial 的新手并且仍处于评估过程中因此这四个概念对我来说有点令人困惑有些被认为相当于 Git 的 Staging Index 概念有些甚至比 Git 的 Staging 更好四个命令怎么做hg graft hg
为什么标签存在却提示“系统找不到指定的批次标签”？

在 Windows XP 中运行批处理文件时我发现随机出现的错误消息系统找不到指定name of label的批次标签标签当然存在导致此错误的原因是什么实际上要实现这一点你需要两个条件批处理文件不得使用 CRLF 行结尾您
SQL Server 列的默认随机 10 个字符串值

我有一个专栏rndm在我的桌子上客人现在对于领域Default value or Binding对于表每当插入新行时我想自动将 10 个字符的随机字符串插入到该列中作为默认值该随机字符串不能包含特殊字符只能包含以下字符a zA
Android：列“_id”不存在

我收到这个错误 IllegalArgumentException 列 id 不存在当使用SimpleCursorAdapter从我的数据库中检索该表确实有这个 id柱子注意到这是一个常见问题我尝试根据网上的一些解决方案来解决它但它
将二进制长字符串转换为十六进制 C#

我正在寻找一种将长二进制字符串转换为十六进制字符串的方法二进制字符串看起来像这样 0110011010010111001001110101011100110100001101101000011001010110001101101011 我
如何使用 ROR 设置控制器页面内的文本区域属性[重复]

这个问题在这里已经有答案了任何人都可以解决我的小问题吗实际上我想在页面加载并检查某些条件后设置文本区域启用让我来解释一下我的故事实际上是我想要的 Story 我有一个博客页面当用户登录并进入博客页面时应该启用文本区域来发表评论如
如何找到 NuGet 包安装的可执行文件？

我的项目需要打包为zip文件进行部署我想在构建后步骤中创建此 zip 文件为了实现这一点我通过 NuGet 安装了 7 Zip 命令行包该包提供了一个可执行文件我想在构建后步骤中调用它我知道我可以通过提供已安装软件包的路径来调用
错误：运算符不存在：整数 = 字符变化，使用 Postgres 8.2

我有一个用旧版本的 Eclipse Ganymede 如果我没记错的话开发的 Java EE Web 应用程序我最近迁移到 Kubuntu 12 04 LTS 并将应用程序迁移到 Eclipse Kepler 我从 Eclipse 网站
android-如何在谷歌地图上将标记的位置显示为地址

我已经尝试过 commonsware googlemapsv2 教程特别是在地图上拖动标记但现在另一个问题困扰着我问题是如何将标记的当前位置显示为地图下方或上方的地址字符串这是我使用的代码 public class MainAct
当我的应用程序运行时，为什么我会在 Android Studio Logcat 中看到“无可调试应用程序”？

我想过滤 Android Studio Logcat 中显示的内容以显示仅与我的应用程序相关的内容我已经选择Show only selected applications从 logcat 顶部的下拉列表中如以下屏幕截图所示但是在它上
在派生类中访问基类变量

class Program static void Main string args baseClass obj new baseClass obj intF 5 obj intS 4 child obj1 new child Consol
Scala：如何获取数据框中的行范围

我有一个DataFrame通过运行创建sqlContext readParquet 文件的一个 The DataFrame由 300 M 行组成我需要使用这些行作为另一个函数的输入但我想以较小的批次进行操作以防止 OOM 错误目前
从数据集的给定日期范围中提取属于一天的数据

我有一个数据集日期范围为 2018 年 1 月 12 日到 8 月 3 日其中包含一些值维数为my df数据框是 my df shape 9752 2 每行包含半小时频率第一行开始于2018 01 12 my df iloc 0 D

从数据集的给定日期范围中提取属于一天的数据

从数据集的给定日期范围中提取属于一天的数据 的相关文章

随机推荐

热门标签

从数据集的给定日期范围中提取属于一天的数据的相关文章