在 pandas 中将列解析为日期时间的最快方法

2023-12-06

我有以下超过 400 000 行的数据框。

df = pd.DataFrame({'date' : ['03/02/2015 23:00',
'03/02/2015 23:30',
'04/02/2015 00:00',
'04/02/2015 00:30',
'04/02/2015 01:00',
'04/02/2015 01:30',
'04/02/2015 02:00',
'04/02/2015 02:30',
'04/02/2015 03:00',
'04/02/2015 03:30',
'04/02/2015 04:00',
'04/02/2015 04:30',
'04/02/2015 05:00',
'04/02/2015 05:30',
'04/02/2015 06:00',
'04/02/2015 06:30',
'04/02/2015 07:00']})

我正在尝试尽快解析 pandas 中 csv 文件的日期列。我知道如何使用 read_csv 来做到这一点，但这需要很多时间！另外，我尝试了以下方法，该方法有效但速度也很慢：df['dateTimeFormat'] = pd.to_datetime(df['date'],dayfirst=True)

如何有效且快速地将日期列解析为日期时间？

非常感谢您的帮助，

Pierre

您可以定义格式datetimes by http://strftime.org/:

df = pd.concat([df] * 1000, ignore_index=True)


%timeit df['dateTimeFormat1'] = pd.to_datetime(df['date'],dayfirst=True)
2.94 s ± 285 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

%timeit df['dateTimeFormat2'] = pd.to_datetime(df['date'],format='%d/%m/%Y %H:%M') 
55 ms ± 1.47 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas

Parsing

datetime

在 pandas 中将列解析为日期时间的最快方法的相关文章

如何在 python 2.7 中创建负日期时间

我需要在 mongodb 中插入一些 BC 日期但我无法创建具有负值的日期时间例如datetime datetime 2000 2 1 但是在 mongodb 中可以使用 IsoDate 那么我如何在 python 中创建负日期呢我目
Pandas 报告系列为小数时为对象

我需要一种自动可靠的方法来查找 pandas 数据框中每列的数据类型我一直在使用 dtype 但注意到它有一些意想不到的东西考虑这个 10 行数据框 df a Out 6 0 250 00 1 750 00 2 0 00 3 0 00
Pandas：使用数据帧的多列作为另一个数据帧的索引

我有一个包含我的数据的大型数据框以及另一个具有相同第一维度的数据框其中包含有关每个时间点的元数据例如试验编号是什么试验类型是什么我想要做的是使用元数据帧的值对大数据帧进行切片我想将它们分开而不是将数据数据帧存储为较大数据
pandas 数据框中的第一列不是列？

我有一个数据框 gt gt df Column1 Column2 vo1 102 0 023002 0 301 3571 662104 0 302 1346 910261 0 那么有三列吗但 gt gt df dtypes Column1
为什么 string.Empty 比 "" 更推荐？

Why is string Empty比更推荐是因为当编译器解析代码时来了编译器会准备好读取一个字符串吗但在string Empty编译器甚至不会准备好读取字符串还有另一个原因常量由于其本质是一个静态是对某个应用程序域中所
有效地选择与 Pandas DataFrame 中的多个值之一匹配的行[重复]

这个问题在这里已经有答案了 Problem 给定 Pandas DataFrame 中的数据如下所示 Name Amount Alice 100 Bob 50 Charlie 200 Alice 30 Charlie 10 我想选择所有行
内存泄漏 - 每个请求命中容器中运行的 Flask API 后

我有一个 Flask 应用程序在 EC2 上的容器中运行启动容器时 docker 统计数据显示内存使用量接近 48MB 进行第一次 API 调用从 s3 读取 2GB 文件后使用量上升至 5 72GB 即使 api 调用完成后使用
在 Python 3 的 Pytz 模块中将 EST、CST 和 DST 时区转换为 unix 时间戳

我有一个采用以下格式的日期 2019 12 13 20 18 EST or 2019 12 13 20 18 DSTor 2019 12 13 20 18 CST 我想将它们转换为unix timestamp 我在用Pytz module
Python：按组计算数据框中的特定出现次数

假设我有一个 df df pd DataFrame id 12 35 37 67 99 78 product banana apple banana pear banana apple reordered 1 0 0 1 1 1 id pr
从 Pandas 的 DatetimeIndex 中创建月份和年份的列表

我有一个信息数据框我将索引设置为接收的日期和时间现在我想要一个清单我设置 df 索引这样做 df index pd to datetime df index format m d Y H M 这给了我这个 print df index
使用 python 元素树从 xml 在 Excel 工作表中创建子表
如何在 VBScript 中使用最少的分隔符和时区格式化日期时间？

我在 C 中有以下代码 DateTime dt GetDateTime string formatted dt ToString yyyyMMddTHHmmsszz 它返回以下格式的日期 20100806T112917 01 我希望能够在
Javascript .toLocaleString() 不支持“2 位数字”

原始问题如何让小时月遵守两位数格式 const event new Date 2012 3 20 3 0 0 Edit 抱歉我不经常使用这个真正的问题取决于您使用的 Chrome 版本它以不同的方式尊重这种格式例如 new
没有 DateAdd() 的 SSIS 表达式前一个日期

目前正在开发一个包它将表达式从先前的日期传递到文件名我当前的代码如下作为字符串变量 DT WSTR 20 DATEPART YYYY Dateadd DD 1 dateadd MM datediff MM DT DATE 1900 01
Pandas 字符串提取所有匹配项

我正在学习 pandas 系列字符串方法中的正则表达式操作我能够从字符串中提取第一个数字但我的正则表达式与第二个数字不匹配如何捕获这两个数字注意第二行第二个元素在这里是 NAN CODE import pandas as pd d
Xcode 6.3 Parse SDK 1.7.1 PFTableViewCell 错误“具有不兼容的类型”

My code override func tableView tableView UITableView cellForRowAtIndexPath indexPath NSIndexPath object PFObject gt PFT
使用 python 只读取 Excel 中的可见行

我想只读取 python 中 Excel 工作表中的可见行输入 Excel表所以当我过滤时作为 python 中的输出在本例中我将仅获得可见数据 1 行这是我的代码 from openpyxl import load workbo
检查多个 pd.DataFrame 是否相等

是否有一种 Pythonic 方式无循环或递归来检查是否超过两个pd DataFrames 例如 pd DataFrames 列表彼此相等吗就像是 all x equals dfs 0 for x in dfs with dfs数据
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
当价格低于阈值时使用 pandas DataFrame 实施矢量化止损

给出这个示例数据框 date close signal positions 2017 01 02 27 90 0 0 0 0 2017 01 03 27 76 0 0 0 0 2017 01 04 28 65 1 0 1 0 2017 01

随机推荐

我可以对自定义查询进行分页而不覆盖默认分页吗？

在我的 CakePHP 1 2 应用程序中我有两个都使用分页的操作索引和搜索在上一个问题中我了解到为了将阈值分数应用于搜索结果我需要使用HAVINGMySQL 关键字由于 CakePHP 本身不支持此功能因此我需要下拉到自定
如何将 Javascript 变量传递给和 JSTL？

如何将 Javascript 变量传递给 JSTL 您需要将其作为请求参数发送其中一种方法是填充隐藏的输入字段
连接mysql并运行命令的批处理文件

我想从 Windows 运行一个批处理文件它连接到不同计算机上的 mysql 服务器并从数据库运行一个过程或运行位于我本地计算机中的 sql 文件有办法做到吗我知道我的批处理文件中需要以下脚本来运行 sql 命令但我相信它只有在
BigQuery 无法从 CSV 文件中解析 M/D/YYYY 格式的日期

Problem 我正在尝试从 Google Cloud Storage 中的 CSV 文件创建 BigQuery 表我明确定义了加载作业的架构如下并设置要跳过的标题行 1 Data cat date formatting test c
如何更改 knit 中 kable 输出表中单元格的颜色

如果单元格的值大于 80 我需要为单元格着色例如给定这个名为 df 的数据框 dput df structure list Server structure 1 2 Label c Server1 Server2 class facto
将输出写入 Graphchi 中的文件

我在 Graphchi 中编写了一个最短路径代码我想在文件中打印该代码的输出我试图使用示例中显示的模板但如果我使用与其他示例中相同的写入文件的方式则会出现错误我被困在这里了作为输出我只想打印顶点 ID 距源的最小距离我怎样
如何过滤一组 (int, str) 元组，以仅返回第一个元素中具有最小值的元组？

假设我有一组表示带有分数的 URL 的元组 0 75 http www foo com 0 33 http www bar com 0 5 http www foo com 0 66 http www bar com 有什么简洁的方法可
如何在 Inno Setup 中运行 CMD 命令而不打开新窗口

我正在使用 Inno Setup 安装程序来设置一个安装程序文件该文件可以调用我刚刚通过其脚本安装的 exe 并在安装后立即使用以下命令启动它 Run Filename cmd Description cm LaunchProgram 3
用于发送带有附件的电子邮件的 VBA 循环还包括所有先前迭代的附件

我需要在 Excel 2007 中发送一封电子邮件其中包含电子邮件正文中工作簿中的一系列单元格以及每个收件人的不同附件我在使用下面的代码时遇到困难除了添加附件之外一切都按预期进行当我开始循环发送带有各自附件的电子邮件时它包括所
如何在 python 中使用 try 和 except 捕获空用户输入？ [关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案我试图弄清楚如何使用 try 和 except 捕获空的用户输入例如如果你有这个 try user input here integer input except ValueEr
如何在列表中找到相同的值并将其分组到一个新列表中？

从这个列表 N 1 2 2 3 3 3 4 4 4 4 5 5 5 5 5 我正在尝试创建 L 1 2 2 3 3 3 4 4 4 4 5 5 5 5 5 任何被发现相同的值都会被分组到它自己的子列表中到目前为止这是我的尝试我想我应该
是否可以在 Spring WS Web 服务中重命名响应名称空间前缀？

我已经建立了一个Spring WS 网络服务基于以下示例http spring io guides gs having web service 响应包含我的名称空间前缀为 ns2 xmlns ns2 http www mycompany
计算 Pandas Dataframe 中两个日期之间的 GroupBy 内的行数

我有一个数据框df 可以使用以下代码创建 import random from datetime import timedelta import pandas as pd import datetime create test range
使用 DirectShow 的视频录制分辨率

在 directshow 中录制时如何更改视频的屏幕分辨率因为我有一个 8 兆像素网络摄像头我用它来录制视频但保存视频后当我查看视频时它的播放效果就像是使用 1 3 兆像素相机录制的一样你需要使用IAMStreamConfig界
如何将 TypeScript 可变元组类型用于笛卡尔积函数？

TypeScript 4 0 开始支持以下概念可变参数元组类型一个很好的类型构造可以用于例如串联函数文档中的一个示例 type Arr readonly any function concat
了解canvas如何将图像转换为黑白图像

我发现这个脚本用于将图像转换为黑白图像效果很好但我希望更好地理解代码我将我的问题以注释的形式放在代码中谁能更详细地解释一下这里发生的事情 function grayscale src Creates a canvas element
ASP.Net Core 2.2 - 输入和输出的单独序列化器设置

ASP Net Core 2 2 允许使用设置序列化器设置MvcJsonOptions SerializerSettings财产问题是它会影响输入和输出有没有办法为输入反序列化和输出序列化提供单独的选项特别是我需要为Null
加载包含数字和字母的文本文件

我有一个文本文件如下所示 A B C 1 2 3 这只是我实际拥有的一个最小示例我的实际文件很大并且行数各不相同我想将此文件加载到 Octave 中但是该文件包含字母而不仅仅是数字当我尝试应用加载函数时出现错误我猜这是因为
如何在 Android 中播放直播视频

在我的项目中我需要播放实时流视频我看到很多评论说只有3 0才支持直播所以我必须使用模拟器3 0 但它不播放任何人都可以帮我吗这是我的代码 String SrcPath http akamedia2 lsops net live
在 pandas 中将列解析为日期时间的最快方法

我有以下超过 400 000 行的数据框 df pd DataFrame date 03 02 2015 23 00 03 02 2015 23 30 04 02 2015 00 00 04 02 2015 00 30 04 02 2015

在 pandas 中将列解析为日期时间的最快方法

在 pandas 中将列解析为日期时间的最快方法 的相关文章

随机推荐

热门标签

在 pandas 中将列解析为日期时间的最快方法的相关文章