来自字典的数据帧，具有自动日期解析功能

2023-12-11

我正在从字典序列创建一个 Pandas DataFrame。这些词典很大而且有些异构。有些字段是日期。

我想自动检测并解析日期字段。这可以通过以下方式实现

df0 = pd.Dataframe.from_dict(dicts)
df0.to_csv('tmp.csv', index=False)
df = pd.read_csv('tmp.csv', parse_dates=True)

我想找到一种更直接的方法来做到这一点。

Use `pd.to_datetime` with `errors='ignore'`

仅用于列dtype == object using select_dtypes。这可以防止将数字列转换为无意义的日期。
'ignore'如果遇到任何错误，则放弃转换尝试。
combine_first被用来代替update因为update保留初始值dtypes。既然他们是对象，这就会把一切搞砸。

df.select_dtypes(include=object).apply(pd.to_datetime, errors='ignore').combine_first(df)

       date0      date1  feuxdate notadate
0 2019-01-01        NaT       NaN      NaN
1        NaT        NaT       0.0      NaN
2        NaT        NaT       NaN       hi
3        NaT 2019-02-01       NaN      NaN

使用它也可能会变得棘手assign处理dtypes

df.assign(**df.select_dtypes(include=object).apply(pd.to_datetime, errors='ignore'))

Setup

dicts = [
    {'date0': '2019-01-01'},
    {'feuxdate': 0},
    {'notadate': 'hi'},
    {'date1': '20190201'}
]

df = pd.DataFrame.from_dict(dicts)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

date

DataFrame

来自字典的数据帧，具有自动日期解析功能的相关文章

如果每个区域内至少有 5 个连续行，如何在每个标题区域的末尾使用 Title[Name]2 发布新行？

我想在每个 Title 区域的末尾使用 Title Name 2 发布新行的最简单方法是通过一个计算连续行数的变量其中至少有 5 个连续行包含 1 1 1 1在每个标题区域内我不确定我对计数变量做错了什么也许确实必须在每个 Tit
将 2D Panda 的 DataFrame 列表转换为 3D DataFrame

我正在尝试创建一个将标签值保存到 2D DataFrame 的 Pandas DataFrame 这是我到目前为止所做的我正在使用读取 csv 文件pd read csv并将它们附加到列表中出于这个问题的目的让我们考虑以下代码 imp
使用 Matplotlib 的范围绘制图像的 3D 轮廓

正如我所介绍的here https stackoverflow com questions 18792624 fits image input to a range in plot python 在二维中我想知道如何缩放要绘制到绘图中
使用 NumPy 的 Mittag-Leffler 函数的不稳定性

在尝试重现时Wolfram MathWorld 上的情节 http mathworld wolfram com Mittag LefflerFunction html 并试图帮助这个问题 https stackoverflow com qu
python - 将cookie添加到cookiejar

如何在 python 中创建 cookie 并将其添加到 CookieJar 实例我拥有 cookie 的所有信息名称值域路径等但我不想通过 http 请求提取新的 cookie 我尝试了这个但看起来 SimpleCookie
使用 argparse 指定默认文件名，但不使用 --help 打开它们？

假设我有一个对文件执行一些操作的脚本它在命令行上获取此文件的名称但如果未提供则默认为已知文件名 content txt 说与蟒蛇的argparse 我使用以下内容 parser argparse ArgumentParser des
为什么最简单的 requests_mock 示例在 pytest 中失败？

我有一个特殊的问题requests mock 我想用它pytest测试我的 API 包装器库我尝试过使用requests mock 文档中的第一个示例 http requests mock readthedocs io en latest
如何从 Python 3.5 降级到 3.4

我想安装 kivy 链接在这里 https kivy org docs installation installation windows html install win dist 用于项目但是当尝试使用 pip 安装它所依赖的包时
获取 pandas 数据框中每列的前 k 个元素的索引的快速方法

我有一个非常大的 pandas 数据框大约有 500 000 列每列大约有 500 个元素长对于每一列我需要检索该列中前 k 个元素的索引列位置所以如果 k 等于 2 这是我的数据框 A B C D w 4 8 10 2
python：UnboundLocalError：赋值前引用的局部变量“open”[重复]

这个问题在这里已经有答案了 def read lines readFileName readfile txt f open readFileName r contents f read and so on read lines 当我运行这个
进行异步调用时，“yield”在龙卷风中如何工作？

最近我在学习龙卷风简介我遇到了以下代码 class IndexHandler tornado web RequestHandler tornado web asynchronous tornado gen engine def get s
如何打印和显示子进程 stdout 和 stderr 输出而不失真？

也许有人可以帮助我解决这个问题我在 SO 上看到了许多与此类似的问题但没有一个问题同时处理标准输出和标准错误也没有处理像我这样的情况因此出现了这个新问题我有一个 python 函数它打开一个子进程等待它完成然后输出返回代码以
pandas-更改重采样时间序列的开始和结束日期

我有一个时间序列我将其重新采样到这个数据框中df 我的数据是从6月6日到6月28日它希望将数据从6月1日延长到6月30日计数列仅在较长时间内具有 0 值而我的实际值是从 6 日到 28 日 Out 123 count Timesta
CryptoJS 和 Pycrypto 一起工作

我正在使用 CryptoJS v 2 3 加密 Web 应用程序中的字符串并且需要在服务器上使用 Python 对其进行解密因此我使用 PyCrypto 我觉得我错过了一些东西因为我无法让它工作这是JS Crypto AES enc
如何在 matplotlib 中第一个 x 轴的底部添加第二个 x 轴？

我指的是已经提出的问题here https stackoverflow com questions 10514315 how to add a second x axis in matplotlib 在此示例中用户通过将第二个轴添加到与标
枚举上的 random.choice

我想用random choice on an Enum I tried class Foo Enum a 0 b 1 c 2 bar random choice Foo 但是这段代码失败了KeyError 我怎样才能随机选择一个成员Enum
如何使用资源模块来衡量函数的运行时间？

我想使用Python代码测量函数的CPU运行时间和挂钟运行时间此处建议资源模块如何以 Python 代码不是从终端的形式分别测量函数的 CPU 运行时间和挂钟运行时间 https stackoverflow com q 192046
如何从 IDLE 命令行运行 Python 脚本？

在 bash shell 中我可以使用 bash 或 source 手动调用脚本我可以在 Python IDLE 的交互式 shell 中做类似的事情吗我知道我可以转到文件 gt gt 打开模块然后在单独的窗口中运行它但这很麻烦
float() 参数必须是字符串或数字，而不是“时间戳”

我无法使 scilearn 与日期时间系列一起工作找到了这篇文章但对我没有帮助 Pandas 类型错误 float 参数必须是字符串或数字 https stackoverflow com questions 41256626 panda
如何通过组度量的平均值在 df 内排列 dplyr:: 组？

借鉴吴卡拉的设计https stackoverflow com a 26555424 9350837 https stackoverflow com a 26555424 9350837答案我希望根据各个组汇总测量的平均值对分组 df 进

随机推荐

如何确定原始变量的原始类型？

Java 中是否有类似 typeof 的函数返回原始数据类型 PDT 变量的类型或操作数 PDT 的表达式 instanceof似乎仅适用于类类型请尝试以下操作 int i 20 float f 20 2f System out prin
如何设置虚拟 GPIO 环回

我目前正在开发一个应该在 Net 中使用 gpio 引脚的程序我想在虚拟 GPIO 引脚上测试我的程序但我不知道该怎么做我想做一个环回将虚拟 GPIO 1 连接到另一个虚拟 GPIO 2 我已经对串口和 tty0tty 做了类似的事
类声明是红宝石中的洗眼剂吗？一切真的都是面向对象的吗？

class Person def name puts Dave end end puts Person object id 访问方法只有两种方式 1 Someclass method 如果是类方法 where Someclass 是一个类
MySQL 在行组合中强制执行唯一约束

我正在完善搜索自动建议系统经过几次迭代和正常化有以下一组表数据库小提琴 https www db fiddle com f b1FvGDkBMQXkREaMh3pHKi 0 表格1 keywords 它存储字母数字相关关键字的列表
默认类继承访问

假设我有一个基类和派生类 class Base public virtual void Do class Derived Base public virtual void Do int main Derived sth sth Do cal
C# 4.0：我可以使用 TimeSpan 作为具有默认值的可选参数吗？

这两个都会生成一个错误指出它们必须是编译时常量 void Foo TimeSpan span TimeSpan FromSeconds 2 0 void Foo TimeSpan span new TimeSpan 2000 首先有人可
Nifi PutSQL Timestamp/Datetime错误无法转换错误

我尝试了建议的解决方案通过使用 UpdateAttribute 处理器来消除时间戳格式转换错误即将JSON转换为SQL gt UpdateAttribute gt PutSQL 在 UpdateAttribute 中我使用了 Prop
对 2D 列表使用 .strip()

第一个问题我想知道如何在二维列表中使用 strip 函数以便在列表内每个列表的每个元素中您可以删除字符串内无用的空格这是我在 shell 中的尝试 gt gt gt questions 1986 Baby Shaw Welcome
如何使用变量作为对象初始化程序中的键

在我正在工作的应用程序中服务器页面用于接收输入的名称作为其值的键用ajax可以做到这一点吗在此示例中 thisName 被视为文字字符串 table each function this delegate input focusout
在 SymPy 中将 ** 替换为 Math.pow

我有一个 Python 中的 SymPy 表达式我想将其复制并粘贴到 Java 源代码中问题是求幂有不同的表示法 Java用途Math pow a b Python使用a b 所以我的问题是有没有办法以 Java 格式打印 SymP
libgdx 中的背景透明度

如果我在Android中使用libgdx 如何使屏幕背景透明我尝试使用的代码不起作用 Gdx gl glClearColor 0 0 0 0 Gdx gl glClear GL10 GL COLOR BUFFER BIT GL10 GL
ActionError 未显示

我想加载我的Error jsp in my ErrorDiv if Action类返回错误我正在执行 AJAX 调用 JS success function result if result success alert Database
Facebook 分享，标题未分享

转到以下网址共享消息中未显示标题我是否正确使用它或者它是 facebook api 中的错误问候潘卡伊我很确定 Google 通过 JavaScript 更改了页面的 Title 属性如果您查看其搜索结果页面的源代码您会发现
MATLAB：频率分布

我在一个文本文件中对 500 个数值范围从 1 到 25000 进行了原始观察我希望在 MATLAB 中进行频率分布我确实尝试过直方图 hist 但是我更喜欢频率分布曲线而不是块和条形图任何帮助表示赞赏如果将两个输出参数传递给HI
如何在 Symfony2 中设置表单字段的默认值？

有没有一种简单的方法来设置文本表单字段的默认值你可以设置默认值empty data builder gt add myField number empty data gt Default value
twilio python 模块版本 2.0.8 中缺少 twilio.rest？

Twilio python 快速入门指南说使用名为 twilio rest 的子模块但是今天通过安装 twilio 模块后sudo pip install twilio安装了版本 2 0 8 的 twilio 模块中似乎没有名为 rest
如何以编程方式在 EditText 上设置焦点（并显示键盘）

我有一个布局其中包含一些如下视图
从 MediaStore 查询播放列表

我正在尝试从 MediaStore 查询设备中的播放列表我已经关注了之前提出的问题但没有得到答案这就是我查询播放列表的方式 public void addToPlaylist long playlistId Context conte
如何单独显示数字？

假设我在 matplotlib 中有两个图形每个图形一个图 import matplotlib pyplot as plt f1 plt figure plt plot range 0 10 f2 plt figure plt plot
来自字典的数据帧，具有自动日期解析功能

我正在从字典序列创建一个 Pandas DataFrame 这些词典很大而且有些异构有些字段是日期我想自动检测并解析日期字段这可以通过以下方式实现 df0 pd Dataframe from dict dicts df0 to csv

来自字典的数据帧，具有自动日期解析功能

Use pd.to_datetime with errors='ignore'

Setup

来自字典的数据帧，具有自动日期解析功能 的相关文章

随机推荐

热门标签

Use `pd.to_datetime` with `errors='ignore'`

来自字典的数据帧，具有自动日期解析功能的相关文章