pandas.read_parquet 错误地解释了日期字段

2023-12-03

我有一个镶木地板文件，其中有一个日期字段，名为'BusinessDate'。当我将其导入数据框时，它会自动确定字段 BusinessDate 是日期（datetime64[ns, UTC]).

然而，由于这种格式'BusinessDate'场是'YYYY-MM-DD'，其中一些日期导入不正确。例如。 2013-02-01 应该是 2013 年 2 月 1 日，但实际上被解释为 2013 年 1 月 2 日。

是否可以设置正确的格式'BusinessDate'导入镶木地板文件时的字段？

最初我使用：

df.read_parquet('data.parquet')

如果我有一个 csv 文件，我的解决方案是：

custom_date_parser = lambda x: datetime.strptime(x, '%Y-%m-%d')
df.read_csv('data.csv',parse_dates=['BusinessDate'], date_parser=custom_date_parser)

但是，当我尝试使用类似的代码来尝试修复日期问题时，它会给出错误：

custom_date_parser = lambda x: datetime.strptime(x, '%Y-%m-%d')
df.read_parquet('data.parquet',parse_dates=['BusinessDate'], date_parser=custom_date_parser)

该错误是由于以下事实引起的：read_parquet函数没有parse_dates or date_parser属性，read_csv功能确实有。

所以我的问题是：如何在 pandas 中导入镶木地板文件，以便'BusinessDate'字段以正确的格式正确导入为日期，即'YYYY-MM-DD'就我而言。或者如果熊猫无法做到这一点read_parquet功能，是否可以导入'BusinessDate'字段作为 a 中的字符串字段pandas.DataFrame以便我之后可以更改它？

很好的问题。 Pandas 还没有这方面的功能。

阅读 parquet 后，我建议您使用 lambda 函数，如下所示：

df['new_col'] = df['col'].apply(lambda x: datetime.strptime(x, '%Y-%m-%d'))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas.read_parquet 错误地解释了日期字段的相关文章

如何返回 cost, grad 作为 scipy 的 fmin_cg 函数的元组

我怎样才能使 scipy 的fmin cg使用一个返回的函数cost and gradient作为元组问题是有f对于成本和fprime对于梯度我可能必须执行两次操作非常昂贵 grad and cost被计算此外在它们之间共享变量可
按边距（“全部”）值列对 Pandas 数据透视表进行排序

我试图根据 pandas 数据透视表中的行总和对最后一列边距 aggrfunc 进行降序排序我知道我在这里错过了一些简单的东西但我无法弄清楚数据框数据透视表 WIDGETS DATE 2 1 16 2 2 16 2 3 16 Al
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
在Python中从大文件中搜索单词列表

我是新蟒蛇我有一个单词列表和一个非常大的文件我想删除文件中包含单词列表中的单词的行单词列表按排序给出并且可以在初始化期间输入我正在努力寻找解决这个问题的最佳方法我现在正在进行线性搜索这花费了太多时间有什么建议么您可以使用i
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
使用 Django 将文件异步上传到 Amazon S3

我使用此文件存储引擎在上传文件时将文件存储到 Amazon S3 http code welldev org django storages wiki Home http code welldev org django storages w
如何通过 python 多处理利用所有核心

我一直在摆弄Python的multiprocessing现在已经使用了一个多小时的功能尝试使用并行化相当复杂的图形遍历函数multiprocessing Process and multiprocessing Manager import
协程从未被等待

我正在使用一个简单的上下文管理器其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
在 python pandas 中，如何保存“网格图”？

我对 pandas 绘图工具很陌生在文档中以下命令非常方便 myplot rts ret hist bins 50 by rts primary mic 然而当我尝试从图中获取图形参考并保存它时问题就出现了 myfigure myp
Python HMAC：类型错误：字符映射必须返回整数、None 或 unicode

我在使用 HMAC 时遇到了一个小问题运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
Ubuntu systemd 自定义服务因 python 脚本而失败

希望获得有关 Ubuntu 中的 systemd 守护进程服务的一些帮助我写了一个 python 脚本来禁用 Dell XPS 上的触摸屏这更像是一个问题而不是一个有用的功能该脚本可以工作但我不想一直启动它这就是为什么我想到编写
检测是否从psycopg2游标获取？

假设我执行以下命令 insert into hello username values me 我跑起来就像 cursor fetchall 我收到以下错误 psycopg2 ProgrammingError no results to fe
无法通过 Python 子进程进行 SSH

我需要通过堡垒 ssh 进入机器因此该命令相当长 ssh i
日历中 primefaces ajax 上的事件日期选择不起作用

我有一个日历
如何从namedtuple实例列表创建pandas DataFrame（带有索引或多索引）？

简单的例子 from collections import namedtuple import pandas Price namedtuple Price ticker date price a Price GE 2010 01 01 30
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
将 r 中的一列从出生日期更改为年龄

我是第一次使用 data table 我的表中有大约 400 000 个年龄的列我需要将它们从出生日期转换为年龄做这个的最好方式是什么我一直在思考这个问题到目前为止对这两个答案都不满意我喜欢用lubridate 就像 KFB 所做
无法安装最新版本的 Numpy (1.22.3)

我正在尝试安装最新版本的 numpy 即 1 22 3 但看起来 pip 无法找到最后一个版本我知道我可以从源代码本地安装它但我想了解为什么我无法使用 pip 安装它 PS 我有最新版本的pip 22 0 4 ERROR Could n

随机推荐

扩展命令提示符的环境变量

我想运行一个 cmd exe 它会在调用时而不是在解析命令时评估环境变量如果我将 BASE 设置为 2 并回显它我应该会看到数字 2 尽管运行此脚本无法正确设置基数预期行为 C Users schristo gt cmd exe X
如何从 ASP.Net MVC 列表页面使用 jQuery UI 模态表单

我正在尝试使用这个 http jqueryui com demos dialog modal form I have
从数据库获取自动编号值

代码如下在我的代码中我更新现有行从现有表程序从文本框中获取所有更新的值表的末尾最后一列有一个名为 codonsAutoNum 的自动编号字段我不知道如何从数据库获取值自动编号值我需要在代码中有的位置的值感谢大家的
ES6 生成器 - 第一个 next() 没有 Yield 表达式的示例

对于 ES6 生成器为什么作者这篇博文 say from http davidwalsh name es6 generators 第一个 next 调用我们不发送任何内容为什么因为没有yield 表达式来接收我们传入的内容不是第一
消息：使用 selenium python 发送密钥 [search_bar.send_keys(course_name)] 到 Youtube 搜索栏时元素不可交互错误

我尝试了 StackOverflow 的大部分解决方案但对我不起作用我正在尝试使用 selenium python 将一些课程名称发送到 youtube 搜索栏它以前工作正常但现在在执行此操作时出现此错误 search bar se
Azure AD 重定向 URI 从 https 更改为 http

Overview 我在 Azure AD 门户注册了一个应用程序重定向机制在开发过程中一直运行良好但 Oauth 重定向 URI 上发生了奇怪的转换客户端应用程序是使用 Django 框架并使用 MSAL for Python 库构建
防止 UISearchDisplayController 隐藏导航栏

每当用户开始编辑UISearchDisplayController的搜索栏搜索控制器将变为活动状态并在显示搜索表视图时隐藏视图的导航栏是否可以预防UISearchDisplayController隐藏导航栏而不重新实现它我刚刚对 U
检查 varchar2 中声明的有效日期

我的表如下所示在 VARCHAR2 中声明 YMD 20101010 20101112 20100231 20150101 20160101 我必须检查有效日期并从 sysdate 中过滤未来日期这些日期的格式有效我编写如下函数来检查
如何在 Struts 2 中创建一个 Action 来接受来自用户界面的动态 JSON 数据？

我想要一个Action类应该接受从用户界面构造的 JSON 字符串其中没有 setter 和 getterAction class 是否可以如果是这样我需要遵循哪些约定Action类和配置文件中 struts xml 将它们发布为带有
最通用的高阶约束，描述相对于关系排序的整数序列

在 CLP FD 中我们经常需要声明这是整数和有限域变量的列表有时 strictly 升序降序是否有任何 CLP FD 系统为此任务提供通用可参数化内置约束 SWI Prolog 提供了一个称为chain 2 这与我正在寻找的
如何在 Jackson 中反序列化多个嵌套元素？

我需要构建一个解析器来解析XML文件到一个Java目的我用Jackson为此请按照中提供的步骤操作THIS教程在教程中有一节操作 XML 中的嵌套元素和列表我遵循了它但不幸的是我无法获得所有所需元素的所需输出我想输出所有作者的
转到特定路线的 div 元素

我有两条路线从一条路线我需要通过单击按钮获取另一条路线的 div 元素我做了类似的方式id 我们在 HTML 中这样做但它不起作用你能建议一个在 Angular 中做的最好的方法吗一号公路 route1 div class div
RESTAssured 禁用 URL 编码无法正常工作

我正在使用如下 URL 测试 HTTP Post 请求 https myurl com api logs 2Fvar 2flogin 2f 消息 Api Token 12332429nmdsafs 我禁用了 URL 编码这里是我的发布请求
检查机器中安装的模块列表

我制作了一个脚本来告知管理员需要在计算机上安装的模块列表我正在尝试检查模块是否通过下面的代码安装奇怪的是它显示机器中已安装的模块为not installed usr bin perl w my module list Smart Co
如何使用带有预填充数据库的房间持久性库？

我想将 Room 与预填充的数据库一起使用但我不明白如何告诉 Room 在哪里可以找到我的数据库我现在已经把它放进去了src main assets databases当我为 Room 数据库创建实例时我这样创建 Room datab
Android：从资产文件夹复制数据库 (Sqliite) 时出错

我在 SQLite 浏览器中设计了数据库现在我正在尝试将其复制到我的根路径面临的问题复制数据库时出错 LINK 我从这个例子中得到帮助将外部 Sqlite Db 添加到应用程序的链接我的 DBhelper 类 package co
在 Python multiprocessing.Pool 中共享可变全局变量

我正在尝试更新共享对象 dict 使用以下代码但这不起作用它给了我输入dict作为输出 Edit Exxentially 我在这里想要实现的是将数据列表中的项目附加到字典的列表中数据项给出字典中的索引预期产出 2 2 1 1 4
MAMP PRO 崩溃； MySQL 不会在重启时启动

今天上班时我的电脑突然死机崩溃了重新启动时 MAMP 拒绝启动 mysql 我不明白为什么肯定没有其他mysql进程在运行我已经检查过好几次了所以killall 9 mysqld不是解决方案实际上我也完全重新安装了 MAMP
twitter4j 未发现身份验证挑战

几天来一直尝试使用 twitter4j 发布推文但没有运气我想做的是让一个人在一轮结束时从应用程序的时间轴上发布他们的新最高分这是我的代码 Override protected void onCreate Bundle savedIn
pandas.read_parquet 错误地解释了日期字段

我有一个镶木地板文件其中有一个日期字段名为 BusinessDate 当我将其导入数据框时它会自动确定字段 BusinessDate 是日期 datetime64 ns UTC 然而由于这种格式 BusinessDate 场是 YY

pandas.read_parquet 错误地解释了日期字段

pandas.read_parquet 错误地解释了日期字段 的相关文章

随机推荐

热门标签

pandas.read_parquet 错误地解释了日期字段的相关文章