我有一个镶木地板文件,其中有一个日期字段,名为'BusinessDate'
。当我将其导入数据框时,它会自动确定字段 BusinessDate 是日期(datetime64[ns, UTC]
).
然而,由于这种格式'BusinessDate'
场是'YYYY-MM-DD'
,其中一些日期导入不正确。例如。 2013-02-01 应该是 2013 年 2 月 1 日,但实际上被解释为 2013 年 1 月 2 日。
是否可以设置正确的格式'BusinessDate'
导入镶木地板文件时的字段?
最初我使用:
df.read_parquet('data.parquet')
如果我有一个 csv 文件,我的解决方案是:
custom_date_parser = lambda x: datetime.strptime(x, '%Y-%m-%d')
df.read_csv('data.csv',parse_dates=['BusinessDate'], date_parser=custom_date_parser)
但是,当我尝试使用类似的代码来尝试修复日期问题时,它会给出错误:
custom_date_parser = lambda x: datetime.strptime(x, '%Y-%m-%d')
df.read_parquet('data.parquet',parse_dates=['BusinessDate'], date_parser=custom_date_parser)
该错误是由于以下事实引起的:read_parquet
函数没有parse_dates
or date_parser
属性,read_csv
功能确实有。
所以我的问题是:如何在 pandas 中导入镶木地板文件,以便'BusinessDate'
字段以正确的格式正确导入为日期,即'YYYY-MM-DD'
就我而言。或者如果熊猫无法做到这一点read_parquet
功能,是否可以导入'BusinessDate'
字段作为 a 中的字符串字段pandas.DataFrame
以便我之后可以更改它?