我正在做一些工作datasets
包含许多DateTime
变量。我总是保存一个.csv
数据清理后的文件。但是,当我下次将文件加载到 pandas 时,我必须转换dtypes
再次,这将需要很长时间。因此,我想知道是否有一种类型的文件可以用 Pandas 保存来避免这种情况。
您可以使用序列化您的对象pickle
。谢天谢地pandas
有一个本机函数来序列化和导出 DataFrame。只需使用导出
df.to_pickle('your_file.pkl')
来自文档:https://pandas.pydata.org/pandas-docs/stable/ generated/pandas.DataFrame.to_pickle.html https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_pickle.html
然后,您可以使用再次加载 DataFrame
df = pandas.read_pickle('your_file.pkl')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)