我正在尝试将大型稀疏数据帧保存到 hdf5 文件,但出现归因错误:
one_hot = pd.get_dummies(my_DF, columns=['cat'], sparse=True)
one_hot.to_hdf('/content/data.h5', 'table', mode='w', append=True, complevel=9, complib='bzip2')
我收到错误:
AttributeError: 'SparseDtype' object has no attribute 'itemsize'
我为 to_hdf 尝试了不同的组合,但没有成功。我以前从未转换为 hdf5,所以我可能会丢失一些东西。我在谷歌上找不到有关此错误的任何信息,所以我想知道是什么导致了此错误?我能做什么来解决它?
https://github.com/pandas-dev/pandas/issues/31199 https://github.com/pandas-dev/pandas/issues/31199to_hdf 尚不支持稀疏数据类型。
好消息是它是已知的,但坏消息是它没有分配给任何人,也没有进行任何修复。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)