为什么创建 SparseDataFrame (Python pandas) 需要这么长时间?

2024-02-20

给出以下代码(在 Jupyter 笔记本中执行):

In [1]: import pandas as pd
        %time df=pd.SparseDataFrame(index=range(0,1000), columns=range(0,1000));

CPU times: user 3.89 s, sys: 30.3 ms, total: 3.92 s
Wall time: 3.92 s

为什么创建稀疏数据框需要这么长时间?

请注意,如果我增加行的维度,这似乎是无关紧要的。但是当我将列数从 1000 增加到 10000 时,代码似乎要花很长时间,我总是不得不中止它。

将其与 scipy 的稀疏矩阵进行比较:

In [2]: from scipy.sparse import lil_matrix
        %time m=lil_matrix((1000, 1000))

CPU times: user 1.09 ms, sys: 122 µs, total: 1.21 ms
Wall time: 1.18 ms

None

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

为什么创建 SparseDataFrame (Python pandas) 需要这么长时间? 的相关文章

随机推荐