为什么不使用dtype=object
?
In [1]: my_list = [['User_0', '2012-2', 1, 6, 0, 1.0], ['User_0', '2012-2', 5,
6, 0, 1.0], ['User_0', '2012-3', 0, 0, 4, 1.0]]
In [2]: my_np_array = np.array(my_list, dtype=object)
In [3]: my_np_array
Out[3]:
array([['User_0', '2012-2', 1, 6, 0, 1.0],
['User_0', '2012-2', 5, 6, 0, 1.0],
['User_0', '2012-3', 0, 0, 4, 1.0]], dtype=object)
Note这是关于内存使用的,当您指定每列的 dtype 时,分配给您的内存ndarray
会比你使用时少dtype=object
其中包含 python 中所有可能的类型,因此为每列分配的内存将是最大的。