我正在使用 pandas 读取 python 中的文件,然后将其保存在 numpy 数组中。
该文件的尺寸为 11303402 行 x 10 列。
我需要拆分数据以进行交叉验证,为此我将数据切片为 11303402 行 x 9 列的示例和 1 个 11303402 行 x 1 列标签的数组。
以下是代码:
tdata=pd.read_csv('train.csv')
tdata.columns='Arrival_Time','Creation_Time','x','y','z','User','Model','Device','sensor','gt']
User_Data = np.array(tdata)
features = User_Data[:,0:9]
labels = User_Data[:,9:10]
错误出现在以下代码中:
classes=np.unique(labels)
idx=labels==classes[0]
Yt=labels[idx]
Xt=features[idx,:]
在线上:
Xt=features[idx,:]
它说“数组索引太多”
所有 3 个数据集的形状为:
print np.shape(tdata) = (11303402, 10)
print np.shape(features) = (11303402, 9)
print np.shape(labels) = (11303402, 1)
如果有人知道这个问题,请帮忙。