我正在尝试将手写字符数据集重塑为 3D 形式,以便它可以与数字识别数据集连接起来。我尝试了多次,但我不知道如何做到这一点。
实际的数字识别数据集的形状为 (60000, 28, 28)
字符识别数据集的形状为 (372450, 785),第一列是目标变量。由于排除第一列 28*28=784,因此有可能将其转换为与数字数据集相同的 3D。请建议如何做到这一点?
我需要一个像 (372450,28,28) 这样的形状来表示整个数据框
先感谢您
形状 (372450, 785) 的数组不能变成 (372450,28,28),因为 28*28 是 784 而不是 785。但是如果你的意思是把 (372450, 784) 变成 (372450,28,28),你可以做
arr = df.column_name.values
将给出一个 numpy 数组,其中的值来自column_name
数据帧的字段df
.
现在你可以使用reshape()
like
arr = arr.reshape(-1,28,28)
Now arr
形状将是 (372450,28,28)。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)