假设我有一个图像文件夹,例如:
PetData
|
Dog - images
|
Cat - images
我如何将其转换为 (x_train, y_train),(x_test, y_test) 格式?我看到这种格式广泛用于 MNIST 数据集,如下所示:
mnist = tf.keras.datasets.mnist
(x_train, y_train),(x_test, y_test) = mnist.load_data()
不过我想用我自己的图像文件夹来完成此操作。
mnist.load_data()
返回两个元组,其中包含图像内容和标签uint8
数组。您应该通过加载文件夹的图像来获取这些数组(您可以使用诸如PIL.Image
为了加载 X,您的 y 只是文件夹名称提供的设置标签)。
PIL.Image
使用示例:
from PIL import Image
import glob
for infile in glob.glob("*.jpg"):
im = Image.open(infile)
要拆分训练/测试,您可以使用sklearn.model_selection.train_test_split
:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)