我目前正在使用 sklearn 构建一个简单的图像识别器。
我需要使用 load_files('./directory/') 从该目录中的子文件夹加载图像。
它正确地获取了目标值,但数据属性不是简单的像素值。我假设我需要设置编码参数来考虑图像文件,但找不到确切要使用的内容。
编码参数用于解码假设文本编码(例如 UTF-8)的文件内容的原始字节。
对于图像文件,您需要迭代其内容filenames
归因自己并使用类似的东西scipy.misc.imread(您还需要安装 PIL 或 Pillow 包)。
下面是一个实用函数,用于将 Wild 中的 Labeled Faces 中的 jpeg 文件数据加载为 numpy 数组:
https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/lfw.py#L108
您可以使用它来了解如何编写自己的自定义数据集加载器。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)