使用sklearn load_files()从png加载图像作为数据

2023-11-29

我目前正在使用 sklearn 构建一个简单的图像识别器。

我需要使用 load_files('./directory/') 从该目录中的子文件夹加载图像。

它正确地获取了目标值,但数据属性不是简单的像素值。我假设我需要设置编码参数来考虑图像文件,但找不到确切要使用的内容。


编码参数用于解码假设文本编码(例如 UTF-8)的文件内容的原始字节。

对于图像文件,您需要迭代其内容filenames归因自己并使用类似的东西scipy.misc.imread(您还需要安装 PIL 或 Pillow 包)。

下面是一个实用函数,用于将 Wild 中的 Labeled Faces 中的 jpeg 文件数据加载为 numpy 数组:

https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/lfw.py#L108

您可以使用它来了解如何编写自己的自定义数据集加载器。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用sklearn load_files()从png加载图像作为数据 的相关文章

  • sklearn DeprecationWarning 数组的真值

    从文档中运行 rasa core 示例 python3 m rasa core run d models dialogue u models nlu default current 并在对话框中的每条消息后获取此错误输出 sklearn D
  • CVXPY 二次规划; ArpackNoConvergence 错误

    我尝试使用 Python 包 CVXPY 来解决第一种形式的凸二次规划问题 https www cvxpy org examples basic quadratic program html https www cvxpy org exam
  • 如何使用 django (python) 和 s3 上传文件?

    我正在寻找一种将文件上传到 s3 的方法 我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
  • 如何为 Intellij/PyCharm 设置 PYTHONSTARTUP 脚本

    我尝试添加PYTHONSTARTUP环境变量 我还尝试了自定义启动脚本 但更令人惊讶的是 这also没有工作 npa别名无法识别 出于一点绝望 我什至尝试添加到interpreter options 那什么也没做 实际上是什么Interpr
  • pip 安装失败,SSL 证书验证失败 (_ssl.c:833)

    我无法通过 pip install 安装任何外部 python 模块 我已经正确安装了 python 但如果我使用 pip install 它会显示此错误 这是我运行后的代码pip install pytesseract C Users 1
  • 我应该为 MySQL 使用什么 python 3 库? [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 据我所知 MySQLdb 仍然没有移植到 Python 3 pypy 上似乎有另一个名为 PyMySQL
  • 在 Python 中绘制分类数据的三个维度

    我的数据包含三个我试图可视化的分类变量 城市 五个之一 职业 四种之一 血型 四种之一 到目前为止 我已经成功地以一种我认为易于使用的方式对数据进行了分组 import numpy as np pandas as pd Make data
  • 如何从 Lua 调用 Python 函数?

    我想从我的 lua 文件运行 python 脚本 我怎样才能实现这个目标 Example Python代码 sum py file def sum from python a b return a b Lua code main lua f
  • Windows Defender 检测 Python EXE 为木马

    我制作了一个 Python 脚本 将 Windows 目录以 zip 形式邮寄给我 我使用 sched 模块添加了一个调度程序 每小时重复一次 我试图制作一个简单的同步应用程序供个人使用 在 Windows 启动时启动 我使用将其转换为 e
  • Seaborn 热图中的自定义调色板间隔

    我正在尝试绘制一个heatmap https seaborn pydata org generated seaborn heatmap html使用seaborn库 绘图函数如下所示 def plot confusion matrix da
  • 从主机名中提取域名

    是否有一种编程方式可以从给定的主机名查找域名 给出 gt www yahoo co jp 返回 gt yahoo co jp 有效但非常慢的方法是 拆分为 并从左侧删除 1 个组 使用 dnspython 加入并查询 SOA 记录 当返回有
  • 使 np.loadtxt 使用多个可能的分隔符

    我有一个程序可以读取数据文件 用户可以选择他们想要使用的列 我希望它对于输入文件更加通用 有时 列可能如下所示 10 34 24 58 8 284 6 121 有时它们可 能看起来像这样 10 34 24 58 8 284 6 121 我希
  • 使用 Python 脚本打开特定文件类型?

    如何使 Python 脚本成为特定文件类型 例如 foo 的默认应用程序 例如 当我双击 Finder Explorer 中的文件时 我希望该文件在 Python 脚本中打开 这可以在 Win 和 或 OS X 中实现吗 如果重要的话 该应
  • 使用 statsmodels.formula.api 中的 ols - 如何删除常数项?

    我正在遵循第一个例子statsmodels教程 http statsmodels sourceforge net devel http statsmodels sourceforge net devel 如何指定在 ols 中不使用常数项进
  • 如何可视化多维数据上的 kmeans 聚类

    我在 mnist 数据集上使用 kmeans 聚类算法 并希望可视化聚类后的图 到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
  • Scrapy 抓取并跟踪 href 中的链接

    我对 scrapy 很陌生 我需要从 url 的主页跟踪 href 到多个深度 再次在 href 链接内我有多个 href 我需要遵循这些href 直到到达我想要抓取的页面 我的页面的示例 html 是 初始页 div class page
  • VSCode无法切换matplotlib后端:ImportError:无法加载需要“qt5”交互框架的后端“Qt5Agg”

    我只想通过在 VSCode 中运行 Python 来进行绘图 但结果失败了 我无法将后端从 agg 切换到 Qt5Agg 但是 我可以在 VSCode 的终端中轻松执行此操作 VSCode集成终端中的问题如下所示 我尝试了各种解决方案但失败
  • 在至少 7 天内连续三天登录该产品的用户

    我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1
  • 通过 ManyToManyField = Value 对 django 查询集进行排序

    如果有一些模型 例如 class Tag models Model name models CharField class Thing models Model title models CharField tags models Many
  • django admin 中内联模型的分页器

    我有这个简单的 django 模型 由一个传感器和特定传感器的值组成 每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

  • MATLAB 中神经网络分类的 10 倍交叉验证示例

    我正在寻找在神经网络中应用 10 倍交叉验证的示例 我需要这个问题的链接答案 MATLAB 中 10 重 SVM 分类的示例 我想对所有 3 个类别进行分类 而在示例中只考虑了两个类别 编辑 这是我为 iris 示例编写的代码 load f
  • 将结果集中的值写入文本文件(.txt 文件)

    请帮助我处理下面的代码 因为我想将结果集中的值写入 txt 文件 Code while rs next FileWriter fstream new FileWriter file BufferedWriter out new Buffer
  • 删除列标题中“.”之后的字符

    我有一个与这里提出的问题类似的问题 r 删除列名中某些字符之后的部分不过我有一点皱纹 我的列标题的格式如 ENSG00000124564 16 和 ENSG00000257509 1 但是我想删除后面的所有字符 我不能只删除最后 x 个字符
  • ie9 不尊重 img 元素比例中的 SVG

    CSS img max height 30px HTML img src foo svg 我正在寻找这个 svg 图像按比例缩放到最大高度 30 像素高 svg 的自然尺寸为 200 像素 x 200 像素 在 FF 和 Chrome 30
  • 如何获取.NET 3.5中CSIDL_COMMON_DOCUMENTS的路径?

    我正在为安装程序执行自定义操作 它必须读取存储在的文件CSIDL COMMON DOCUMENTS以确定安装目录 我希望在自定义操作中更改安装目录不会成为问题 但这是另一个问题 我看到 NET 4 添加了CommonDocuments to
  • 如何更改ggplot中图例“键”的方向?

    如何更改下面标题的键 使其处于水平位置而不更改图形的垂直线 set seed 000 m lt matrix rnorm 100 0 1 100 1 dt lt data frame m names dt lt c X library gg
  • 根据两个变量匹配数据帧行(索引)

    我本质上是试图将杂乱的数据转换成长形式以进行线性建模 我有 2 个 data frames rec 和 book book 中的每一行都需要根据行中匹配的两个变量 MRN 和 COURSE 粘贴到 rec 的几行的末尾 我已尝试以下方法及其
  • 在 Python 中从 json 数组中选取数据对象

    我有这个数据对象 我想知道如何选择名为的子对象commits or projects 我试过all commits all data commits 但 python 强迫我给它一个整数而不是字符串 想法 commits project i
  • cudaatomicAdd 示例无法产生正确的输出

    编写以下代码的目的是将 100 个元素的浮点数数组增加 1 十倍 在输出中 我期望每个元素都有 10 0f 值的 100 个元素数组 相反 我得到随机值 您能在这里指出我的错误吗 global void testAdd float a fl
  • AutoCompleteTextView 搜索部分单词而不是整个单词

    我有一个AutoCompleteTextView 并且它工作得很好 直到我在输入中添加一个空格 比如说 如果我有许多历史事件的清单 不列颠之战 1940 突出部之战 1944 插入大量战斗 拿破仑的致命进军 1812 插入许多其他历史事件
  • 数据库中电子邮件地址的最佳长度是多少?

    这是我的查询的摘录部分 反映了EMAIL ADDRESS列数据类型和属性 EMAIL ADDRESS CHARACTER VARYING 20 NOT NULL 然而 约翰 桑德斯 uses VARYING 256 这表明我不一定正确理解
  • Java:加载依赖于其他库的库

    我想在我的 java 应用程序中加载我自己的本机库 这些本机库依赖于第三方库 当我的应用程序安装在客户端计算机上时 第三方库可能存在 也可能不存在 在我的 java 应用程序中 我要求用户指定依赖库的位置 获得此信息后 我将使用它通过 JN
  • 在我网站的图像上添加 Instagram 滤镜

    我在用CSSGram在我的网站上使图像具有类似 Instagram 的滤镜 下面是向图像添加滤镜的方法
  • android中声音转换为频率[重复]

    这个问题在这里已经有答案了 可能的重复 实时音高检测 确定通过麦克风接收到的声音的音频频率 我正在开发自己的 Android 吉他调音器 在这里我将不得不使用吉他音符频率 因此 我想知道如何在android中将通过麦克风端口传来的声音转换为
  • 在静态类中使用依赖注入

    我需要在静态类中使用依赖注入 静态类中的方法需要注入依赖项的值 以下代码示例演示了我的问题 public static class XHelper public static TResponse Execute string metodo
  • 缓冲区为空后关闭“worker”go 例程

    我想要我的 goroutine 工作人员 ProcessToDo 在下面的代码中 等待所有 排队 工作处理完毕后再关闭 工作例程有一个 待办事项 通道 缓冲 通过该通道将工作发送给它 它有一个 完成 通道来告诉它开始关闭 文档称 如果满足多
  • 如何在JAVA中将纪元转换为mySQL时间戳

    如何获取mySQL时间戳格式mySQLtimestamp long epochNow System currentTimeMillis 1000 long epochWeek 604800 long date7daysAgo epochNo
  • 对 mongoose 3.x 填充文档进行排序的正确语法

    我有两个 MongoDB 集合Customer and User in 1 1关系 我正在尝试使用查询两个文档猫鼬种群并对它们进行排序User name 下面没有任何工作 我的猫鼬是 3 8 19 Customer find populat
  • PHP array_search 多维数组并返回键

    我试图在多维数组中搜索一个值 下面只是大数组的一部分 并获取该值的密钥 但我无法自己管理它 这是我尝试过的 Array 0 gt Array 0 gt SMEG 30 1 gt ALES 2 gt 3 gt 4 gt 5 gt ALES 6
  • 使用sklearn load_files()从png加载图像作为数据

    我目前正在使用 sklearn 构建一个简单的图像识别器 我需要使用 load files directory 从该目录中的子文件夹加载图像 它正确地获取了目标值 但数据属性不是简单的像素值 我假设我需要设置编码参数来考虑图像文件 但找不到