如何在 scikit-learn(用于计算机视觉)中使用自己的数据集?

2024-01-16

如何在 scikit-learn 中使用我自己的数据集? Scikit教程总是以加载他的数据集(数字数据集,花卉数据集......)为例

http://scikit-learn.org/stable/datasets/index.html http://scikit-learn.org/stable/datasets/index.html即:从 sklearn.datasets 导入 load_iris

我有我的图像,但我不知道如何创建新的图像。

特别是,首先,我使用我找到的这个示例(我使用库 opencv):

img =cv2.imread('telamone.jpg')

# Convert them to grayscale
imgg =cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# SURF extraction
surf = cv2.SURF()
kp, descritors = surf.detect(imgg,None,useProvidedKeypoints = False)

# Setting up samples and responses for kNN
samples = np.array(descritors)
responses = np.arange(len(kp),dtype = np.float32)

我想提取一组图像的特征,以一种有助于实现机器学习算法的方式!


您首先需要清楚地定义您想要实现的目标:“以有助于实现机器学习算法的方式提取一组图像的特征!”太模糊了,无法给你任何指导。

你是否正在尝试做:

  • 整个图片的图像分类(例如室内场景与室外场景)?

  • 在一组图片的子部分内进行对象识别(例如,识别不同图片中同一对象的多个实例),也许使用具有不同尺寸窗口的扫描程序?

  • 对象检测和基于类的分类(例如,查找图片中所有出现的汽车或行人以及这些类实例的每次出现周围的边界框)?

  • 全图语义解析,又称像素分割+每个片段的类分类(建筑、道路、人、树)...

这些任务中的每一个都需要不同的管道(特征提取+机器学习模型组合)。

您可能应该从阅读一本有关该主题的书开始,例如:http://szeliski.org/Book/ http://szeliski.org/Book/

另请注意,stackoverflow 可能不是提出此类开放式问题的最佳场所。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 scikit-learn(用于计算机视觉)中使用自己的数据集? 的相关文章

  • 同时重新排序和旋转图像的高效方法

    为了快速加载 jpeg 我为turbojpeg 实现了一个 mex wrapper 以有效地将 大 jpeg 读入 MATLAB 对于 4000x3000px 的图像 实际解码只需要大约 120 毫秒 而不是 5 毫秒 然而 像素顺序是 R
  • PHP - 从图像创建一张图像

    我有 n 张图像 想用 php 代码创建一张 我使用 imagecopymerge 但无法成功 请举一些例子 Code numberOfImages 3 x 940 y 420 background imagecreatetruecolor
  • Python - 如何将列表保存为图像?

    我生成一个常规列表 是否可以将此列表保存为 JPEG 图像或 PNG 或其他格式 以便我可以打开图像并查看它 我目前正在尝试使用 python 成像库 PIL 来解决这个问题 这是可能的解决方案之一 使用以下方法创建一个空图像对象 Imag
  • 随机森林修剪

    我有 sklearn 随机森林回归器 它非常重 有 1 6 GB 并且在预测值时工作很长时间 我想把它修剪一下 让它变得更轻 据我所知 决策树和森林没有实施修剪 我无法自己实现它 因为树代码是用 C 编写的 而我不知道 有谁知道解决方案吗
  • 减少1000张图片的HTTP请求?

    我知道这个问题可能听起来有点疯狂 但我想也许有人会想出一个聪明的主意 假设您在一个 HTML 页面上有 1000 个缩略图 图像大小约为5 10 kb 有没有办法在单个请求中加载所有图像 以某种方式将所有图像压缩到一个文件中 或者您对该主题
  • CSS 比例和方形中心裁剪图像

    所以我的应用程序中有一个缩略图集合 其大小为200x200 有时原始图像没有这个比例 所以我计划将此图像裁剪为正方形 目前它只是拉伸图像以适合缩略图 所以说我的原始图像大小是400x800 那么图像看起来就很压扁 我想裁剪此图像 以便它查看
  • 如何更改焦点/按下时图像按钮的色调

    我有一个ImageButton在我的应用程序中 当按钮打开时我需要更改图像的色调pressed focused 我有ImageButton设置为获取其src来自 XML 文件 如下所示
  • GKE 出现错误:ImagePullBackOff 和错误:ErrImagePull 错误

    当 kubectl 应用 yaml 将自定义构建的 docker 映像部署到 GCP 中的集群 编辑掉敏感信息 时 我收到以下错误 已尝试以下但没有运气 手动部署镜像 检查以确保防火墙规则允许 443 并且没有任何东西阻止它 尝试将容器注册
  • 为什么 cross_val_predict 比 KNeighborsClassifier 的拟合慢得多?

    在 Jupyter 笔记本上本地运行并使用 MNIST 数据集 28k 条目 每个图像 28x28 像素 以下内容为27秒 from sklearn neighbors import KNeighborsClassifier knn clf
  • Python 上每个系数具有特定约束的多元线性回归

    我目前正在数据集上运行多元线性回归 起初 我没有意识到我需要限制自己的体重 事实上 我需要有特定的正权重和负权重 更准确地说 我正在做一个评分系统 这就是为什么我的一些变量应该对音符产生积极或消极的影响 然而 当运行我的模型时 结果不符合我
  • Tkinter:无法识别图像文件中的数据[重复]

    这个问题在这里已经有答案了 我有以下问题 我使用外部应用程序生成 GIF 文件 对我来说 GIF 看起来不错 我可以毫无问题地打开它们 然而 使用 photo PhotoImage file screenshot file self pre
  • mlflow 如何使用自定义转换器保存 sklearn 管道?

    我正在尝试使用 mlflow 保存 sklearn 机器学习模型 这是一个包含我定义的自定义转换器的管道 并将其加载到另一个项目中 我的自定义转换器继承自 BaseEstimator 和 TransformerMixin 假设我有 2 个项
  • Javascript图像编辑插件

    在哪里可以找到 Javascript 或 jQuery 图像编辑器插件 用户可以单击图像进行编辑 并且该插件允许他们进行裁剪 调整大小 旋转 翻转等 Pixastic http pixastic com lib 不再活跃 和CamanJS
  • 了解客户端文件的对象 URL 以及如何释放内存

    我在用createObjectURL获取本地图像文件的引用 URL 当我完成文件 图像后 我打电话revokeObjectURL释放该内存 一切对我来说都很好 但我只是想确保我释放了我能释放的所有内存 我检查后出现了我的担忧chrome b
  • 在 Android 上将大位图文件的大小调整为缩放的输出文件

    我的文件中有一个大位图 例如 3888x2592 现在 我想将该位图大小调整为 800x533 并将其保存到另一个文件中 我通常会通过调用来缩放位图Bitmap createBitmap方法 但它需要一个源位图作为第一个参数 我无法提供它
  • sklearn:使用 Pipeline 和 TransformedTargetRegressor 缩放 x(数据)和 y(目标)

    我想使用 Pipeline 和 TransformedTargetRegressor 来处理所有缩放 数据和目标 是否可以混合 Pipeline 和 TransformedTargetRegressor 如何从 TransformedTar
  • 预训练 inception v3 模型的层名称(tensorflow)[重复]

    这个问题在这里已经有答案了 任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
  • C# 代码上的 ImageURL 不显示图像

    我在 aspx 页面上有图像
  • 如何确定 Keras Conv2D 函数中的“filter”参数

    我刚刚开始我的 ML 之旅 并且已经完成了一些教程 对我而言 不清楚的一件事是如何为 Keras Conv2D 确定 过滤器 参数 我读过的大多数资料只是将参数设置为 32 没有任何解释 这只是经验法则还是输入图像的尺寸起作用 例如 CIF
  • setImageCompressionQuality 与 setCompressionQuality 之间有什么区别 - Imagick

    我在Imagick中找到了两种设置图像压缩质量的方法 A 设置图像压缩质量 B 设置压缩质量 所以我想知道哪一个是最好的以及为什么在以下条件下 我读到了setCompressionQuality方法仅适用于新图像 我正在尝试压缩文件 jpe

随机推荐

  • SDL_Init 中存在大量内存泄漏

    EDIT 更新了一些新信息 粗体 此外 代码和 Valgrinds 输出也已更新 我最近开始使用 SDL2 作为我的图形库 开发了一些东西后 我决定运行 Valgrind 并发现我正在泄漏内存 大量内存 缩小范围后我编译了这段代码 In C
  • 在 Interface Builder 中设置遮罩角

    值是什么类型 layerMaxXMinYCorner layerMinXMinYCorner 是否可以在 Interface Builder 中的视图上设置此参数 我知道怎么设置layer borderWidth layer borderU
  • 如何将 spring boot 参数传递给 tomcat 部署?

    我有一个 Spring Boot 项目 在 pom 文件中声明了打包 war
  • 除了 recaptcha.net 之外,还有其他方法可以阻止垃圾邮件吗? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我公司的一位排名比我高的成员拒绝在他的网站上使用 recaptcha net 来阻止公共表单上的垃圾邮
  • 如何在服务器端知道用户已离开网站或立即关闭浏览器窗口?

    在 ASP NET 中 当会话超时时 Session End 将被触发 那么我可以猜测用户已经在这个方法中离开或关闭了浏览器窗口 但是有一些延迟 直到超时 有什么更好的解决方案吗 由于有很多事情可能会中断用户的访问 例如连接丢失或浏览器崩溃
  • 选择正确的分区规则

    我正在设置一个新的 PostgreSQL 9 数据库 其中将包含数百万 甚至数十亿 行 所以我决定使用 PostgreSQL 继承来分区数据 我创建了一个像这样的主表 例如简化的 CREATE TABLE mytable user id i
  • .htaccess - 尝试强制 https 时“重定向过多”

    我试图强制根域的子文件夹 bbb 始终显示为 https 还有我的 htaccess文件负责页面的扩展名 我已经把 htaccess文件在我的里面 bbb 文件夹 但当我尝试强制连接到 https 时 我得到 太多重定向 没有它一切工作正常
  • Maven:在构建过程中安装jar文件

    我有一个要求如下 我需要在 Maven 构建过程中运行 ant 构建文件 我需要从 pom xml 文件调用 build xml 我已经使用 maven antrun plugin 做到了这一点 现在我需要在 maven 编译我的项目源之前
  • Azure WebJobs 发布错误

    我们部署了一个带有生产槽和开发槽的 Web 应用程序 我们创建了多个 Web 作业 连续的和计划的 并且我们希望手动部署它们 不链接到 Web 应用程序部署 因此我们遵循的流程部署是 1 gt 部署Web应用程序 2 gt 对于每个 Web
  • 无法从 Kubernetes 中的 Spring Boot 客户端从远程 Spring 配置获取值

    这是我的客户端的 bootstrap yml spring cloud config enabled true uri http localhost 8888 label master spring application name mic
  • 释放空指针

    如何释放空指针 struct vStruct void vPtr struct vStruct next struct vStruct sObj struct vStruct sObjNew sObj delete sObjNew gt v
  • 当检测到pointermove时,链接上的鼠标操作不会触发pointerup事件

    我无法获取pointerup在链接上触发的事件 A带有一个标签href属性集 对于event pointerType mouse 如果鼠标在之间移动pointerdown and pointerup 我有以下场景 var lastEvent
  • 为什么我的最终向量是应有大小的两倍并且有前导 0?

    我正在为一个班级做这个小项目 我已经基本完成了它 但由于某种原因 我的合并向量是应有大小的两倍 并且有不应该存在的前导 0 main函数是为我们编写的 我们必须编写分区 快速排序和multiway merge函数 首先 程序应该获取列表的数
  • 在 json 和 Web api 之间保留 C# 日期时间本地时间?

    当我在 json 对象中有数据时间时 我遇到问题 它会将其转换为 C dateTime 中的 UTC 时区 只是想问如何保留本地时间 我可以在 web config 文件或 geter 或 setter 中设置时区属性吗 因为我必须对象可以
  • Linux 上的 python 中的“导出”子进程模块错误?

    我正在设置一个程序将我的计算机连接到我们学校的代理 目前有这样的东西 import subprocess import sys username fergus barker password proxy proxy det nsw edu
  • asp.net mvc 中使用 My SQL 的实体框架 [重复]

    这个问题在这里已经有答案了 我正在开发一个 ASP NET MVC Web 应用程序 并且我有一个商业系统 我想连接到它的 MySQL 数据库 所以我决定在 ASP NET MVC Web 应用程序中使用实体框架 但是当我厌倦了创建新连接时
  • AngularJS:当 $rootScope 值更改时,指令中的 $watch 不起作用

    我创建了一个应用程序 AngularJS 其中我有一个指令 我在指令中设置了一个监视 以便在 rootScope 变量发生更改时触发指令中的一些方法 但问题是当 rootScope name值已更改指令内的手表不起作用 我的代码如下所示 工
  • 按组编号[重复]

    这个问题在这里已经有答案了 假设我们有以下数据库 ID Shoot hit 1 10 2 1 9 3 1 8 1 2 10 8 2 8 8 2 11 10 2 7 2 3 9 2 4 6 6 4 6 5 我希望为每个组分配编号 在本例中为每
  • 查找文本并替换为超链接

    我正在尝试将正文中的文本替换为模式 ASA 到 ASA 超链接 如果主体中只有一种模式 我的代码就可以工作 但如果我有很多模式 比如 ASA3422dfASA2389dsASA1265sa 整个身体被替换为 ASA互易65 我的代码在这里
  • 如何在 scikit-learn(用于计算机视觉)中使用自己的数据集?

    如何在 scikit learn 中使用我自己的数据集 Scikit教程总是以加载他的数据集 数字数据集 花卉数据集 为例 http scikit learn org stable datasets index html http scik