用于多对象分类的支持向量机

2023-12-05

我正在尝试使用线性支持向量机进行多类对象类别识别。到目前为止，我了解到主要使用两种方法 - 一对一（OVA）和一对一（OVO）。但我很难理解它的实现。我的意思是我认为使用的步骤是：

首先，特征描述符是通过 SIFT 准备的。所以我有一个 128XN 的特征向量。
接下来，为特定对象类别（例如汽车）准备 SVM 分类器模型，我将 50 张汽车图像作为正训练集，并从每个类别中随机抽取其余类别的总共 50 张图像（这部分正确吗？）。我为所有此类类别（比如其中 5 个）准备了此类模型。
接下来，当我有输入图像时，我是否需要将图像输入到所有 5 个模型中，然后检查每个模型的值 (+1/-1)？我很难理解这部分。

在一对多方法中，您必须检查所有 5 个模型。然后你就可以做出最有信心值的决定。LIBSVM给出概率估计。

在一对一的方法中，你可以占据多数。例如，您测试 1 vs. 2、1 vs. 3、1 vs. 4 和 1 vs. 5。您将其分类为 3 例中的 1 例。您对其他 4 个类执行相同的操作。假设其他四个类别的值为[0, 1, 1, 2]。因此，第1类获得次数最多，因此该类为最终类。在这种情况下，您还可以进行总概率估计。取最大值。除非在一对中分类出现严重错误，否则这种方法是有效的。例如，在 1 vs. 4 中，它以 0.7 的置信度对 4 进行分类（真实类别为 1）。那么仅仅因为这一决定，你的概率估计总数可能会猛增并给出错误的结果。这个问题可以通过实验来检验。

LIBSVM 使用一对一的方式。你可以检查一下推理过程here。你可以阅读this他们也在论文中捍卫了一种与所有的分类方法并得出结论认为它是not必然比一对一更糟糕。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

用于多对象分类的支持向量机的相关文章

在discord.py中访问成员的横幅

我正在制作图像配置文件命令我想为此访问会员的横幅我们有什么办法可以在discord py 中做到这一点吗如果不清楚我所说的横幅是什么意思那么蓝色背景的图像就是横幅我想访问它在discord py v2 0中你可以使用 You m
仅获取图像中的外部轮廓

我有这段代码可以在图像中绘制轮廓但我只需要外部轮廓 import cv2 import numpy as np camino C Users Usuario Documents Deteccion de Objetos 123 jpg
识别相似图像的库

我想确定 2 张图像的相似程度图像可能已被缩放裁剪等因此简单的像素比较将不起作用我环顾四周有很多关于这个主题的学术论文但他们没有发布他们的代码那么您知道有一个可以比较图像的已发布库适用于 Linux 和 Windows 吗
从图像坐标获取对象的世界坐标

I have been following this http docs opencv org modules calib3d doc camera calibration and 3d reconstruction html docume
在 Visual Studio 中调试非托管 C++ 图像

我确实在 Visual Studio 2010 下的非托管 C 上编写了大量图像处理代码其中涉及许多不同的图像我希望能够在逐步调试时像简单标识符一样轻松地观看它们我当前的解决方案是使用一些在 Matlab 控制台中导出图像的函数可以
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过
kmeans 对分组数据进行聚类

目前我尝试在分组数据中找到簇的中心通过使用示例数据集和问题定义我能够创建kmeans每个组内的集群然而当涉及到给定组的集群的每个中心时我不知道如何获取它们 https rdrr io cran broom man kmeans
Matlab 图像数据的 hist 函数

我是 Matlab 新手我想制作自己的函数与 imhist 显示图像数据的直方图完成相同的工作但我对此完全是新手我不知道如何做开发这样的功能我开始做一些东西但它非常不完整 function output args myhist
如何确定与视频中物体的距离？

我有一个从行驶中的车辆前面录制的视频文件我将使用 OpenCV 进行对象检测和识别但我停留在一方面如何确定距已识别物体的距离我可以知道我当前的速度和现实世界的 GPS 位置但仅此而已我无法对我正在跟踪的对象做出任何假设我计划用
在 GPU 支持下对高维数据进行更快的 Kmeans 聚类

我们一直在使用 Kmeans 来对日志进行聚类典型的数据集有 10 mill 具有 100k 特征的样本为了找到最佳 k 我们并行运行多个 Kmeans 并选择轮廓得分最佳的一个在 90 的情况下我们最终得到的 k 介于 2 到 1
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
如何重现 Ridge(normalize=True) 的行为？

这段代码 from sklearn pipeline import make pipeline from sklearn preprocessing import StandardScaler from sklearn linear mod
TensorFlow：带有轴选项的 bincount

在 TensorFlow 中我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
低质量相机的模糊内核

我正在做一些图像增强实验所以我用我的廉价相机拍照相机有马赛克伪像所有图像看起来都像网格我认为药盒失焦内核和高斯内核不是最佳候选有什么建议么 EDIT Sample 我怀疑这不能通过恒定的内核来完成因为对像素的影响并不相同因
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs
jpegtran 优化而不更改文件名

我需要优化一些图像但不更改它们的名称 jpegtran copy none optimize image jpg gt image jpg 但是这似乎创建了 0 的文件大小当我对不同的文件名执行此操作时大小仍然完全相同怎么样 jp
使用 LightGBM 进行多类分类

我正在尝试使用 Python 中的 LightGBM 为多类分类问题 3 类建模分类器我使用了以下参数 params task train boosting type gbdt objective multiclass num clas
具有定制损失函数的随机森林

我是机器学习领域的初学者对于一个项目我必须在随机森林分类中使用自定义损失函数到目前为止我一直使用 scikit 通过 scikit 实现这一点的建议会更有帮助损失函数分类树中的基尼杂质和熵在 scikit 的 tree pyx
安卓的限制

我需要构建一个应用程序该应用程序拍摄相机图像并将其上传到网络在网络上进行一些处理并返回真假我在这方面遇到了一些问题希望得到澄清 1 我的应用程序有什么方法可以知道 Android 相机捕获的图像吗我从这里明白了什么 Androi

随机推荐

注销页面在 Django 中不起作用

我正在尝试为 django 创建一个注销页面这是views py 文件 def index request if not request user is authenticated return redirect webapp login
如何对 OrderedDict 的 OrderedDict 进行排序？

我正在尝试对 OrderedDict 中的 OrderedDict 进行排序 depth 钥匙有什么解决方案可以对该 Dictionary 进行排序吗 OrderedDict 2 OrderedDict depth 0 height 51
C++11：在 std::array 上定义函数

std array采用两个模板参数 typename T the element type size t N the size of the array 我想定义一个函数它采用 std array 作为参数但仅适用于特定的 T 在本例中
Android - 应用程序未运行。错误：依赖项的 AAR 元数据中指定的 minCompileSdk 大于此模块的compileSdkVersion [重复]

这个问题在这里已经有答案了一周前该应用程序运行完美但突然没有更新任何内容该应用程序无法运行当我尝试运行该应用程序时出现此错误 minCompileSdk 31 中指定依赖项的 AAR 元数据 META INF com andr
PySpark Dataframe 将两列转换为基于第三列值的新元组列

正如主题所描述的我有一个 PySpark Dataframe 我需要将两列转换为一个新列它是基于第三列值的元组列表该演员阵容将减少或通过键值本例中为产品 id 展平数据框结果为一行每个键该数据框中有数亿行有 3700 万
在函数中使用时，右值引用是否被视为左值？

我发布了这个答案 https stackoverflow com a 28459180 2642059其中包含以下代码 void foo string bar string temp bar cout lt lt temp lt lt lt
Mac 上未设置 TERM 环境变量

我不断收到 TERM 环境变量未设置的消息当我在 Mac 终端上使用 svn 命令时出现错误我以为我已经通过以下操作设置了我的个人资料 export SVN EDITOR usr bin nano export EDITOR usr
Laravel Carbon 日期 diffInDays() 出现字符串错误

我需要找出两个日期之间的差异假设我有 2017 02 01 2017 01 01 输出的就是两天之间的天数 formatted dt1 Carbon parse a gt date gt format Y m d formatted dt
PDOStatement::execute(): SQLSTATE[HY093]: 参数数量无效：绑定变量的数量与标记数量不匹配

sql INSERT INTO table name day campaign name campaign id views CPM cost currency cost EUR VALUES day campaign name campa
CMake - 始终构建特定文件

我有一个特定的文件无论它是否被修改都应该在每次编译时重建原因是它取决于值变化的系统宏我如何使用 CMake 强制重建我不想将其绑定到特定目标在 CMakeLists txt 中指定的任何目标开始实际构建过程之前应该触及该文
EclipseLink 自定义表和列命名策略

有没有办法让 EclipseLink 将驼峰式大小写转换为下划线例如 class MyEntity gt select from MY ENTITY 理想情况下我可以将预先打包的东西作为属性放入 persistence xml 中您可
将 pandas 系列和 dataframe 对象转换为 numpy 数组

系列到 Numpy 数组我有一个pandas系列对象如下所示 s1 pd Series 0 1 2 3 4 5 6 7 8 index AB AC AD BA BB BC CA CB CC 我想把这个系列转换成numpy数组如下 seri
如何以编程方式启动特定应用程序？

我想启动一个特定的应用程序我知道如何执行意图但如果有多个应用程序可以处理意图我想避免选择菜单我想直接进入特定的应用程序希望这是有道理的您应该使用包管理器的功能 Context ctx this or you can replac
在 Flask 应用程序中返回 Excel 文件

我正在创建一个 Flask 应用程序提示用户输入 Excel 文件对其进行一些处理然后将文件返回给用户以便他们可以下载它请忽略任何未使用的导入我计划稍后使用它们我的功能已关闭我只是不确定如何将文件发送回用户以便他们可以下载它
JSP 表达式适用于 JSTL 标记，但不适用于 Struts 2 标记

我在我的项目中使用 JSTL 和 Struts 2 我正在尝试使用 JSTL 和 Struts 2 标记在范围内设置一个值如下所示 div div div div
警告：mysql_fetch_object()：提供的参数不是有效的 MySQL 结果资源

地狱在那里当我尝试连接以从数据库中提取内容时出现以下错误 Warning mysql fetch object supplied argument is not a valid MySQL result resource in home
String 与 Stringbuffer 作为 HashMap 键

我试图理解为什么 String 和 Stringbuilder StringBuffer 在用作 Hashmap 键时会受到不同的对待让我用下面的插图来澄清我的困惑示例 1 使用字符串 String s1 new String abc
图库内的图像缩放/平移

我正在尝试在 Android 图库小部件中缩放平移图像图像覆盖整个屏幕虽然我可以缩放平移图库中的图像但我无法滑动到下一个上一个图像单个图像的缩放和平移效果很好我创建了一个 TouchImageView 它扩展了 ImageV
为什么 GWT 不允许我们在文档元素上添加关键事件处理程序？

我知道有FocusPanel我可以在其上附加此类处理程序但根据我的经验该组件的行为不太好所以我想尽可能避免它所以我想知道为什么没有办法在文档上附加密钥处理程序根据怪异模式它可以跨浏览器工作所以这不应该是一个问题我也尝试自己编写
用于多对象分类的支持向量机

我正在尝试使用线性支持向量机进行多类对象类别识别到目前为止我了解到主要使用两种方法一对一 OVA 和一对一 OVO 但我很难理解它的实现我的意思是我认为使用的步骤是首先特征描述符是通过 SIFT 准备的所以我有一个 128XN

用于多对象分类的支持向量机

用于多对象分类的支持向量机 的相关文章

随机推荐

热门标签

用于多对象分类的支持向量机的相关文章