一对多 SVM 中的 10 倍交叉验证（使用 LibSVM）

2023-12-25

我想在我的系统中进行 10 倍交叉验证一对一 支持向量机 http://en.wikipedia.org/wiki/Support_vector_machineMATLAB 中的分类。

我试图以某种方式混合这两个相关的答案：

libsvm 中的多类分类 https://stackoverflow.com/a/9049808/1071703
MATLAB 中 10 重 SVM 分类的示例 https://stackoverflow.com/a/3071938/1071703

但由于我对 MATLAB 及其语法还很陌生，所以直到现在我才设法让它工作。

另一方面，我在LibSVM http://www.csie.ntu.edu.tw/~cjlin/libsvm/自述文件，我在那里找不到任何相关示例：

选项-v将数据随机分成n部分并计算cross 验证准确性/均方误差。

有关输出的含义，请参阅 libsvm FAQ。

谁能给我提供一个 10 倍交叉验证和一对多分类的例子吗？

我们这样做主要有两个原因交叉验证 http://en.wikipedia.org/wiki/Cross-validation_%28statistics%29:

作为一种测试方法，它可以让我们对模型的泛化能力进行近乎无偏的估计（通过避免过度拟合）
作为一种方式选型 http://en.wikipedia.org/wiki/Model_selection（例如：找到最好的C and gamma训练数据上的参数，请参见这个帖子 https://stackoverflow.com/a/9049225/97160举个例子）

对于我们感兴趣的第一个案例，该过程涉及培训k每个折叠的模型，然后在整个训练集上训练一个最终模型。我们报告了 k 倍的平均准确度。

现在，由于我们使用一对一的方法来处理多类问题，因此每个模型都包含N支持向量机（每一类一个）。

以下是实现一对一方法的包装函数：

function mdl = libsvmtrain_ova(y, X, opts)
    if nargin < 3, opts = ''; end

    %# classes
    labels = unique(y);
    numLabels = numel(labels);

    %# train one-against-all models
    models = cell(numLabels,1);
    for k=1:numLabels
        models{k} = libsvmtrain(double(y==labels(k)), X, strcat(opts,' -b 1 -q'));
    end
    mdl = struct('models',{models}, 'labels',labels);
end

function [pred,acc,prob] = libsvmpredict_ova(y, X, mdl)
    %# classes
    labels = mdl.labels;
    numLabels = numel(labels);

    %# get probability estimates of test instances using each 1-vs-all model
    prob = zeros(size(X,1), numLabels);
    for k=1:numLabels
        [~,~,p] = libsvmpredict(double(y==labels(k)), X, mdl.models{k}, '-b 1 -q');
        prob(:,k) = p(:, mdl.models{k}.Label==1);
    end

    %# predict the class with the highest probability
    [~,pred] = max(prob, [], 2);
    %# compute classification accuracy
    acc = mean(pred == y);
end

以下是支持交叉验证的函数：

function acc = libsvmcrossval_ova(y, X, opts, nfold, indices)
    if nargin < 3, opts = ''; end
    if nargin < 4, nfold = 10; end
    if nargin < 5, indices = crossvalidation(y, nfold); end

    %# N-fold cross-validation testing
    acc = zeros(nfold,1);
    for i=1:nfold
        testIdx = (indices == i); trainIdx = ~testIdx;
        mdl = libsvmtrain_ova(y(trainIdx), X(trainIdx,:), opts);
        [~,acc(i)] = libsvmpredict_ova(y(testIdx), X(testIdx,:), mdl);
    end
    acc = mean(acc);    %# average accuracy
end

function indices = crossvalidation(y, nfold)
    %# stratified n-fold cros-validation
    %#indices = crossvalind('Kfold', y, nfold);  %# Bioinformatics toolbox
    cv = cvpartition(y, 'kfold',nfold);          %# Statistics toolbox
    indices = zeros(size(y));
    for i=1:nfold
        indices(cv.test(i)) = i;
    end
end

最后用一个简单的demo来说明使用方法：

%# laod dataset
S = load('fisheriris');
data = zscore(S.meas);
labels = grp2idx(S.species);

%# cross-validate using one-vs-all approach
opts = '-s 0 -t 2 -c 1 -g 0.25';    %# libsvm training options
nfold = 10;
acc = libsvmcrossval_ova(labels, data, opts, nfold);
fprintf('Cross Validation Accuracy = %.4f%%\n', 100*mean(acc));

%# compute final model over the entire dataset
mdl = libsvmtrain_ova(labels, data, opts);

将其与 libsvm 默认使用的一对一方法进行比较：

acc = libsvmtrain(labels, data, sprintf('%s -v %d -q',opts,nfold));
model = libsvmtrain(labels, data, strcat(opts,' -q'));

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MATLAB

machinelearning

Classification

SVM

Libsvm

一对多 SVM 中的 10 倍交叉验证（使用 LibSVM）的相关文章

Scikit-learn：如何获得 True Positive、True Negative、False Positive 和 False Negative

我的问题我有一个数据集它是一个很大的 JSON 文件我读取它并将其存储在trainList多变的接下来我对其进行预处理以便能够使用它完成后我开始分类我用kfold交叉验证方法以获得平均值准确性并训练分类器我做出预测并获
TensorFlow 运算符重载

有什么区别 tf add x y and x y 在 TensorFlow 中当您使用以下命令构建图表时您的计算图表会有什么不同代替tf add 更一般地说有或者其他张量超载的操作如果至少有一个x or y is a tf Te
Pytorch TypeError：eq() 收到无效的参数组合

num samples 10 def predict x sampled models guide None None for in range num samples yhats model x data for model in sam
Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型有时代码第一次运行良好没有错误其他时候相同的代码使用相同的数据会导致 CUDA 内存不足错误以前重新启动运行时或退出笔记本返回笔
Haar级联正例图像大小调整

我正在迈出第一步为自定义对象识别创建 haar 级联我花了时间获取大量数据并编写了一些预处理脚本以将视频转换为帧我的下一步是裁剪感兴趣的对象以创建一些积极的训练示例我有几个问题我确实在网上寻找答案我有点困惑我读到我应该致力于
Matlab 错误：()-索引必须出现在索引表达式的最后

我有这段代码想要在制表符分隔的 txt 文件中写入一个数组 fid fopen oo txt wt for x 1 length s fprintf fid s t n s x 1 end fclose fid 但我收到此错误 Error
可以避免迭代元胞数组时的“s{1} 烦恼”吗？

The s 1 标题的烦恼指的是下面的 for 块中的第一行 for s some cell array s s 1 unpeel the enclosing cell do stuff with s end This s s 1 业务
如何调整x轴和y轴的大小

如何调整 x 轴和 y 轴的大小我想要什么更具体 3900 60 30 0 60 120 180 3600 我做了什么 a 0 0 1 10000 plot a 我应该写什么才能按预期调整 x 和 y 轴的大小 EDIT 我不想 390
matlab 中的 for 或 while 循环

我刚刚开始在编程课的 matlab 中使用 for 循环基本的东西对我来说很好但是我被要求使用循环创建一个 3 x 5 矩阵其中每个元素的值是其行号其列号除以行号和列号之和的幂例如元素 2 3 的值为 2 3 2 3 1 6 那么
在基本 Tensorflow 2.0 中运行简单回归

我正在学习 Tensorflow 2 0 我认为在 Tensorflow 中实现最基本的简单线性回归是一个好主意不幸的是我遇到了几个问题我想知道这里是否有人可以提供帮助考虑以下设置 import tensorflow as tf 2
model.predict() 返回类而不是概率

Hello 我是第一次使用 Keras 我训练并保存了一个模型作为 json 文件及其权重该模型旨在将图像分为 3 个类别我的编译方法 model compile loss categorical crossentropy optim
MATLAB 中的内存映射文件？

我决定使用 memmapfile 因为我的数据通常为 30Gb 到 60Gb 太大无法放入计算机内存中我的数据文件由两列数据组成对应于两个传感器的输出并且它们采用 bin 和 txt 格式 m memmapfile G E Str
线性问题和非线性问题之间的区别？点积和核技巧的本质

核技巧将非线性问题映射为线性问题我的问题是 1 线性问题和非线性问题的主要区别是什么这两类问题的差异背后的直觉是什么核技巧如何帮助在非线性问题上使用线性分类器 2 为什么点积在这两种情况下如此重要 Thanks 当人们说到分类问题的线
在防风草模型上使用 VIP 包计算重要性度量

我正在尝试使用 vi firm 在防风草中制作的逻辑回归模型上计算特征重要性对于正则表达式我将使用 iris 数据集并尝试预测观察结果是否为 setosa iris1 lt iris gt mutate class case when
如何使用神经网络保存 Sift 特征向量进行分类

SIFT 特征的 Matlab 实现发现于http www cs ubc ca lowe keypoints http www cs ubc ca lowe keypoints 在 stackoverflow 的帮助下我想将功能保存到 m
覆盖 MATLAB 默认静态 javaclasspath 的最佳方法

MATLAB 配置为在搜索用户可修改的动态路径之前搜索其静态 java 类路径不幸的是静态路径包含相当多非常旧的公共库因此如果您尝试使用新版本您可能最终会加载错误的实现并出现错误例如静态路径包含 google collectio
在每次迭代中使用 for 循环的索引命名图像

我正在使用 MATLAB 进行图像处理项目我使用 for 循环在每次循环迭代时生成某种图像数据图像大小不同我的问题是如何阻止它在下一次迭代中覆盖图像 Img i j data 理想情况下我希望它有 Img 1 data for 1st
期望最大化算法的数值示例[重复]

这个问题在这里已经有答案了由于我不确定给出的公式有人可以提供 EM 算法的简单数字示例吗一个非常简单的具有 4 或 5 个笛卡尔坐标的坐标就可以了那这个呢 http en wikibooks org wiki Data Mining
将此 MATLAB 代码转换为 Python 时我做错了什么？

我正在努力将生成波形的 MATLAB 代码转换为 Python 就上下文而言这是原子力显微镜带激发响应的模拟与代码错误无关在 MATLAB 中从 r vec 生成的图形与我在 Python 中生成的图形不同我是否正确地将 MATLA
如何将条形图的 XtickLabels 向左移动？

我目前正在尝试创建频率直方图为此我必须创建一个条形图条形图之间没有空格然而这集中于XTickLabels在酒吧的中间由于它是一个直方图我希望数值位于每个条形之间的线上以便它可以直观地指示间隔本质上我需要将所有刻度标签移至

随机推荐

GROUP BY 忽略属性

例如我有这张表 itemgroup description price A a 10 A b 12 A c 14 B g 11 B h 16 我想选择一组中价格最高的行如下所示 A c 14 B h 16 让我接近这个的 SQL 查询功
在 3D 地形上，给定 3D 线，找到线与地形之间的交点

我有一个 3D 地形网格其中每个坐标 x y z 每个网格的值都是已知的现在我有一条单调增加减少的线它的起点也是已知的我想找到地形和线的交汇点做到这一点的算法是什么我能想到的是将 3D 地形的坐标存储在nxn矩阵然后我会根
如何在枚举中调用附加方法？

enum Enum1 BIG 8 HUGE 10 public String getName return Huge public String getContry return India additional Method OVERWH
Azure Active Directory 登录应用程序始终创建企业应用程序，无法设置replyUrls

过去有单独的网站和 Azure 经典门户用于管理登录应用程序在经典门户中您可以编辑 ReplyUrls 在新门户中无论您如何创建应用程序企业或应用程序注册您都无法从 UI 编辑您的 ReplyUrls 使用应用程序您可以第一次
如何找出哪个 Rust 依赖项添加了动态链接库

我有一个相当大的项目有很多依赖项我希望生成的二进制文件使用尽可能少的动态链接库我刚刚检查了生成的二进制文件并看到 ldd target debug foo libssl so 1 1 gt lib x86 64 linux gnu l
使用python解析JSON以根据条件获取值

我是 python 新手尝试解析 json 文件并根据条件获取所需字段例如如果 status true 则打印姓名 json文件 id 12345 name London active true status true versio
检查蓝牙状态 - Swift 4

我在 Xcode 中遇到蓝牙问题我找不到关于如何检查蓝牙是否打开的好解决方案我想要的就是这个我在网上搜索了一些解决方案但没有任何对我有用关于如何检查蓝牙有什么想法吗我导入了 CoreBluetooth 类并编写了这行代码 if
如何从 Swift 中的字符串中删除引号？

我正在尝试删除 Swift 中的引号String就像是 Hello 这样斯威夫特String只是 Hello 你可以简单地使用 Swift 1 var str String Hello print str Hello print str s
角度4-在一个打开的选项卡中注销时在所有选项卡中自动注销

我想在一个打开的选项卡中注销时自动从所有打开的选项卡中注销我在登录时将 jwt 令牌设置为 localStorage 并在注销时删除该令牌如何使用存储事件从所有打开的选项卡中注销您可以在存储上添加事件侦听器如下所示 window a
如何在java中生成XML（以字符串表示形式）

我定义了一个java类但只需要将该类的一些字段输出到XML中返回的类型必须是 String 我首先选择了使用 StringBuffer 的最简单方法但是当我尝试处理输出字符串表示时它失败了我认为这很可能是因为输入中有些字符没有以
在C中循环中重新声明数组

当循环重复时在循环中声明的数组不会设置为零吗我有一个数组并以这种方式使用它 while i
C++0x 草案中的一点：n3290

N3290 ISO 标准草案 3 4 1 12 中的一点在查找中使用的名称期间常量表达式 of an 枚举数定义之前声明的枚举器枚举的可见并隐藏在包含该枚举的块类或命名空间范围中声明的实体的名称枚举说明符这是添加的新点任何人都可
HTML5 视频：检测时间线的拖动

我想知道是否有一种完全可靠的方法可以知道用户何时拖动 HTML5 视频的时间线到目前为止我一直绑定到 timeUpdate 但尚不清楚 currentTime 是否由于拖动而增加或者只是由于视频播放而增加谢谢我知道MediaEle
H2数据库从1.4.200升级到2.0.204后集成测试出现问题

最近我升级了H2数据库在我们的SpringBoot 2 5 8来自版本的项目1 4 200 to 2 0 204 它仅用于测试目的对于生产我们使用PostgreSQL 12 9 好像升级后有些词变成了关键词H2数据库例如 day val
查询生成器/DQL 不适用于 INNER JOIN - 语法问题

我知道我这里有语法问题但我无法弄清楚我正在尝试对 5 个表进行 SELECT 和 INNER JOIN 但 Symfony 抱怨 JOIN 中的实体在定义之前就被使用了实际错误如下 Semantical Error line 0 co
symfony2 学说 expr 子查询：错误：参数号无效

试图获得用户喜欢的状态 public function getLikedStatuses User user qb this gt em gt createQueryBuilder qb gt select s id gt from Wal
匹配列表中至少两个单词的正则表达式

我有一个单词列表 foo bar baz 我想编写一个正则表达式来匹配至少包含其中两个的字符串例如 foo baz 应该匹配同时 ba foo z 不应该显而易见的解决方案 foo bar baz foo bar baz 有效但我觉得
JCL 错误 - “$HASP165 IBMUSERW ENDED AT SVSCJES2 - JCL ERROR CN(INTERNAL)”

我正在尝试使用实用程序 DFHWS2LS 创建 CICS Web 服务请求程序 IBM 红皮书或指南中提到的第一步是在 JCL 中运行它我在提交 JCL 时遇到了这个问题我做错事了无法弄清楚什么任何有关此问题的帮助将不胜感激 IBM
让 onClick 事件每次点击时执行不同的操作？

我的表格中有 3 列每列顶部都有一些文本下面有一个图像我拥有这样的功能当有人单击 3 列之一中的图像时它会放大该列并使用 onClick 事件删除其他列但是我希望当我第二次单击图像时它会带回其他列我遇到的问题是弄清楚如何
一对多 SVM 中的 10 倍交叉验证（使用 LibSVM）

我想在我的系统中进行 10 倍交叉验证一对一支持向量机 http en wikipedia org wiki Support vector machineMATLAB 中的分类我试图以某种方式混合这两个相关的答案 libsvm 中的多类

一对多 SVM 中的 10 倍交叉验证（使用 LibSVM）

一对多 SVM 中的 10 倍交叉验证（使用 LibSVM） 的相关文章

随机推荐

热门标签

一对多 SVM 中的 10 倍交叉验证（使用 LibSVM）的相关文章