Libsvm网格参数寻优教程

2023-05-16

原文：http://endual.iteye.com/blog/1262010

首先下载Libsvm、Python和Gnuplot：

l libsvm的主页http://www.csie.ntu.edu.tw/~cjlin/libsvm/上下载libsvm （我自己用2.86版本）

l python的主页http://www.python.org下载 python （我自己用2.5版本）

l gnuplot的主页http://www.gnuplot.info/下载gnuplot （我用4.0版本）

LIBSVM 使用的一般步骤是：

1）按照LIBSVM软件包所要求的格式准备数据集；

2）对数据进行简单的缩放操作；

3）首要考虑选用RBF 核函数；

4）采用交叉验证选择最佳参数C与g ；

5）采用最佳参数C与g 对整个训练集进行训练获取支持向量机模型；

6）利用获取的模型进行测试与预测。

1）LIBSVM使用的数据格式

该软件使用的训练数据和检验数据文件格式如下：

[label] [index1]:[value1] [index2]:[value2] ...

一行一条记录数据，如:

+1 1:0.708 2:1 3:1 4:-0.320 5:-0.105 6:-1

这里(x,y)à((0.708,1,1, -0.320, -0.105, -1), +1)

label 或说是class, 就是你要分类的种类，通常是一些整数。

index 是有順序的索引，通常是连续的整数。

value 就是用来 train 的数据，通常是一堆实数。

2）对数据进行简单的缩放操作

扫描数据. 因为原始数据可能范围过大或过小, svmscale可以先将数据重新scale (縮放) 到适当范围使训练与预测速度更快。

svmscale.exe的用法：svmscale.exe feature.txt feature.scaled

默认的归一化范围是[-1,1]，可以用参数-l和-u分别调整上界和下届,feature.txt是输入特征文件名输出的归一化特征名为feature.scaled

3）考虑选用RBF 核函数

训练数据形成模型（model）,实质是算出了wx+b=0中的w,b.

Svmtrain的用法：svmtrain [options] training_set_file [model_file]

其中options涵义如下:

-s svm类型：设置SVM 类型，默认值为0，可选类型有：

0 -- C- SVC

1 -- nu - SVC

2 -- one-class-SVM

3 -- e - SVR

4 -- nu-SVR

-t 核函数类型：设置核函数类型，默认值为2，可选类型有：

0 -- 线性核：u'*v

1 -- 多项式核：(g*u'*v+ coef0)degree

2 -- RBF 核:exp(-||u-v||*||u-v||/g*g)

3 -- sigmoid 核：tanh(g*u'*v+ coef 0)

-d degree：核函数中的degree设置，默认值为3；

-g r(gama)：核函数中的函数设置(默认1/ k);

-r coef 0：设置核函数中的coef0，默认值为0；

-c cost：设置C- SVC、e - SVR、n - SVR中从惩罚系数C，默认值为1；

-n nu ：设置nu - SVC、one-class-SVM 与nu - SVR 中参数nu ，默认值0.5；

-p e ：核宽,设置e - SVR的损失函数中的e ，默认值为0.1；

-m cachesize：设置cache内存大小，以MB为单位(默认40)：

-e e ：设置终止准则中的可容忍偏差，默认值为0.001；

-h shrinking：是否使用启发式，可选值为0 或1，默认值为1；

-b 概率估计：是否计算SVC或SVR的概率估计，可选值0 或1，默认0；

-wi weight：对各类样本的惩罚系数C加权，默认值为1；

-v n：n折交叉验证模式。

其中-g选项中的k是指输入数据中的属性数。操作参数 -v 随机地将数据剖分为n 部分并计算交叉检验准确度和均方根误差。以上这些参数设置可以按照SVM 的类型和核函数所支持的参数进行任意组合，如果设置的参数在函数或SVM 类型中没有也不会产生影响，程序不会接受该参数；如果应有的参数设置不正确，参数将采用默认值。training_set_file是要进行训练的数据集；model_file是训练结束后产生的模型文件，该参数如果不设置将采用默认的文件名，也可以设置成自己惯用的文件名。举个例子如下：

C:\libsvm-2.85\windows>svmtrain heart_scale

optimization finished, #iter = 162

nu = 0.431029

obj = -100.877288, rho = 0.424462

nSV = 132, nBSV = 107

Total nSV = 132

现简单对屏幕回显信息进行说明：

#iter为迭代次数，

nu 与前面的操作参数-n nu 相同，

obj为SVM文件转换为的二次规划求解得到的最小值，

rho 为判决函数的常数项b，

nSV 为支持向量个数，

nBSV为边界上的支持向量个数，

Total nSV为支持向量总个数。

训练后的模型保存为文件*.model，用记事本打开其内容如下：

svm_type c_svc % 训练所采用的svm类型，此处为C- SVC

kernel_type rbf %训练采用的核函数类型，此处为RBF核

gamma 0.0769231 %设置核函数中的g ，默认值为1/ k

nr_class 2 %分类时的类别数，此处为两分类问题

total_sv 132 %总共的支持向量个数

rho 0.424462 %决策函数中的常数项b

label 1 -1%类别标签

nr_sv 64 68 %各类别标签对应的支持向量个数

SV %以下为支持向量

1 1:0.166667 2:1 3:-0.333333 4:-0.433962 5:-0.383562 6:-1 7:-1 8:0.0687023 9:-1 10:-0.903226 11:-1 12:-1 13:1

0.5104832128985164 1:0.125 2:1 3:0.333333 4:-0.320755 5:-0.406393 6:1 7:1 8:0.0839695 9:1 10:-0.806452 12:-0.333333 13:0.5

1 1:0.333333 2:1 3:-1 4:-0.245283 5:-0.506849 6:-1 7:-1 8:0.129771 9:-1 10:-0.16129 12:0.333333 13:-1

1 1:0.208333 2:1 3:0.333333 4:-0.660377 5:-0.525114 6:-1 7:1 8:0.435115 9:-1 10:-0.193548 12:-0.333333 13:1

4）采用交叉验证选择最佳参数C与g

通常而言，比较重要的参数是 gamma (-g) 跟 cost (-c) 。而 cross validation (-v)

的参数常用5。那么如何去选取最优的参数c和g呢？libsvm 的 python 子目录下面的 grid.py 可以帮助我们。此时。其中安装python2.5需要（一般默认安装到c:\python25

下），将gnuplot解压。安装解压完毕后，进入\libsvm\tools目录下，用文本编辑器（记事

本，edit都可以）修改grid.py文件，找到其中关于gnuplot路径的那项（其默认路径为

gnuplot_exe=r"c:\tmp\gnuplot\bin\pgnuplot.exe"），根据实际路径进行修改，并保存。然

后，将grid.py和C:\Python25目录下的python.exe文件拷贝到libsvm\windows目录下，键入以下命令：$ python grid.py train.1.scale 执行后，即可得到最优参数c和g。

另外，至于下libsvm和python的接口的问题，在libsvm2.86中林老师已经帮助我们解决，在\libsvm\windows\python目录下自带了svmc.pyd这个文件，将该文件文件复制到

libsvm\python目录下，同时，也将python.exe文件复制到该目录下，键入以下命令以检验效

果（注意：.Py文件中关于gnuplot路径的那项路径一定要根据实际路径修改）：

python svm_test.py

如果能看到程序执行结果，说明libsvm和python之间的接口已经配置完成，以后就可以直接在python程序里调用libsvm的函数了！

5）采用最佳参数C与g 对整个训练集进行训练获取支持向量机模型

$ svmtrain –c x –g x –v x training_set_file [model_file]

x为上述得到的最优参数c和g的值，v的值一般取5。

6）利用获取的模型进行测试与预测

使用Svmtrain训练好的模型进行测试。输入新的X值，给出SVM预测出的Y值

$ Svmpredict test_file model_file output_file

如：./svm-predict heart_scale heart_scale.model heart_scale.out

Accuracy = 86.6667% (234/270) (classification)

这里显示的是结果

一个具体使用的例子。

以libsvm中的heart_scale作为训练数据和测试数据，同时已经将python安装至c盘，并将grid.py文件中关于gnuplot路径的默认值修改为实际解压缩后的路径，将

heart_scale、grid.py和python.exe拷贝至\libsvm\windows文件夹下。

./svm-train heart_scale

optimization finished, #iter = 162

nu = 0.431029

obj = -100.877288, rho = 0.424462

nSV = 132, nBSV = 107

Total nSV = 132

此时，已经得到heart_scale.model，进行预测：

./svm-predict heart_scale heart_scale.model heart_scale.out

Accuracy = 86.6667% (234/270) (classification)

正确率为Accuracy = 86.6667%。

./python grid.py heart_scale

得到最优参数c=2048，g=0.0001220703125.

./svm-train -c 2048 -g 0.0001220703125 heart_scale得到model后，由./svm-predict heart_scale heart_scale.model heart_scale.out得到的正确

率为Accuracy = 85.1852%.这块还有点迷惑？为什么正确率降低了？

当然也可以结合subset.py 和 easy.py 实现自动化过程。

如果要训练多次，可以写个批处理程序省好多事。

这里举个例子：

::@ echo off
cls
:: split the data and output the results
for /L %%i in (1,1,1000) do python subset.py b59.txt 546 b59(%%i).in8 b59(%%i).out2

for /L %%i in (1,1,1000) do python easy.py b59(%%i).in8 b59(%%i).out2 >> result89.txt

这段批处理代码首先调用subset.py对文件b59.txt执行1000次分层随机抽样(对数据进行80-20%分割)然后调用easy.py 进行1000次参数寻优，把记录结果写到result89.txt中

（包括1000次训练的分类准确率和参数对）。

还可以调用fselect.py进行特征选择，调用plotroc.py进行roc曲线绘制。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Libsvm网格参数寻优教程的相关文章

简述PHP执行流程

目的 xff1a 本文主要介绍PHP执行流程目的是梳理php代码是如何最终转换成为机器二进制指令而被执行的参考文章 xff1a https blog csdn net diavid article details 81035188 PH
Java为啥比PHP快?

一直都说php比java要慢今天从理论跟实际测试看看php是否真的慢慢在哪里一运行模式对比 java 一般用java 语言开发的网站项目都是以命令行模式运行部分可能以可执行文件 xff08 exe xff09 的形式运行 php
PHP微服务 hyperf+nacos使用

PHP微服务 hyperf 43 nacos使用这里简单说下微服务及架构方面东西 1 微服务对php 43 fpm 模式意义不是很大原因就是php 43 fpm 天生支持模块拆分热更新如果只是性能上的考虑那php 43 fpm
PHP项目临时拓容Nginx负载均衡实操记录

项目域名 test baidu com 服务器A 127 0 0 1 内网ip 原有服务器服务器B 172 30 228 254 内网ip 需求项目本在服务器A中正常运行现在临时搞活动需要拓容一台多台服务器在最小成本跟改动下完成
layui templet中html标签获取js全局变量方法

开发中涉及layui中 xff0c 在使用到table的模板方法时templet xff0c 会遇到其内部除了使用table field xff08 此处通过d 来获取 xff0c 就不啰嗦了 xff09 然后如果想获取某个外部js中的全局
PHP分布式部署代码同步Git实现

PHP 分布式部署后代码自动同步实现项目架构如下需要更新代码时我们只需要把代码传到主服务器后通过定时任务主服务器自动push 代码到Git服务端之后其他从服务器则自动从Git云端拉取最新的代码即可需要用到 expect 软件安装
nginx 负载均衡502问题

项目架构 nginx 43 php fpm 负载均衡负载均衡关键配置如下引入负载均衡配置 include proxy conf 负载均衡 upstream test balance server 172 28 196 xxx 80 we
用Android 动画演示冒泡排序

之前面试遇到的一道机试题当时时间不够没有调出来有时间把它整了一下代码 public class MainActivity extends ActionBarActivity implements OnClickListener pri
教你怎么阅读外文文献

转载自 http www douban com group topic 14551517 NO 1 中科院大博士是如何进行文献检索和阅读的 xff08 好习惯受益终生 xff09 一如何进行文献检索我是学自然科学的 xff0c 平时确实
webpack打包时提示Invalid configuration object错误

初学者如果是通过网上教程来学习webpack xff0c 第一次用webpack打包时通常会遇到下面这样的问题 xff1a 实际上出错信息已经说明了问题原因 xff1a Invalid configuration object Webpac
Maven核心概念（1）--坐标

注 xff1a 转载时请注明原作者 lreis2010 及出处 http blog csdn net lreis2010 xff01 作者初次接触Maven是希望有一种方式能够自动化地管理项目中使用的Jar包随着对于Maven的学习 xf
【UML】四种关系

一在学习UML中的时候含有的四种关系是 xff1a 关联Association xff1a 是一种结构化的关系 xff0c 指一种对象和另一种对象有联系 xff0c 给定关联的两个类 xff0c 可以从其中的一个类的对象访问到另一个类的相
vnc，在windows系统上安装vnc，操作教程

VNC是一款可以实现远程桌面控制方面很实用的小工具 xff0c 今天给大家分享如何在在windows系统上安装vnc的操作方法 xff1a 小编在这里用到了 xff1a IIS7服务器管理工具来操作的具体操作的如下 xff1a 一首先
51单片机手动自动智能窗户窗帘控制系统手动自动定时

实践制作DIY GC 00 45 智能窗户窗帘控制系统一功能说明 xff1a 基于 51 单片机设计智能窗户窗帘控制系统二功能介绍 xff1a STC89C52 AT89C52 系列最小系统板 43 5VUSB电源 43 ULN2
linux下 bash-completion 离线安装（Ubuntu或centos ）

bash completion 安装实现k8s命令自动补全 xff0c 我们需要安装bash completion 在github下载离线包下载地址解压 tar xvJf bash completion 2 11 tar xz 命令补全
ROS自定义地图（CAD、手绘等）

0x00 概述在前面的文章中 xff0c 我们介绍如何自动导航时 xff0c 都是基于使用gmapping或者hector mapping创建的地图当然使用其他的建图方法创建的地图也可以 xff0c 但是目前为止 xff0c 无论使用哪
STM32 控制蜂鸣器播放音乐的原理和实例

STM32 控制蜂鸣器播放音乐的原理和实例本文通过将乐谱里的每个音符的声音频率和声音时长保存在两个数组里面 1 使用通用定时器TIM4实现无中断的微秒级延时函数 xff0c 控制每个音符的发声时长 2 使用系统滴答时钟Systick实现带
影响力最大化——CELF算法的简介与python实现

CELF算法是Leskovecl等人利用IC模型的子模特性对爬山贪心算法进一步改进得到的优化算法子模函数的定义为任意函数f 将有限集合映射为非负实数集并且满足收益递减特性即为子模函数设集合s T xff0c 任意元素v添加到集合S中获
Qos队列调度算法(SP/WRR/DWRR)

本文重点分析sonic中支持的三种Qos队列调度算法 xff1a 1 SP xff08 Strict Priority xff0c 严格优先级 xff09 也称为PQ xff08 Priority Queuing xff09 调度 xff0
python的MapReduce的应用案例

在学习这个项目中用到许多数学公式 xff0c 有的自己不太懂 xff0c 所以上传上来进行实地应用参考资料 generate train feature map py usr bin env python encoding 61 UTF

随机推荐

索赔649亿！GitHub Copilot惹上官司，被指控侵犯代码版权，是开源社区“寄生虫”...

大数据文摘授权转载自AI前线整理 xff1a 刘燕 xff0c 核子可乐一位 20 年老开源程序员 xff1a GitHub Copilot 就是开源社区的寄生虫 GitHub 面临集体起诉 xff0c 索赔 647 亿 GitHub
SDN网络技术：OpenFlow协议（1）

本文首发于我的公众号码农之屋 xff08 id Spider1818 xff09 xff0c 专注于干货分享 xff0c 包含但不限于Java编程网络技术 Linux内核及实操容器技术等欢迎大家关注 xff0c 二维码文末可以扫导读
Ubuntu、debian安装图形界面，输入法，解决远程桌面卡顿问题

安装图形界面 tasksel选择安装Ubuntu Desktopapt get install xrdp tigervnc standalone server安装远程接入systemctl start xrdpsystemctl enabl
JS 异步 ( 一、异步概念、Web worker 基本使用 )

相关阅读 xff1a JS 异步一异步概念 Web worker 基本使用 JS 异步二 Promise 的用法手写模拟 Promise JS 异步三 generator 的用法 async await 的用法文章目录异步异步
eve-ng 自定义linux镜像

文章目录 1 创建目录2 上传镜像并改名3 创建虚拟磁盘qcow24 登录eve网页5 查找lab UUID和虚拟机编号6 将系统提交成模板7 压缩镜像 xff08 可选 xff09 1 创建目录 root 64 eve ng opt un
百度地图Marker的定位和方向

原文 xff1a http bbs lbsyun baidu com forum php mod 61 viewthread amp tid 61 83704 今天做百度地图需要在显示很多车辆的位置信息并显示车辆的角度和行驶方向需要用到
ELFhash - 优秀的字符串哈希算法

1 字符串哈希 xff1a 我们先从字符串哈希说起在很多的情况下 xff0c 我们有可能会获得大量的字符串 xff0c 每个字符串有可能重复也有可能不重复 C不像Python有字典类型的数据结构 xff0c 我们没有办法吧字符串当做是键值
详解TensorFlow数据读取机制（附代码）

在学习TensorFlow的过程中 xff0c 有很多小伙伴反映读取数据这一块很难理解确实这一块官方的教程比较简略 xff0c 网上也找不到什么合适的学习材料今天这篇文章就以图片的形式 xff0c 用最简单的语言 xff0c 为大家详细
Linux下安装boa服务器遇到的问题

最近在CentOS7机器上安装boa服务器的时候 xff0c 遇到了不少问题 xff0c 在这里记录一下 1 从官网下载最新 boa源码包 xff0c 网址 xff1a http www boa org xff1b 2 解压 xff0c 进
【linux】查看Linux系统版本信息的几种方法

一查看Linux内核版本命令 xff08 两种方法 xff09 xff1a 1 cat proc version 2 uname a 二查看Linux系统版本的命令 xff08 3种方法 xff09 xff1a 1 lsb releas
如何使用Python为Hadoop编写一个简单的MapReduce程序

转载自 xff1a http asfr blogbus com logs 44208067 html 在这个实例中 xff0c 我将会向大家介绍如何使用Python 为 Hadoop编写一个简单的 MapReduce 程序尽管 Hadoo
Android Gradle 7.x新版本的依赖结构变化

版本的小蜜蜂小海豚电鳗版本的Android Studio新建工程的依赖结构和之前的发生了变化 xff0c 主要有 xff1a 原来在工程build gradle中的buildscript和allprojects xff0c 移动至set
C#：如何用VS开启人生中第一个Windows窗体应用程序(Winform)?

摘要 xff1a Windows窗体应用程序 xff08 Winform xff0c 下文以此指代 xff09 既能有效直观地设计Windows窗体界面 xff0c 又支持内部逻辑的编写那么 xff0c 对于C 初学者来说 xff0c
BootLoader & Grub详解

BootLoader amp Grub详解 xff08 补记 xff09 2008 8 2 星期日凉爽补记 xff1a 2010 xff0d 04 xff0d 21 时隔两年 xff0c 会过头来重新看了一下 xff0c 发现GRUB的
签名问题：EXPKEYSIG F42ED6FBAB17C654 Open Robotics ＜info@osrfoundation.org＞

sudo apt key adv keyserver keyserver ubuntu com recv keys F42ED6FBAB17C654 代码如上 xff0c 更换签名
Python,gnuplot,libsvm配置详细步骤

1 下载Python xff0c gnuplot以及libsvm 我的电脑是64位 xff0c Win7操作系统 1 1 python 2 7 6 64位这里我用的Python是64位的Python2 7 6 下载地址 xff1a htt
C++中assert函数的用法介绍

assert宏的原型定义在 lt assert h gt 中 xff0c 其作用是如果它的条件返回错误 xff0c 则终止程序执行 xff0c 原型定义 xff1a inclide lt assert h gt void assert in
C++中stdlib.h头文件介绍

stdlib头文件即standard library标准库头文件 xff0c stdlib头文件里包含了C C 43 43 语言的最常用的系统函数 xff0c 该文件包含了C语言标准库函数的定义 xff0c stdlib h中定义了物种类型
蛋白质性质和结构分析

原文链接第七章蛋白质性质和结构分析传统的生物学认为 xff0c 蛋白质的序列决定了它的三维结构 xff0c 也就决定了它的功能由于用X光晶体衍射和NMR核磁共振技术测定蛋白质的三维结构 xff0c 以及用生化方法研究蛋白质的功能效率
Libsvm网格参数寻优教程

原文 xff1a http endual iteye com blog 1262010 首先下载Libsvm Python和Gnuplot xff1a l libsvm的主页http www csie ntu edu tw cjlin li

Libsvm网格参数寻优教程

Libsvm网格参数寻优教程 的相关文章

随机推荐

热门标签

Libsvm网格参数寻优教程的相关文章