机器学习（一）svm运用实例

2023-11-03

机器学习（一）svm运用实例

这里我使用sklearn.svm.SVC函数，首先介绍一下函数参数。

sklearn.svm.SVC(C=1.0, kernel=‘rbf’, degree=3, gamma=‘auto’,
coef0=0.0, shrinking=True, probability=False,tol=0.001,
cache_size=200, class_weight=None, verbose=False, max_iter=-1,
decision_function_shape=None,random_state=None)

C：C-SVC的惩罚参数C?默认值是1.0。C越大，相当于惩罚松弛变量，希望松弛变量接近0，即对误分类的惩罚增大，趋向于对训练集全分对的情况，这样对训练集测试时准确率很高，但泛化能力弱。C值小，对误分类的惩罚减小，允许容错，将他们当成噪声点，泛化能力较强。
Kernel：核函数，默认是rbf，可以是‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’‘precomputed’
degree ：多项式poly函数的维度，默认是3，选择其他核函数时会被忽略。
gamma ：‘rbf’,‘poly’ 和‘sigmoid’的核函数参数。默认是’auto’，则会选择1/n_features
coef0 ：核函数的常数项。对于‘poly’和 ‘sigmoid’有用。
probability ：是否采用概率估计？.默认为False
shrinking ：是否采用shrinking heuristic方法，默认为true
tol ：停止训练的误差值大小，默认为1e-3
cache_size ：核函数cache缓存大小，默认为200
class_weight ：类别的权重，字典形式传递。设置第几类的参数C为weightC(C-SVC中的C)
verbose ：允许冗余输出？
max_iter ：最大迭代次数。-1为无限制。
decision_function_shape ：‘ovo’, ‘ovr’ or None, default=None3
random_state ：数据洗牌时的种子值，int值
主要调节的参数有：C、kernel、degree、gamma、coef0。*

创造数据集函数
make_blobs
x为特征y为标签
X, y = make_blobs(n_samples=200, centers=2, random_state=0, cluster_std=0.3)
画图
- 找出x轴，y轴的长度，x[:,0].min()+1 x[:.0].man()+1
- 生成坐标矩阵
  numpy.meshgrid()生成网格点坐标矩阵
  [X,Y] = meshgrid(x,y) 将向量x和y定义的区域转换成矩阵X和Y,其中矩阵X的行向量是向量x的简单复制，而矩阵Y的列向量是向量y的简单复制(注：下面代码中X和Y均是数组，在文中统一称为矩阵了)。假设x是长度为m的向量，y是长度为n的向量，则最终生成的矩阵X和Y的维度都是 nm （注意不是mn）
  np.linspace主要用来创建等差数列
  np.arange函数返回一个有终点和起点的固定步长的排列
  np.c_给numpy数组添加列
  np.r_给numpy数组添加行
1. 生成数据作图
  np.ravel()将采样点的x坐标摊平,
  np.r_是按列连接两个矩阵，就是把两矩阵上下相加，要求列数相等。
  np.c_是按行连接两个矩阵，就是把两矩阵左右相加，要求行数相等。
  xx.shape表示一共有多少个元素
  Z.reshape作用就是把数据原来的尺寸更改为我们想要的尺寸
2. 绘制
  plt.contourf(xx, yy, Z, cmap=‘hot’, alpha=0.5)等高线作图
  np.unique(y)该函数是去除数组中的重复数字，并进行排序之后输出

from sklearn import svm
from sklearn.datasets import make_blobs
from matplotlib import pyplot as plt
import numpy as np
X, y = make_blobs(n_samples=300, centers=2, random_state=0, cluster_std=0.3)
clf = svm.SVC(kernel='linear', C=1.0)
clf.fit(X, y)
plt.figure(figsize=(12, 4), dpi=144)
h = 0.02
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
# 使用np.meshgrid()扩充为两轴的所有可能取值的组合
xx, yy = np.meshgrid(np.arange(x_min, x_max, h),
                     np.arange(y_min, y_max, h))
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)
plt.contourf(xx, yy, Z, cmap='hot', alpha=0.1)
markers = ['o', 's', '**']
colors = ['r', 'g', 'y']

labels = np.unique(y)
for label in labels:
    plt.scatter(X[y == label][:, 0],
                X[y == label][:, 1],
                c=colors[label],
                marker=markers[label])


sv = clf.support_vectors_
# 绘制为白色'x',这样就会贴在之前的有色点上了
plt.scatter(sv[:, 0], sv[:, 1], c='y', marker='x')
plt.style.use("ggplot")
plt.title('svm')

plt.xlabel('X1 ')
plt.ylabel('X2 ')
plt.show()

运行结果
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习（一）svm运用实例的相关文章

xlrd.biffh.XLRDError：Excel xlsx 文件；不支持[重复]

这个问题在这里已经有答案了我正在尝试使用读取启用宏的 Excel 工作表pandas read excel与 xlrd 库它在本地运行良好但是当我尝试将其推送到 PCF 时我收到此错误 2020 12 11T21 09 53 441
切片稀疏（scipy）矩阵

我将不胜感激任何帮助以理解从 scipy sparse 包中切片 lil matrix A 时的以下行为实际上我想根据行和列的任意索引列表提取子矩阵当我使用这两行代码时 x1 A list 1 x2 x1 list 2 一切都很好
即使页面未完全加载，我们也可以使用 Selenium 获取页面源吗（TimeoutException: Message: timeout）？

即使遇到 TimeoutException Message timeout 也能获取页面源码吗当我调用 driver page source 时有时无法加载整页但我只需要它的部分信息尚未确定所以我只想在任何情况下保存页面是否可以
当我在 Pandas 中使用 df.corr 时，我的一些列丢失了

这是我的代码 import numpy as np import pandas as pd import seaborn as sns import matplotlib pyplot as plt data pd read csv dea
在 macOS 中通过 Python 访问进程的压缩 RAM（顶部的 CMPRS）的方法？

我试图弄清楚如何从 Python 访问任何给定进程占用的实际 RAM 量我发现 psutil Process PID memory info rss 工作得很好直到操作系统决定开始压缩某些进程的 RAM 然后所有的 memory in
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
PySide6.1 与 matplotlib 3.4 不兼容

当我只安装PySide6时 GUI程序运行良好但是一旦我安装了matplotlib及其依赖包包括pyqt5 则GUI程序将无法运行并输出以下错误消息 This application failed to start because no
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
`list()` 被认为是一个函数吗？

list显然是内置类型 https docs python org 3 library stdtypes html list在Python中我看到底下有一条评论this https stackoverflow com a 53645813
django-admin.py makemessages 不起作用

我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
Pandas style.bar 颜色基于条件？

如何渲染其中一列的 Pandas dfstyle bar color属性是根据某些条件计算的 Example df style bar subset before after color ff781c vmin 0 0 vmax 1 0 而
将文本注释到轴并对齐为圆

我正在尝试在轴上绘制文本并将该文本与圆对齐更准确地说有一些具有不同坐标 x y 的点位于该圆内并使用以下命令创建 ax scatter x y s 100 我想用圆圈连接并标记每个点 Cnameb 文本的坐标由 xp yp 定义因此
Python 类型安全吗？

根据维基百科 https en wikipedia org wiki Type system Type safety and memory safety 如果一种语言不允许违反类型系统规则的操作或转换计算机科学家就认为该语言是类型安全的
在 Sphinx 中，有没有办法在声明参数的同时记录参数？

我更喜欢在声明参数的同一行记录每个参数根据需要以便应用D R Y http en wikipedia org wiki Don t repeat yourself 如果我有这样的代码 def foo flab nickers a ser
如何使用 matplotlib 为圆柱体的每个单独面添加颜色

我正在尝试为圆柱体的每个面着色但是我不确定如何进行我尝试了以下方法 for i in range 10 col append for i in range 10 for j in range 20 col i append plt cm
在 virtualenvwrapper 中激活环境

我安装了virtualenv and virtualenvwrapper用这个命令我创建了一个环境 mkvirtualenv cv 它有效创建后我就处于新环境中现在我重新启动了我的电脑我想activate又是那个环境但是怎么样我使
为什么 smtplib.SMTP().sendmail 不发送 DKIM 签名邮件

我已经在服务器上设置了 postfix 以及 openDKIM 当我跑步时 echo Testing setup mail s Postfix test my email address 我收到电子邮件邮件标题中有一个DKIM Signa
如何在 robobrowser-python 中发出 POST 请求

http robobrowser readthedocs org en latest api html http robobrowser readthedocs org en latest api html 我正在尝试使用 APIbrows
在 Django shell 会话期间获取 SQL 查询计数

有没有办法打印 Django ORM 在 Django shell 会话期间执行的原始 SQL 查询的数量 Django 调试工具栏已经提供了此类信息例如 5 QUERIES in 5 83MS但如何从 shell 中获取它并不明显您可
长/宽数据到宽/长

我有一个数据框如下所示 import pandas as pd d decil 1 decil 1 decil 2 decil 2 decil 3 decil 3 decil kommune AA BB AA BB AA BB 2010

随机推荐

frida启动报错：./frida-server-15.1.27-android-x86_64: can‘t execute: Is a directory

报错场景在MuMu模拟器上安装frida server 启动的时候报错报错信息如下 frida server 15 1 27 android x86 64 can t execute Is a directory 原因剖析报错信息上显
10g r2 RAC Dataguard 3 nodes

最近在深圳实施windows 2003 上的oracle RAC项目原来计划是两个节点结果客户要求三个节点因为是他们认为购买的服务器只有二个cpu 原来计划是四个cpu 然后还要在做dataguard 一开始安装很顺利两个节点测试也
HTTP状态 405 - 方法不允许

错误描述 HTTP状态 405 方法不允许类型状态报告消息 Request method GET not supported 描述请求行中接收的方法由源服务器知道但目标资源不支持此时的原因是请求类型错误网页是get请求但是实
springMVC项目如何配置tomcat

先打开项目然后按图片所示操作最后点击ok就可以启动项目啦
【机器学习教程】四、随机森林：从论文到实践

引言随机森林 Random Forest 是机器学习领域中一种强大的集成学习算法它的优秀性能和广泛应用使得它成为了机器学习领域的一个重要里程碑本文将从算法的发展历程重要论文原理以及实际应用等方面详细介绍随机森林并提供一个复杂的实
时间段随机 java_java生成指定范围的随机日期

有这样一个需求构造一个方法随机生成1990 12 31 00 00 00到 2013 12 31 00 00 00之间任意一个时间点思路是这样在javaAPI中 Date类型和long类型很好转化所以我们可以把问题转化为求两个l
Selinux

1 Selinux的影响对于文件的影响当selinux开启时内核会对每个文件及每个开启的程序进行标签加载标签内记录程序和文件的安全上下文 context 对于程序功能的影响当selinux开启会对程序的功能加载开关并设定此开关的
HBuilder 打包 H5 APP 进行认证登录

H5 Mui App 统一身份认证登录过程的记录在 h5 app 开发的过程中用到到统一认证登录的功能统一身份认证登接口来进行登录验证在开发 h5 app 的时候一般会提供 app 网页版的这时候会发现网页版和打包的APP几
Perl知识点滴

函数多返回值 v1 abc v2 bcd v3 v4 upcase v1 v2 sub upcase my parms for parms tr a z A Z return wantarray parms parms 0 print v3
【数据结构】6.4 AVL树（C++）

数据结构 6 4 AVL树没有学过二叉搜索树也叫二叉排序树或二叉查找树的小伙伴们建议先学习一下这样阅读会更轻松哦点我学习二叉搜索树目录一 AVL树的概念 1 二叉搜索树的问题 2 AVL树的性质二 AVL树实现平衡的方法 1
为啥要用三层结构

开发人员可以只关注整个结构中的其中某一层可以很容易的用新的实现来替换原有层次的实现可以降低层与层之间的依赖有利于标准化利于各层逻辑的复用结构更加的明确在后期维护的时候极大地降低了维护成本和维护时间体现了高内聚低耦合的思想
DocuCentre SC2020 打印机连接

驱动下载地址 https support fb fujifilm com setupDriverForm do ctry code CN lang code zh CN d lang zh CN pid DCSC2020 anchor0 安
《再也不怕elasticsearch》es环境搭建、集群搭建

Elasticsearch环境搭建大家好我是迷途一个在互联网行业摸爬滚打的学子热爱学习热爱代码热爱技术热爱互联网的一切再也不怕elasticsearch系列帅途会慢慢由浅入深为大家剖析一遍各位大佬请放心虽然这个系列帅
90、基于STM32单片机数字频率计频率检测配NE555脉冲发生器设计(程序+原理图+PCB源文件+参考论文+硬件设计资料+元器件清单等)

单片机主芯片选择方案方案一 AT89C51是美国ATMEL公司生产的低电压高性能CMOS型8位单片机器件采用ATMEL公司的高密度非易失性存储技术生产兼容标准MCS 51指令系统片内置通用8位中央处理器 CPU 和Flash存储
几个效率高的排序算法

实用排序算法复杂度小于等于O n 2 中效率最低但实现并不是最简单的的两个 C C 教材却总喜欢拿来大讲特讲非常不利于初学者养成程序效率的思维实际上各种排序算法里除了堆排序实现较为复杂外从代码量的角度大多数算法都不比冒泡
matlab标准数据,Matlab数据标准化实现

在多属性综合评价问题中为了消除量纲差异带来指标不可公度性问题往往需要对原始评价矩阵进行标准化处理通过将不同量纲进行变换变为无量纲的标准化指标考虑到原始评价矩阵可能同时有多种类型的指标比如某个评价问题中可能同时有正向指标越大越
五分钟让你彻底了解TDD、ATDD、BDD&RBE

在目前比较流行的敏捷开发模式如极限编程 Scrum方法等中推崇测试驱动开发 Test Driven Development TDD 测试在先编码在后的开发实践 TDD有别于以往的先编码后测试的开发过程而是在编程之前先写测
PostgreSQL用户登录失败自动锁定的解决办法

墨墨导读 PostgreSQL使用session exec插件实现用户密码验证失败几次后自动锁定本文介绍一种处理方案一插件session exec安装配置篇下载插件并编译安装 https github com okbob sessi
RPA机器人的两种类型与未来发展

眼下 RPA 机器人流程自动化日渐成为业务流程优化重要解决方案和企业关注的重点 RPA不仅可以改善企业的工作方式带来效率的提升和超高的投资回报率 ROI 其潜在的其他好处也是其他工具所无法比拟的如改善客户体验提高员工满意度提高人才
机器学习（一）svm运用实例

机器学习一 svm运用实例这里我使用sklearn svm SVC函数首先介绍一下函数参数 sklearn svm SVC C 1 0 kernel rbf degree 3 gamma auto coef0 0 0 shrinkin

机器学习（一）svm运用实例

机器学习（一）svm运用实例

机器学习（一）svm运用实例 的相关文章

随机推荐

热门标签

机器学习（一）svm运用实例的相关文章