【读书笔记】周志华 机器学习 第六章 支持向量机

2023-11-13

1 间隔和支持向量

超平面
对上图所示的数据集,有多个超平面可以划分。直观上来说,最中间加粗的那个超平面是最好的,因为离两类数据都比较远。“离两类数据都比较远”的好超平面指的是离超平面最近的点到超平面的距离最大
最优超平面定义
y i w x i ∣ ∣ w ∣ ∣ y_i \frac {{\boldsymbol w}x_i}{||{\boldsymbol w}||} yi∣∣w∣∣wxi表示所有数据到超平面的距离。
d i s t < = y i w x i ∣ ∣ w ∣ ∣ dist <= y_i \frac {{\boldsymbol w}x_i}{||{\boldsymbol w}||} dist<=yi∣∣w∣∣wxi表示dist是最小距离。
m a x   d i s t max\ dist max dist表示要最大化最小距离。
这样,如图所示的最优化问题的求解结果就是希望找的最优超平面。
使用拉格朗日函数法求解该最优化问题。最后可以证明对参数w和b有影响的数据都是离最优超平面最近的点,其他点不影响参数。这些最近的点称为支持向量。在实际学习过程中常使用SMO算法以加快学习速度。

2 核函数

对于非线性可分的数据,可将样本映射到更高维的空间 x − > φ ( x ) {\boldsymbol x}->\varphi ({\boldsymbol x}) x>φ(x),比如 x − > x 2 x -> x^2 x>x2。已经证明,当非线性可分数据特征有限时,一定存在某个高维空间使得其线性可分。问题是,我们事先并不知道该如何映射,不知道是将x映射为平方还是立方。核函数 K ( x 1 , x 2 ) = φ ( x 1 ) ∗ φ ( x 2 ) K({\boldsymbol x}_1, {\boldsymbol x}_2) = {\varphi({\boldsymbol x}_1)}*{\varphi ({\boldsymbol x}_2)} K(x1,x2)=φ(x1)φ(x2)让我们不必知道具体的映射 φ ( x ) \varphi ({\boldsymbol x}) φ(x),只用知道映射之后内积的结果。常用核函数如下图所示。
常用核函数

3 软间隔和正则化

当数据含有噪声时,我们可以适当降低最大距离的要求。同时,加入惩罚项避免一味降低要求。和之间避免过拟合加入正则项类似。
软间隔

4 参考文献

周志华 机器学习 清华大学出版社
谢文睿、秦州 机器学习公式详解 人民邮电出版社
李航 统计学习方法第二版 清华大学出版社
部分图片和文字源自网络和书本,如有侵权联系删除

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【读书笔记】周志华 机器学习 第六章 支持向量机 的相关文章

随机推荐

  • vite和webpack的区别及优势

    webpack会先打包 然后启动开发服务器 请求服务器时直接给予打包结果 vite直接启动开发服务器 请求哪个模块再对该模块进行实时编译 打包原理 vite优点 webpack服务器启动速度比vite慢 由于vite启动的时候不需要打包 也
  • 双向链表删除节点时间复杂度_Leetcode简洁笔记 第19题:删除链表的倒数第N个节点...

    给定一个链表 删除链表的倒数第 N 个节点 并且返回链表的头结点 本文答案参考自leetcode官方题解 方法1 先遍历再删除 时间复杂度 O L 空间复杂度 O 1 删除链表的倒数第 N 个节点 即 删除链表的 第 L n 1 个节点 因
  • SQL注入-堆叠注入

    SQL注入 堆叠注入 原理 数据库支持堆叠查询 所谓堆叠查询就是执行多条语句 语句以 隔开 并且代码使用了支持堆叠查询的函数 列如PHP的mysqli multi query 堆叠注入就是在第二条语句中构造payload 注 页面只返回第一
  • Linux下docker的常用命令

    我们来了解一下常用的docker命令 其中docker container命令中的参数 有同于docker命令的参数的 其用法相同 效果一样 docker container命令的参数和docker命令的参数不同的有prune ls 其中d
  • 若依框架项目部署后路由报错

    若依框架部署到服务器后 动态路由报错 无法访问 原因是有些版本不支持动态import导入 解决 找到 store modules permission js 将 import引入改为require export const loadView
  • BigDecimal的使用

    1 初始化 推荐使用字符串初始化 直接使用数字会导致精度问题 直接使用数字 BigDecimal num new BigDecimal 0 05 使用字符串 BigDecimal num1 new BigDecimal 0 05 BigDe
  • 入侵杂草算法matlab,一种基于入侵杂草算法改进的差分进化算法

    1 引言 进化算法是模仿生物进化过程设计的现代优化方法 作为一种有效的随机优化方法 被广泛应用于求解复杂优化问题 DE算法 1 使用浮点矢量进行个体编码 通过简单的变异 交叉及竞争算子实现在连续空间中的随机搜索 DE算法原理简单 易于理解和
  • 网页常用JS/VBS代码

    nc ntextmenu window event returnValue false 将彻底屏蔽鼠标右键 table border border td no td table 可用于Table 2 取消选取 防止复制 3 npaste r
  • WEB靶场搭建教程(PHPstudy+SQLllib+DVWA+upload-labs)

    WEB靶场搭建教程 PHPstudy SQLllib DVWA upload labs 0x00 简介 0x01 PHPstudy 0x02 搭建SQLi labs靶场 0x03 搭建DVWA靶场 0x04 搭建upload labs靶场
  • 深入浅出Redis-redis底层数据结构

    相信使用过Redis 的各位同学都很清楚 Redis 是一个基于键值对 key value 的分布式存储系统 与Memcached类似 却优于Memcached的一个高性能的key value数据库 在 Redis设计与实现 这样描述 Re
  • ideagit回退回滚到以前的指定版本

    idea git gitee gitlab 回退回滚到以前的指定版本分为三步 1 本地库硬 hard 回滚 2 远程库混合 mixed 回滚 3 最好等待一分钟让代码回滚后可以被git识别代码状态 提交到远程库 首先是准备工作 我下面先提交
  • Spring中对于@RequestBody的参数解析问题

    文章目录 问题起源 问题延伸 代码实现 前置准备阶段 选择解决方案 如何自定义Resolver 处理类型 如何自定义HttpMessageConverter 思考总结 问题起源 今天后端与前端同事在讨论对于只有一个参数的接口 能否不将参数当
  • Linux文件系统简单认识学习笔记

    Linux文件系统简单认识 ReadMe 1 什么是文件系统 2 文件系统 文件管理系统的方法 的种类有哪些 3 什么是分区 4 什么是文件系统目录结构 5 什么虚拟文件系统Virtual File System 6 虚拟文件系统有什么作用
  • C语言头文件和源文件差异,#include两种引用方式差异

    一些初学c语言的人 不知道头文件 h文件 原来还可以自己写的 只知道调用系统库函数时 要使用 include语句将某些头文件包含进去 其实 头文件跟 c文件一样 是可以自己写的 头文件是一种文本文件 使用文本编辑器将代码编写好之后 以扩展名
  • Java将一个List中的值赋值给另一个List

    刷leetcode中的一道dfs题时 添加结果集时如果不新创建list所有添加的list都是同一个 并且回溯得到时候会删掉所有元素 Java中 的作用有两个 1 赋值 2 指向地址 当对基本数据类型进行赋值时 的作用就是单纯的赋值 例如 i
  • 使用zabbix监控avamar【一】

    1 介绍 avamar是dell的一款数据备份产品 用于公司私有云平台虚拟机备份 虽然不是与业务直接相关 关注度不是特别高 也正因为如此偶尔出现备份失败问题不能及时发现 所以要加入公司的智慧运维系统 以zabbix为底层开发 2 选择模式
  • 变分推断的数学推导

    这里只给出变分推断的数学推导 变分颇为高深 这里只是简单介绍一下基本概念 想了解更多详见 https blog csdn net weixin 40255337 article details 83088786 变分推断的目的是构造 q w
  • seaborn可视化库分析库基础01 - 布局、参数、色板等

    Seaborn库简介 Seaborn库官网 正如你所知道的 Seaborn是比Matplotlib更高级的免费库 特别地以数据可视化为目标 但他要比这一切更进一步 他解决了用Matplotlib的2个最大问题 正如Michael Wasko
  • windows中将sqlmap添加到环境变量中

    在windows下每次使用sqlmap进行sql注入测试时 都要先进到sqlmap py的目录中 然后执行python sqlmap py url 而作为未来的渗透大佬 怎么能够允许这么low的事情出现 1 添加环境变量 电脑右键属性 高级
  • 【读书笔记】周志华 机器学习 第六章 支持向量机

    第六章 支持向量机 1 间隔和支持向量 2 核函数 3 软间隔和正则化 4 参考文献 1 间隔和支持向量 对上图所示的数据集 有多个超平面可以划分 直观上来说 最中间加粗的那个超平面是最好的 因为离两类数据都比较远 离两类数据都比较远 的好