【机器学习】支持向量机（Support Vector Machines，SVM）

2023-05-16

SVM简介

支持向量机（Support Vector Machines）是一种二分类模型，对于多分类通常将其分解为多个二元分类问题，再进行分类。SVM 的基本模型是定义在特征空间上的间隔最大的线性分类器，SVM 还包括核技巧，这使它成为实质上的非线性分类器。SVM 的学习策略就是间隔最大化，最终可转化为一个凸二次规划问题的求解。

SVM学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分隔超平面。如下图所示，即为分隔超平面。
在这里插入图片描述
距离分隔超平面最近的点，即空心和实心的红色圆圈即为支持向量（Support Vector）。SVM的目标就是最大化支持向量所在的超平面之间的几何距离，两条平行直线的距离公式推广到高维可求得图中几何间隔距离：

m a r g i n = 2 ∣ ∣ ω ∣ ∣ margin = \frac{2}{||\omega||} margin=∣∣ω∣∣2

使得 margin 最大，也就等价于使得 ∣ ∣ ω ∣ ∣ 2 2 \frac{||\omega||^2}{2} 2∣∣ω∣∣2 最小，这里的 1 2 \frac{1}{2} 21 只是为了后续求导后刚好能消去，没有其他特殊意义。再加上使得所有数据能被分开的条件，转换成数学表达即是：

{ m i n ∣ ∣ ω ∣ ∣ 2 2 s . t . y i ( ω x i + b ) ≥ 1 i = 1 , . . . , m \begin{cases} min\frac{||\omega||^2}{2} \\ s.t. \ y_i (\omega x_i+b) \geq 1 \ \ \ \ \ \ i = 1,...,m \end{cases} {min2∣∣ω∣∣2s.t. yi(ωxi+b)≥1 i=1,...,m

这是一个凸二次规划问题，一般的优化方法求解不够高效，可以使用拉格朗日乘子法，转换成它的对偶问题求解。其对偶形式如下：

{ m a x ∑ i = 1 m α i − 1 2 ∑ i = 1 m ∑ j = 1 m α i α j y ( i ) y ( j ) ( x ( i ) ) T x ( j ) s . t . ∑ i = 1 m α i y ( i ) = 0 α i ≥ 0 i = 1 , . . . , m \begin{cases} max\sum^m_{i=1}\alpha_i-\frac{1}{2}\sum^m_{i=1}\sum^m_{j=1}\alpha_i\alpha_jy^{(i)}y^{(j)}(x^{(i)})^Tx^{(j)}\\ s.t. \ \sum^m_{i=1}\alpha_iy^{(i)} = 0 \ \ \ \ \ \ \ \ \ \alpha_i \geq 0 \ \ \ \ \ i = 1,...,m \end{cases} {max∑i=1mαi−21∑i=1m∑j=1mαiαjy(i)y(j)(x(i))Tx(j)s.t. ∑i=1mαiy(i)=0 αi≥0 i=1,...,m

在原始问题下，求解的复杂度与样本的维度有关，即 ω \omega ω 的维度。在对偶问题下，只与样本数量有关，即改变了问题的复杂度。因为只用求解 α \alpha α 系数，而 α \alpha α 系数只有支持向量才非 0 0 0，其它全部为 0 0 0，使得求解更高效。

对于得到的最优解 α ∗ \alpha^* α∗ 可以求得：

ω ∗ = ∑ i = 1 m α i ∗ y ( i ) x ( i ) b ∗ = y j − ∑ i = 1 m α i ∗ y ( i ) ( x ( i ) ) T x j \omega^* = \sum^m_{i=1}\alpha_i^*y^{(i)}x^{(i)}\\ b^* = y_j - \sum^m_{i=1}\alpha_i^*y^{(i)}(x^{(i)})^Tx_j ω∗=i=1∑mαi∗y(i)x(i)b∗=yj−i=1∑mαi∗y(i)(x(i))Txj

其中式中的 j j j 是任意一个 α j ∗ > 0 α_j^* > 0 αj∗>0 时的 j j j。此外，当样本点是非支持向量时，因为 a i ∗ = 0 a_i^*=0 ai∗=0，所以，SVM 的解只与支持向量有关，与非支持向量无关，即在决定最佳超平面时只有支持向量起作用，而其他数据点并不起作用。

对于线性不可分的情况，引入“软间隔(soft margin)”允许少量样本不满足约束，将目标函数改为：

m i n ω , b ∣ ∣ ω ∣ ∣ 2 2 + C ∑ i = 1 m m a x ( 0 , 1 − y ( i ) ( ω T x ( i ) + b ) ) min_{\omega,b}\frac{||\omega||^2}{2} + C\sum^m_{i=1}max(0, 1-y^{(i)}(\omega^Tx^{(i)}+b)) minω,b2∣∣ω∣∣2+Ci=1∑mmax(0,1−y(i)(ωTx(i)+b))

其中 C>0 称为惩罚参数，C 越小时对误分类惩罚越小，越大时对误分类惩罚越大，当 C 取正无穷时就变成了硬间隔。实际上应用时需要合理选取 C，C 越小越容易欠拟合，C 越大越容易过拟合。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【机器学习】支持向量机（Support Vector Machines，SVM）的相关文章

decltype(some_vector)::size_type 不能用作模板参数

以下类无法编译 template
使用大括号括起来的初始值设定项列表初始化结构向量

我像这样初始化普通类型向量 vector
使用 int 值初始化向量

我想用这个 ASCII 代码初始化这个 char 向量 vector
使用迭代器从“查找”或“删除”中删除

我想知道在 C 中从向量中删除元素的最佳实践是什么我多次看到人们使用 std remove 查找并删除元素然后使用擦除从向量中删除元素但为什么它比使用 find 获取要删除的元素的迭代器然后使用该迭代器的擦除更好呢 Thanks st
无法在向量向量上使用 emplace_back() 花括号初始化器

这与我之前提出的有关使用的问题有些相关emplace back在对向量上将一对插入到 std vector 时 emplace back 与 Push back https stackoverflow com questions 5390
如何使用 boost::serialization 序列化 std::vector ？

class workflow private friend class boost serialization access template
gnuplot 动画 2D 矢量场

我正在尝试使用 gnuplot 制作 2D 矢量动画我想显示一行即一次显示一个向量我的数据结构如下它们x y u v 2 24448 0 270645 1 00 1 00 3 24448 0 270645 0 500 1 20 我可
无法在 Android 中将矢量可绘制对象转换为位图可绘制对象

我正在尝试将位图转换为字节数组其中我将矢量可绘制图像转换为位图然后将其转换为字节数组但是当我打开应用程序时它向我显示错误类强制转换异常无法将矢量可绘制图像转换为位图可绘制 Resources res getResources Dra
如何旋转矢量？

如果我有 1 0 我旋转它90 degrees 1 2PI radians 我应该得到 0 1 我该如何实现这一目标我在看这一页 http en wikipedia org wiki Rotation matrix并实现了这个 var r
Numpy 提取网格数据的子集

在我的应用程序中我有一个从 meshgrid 命令获得的值矩阵及其坐标经度纬度我想根据经度和纬度限制提取该矩阵的特定子区域我已经尝试过这个解决方案但它不起作用我需要三个矩阵作为输出一个用于数据另外两个用于网格 Lons L
将 OneClassSVM 与 GridSearchCV 结合使用

我正在尝试在 OneClassSVM 上执行 GridSearchCV 函数但我似乎无法找到 OCSVM 的正确评分方法根据我收集的信息像 OneClassSVM score 这样的东西不存在因此 GridSearchCV 中没有所
scikit-learn：SVC 和 SGD 有什么区别？

SVM http scikit learn org stable modules svm html classification http scikit learn org stable modules svm html classific
我如何从 Rust 的 Vec 中获取项目？

我正在寻找一种方法consumes a Vec并返回一个元素无需恢复的开销Vec的不变量的方式remove and swap remove do fn take
我可以合法地写入常量向量指向的数据吗？把它分类？

我有一个常量整数向量const vector
rbind 命名向量到不同长度的矩阵

我正在尝试将命名向量绑定到矩阵上命名向量的长度与矩阵不同 gt m lt matrix data c 1 2 3 nrow 1 ncol 3 dimnames list c c column 1 column 2 column 3 gt
一个同时接受 std::vector 和 QVector 的函数模板？

假设我有一个函数叫做loadData 它需要一个容器填充数据和一个 CSV 文件我需要以下重载 loadData std vector
从设备坐标系到绝对坐标系的加速度

从我的 Android 设备中我可以读取线性加速度值数组在设备的坐标系中和绝对方向值数组在地球坐标系中我需要的是获得后一个坐标中的线性加速度值系统我怎样才能转换它们 EDIT阿里在评论中回复后好吧如果我理解正确的话当我测
使用步骤 c++ 构建向量

是否可以在不使用 C 中的循环的情况下以固定步骤创建从一个值到另一个值的向量例如我想用步长 0 5 构建一个从 1 到 10 的向量在 MATLAB 中我可以按如下方式执行此操作 vector 1 0 5 10 c 中有类似的东西吗
错误 C2039：“find”：不是“std”的成员

我刚刚遇到一个奇怪的错误它说 find 不是 std 的成员错误 C2039 find 不是 std 的成员错误 C3861 查找未找到标识符基本上我想查找是否可以在向量中找到字符串知道为什么会发生这种情况吗代码帮助告诉我
如何根据原始元素将向量中的元素替换为另一个元素[重复]

这个问题在这里已经有答案了请考虑以下程序这是一个最小化的示例所以不要纠结于我在这里尝试做的事情可以通过以下方式更好地实现 HashMap

随机推荐

【推免】笔试+机试+面试准备

CONTENT 笔试机试面试一常见问题二引导老师三临场反应笔试笔试每个学校都有自己的要求 xff0c 不一而论但大多是专业课的概念理解 xff0c 这些面试也会考 xff0c 准备不亏数学也可以看看万一问到了看过就不至于太
【机器学习】逻辑回归中代价函数详细求导过程
【leetcode】114. 二叉树展开为链表（Flatten Binary Tree to Linked List）（DFS）[中等]

链接 https leetcode cn com problems flatten binary tree to linked list 耗时解题 xff1a 2 0 5 day 题解 xff1a min 题意给定一个二叉树 xff0c
OVS 流表轨迹入门及典型场景举例【ovs-appctl ofproto/trace】

OVS 流表轨迹入门及典型场景举例一流表轨迹入门二典型场景举例三小技巧一流表轨迹入门在数据中心网络中 SDN控制器通过向OVS交换机下发OpenFlow流表指导报文转发在OVS中如何观察某个特定报文在OpenFlow
【leetcode】136. 只出现一次的数字（Single Number）（位运算）[简单]

链接 https leetcode cn com problems single number 题意给定一个非空整数数组 xff0c 除了某个元素只出现一次以外 xff0c 其余每个元素均出现两次找出那个只出现了一次的元素说明 xff
【机器学习】线性回归

目录 1 问题2 解决3 代码4 结果5 数据 1 问题假设你是一个餐饮连锁店的CEO xff0c 你打算在不同的城市开设不同的分店你已经在一些城市开了分店而且你有这些城市人口与利润的数据 xff08 见 5 数据 data txt x
【机器学习】主成分分析(Principal Component Analysis，PCA)_吴恩达ML

声明 xff1a 本文基于在校课程及吴恩达ML教程 xff0c 代码参考自多份博客 xff08 已在参考链接中表明 xff09 xff0c 如需转载请标明出处源代码实验数据实验指导书 xff1a https pan baidu com
【机器学习】K均值聚类(K-Means)_吴恩达ML

声明 xff1a 本文基于在校课程及吴恩达ML教程 xff0c 代码参考自多份博客 xff08 已在参考链接中表明 xff09 xff0c 如需转载请标明出处源代码实验数据实验指导书 xff1a https pan baidu com
【codeforces】Round #604 (Div. 2)（A. B.）

Codeforces Round 604 Div 2 xff1a http codeforces com contest 1265 目录 A Beautiful String链接题意思路AC代码 B Beautiful Numbers链接题
【leetcode】解题日记（未完待续）

开坑 xff0c 有生之年系列 xff0c 希望有一天能解出 l e e t c o d
【leetcode】10. 正则表达式匹配（regular-expression-matching）（DP）[困难]

链接 https leetcode cn com problems regular expression matching 题意给你一个匹配串 s 和一个模式串 p xff0c 实现一个支持和的正则表达式匹配匹配任意单个字符匹
【leetcode】14. 最长公共前缀（longest-common-prefix）（字符串）[简单]

链接 https leetcode cn com problems longest common prefix 题意查找给定字符串数组中的最长公共前缀如果不存在公共前缀 xff0c 返回空字符串思路先检查是否为空 xff0c
【leetcode】26. 删除排序数组中的重复项（remove-duplicates-from-sorted-array）（双指针）[简单]

链接 https leetcode cn com problems remove duplicates from sorted array 题意给定一个排序数组 xff0c 在原地删除重复出现的元素 xff0c 使得每个元素只出现一
【Linux】Ubuntu 服务器搭建 Jupyter Notebook 云服务并开启端口实现远程访问

目录一安装 Jupyter Notebook二设置密码生成密钥三生成 Jupyter Notebook 配置文件四修改配置文件五启动 Jupyter Notebook1 前台运行2 后台运行3 退出六远程访问七遇到的问题1
linux 下实现VNC显示图形界面开机自动启动

一般linux都内置了VNC软件 xff0c 除非你安装时候没选上默认的选项 xff0c 在liunx 启动vncserver非常简单 xff0c 只要在shell输入 vncserver xff0c 然后输入密码就可以了通过其他电脑在sh
【机器学习】交叉验证(Cross Validation)与网格交叉验证(GridSearchCV)的区别

原文链接 xff1a https blog csdn net qq 32241189 article details 80182114 一交叉验证交叉验证就是将原始数据集 dataset 划分为两个部分一部分为训练集用来训练模型另外
【Linux】PyCharm 连接服务器同步文件进行开发

文章目录一原因二推荐三配置1 基本服务器配置2 python 解释器配置四使用五参考链接一原因在服务器上开发时直接用 vim 粘贴进去的代码总有问题 xff08 各种不开心 xff09 我想与其一直纠结如何解决这个问题
【计算机视觉】方向梯度直方图（Histogram of Oriented Gradient，HOG）

文章目录 1 HOG 简述2 HOG 工作流程第一步对图像的颜色空间进行归一化第二步计算每个像素点的梯度第三步为每个单元构建梯度方向直方图第四步块内梯度直方图归一化 3 举个例子4 HOG 可视化 1 HOG 简述 HOG xff0
【Sublime】插件及配置

说明 xff1a 自用 Sublime Text 3 时用到的方便高效的插件及其相关配置 Sublime 下载地址 xff1a https www sublimetext com 3 文章目录 1 Package Control 安装包管理
【机器学习】支持向量机（Support Vector Machines，SVM）

SVM简介支持向量机 xff08 Support Vector Machines xff09 是一种二分类模型 xff0c 对于多分类通常将其分解为多个二元分类问题 xff0c 再进行分类 SVM 的基本模型是定义在特征空间上的间隔最大的

【机器学习】支持向量机（Support Vector Machines，SVM）

SVM简介

【机器学习】支持向量机（Support Vector Machines，SVM） 的相关文章

随机推荐

热门标签

【机器学习】支持向量机（Support Vector Machines，SVM）的相关文章