统计学习方法笔记（二）感知机

2023-10-26

感知机于1957年由Rosenblatt提出，是一种线性分类模型，属于判别模型，直接学习判别函数，是神经网络和支持向量机的基础。

对于感知机的学习推导首先要知道他的模型是什么，然后是学习策略（损失函数），最后是学习算法。

1. 感知机的模型（假设空间）：

其中符号函数为：

2. 感知机的学习策略（损失函数）：

首先超平面为：

点到超平面的距离(几何间隔)为：

感知机的学习策略是误分类驱动的，当误分类的点的个数为零那么感知机的模型也就收敛了。

所以对于误分类的点有：

所以误分类的点到超平面的距离就可以表示为：

那么所有的被误分类的点到超平面的距离之和为：

其中M为被误分类点的集合。

由于感知机模型只是寻求一个超平面来将两类点分开，而不是像支持向量机那样需要找到一个最优的点，所以为了简单，去掉||w||来得到感知机的损失函数：

理论上，感知机的损失函数应该是误分类的点的个数的度量，但是由于它对于变量不是连续可导的，因此，实际中我们使用以上这个误分类点的距离之和来作为度量，此时L(w,x)对w和x是连续可导的。

3. 感知机的学习算法：

对于感知机的损失函数的优化，使用的是随机梯度下降的方法。对模型的求解变成了对目标函数的优化问题：

随机梯度下降法的梯度计算：

随机梯度下降算法每次从误分类的点中挑选一个点，所以权值和偏置的更新方式为：

其中是步长。这样通过不断的迭代最终能够实现损失函数为0.

学习算法流程为：

由于在计算的过程中选取不同的初值和不同的误分类点都会导致解的不同。但是由novikoff定理可以得到只要数据是线性可分的，最终，模型都是收敛的。且误分类的次数满足：

其中

对偶形式的感知机学习算法：

为了更加的易于计算，提出了感知机学习算法的对偶形式。

因为如果设置w和b的初始值都是0的话，那么最终的优化出来的w为： ,其中 ,如果步长为1，那么则为第i个点被误分类的次数

因此，感知机对偶算法的模型为：

此时需要求出的变量变成了α和b

权值更新变成了:

对偶形式的训练样本都是以内积的形式出现的，因此可以预先计算出来并以矩阵的形式存储起来，这个矩阵被称为gram矩阵：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

统计学习方法

统计学习方法笔记（二）感知机的相关文章

【华为OD统一考试A卷

华为OD统一考试A卷 B卷新题库说明 2023年5月份华为官方已经将的 2022 0223Q 1 2 3 4 统一修改为OD统一考试 A卷和OD统一考试 B卷你收到的链接上面会标注A卷还是B卷请注意根据反馈目前大部分收到的都是
【深度学习】 Python 和 NumPy 系列教程（二十）：Matplotlib详解：2、3d绘图类型（6）3D向量场图（3D Vector Field Plot）

目录一前言二实验环境三 Matplotlib详解 1 2d绘图类型 2 3d绘图类型 0 设置中文字体 1 3D线框图 3D Line Plot 2 3D散点图 3D Scatter Plot 3 3D条形图 3D Bar Plo

随机推荐

两个分数化简比怎么化_小学数学“比的化简和求比值”

小学数学第十一册中比的化简和要比值有些小学生觉得有点难我觉得这部分知识主要是学生还没有掌握以下方法一比的化简几种类型 1 比的前项和比的后项都是整数例 5 25 5 25 1 5 1 5 就是用比的前项除以比的后项可写成分数的形
Java 零基础教程，看完就会，建议收藏

如果你不懂Java 并且想认真学习接触了解一下Java的语法建议把这篇文章收藏了多看几遍应该可以初步掌握Java 大部分基础的语法让我们出发吧 ps 本文有点长耐心阅读编程环境工程项目推荐使用IDEA 入门学习推荐使用jupy
Redis在Springboot中的使用——Hash

Redis在Springboot中的使用 Hash 数据类型详解操作命令添加获取修改删除其他操作使用应用场景购物车用户个人详情商品详情数据类型详解在讲解Redis中Hash的使用之前大家需要知道Hash是怎么样的
【C++】构造函数初始化列表

目录一为什么要用构造函数初始化列表二使用构造函数初始化列表的方式三构造函数成员初始化顺序一为什么要用构造函数初始化列表常规的构造函数初始化方式 class Rectangle public Rectangle int wi
C++二进制（写入，读取）

二进制文件以基本类型数据在内存的二进制表示形式存放数据不对写入或读出的数据做格式转换二进制文件的读写方式由程序控制打开二进制文件用binary方式 istream istream read char buf int n 作用从流中提
从键盘上输入一个字符，进行加密以后再输出在屏幕上。加密规律是：输入小写英文字母时，输入a输出Z、输入b输出Y、输入c输出X、...、输入z输出A。

题目描述从键盘上输入一个字符进行加密以后再输出在屏幕上加密规律是输入小写英文字母时输入a输出Z 输入b输出Y 输入c输出X 输入z输出A 输入大写英文字母时将该字母ASCII码值再加上该值的1 2后输出所对应的字符例如数字A的
orb-slam2 从单目开始的简单学习（6）Frame

1 SetPose 为了获得相机坐标系到世界坐标系的旋转矩阵和平移向量以及当前相机光心在世界坐标系下坐标 void Frame SetPose cv Mat Tcw mTcw Tcw clone UpdatePoseMatrices voi
solve Android studio click device manage no working

Android Studio wants to know what kind of project you have to show the right menus click left in file tree on the root n
vuecli引入vue-amap地图组件（高德地图SDK）

指南组件 vue amap 1 前往高德开放平台注册开发者账号在控制台申请Key 高德开放平台高德开放平台高德地图API 申请Key 获取Key 创建工程开发指南 Web服务 API 高德地图API 2 安装vue amap np
虚拟机配置

1 Finalshell下载 Mac http www hostbuf com downloads finalshell install pkg Windows http www hostbuf com downloads finalshe
clang static analyzer源码分析（二）

引子在clang static analyzer源码分析一中我们简单介绍了 AnalysisConsumer 这个类以及基于AST树的语法层级的代码检查今天简单介绍下 PathSensitiveChecks 的概念以及如何对cla
STL:vectoer

首先包含头文件 include
重参数化技巧：高斯分布采样

1 高斯分布采样我们现在得到了有样本X得到的分布X N mu sigma 2 通过采样我们得到确定的隐变量向量从而作为解码器的输入采样这个操作本身是不可导的但是我们可以通过重参数化技巧将简单分布的采样结果变换到特定分布中
Fabric上搭建Hyperledger caliper进行性能测试

Fabric介绍推荐文章 Hyperledger 超级账本是Linux基金会旗下的项目 Fabric是Hyperledger项目里最早也是目前应用最广泛的区块链项目最初由IBM开发后来捐助给基金会是一个开源的企业级需要许可的分布式
Git Gui客户端软件连接及上传文件

1 下载客户端软件 2 上传那个文件就在哪个文件下 git gui here 之后选择当前的目录创建仓库 3 关于操作在一下连接有 https blog csdn net qq 15509267 article details 836170
关于mybatis使用pageHelper分页插件问题

关于mybatis使用PageHelper分页插件冲突以及解决方案分页插件其实可以提高我们的开发效率如果我们自己手写 1会嫌麻烦 2需要写两条一条写count一条写list 虽然他底层也是这么实现的但是不需要我们手动来写好的工具能
大数据的入门级学习

大数据方向的工作目前分为三个主要方向 01 大数据工程师 02 数据分析师 03 大数据科学家 04 其他数据挖掘本质算是机器学习不过和数据相关也可以理解为大数据的一个方向吧由于本人曾是大数据工程师的角色我就这个方向做一些介绍本
从0开始使用vue-element-admin

目录安装node js及npm 安装nrm 安装vscode 汉化推荐安装一些好用的扩展安装vue element admin 框架登陆原理简单分析本教程经亲测支持最新版4 0 1vue element admin 安装node j
RabbitMQ宕机后，消息100%不会丢失吗

V xin ruyuanhadeng获得600 页原创精品文章汇总PDF 这篇文章给不太熟悉MQ技术的同学介绍一个生产环境中可能会遇到的问题目前为止你的RabbitMQ部署在线上服务器了对吧然后订单服务和仓储服务都可以基于Rab
统计学习方法笔记（二）感知机

感知机于1957年由Rosenblatt提出是一种线性分类模型属于判别模型直接学习判别函数是神经网络和支持向量机的基础对于感知机的学习推导首先要知道他的模型是什么然后是学习策略损失函数最后是学习算法 1 感知机的模型假设空

统计学习方法笔记（二）感知机

统计学习方法笔记（二）感知机 的相关文章

随机推荐

热门标签

统计学习方法笔记（二）感知机的相关文章