图解十大经典机器学习算法入门

2023-11-18

通过本篇文章可以对机器学习的常用算法有个常识性的认识，没有代码，没有复杂的理论推导，就是图解一下，知道这些算法是什么，它们是怎么具体应用的。

1. 决策树

根据一些 feature 进行分类，每个节点提一个问题，通过判断，将数据分为两类，再继续提问。这些问题是根据已有数据学习出来的，再投入新数据的时候，就可以根据这棵树上的问题，将数据划分到合适的叶子上。

2、随机森林

在源数据中随机选取数据，组成几个子集：

S矩阵是源数据，有1-N条数据，A、B、C 是feature，最后一列C是类别：

由S随机生成M个子矩阵：

这M个子集得到 M 个决策树：

将新数据投入到这M个树中，得到M个分类结果，计数看预测成哪一类的数目最多，就将此类别作为最后的预测结果。

3、逻辑回归

当预测目标是概率这样的，值域需要满足大于等于0，小于等于1的，这个时候单纯的线性模型是做不到的，因为在定义域不在某个范围之内时，值域也超出了规定区间。

插播福利

1.赠送互联网领域技术图书（pdf），143家公司的面试真题，共计10T干货资源。

获取方式：关注本公众号，回复“干货”。

2.免费微信交流群：包括健身群，运动群，交友群，学习群，求职群，讨论群，老乡群，学生群，校招群，跑步群，聚餐群

入群方式：关注本公众号，回复“入群”。

所以此时需要这样的形状的模型会比较好：

那么怎么得到这样的模型呢？

这个模型需要满足两个条件 “大于等于0”，“小于等于1”

大于等于0 的模型可以选择绝对值，平方值，这里用指数函数，一定大于0；

小于等于1 用除法，分子是自己，分母是自身加上1，那一定是小于1的了。

再做一下变形，就得到了 logistic regressions 模型：

通过源数据计算可以得到相应的系数了：

最后得到 logistic 的图形：

4、SVM

要将两类分开，想要得到一个超平面，最优的超平面是到两类的 margin 达到最大，margin就是超平面与离它最近一点的距离，如下图，Z2>Z1，所以绿色的超平面比较好。

将这个超平面表示成一个线性方程，在线上方的一类，都大于等于1，另一类小于等于－1：

点到面的距离根据图中的公式计算：

所以得到total margin的表达式如下，目标是最大化这个margin，就需要最小化分母，于是变成了一个优化问题：

举个例子，三个点，找到最优的超平面，定义了 weight vector＝（2，3）－（1，1）：

得到weight vector为（a，2a），将两个点代入方程，代入（2，3）另其值＝1，代入（1，1）另其值＝-1，求解出 a 和截矩 w0 的值，进而得到超平面的表达式。

a求出来后，代入（a，2a）得到的就是support vector，

a和w0代入超平面的方程就是support vector machine。

插播福利

1.我最近把各个互联网领悟的经典技术书和资源整理了一下，涵盖34个领域，143家公司的面试真题，以及常见互联网技术领悟经典书和面试书和知名互联网公司校招薪资汇总表。

获取方式：关注本公众号，回复“干货”。

2.技术交流群：在公众号后台回复”入群”。

5、朴素贝叶斯

举个在 NLP 的应用：

给一段文字，返回情感分类，这段文字的态度是positive，还是negative：

为了解决这个问题，可以只看其中的一些单词：

这段文字，将仅由一些单词和它们的计数代表：

原始问题是：给你一句话，它属于哪一类？

通过bayes rules变成一个比较简单容易求得的问题：

问题变成，这一类中这句话出现的概率是多少，当然，别忘了公式里的另外两个概率。

例子：单词“love”在positive的情况下出现的概率是 0.1，在negative的情况下出现的概率是0.001。

6、K最近临算法

给一个新的数据时，离它最近的 k 个点中，哪个类别多，这个数据就属于哪一类。

例子：要区分“猫”和“狗”，通过“claws”和“sound”两个feature来判断的话，圆形和三角形是已知分类的了，那么这个“star”代表的是哪一类呢？

k＝3时，这三条线链接的点就是最近的三个点，那么圆形多一些，所以这个star就是属于猫。

7、K均值算法

先要将一组数据，分为三类，粉色数值大，黄色数值小。

最开始先初始化，这里面选了最简单的 3，2，1 作为各类的初始值。

剩下的数据里，每个都与三个初始值计算距离，然后归类到离它最近的初始值所在类别。

分好类后，计算每一类的平均值，作为新一轮的中心点：

几轮之后，分组不再变化了，就可以停止了：

8、Adaboost

adaboost 是 bosting 的方法之一。

bosting就是把若干个分类效果并不好的分类器综合起来考虑，会得到一个效果比较好的分类器。

下图，左右两个决策树，单个看是效果不怎么好的，但是把同样的数据投入进去，把两个结果加起来考虑，就会增加可信度。

adaboost 的例子，手写识别中，在画板上可以抓取到很多 features，例如始点的方向，始点和终点的距离等等。

training的时候，会得到每个feature的weight，例如2和3的开头部分很像，这个feature对分类起到的作用很小，它的权重也就会较小。

而这个alpha角就具有很强的识别性，这个feature的权重就会较大，最后的预测结果是综合考虑这些feature的结果。

9、网络神经

Neural Networks适合一个input可能落入至少两个类别里：

NN由若干层神经元，和它们之间的联系组成。

第一层是input层，最后一层是output层。

在hidden层和output层都有自己的classifier。

input输入到网络中，被激活，计算的分数被传递到下一层，激活后面的神经层，最后output层的节点上的分数代表属于各类的分数，下图例子得到分类结果为class 1；

同样的input被传输到不同的节点上，之所以会得到不同的结果是因为各自节点有不同的weights 和bias，这也就是forward propagation。

10、马尔可夫

Markov Chains 由state和transitions组成。

例子，根据这一句话 ‘the quick brown fox jumps over the lazy dog’，要得到markov chains。

步骤，先给每一个单词设定成一个状态，然后计算状态间转换的概率。

这是一句话计算出来的概率，当你用大量文本去做统计的时候，会得到更大的状态转移矩阵，例如the后面可以连接的单词，及相应的概率。

生活中，键盘输入法的备选结果也是一样的原理，模型会更高级。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

算法

解释说明

图解十大经典机器学习算法入门的相关文章

代码随想录算法训练营Day18 | 二叉搜索树中的插入操作、二叉搜索树的最近公共祖先、删除二叉搜索树的节点、修剪二叉搜索树、二叉搜索树转换成累加树、将有序数组转换成二叉搜索树

LeetCode 701 二叉搜索树的插入操作本题思路既然是二叉搜索树那么插入就变得比较简单了因为二叉搜索树的左树节点值都小于根节点值右树节点值都大于根节点值直接将要插入的节点值和根节点进行对比如果比它小就往左孩子走比他大
工业异常检测AnomalyGPT-Demo试跑

写在前面如果你有大的cpu和gpu可以使用直接根据官方的安装说明就可以如果没有可以点进来试着看一下我个人的安装经验一试跑环境 NVIDIA4090显卡24g cpu内存33G 交换空间8g 操作系统ubuntu22 04 试跑过
CCF模拟题 202309-2 坐标变换（其二）

问题描述试题编号 202309 2 试题名称坐标变换其二时间限制 1 0s 内存限制 512 0MB 问题描述对于平面直角坐标系上的坐标 x y 小 P 定义了如下两种操作 1 拉伸 k 倍横坐标 x 变为 kx 纵坐标 y 变
基于机器学习的贷中风险预测模型-江苏银行“随e融”杯-二等奖

文章目录源码下载地址项目介绍界面预览项目备注毕设定制咨询源码下载地址源码下载地址点击这里下载源码项目介绍基于机器学习的贷中风险预测模型江苏银行
华为OD机试真题-计算三叉搜索树的高度-2023年OD统一考试（C卷）

题目描述定义构造三叉搜索树规则如下每个节点都存有一个数当插入一个新的数时从根节点向下寻找直到找到一个合适的空节点插入查找的规则是 1 如果数小于节点的数减去500 则将数插入节点的左子树 2 如果数大于节点的数加上500 则将数
基于粒子群算法的电动汽车充电动态优化策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
毕业设计-基于深度学习的细菌微生物目标检测系统系统 YOLO python 目标检测人工智能卷积神经网络机器学习

目录前言设计思路一课题背景与意义二算法理论原理 2 1 CBAM模块 2 2 损失函数三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析实现效果图样例最后前言大四是整个大学期间最忙碌的时光一
【具有延迟反馈的滤波器，其具有负群延迟】对于混沌系统，在可预测性高的阶段，该滤波器具有预测能力(Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
机器学习：基于python微博舆情分析系统+可视化+Django框架 K-means聚类算法（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
机器学习算法实战案例：LSTM实现多变量多步负荷预测

文章目录 1 数据处理 1 1 数据集简介 1 2 数据集处理 2 模型训练与预测 2
如何用GPT进行论文润色与改写？

详情点击链接如何用GPT GPT4进行论文润色与改写一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Ge
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
基于卡尔曼的混合预编码技术用于多用户毫米波大规模MIMO系统研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态

随机推荐

K8s Liveness/Readiness/Startup 探针机制

官方参考文档目录前言一默认健康检测 1 1 restartPolicy 1 2 测试案例二 Liveness 三 Readiness 四 Startup 前言玩过 Docker Swarm 的应该都知道有一种功能叫自愈功能当
4.9-4.10 矩阵乘法的性质 & 矩阵的幂运算 & 矩阵的转置及其性质

矩阵乘法的性质矩阵的乘法不遵守交换律矩阵乘法遵守结合律分配律对于任意r行c列的矩阵A 存在c行x列的矩阵O 满足 A Ocx Orx 对于任意r行c列的矩阵A 存在x行r列的矩阵O 满足 Oxr A Oxc 证明思路 A B C A
3.二进制数的应用、逻辑学及逻辑门

由前面的例子中我们讲了很多设备比如手电筒继电器以及两个编码莫尔斯编码和布莱叶盲文这些和我们熟知的二进制数有着很大的联系二进制数我们已经很了解了接下来举几个例子 1 胶卷的好坏判定我们把胶卷拉开会发现有12个方格是由银色和
Keil（MDK-ARM-STM32）系列教程（四）工程目标选项配置（Ⅱ）

写在前面本文接着上一篇文章工程目标选项配置进行讲述工程目标选项中后五项的配置也就是C C Asm Linker Debug Utilities这五项配置的具体内容对于工程目标选项中的C C 选项不管是初学者还是资深的软件工程师
memcach redis的理解和有点

Memcach 是一种缓存技术在一定的时间内将动态页面经过解析之后保存发到文件中国下次访问时动态网页就直接调用这个文件而不必再重新访问数据库使用memcach 做缓存的好处是提高网站的访问速度减轻高并发是服务器的压力优点稳定
对于一个程序员来说，电脑的内存需要多大？

1 程序员电脑内存有多大内存够用足够了纯写代码的编程对电脑要求不高尤其对显卡几乎没有要求一般编程可能开的任务窗口比较多所以只要cpu和内存大点就可以了一般来说处理器确实比显卡来得重要一些因为我们的电脑中只配备了一块处理器而处理
MEX 文件 ‘lsd.mexw64‘ 无效: 找不到指定的模块。问题解决方法

问题描述在跑MATLAB和C 混合编程的一个算法时出现了如下错误 MEX 文件 C Project final code reference code lsd mexw64 无效找不到指定的模块如下图所示原因分析根据资料 1 的
windows安装cx_oracle的坑

转自http rookiefly cn detail 69 作死小能手这两天闲着没事把自己电脑重装了然而重装过后配置开发环境踩了一些坑这里把安装cx oracle遇到的坑记录下来方便以后查看使用pip安装出现的问题命令 pip
linux下nc命令

一 nc命令检测端口的用法 nc v w 10 IP z PORT v 显示指令执行过程 w lt 超时秒数 gt 设置等待连线的时间 u 表示使用UDP协议 z 使用0输入输出模式只在扫描通信端口时使用例1 扫描指定的8080端口
亚马逊云科技与百川智能发起AI黑客松，共探医疗健康和游戏娱乐领域的前沿应用

8月31日亚马逊云科技云创计划成员企业暨基础模型创业公司百川智能率先通过了生成式人工智能服务管理暂行办法备案即日起面向全社会开放服务基础模型获准面向公众用户开放服务意味着有机会基于大量真实用户的调用反馈建立模型迭代的飞轮其效
Linux命令之远程连接ssh

概述 ssh命令是openssh套件中的客户端连接工具可以给予ssh加密协议实现安全的远程登录服务器实现对服务器的远程管理在脚本中该命令有着重要重要可用于在远程服务器中执行命令语法 ssh命令的基本语法如下 ssh 选项参数常
APP启动页隐私弹窗实现说明

最近审核严禁腾讯应用市场要求APP在启动页增加隐私政策和用户协议用户从腾讯应用市场上下载APP 第一加载的时候弹窗不然审核就不给过样式大概如下用户若点击不同意的时候无法进入APP内部下面把实现的代码贴上来 1 加个判断其他应
java eclipse打不开_安装eclipse以后打不开，出现这个图

方法1 将eclipse发送到桌面快捷方式然后右键属性快捷方式 tab 目标显示E dev enrionment eclipse eclipse exe 进行如下更改 E dev enrionment eclipse eclipse
基于改进YoloV3卷积神经网络的番茄病虫害检测

ABSTRACT 番茄在生长过程中受到各种病虫害的影响如果控制不及时就会导致减产甚至歉收如何有效地控制病虫害帮助菜农提高番茄的产量是非常重要的而准确地识别病虫害是最重要的与传统的模式识别方法相比基于深度学习的病虫害识别方法可以
pycharm设置文件标头

一设置模板步骤文件File 设置Settings 编辑器Editor File and Code Templates Python Script 里面设置模板 coding utf 8 Time DATE TIME 人生的事情并不是一帆
C++针对ZeroMQ库的选择

介绍 ZeroMQ 也称为0MQ或 MQ 是一个高性能低延迟的消息队列库它为分布式和并发应用程序提供了简洁高效的通信机制它是一个开源的库支持多种编程语言包括C 和操作系统 ZeroMQ通过使用套接字抽象来实现消息传递使得它易于
计算机网络学习日记把码元的振幅化为16个不同等级来传输-为什么要使用信道复用技术？

奈氏准则在宽带为W的低通信道中若不考虑噪声影响则马原传输的最高速率是2W 传输速率超过此上线就会出现验证的码间串扰的问题使接收端对码元的决判成为不可能假定某信道收奈氏准则的限制最高码元速率为20000码元秒如果采用振幅调制
如何使用CSS递归选择所有子元素？

当元素是某个元素的子元素时子选择器匹配子选择器由两个或多个由 gt 分隔的选择器组成也称为元素 gt 元素选择器它选择特定父级的所有元素语法如下选择所有子元素 element gt element 如果子元素递归选择则使用以下
Python_文件的代码格式

导入模块定义全局变量定义类定义函数在代码的最下方 def main pass 根据 name 判断是否执行下方代码 if name main main
图解十大经典机器学习算法入门

通过本篇文章可以对机器学习的常用算法有个常识性的认识没有代码没有复杂的理论推导就是图解一下知道这些算法是什么它们是怎么具体应用的 1 决策树根据一些 feature 进行分类每个节点提一个问题通过判断将数据分为两类再继续

图解十大经典机器学习算法入门

图解十大经典机器学习算法入门 的相关文章

随机推荐

热门标签

图解十大经典机器学习算法入门的相关文章