人工智能-10种机器学习常见算法

2023-11-20

机器学习是目前行业的一个创新且重要的领域。今天,给大家介绍机器学习中的10种常见的算法,希望可以帮助大家适应机器学习的世界。

1、线性回归

线性回归(Linear Regression)是目前机器学习算法中最流行的一种,线性回归算法就是要找一条直线,并且让这条直线尽可能地拟合散点图中的数据点。它试图通过将直线方程与该数据拟合来表示自变量(x)和数值结果(y)。然后就可以用这条直线来预测未来的值!
这种算法最常用的技术是最小二乘法(Least of squares)。这个方法计算出最佳拟合线,以使得与直线上的每个数据点垂直距离最小。总距离是所有数据点的垂直距离(绿线)的平方和。其思想是通过最小化这个平方误差或距离来拟合模型。
在这里插入图片描述
线性回归
在这里插入图片描述

2、逻辑回归

逻辑回归(Logistic regression)与线性回归类似,但逻辑回归是用于输出为二进制的情况(即,当结果只能有两个可能的值)。对最终输出的与预测是一个非线性的S型函数,称为logistic function,g()
这个逻辑函数将中间结果映射到结果变量Y,其值范围是从0到1.然后,这些值可以解释为Y出现的概率。S型逻辑函数的性质使得逻辑回归更适合用于分类任务。在这里插入图片描述
逻辑回归曲线图,显示了通过考试的概率与学习时间的关系

3、决策树

决策树(Decision Trees)可用于回归和分类任务。
在这一算法中,训练模型通过学习树表示(Tree representation)的决策规则来学习预测目标变量的值。树是由具有相应属性的节点组成的。
在每个节点上,我们根据可用的特征询问有关数据的问题,左右分支代表可能的答案。最终节点(即叶节点)对应于一个预测值。每个特征的重要性是通过自顶向下方法确定的,节点越高,其属性就越重要。
在这里插入图片描述
玩还是不玩,这是一个问题。

4、朴素贝叶斯

朴素贝叶斯(Naive Bayes)是基于贝叶斯定理。它测量每个类的概率,每个类的条件概率给出x的值。这个算法用于分类问题,得到一个二进制“是”/“非”的结果,如下图所示。
在这里插入图片描述
其中,P(Y|X)代表X事件发生的条件下,Y事件发生的概率;P(X)和P(Y)分别代表了事件X和事件Y发生的概率;P(X|Y)代表了Y事件发生的条件下,X事件发生的概率。
朴素贝叶斯分类器是一种流行的统计技术,可用于过滤垃圾邮件

5、支持向量机(SVM)

支持向量机(Support Vector Machine, SVM)是一种用于分类问题的监督算法。支持向量机试图在数据点之间绘制两条线,它们之间边距最大。为此,我们将数据项绘制为n维空间中的点,其中n是输入特征的数量,我们生活在3维空间,所以大多数想象n=3。在此基础上,支持向量机找到一个最优边界,简称超平面(Hyperplane),它通过类标签将可能的输出进行最佳分离。二维数据用线分离,三维数据用平面分离,当n超过3时候,我们就无法想象。
超平面与最近的类点之间的距离称为边距。最优超平面具有最大边界,可以对点进行分类,从而使最近的数据点与这两个点间的距离最大化,使得类类间的距离最小,类间的距离最大。
在这里插入图片描述

如图所示,H1没有将两个类分开。但是H2将两个类分开。但是H2只有很小的边距,而H3以最大的边距将它们分开了,使得类类间的距离最小,类间的距离最大。

6、K-最近邻算法(KNN)

这个可以参考我之前的博客,讲的很详细啊

7、K-均值

K均值(K-means)是通过对数据集进行分类来聚类的。例如这个算法可以根据购买历史将用户进行分组,它在数据集中找到K个聚类。K-均值用于无监督学习,因此,我们只需要使用训练数据X,以及我们想要识别的聚类数量K。
该算法根据每个数据点的特征,将每个数据点迭代地分配给K个组中的一个组,它为每个K-聚类(称为质心)的聚类中。这个过程一直持续到质心停止变化为止。
在这里插入图片描述

8、随机森林

随机森林(Random Forest)是一种非常流行的集成机器学习算法。这个算法的基本思想是,许多人的意见要比一个人的意见更加准确,好而不同。在随机森林中,我们使用决策树集成,一棵棵树,最后就集成了一片森林。
为了对新对象进行分类,我们从每个决策树中进行投票,并结合结果,然后根据多数投票最终做出决定。
在这里插入图片描述
(a)在训练过程中,每个决策树都是基于训练集的引导样本来构建的。
(b)在分类过程中,输入实例的决定是根据多数投票做出的。

9、降维

由于我们今天能够捕获的数据量信息太大,维度空间也越来越大,机器学习问题变得更加复杂。这个就意味着训练极其缓慢,而且很难找到一个好的解决方案。这个问题,通常被称为“维数灾难”(Curse of dimensionality)。
降维(Dimensionality reduction)试图在不丢失最重要信息的情况下,通过将特定的特征组合成高层次的特征来解决这个问题。主成分分析是最流行的降维技术。
主成分分析是通过将数据集压缩到低维线或超平面/子空间来降低数据集的维数。这尽可能地保留了原始数据的显著特征。
在这里插入图片描述
如图所示,可以通过将所有数据点近似到一条直线上来实现降维。

10、人工神经网络(ANN)

人工神经网络(Artificial Neural Networks, ANN)可以处理大型复杂的机器学习任务。神经网络本质上是一组带有权值的边和节点组成的相互连接的层,称为神经元。在输入层和输出层之间,我们可以插入多个隐藏层。人工神经网络使用了两个隐藏层。除此之外,还需要处理深度学习的问题。
人工神经网络的工作原理与大脑的结构类似。一组神经元被赋予一个随机权重,以确定神经元如何处理输入数据。通过对输入数据训练神经网络来学习输入和输出之间的关系。在训练阶段,系统可以访问正确的答案。如果网络不能准确识别输入,系统就会调整权重。经过充分的训练后,它将始终如一地识别出正确的模式。
在这里插入图片描述

每个圆形节点表示一个人工神经元,箭头表示从一个人工神经元的输出到另一个人工神经元的输入的连接。
这就是我对于机器学习的十种比较流行的算法的总结,大家也可以自己尝试去深入了解一下,希望对大家的学习有帮助啊。
照例给大家推荐一个b站视频:YOLOV4和YOLOV5教程 BV1pv411V7kR

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能-10种机器学习常见算法 的相关文章

随机推荐

  • 瀑布流布局2

    要实现瀑布流布局中让图片先排满第一行再排第二行 你可以使用 CSS 的多列布局 CSS multi column layout 来控制 目前你的布局使用了 column count 和 column gap 来定义列数和列之间的间隙 但这会
  • 记一次ElasticSearch 更改 mapping 字段类型的过程

    我的个人博客 逐步前行STEP 首先 es不支持直接更改mappinng 所以 更改 mapping 实质上是重建索引 操作步骤如下 1 为当前这个索引old index设置一个别名my index curl XPOST localhost
  • 数据类型分类

    分为四种类型
  • Java垃圾回收机制(GC)

    一 要回收哪些区域 在JVM内存模型中 有三个是不需要进行垃圾回收的 程序计数器 JVM栈 本地方法栈 因为它们的生命周期是和线程同步的 随着线程的销毁 它们占用的内存会自动释放 所以只有方法区和堆需要进行GC 二 如何判断对象是否存活 1
  • linux 开放端口

    我们可以输入命令查看防火墙的状态 firewall cmd state 如何在CentOS 7下开放8080端口 如果上一步处于关闭状态 输入命令 systemctl start firewalld service 如何在CentOS 7下
  • 计算机毕业设计Node.js+Vue大型零售电商平台——购物车管理子系统(程序+源码+LW+部署)

    该项目含有源码 文档 程序 数据库 配套开发软件 软件安装教程 欢迎交流 项目运行 环境配置 Node js Vscode Mysql5 7 HBuilderX Navicat11 Vue Express 项目技术 Express框架 No
  • 华硕T100HA鼠标乱跳及点击问题解决

    从入手此平板开始就一直有此问题 一直没有解决 今天正好装系统 就顺便解决此问题 一开始打算给这个平板安装Win7 8 网上说装了之后驱动不适配 就此放弃 然后 将系统恢复出厂设置了 然后问题依然在 在网上一直找啊找 终于在百度帖吧里找到问题
  • 人工智能概念

    人工智能概念 人工智能就是用人工方法在机器 计算机 上实现的智能 或称机器智能 即是研究如何用计算机来表示和执行人类的智能活动 以模拟人脑所从事的推理 学习 思考和规划等思维活动 并解决需要人类的智力才能处理的复杂问题 如医疗诊断 管理决策
  • 两个任意长度的长整数相乘(华为oj,C++)

    pre class cpp include oj h include pre
  • 【Android系统蓝牙开发】蓝牙基础知识-蓝牙核心系统架构

    什么是蓝牙 在开启基于蓝牙Spec v5 2的学习前 我们先了解下什么是蓝牙 蓝牙在我们日常生活中又存在哪些实际应用呢 蓝牙无线技术是一种短距离无线通信系统 其核心特性主要是以下三点 robustness 鲁棒性 抗干扰能力强 Low po
  • Python入门—— MySQL-python模块

    MySQL python模块 MySQLdb Python 标准数据库接口为 Python DB API Python DB API为开发人员提供了数据库应用编程接口 可以访问Python数据库接口及API查看详细的支持数据库列表 不同的数
  • Hadoop3 启动服务,提示:Attempting to operate on hdfs namenode as root

    在刚刚安装Hadoop3 环境上 启动Hadoop3 给出如下提示信息 Attempting to operate on hdfs namenode as root 翻译 尝试使用root 账户去操作hdfs namenode 造成原因 缺
  • IEEE 1588-PTP简介

    1 PTP简介 网络测控系统精确时钟同步协议PTP Precision Time Protocol 是一种对标准以太网终端设备进行时间和频率同步的协议 也称为IEEE 1588 简称为1588 1588分为1588v1和1588v2两个版本
  • 树莓派4B安装详细教程,从零开始!

    树莓派4B安装详细教程 从零开始 前言 一 准备材料 1 硬件材料 2 软件材料 二 安装步骤 1 格式化SD卡 2 安装系统 三 安装完成 前言 提示 本文详细介绍树莓派4B的安装流程 适合刚入手树莓派的同学 认为我写的好的同学希望点赞关
  • xxx-0.0.1-SNAPSHOT.jar中没有主清单属性

    添加如下配置即可
  • 算法通关村——二分查找在寻找数组峰顶中的应用

    题目 在数组i的某个位置i 开始 从 0 到 i 都是递增的 从 i 1 都是递减的 请你找到这个最高点 方法一 使用线性遍历实现 分析 最高点如果存在 需要满足arr i 1 lt arr i gt arr i 1 又因为题目说了0到i就
  • 史上最全的Android面试题集锦

    前言 很多人面试之前 可能没有在互联网公司工作过或者说工作过但年头较短 不知道互联网公司技术面试都会问哪些问题 再加上可能自己准备也不充分 去面试没几个回合就被面试官几个问题打蒙了 最后以惨败收场 下述是我收录整理的Android面试题汇总
  • 解决Photoshop无法完成请求,因为找到不知名的或无效的JPEG标识符类型问题

    在我将用微信Alt A截的图到Photoshop的时候出现无法完成请求 因为找到不知名的或无效的JPEG标识符类型问题 如下图 解决办法是 右击图片 用画图打开图片 将图片另存为jpg格式或者png格式即可 再次导入即可成功 具体原因不详
  • 2021年10月中旬—字节AI LAB NLP算法面试题(一)

    问题一 bert的架构是什么 目标是什么 输入包括了什么 三个embedding输入是怎么综合的 Bert的结构主要是Transformer的encoder部分 其中Bert base有12层 输出维度为768 参数量为110M Bert
  • 人工智能-10种机器学习常见算法

    机器学习是目前行业的一个创新且重要的领域 今天 给大家介绍机器学习中的10种常见的算法 希望可以帮助大家适应机器学习的世界 1 线性回归 线性回归 Linear Regression 是目前机器学习算法中最流行的一种 线性回归算法就是要找一