机器学习(一)

2023-11-16

人工智能

人工智能的诞生

  • 人工智能诞生于一群科学家想使用机器模拟人类思维或者人类智能的一系列问题
  • 人工智能的目标是想通过计算机模拟人的某一些思维能力或者智能行为,让计算机能够像人类一样进行思考
  • 人工智能应用于机器翻译、智能控制、图像理解、游戏博弈等

人工智能的发展历程

根据所使用的核心技术的不同

  • 逻辑推理:主流技术是符号逻辑计算
    在这里插入图片描述

  • 知识工程:以知识工程为核心技术
    在这里插入图片描述

  • 机器学习:让机器像人类一样具有学习的能力,以机器学习为主流核心技术
    起源于二十世纪五十年代的感知机数学模型

人工智能与机器学习的关系

在这里插入图片描述

机器学习

机器学习是一种通过先验信息来提升模型能力的方式,具体说来,对于给定任务和性能度量标准,使用先验信息,通过某一种计算方式改进初始的模型,或者一个性能更好的改进模型的过程,就是机器学习。

机器学习的发展历程

  • 感知机与连接学习(使用阳历信息调节神经元之间连接权重的学习方式)

    通过模仿生物大脑神经网络结构的方式来实现机器智能,典型的如MP模型(无权重)、感知机(有权重、线性)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 符号学习(逻辑推理、决策树模型)与统计学习(基于概率统计理论、支持向量机),符号学习包括:

    • 记忆学习:死记硬背
    • 演绎学习:从一般到特殊的学习方式
    • 归纳学习:从特殊到一般的学习方式

    核方法:讲低维度特征空间中线性不可分的数据映射到高维特征控件当中,使得数据在高维特征控件中线性可分,但是在计算超平面的时候还是在低维空间内,解决线性可分的问题的同时计算也比较简单。

  • 连接学习的兴起——深度信念网络
    在这里插入图片描述

  • 机器学习与其他领域的关系

    人工智能、表示学习、深度学习
    在这里插入图片描述

讨论

在这里插入图片描述
在这里插入图片描述

机器学习的必要性

给出一棵树的图像,编程无法实现辨认一棵树的程序

机器学习的必要性在于:

  1. 系统过于复杂的,无法用编程解决的,可以使用机器学习,比如自动驾驶;
  2. 对于无法明确定义出一个解决方案的,可以使用机器学习,比如图像识别;
  3. 对于需要快速的判断和决策的,可以使用机器学学习;
  4. 对于需要处理非常大量的数据的,可以使用机器学习;
  5. 机器学习的应用非常广泛,包含了衣食住行;
  6. 机器学习是其他研究问题的基础,包括数据挖掘、计算机视觉、自然语言处理、生物特征识别等。

机器学习的定义

  • 假设用E来评估计算机程序在某 任务类T 上的性能(度量),若一个程序通过利用经验P在T中的任务上获得了性能改善,则我们就说关于T和E,该程序对P进行了学习
  • 机器学习致力研究如何通过计算的手段,利用经验来改善系统自身的性能,从而在计算机上从数据中产生“模型”,用于对新的情况给出判断

在这里插入图片描述

机器学习的三要素

模型+学习准则+优化算法

在这里插入图片描述

机器学习的实质是:根据现有的数据,寻找输入数据和输出数据的映射关系/函数,机器学习很难找到输入数据和输出数据的最佳映射关系/函数,一般来讲,只能找到符合要求的映射关系。

机器学习的基本概念

  • 训练集:带有标记的数据,比如某一个瓜带有某一个特证,它的标记是好瓜,这些数据就是训练集(给出y的x的集合)

  • 测试集:没有标记的数据,用来评估模型的好坏

  • 标记:也即是好瓜还是坏瓜,即y

  • 任务:(机器学习按照解决的问题(任务)的不同划分为以下三类

    • 回归任务:输出为连续的值,比如瓜的成熟度,甜度
    • 分类任务:输出为离散值,分为二分类和多分类,比如好瓜坏瓜,非0即1
    • 聚类任务:数据为无标记的数据
    • 回归任务:
      在这里插入图片描述
    • 分类任务:
      在这里插入图片描述
    • 聚类任务:聚类任务的类别与分类任务不同,聚类任务的类含有特殊含义和不确定性;聚类需要设置参数,明确需要分成多少类
      在这里插入图片描述
  • 机器学习的常见类型(机器学习按照先验信息(标记、标签)的不同可以分为以下类别)

    • 有监督学习:有标记的信息,包括分类和回归
    • 无监督学习:无标记信息,分为聚类和降维
    • 强化学习:环境的反馈
    • 有监督学习:
      在这里插入图片描述
    • 无监督学习:
      在这里插入图片描述
    • 强化学习:不断与环境交互、通过反馈的信息来调整策略
      在这里插入图片描述
  • 泛化能力:模型适用于新样本的能力

  • 假设空间:
    在这里插入图片描述

    案例说明:色泽包含了表格中的两种,还有一种其他的颜色,不包含在表格内,所以色泽有三种可能,根蒂和敲声也是同理,最终的结果映射可能映射为好瓜,也可能好瓜的概念不成立,所以需要+1
    在这里插入图片描述

  • 模型偏好:学习过程中,对某种类型结社的偏好叫做模型偏好;根据模型的偏好不同,对于预测的结果也会有所不同,如何挑选模型,要看模型泛化能力。
    在这里插入图片描述

    • 奥卡姆剃刀原理:如无必要,勿增实体,即简单有效原理
    • 没有免费的午餐定理:
      在这里插入图片描述
  • 误差和损失函数:
    在这里插入图片描述

    • 整体误差:整体误差定义为所有单个样本所分别对应损失函数值的平均值
      在这里插入图片描述
      常见的损失函数:
      0-1损失:简单但是不可导,不可以应对诸多复杂问题
      平凡损失:处处可导
      在这里插入图片描述
  • 泛化误差(期望风险)和训练误差(经验风险)
    在这里插入图片描述

    • 泛化误差(期望风险)表述的是整个样本集中的整体误差,这个很可能是达不到的,比如数据集很大、无限的时候,是达不到泛化误差的。
    • 训练误差(经验风险)表述的是取一部分的样本来表达整个样本空间,在实际应用中,我们希望经验风险最小化
      模型参数:根据经验风险最小化的方法得到的优化模型,即为模型参数
      在这里插入图片描述
  • 测试误差:模型在测试样本中的整体误差
    在这里插入图片描述

  • 过拟合和欠拟合

    • 过拟合:同时拟合了训练样本的共性和个性特征(在学习过程中把噪声一起学进去了)
    • 欠拟合:未能充分拟合训练样本的共性造成模型的泛化误差比较大,从而模型泛化能力较弱
  • 偏差和方差分解
    在这里插入图片描述
    在这里插入图片描述

    • 偏差:期望输出与真实值之间的差异
    • 期望泛化误差:
      y^为预测出来的结果的标记值
      在这里插入图片描述
      公式推导详情查看:https://blog.csdn.net/qq_43246110/article/details/105318825

作业

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习(一) 的相关文章

  • 比尔盖茨与萨姆.奥尔特曼的对话及感想

    谈话内容 比尔 盖茨 嘿 萨姆 萨姆 奥尔特曼 嘿 比尔 比尔 盖茨 你好吗 萨姆 奥尔特曼 哦 天哪 这真的太疯狂了 我还好 这是一个非常激动人心的时期 比尔 盖茨 团队情况怎么样 萨姆 奥尔特曼 我想 你知道很多人都注意到了这样一个事实
  • 【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究(Python代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 2 1 有 无策略奖励 2 2 训练结果1
  • 用CHAT写一份标题为职业教育教师教学能力提升培训总结

    CHAT回复 标题 职业教育教师教学能力提升培训总结 一 活动概述 本次由学校组织的职业教育教师教学能力提升培训于8月15日至8月20日顺利进行 来自全校的60位职业教育教师参与了此次培训 主讲人为享有盛名的教育专家马丁先生 二 培训内容与
  • socket网络编程几大模型?看看CHAT是如何回复的?

    CHAT回复 网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型 一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求 不需
  • 利用CHAT写实验结论

    问CHAT 通过观察放置在玻璃表面上的单个水滴 人们可以观察到水滴充当成像系统 探究这样一个透镜的放大倍数和分辨率 CHAT回复 实验报告标题 利用玻璃表面的单一水滴观察成像系统的放大倍数和分辨率 一 实验目的 通过对比和测量 研究和探索玻
  • 让CHAT介绍下V2ray

    CHAT回复 V2Ray是一个网络工具 主要用于科学上网和保护用户的网络安全 它的名字源自Vmess Ray 光线 通过使用新的网络协议 为用户提供稳定且灵活的代理服务 下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
  • 链上繁荣,合作不断,外媒热议波场 TRON 2023 年度成绩

    近日 权威外媒Theblock 美联社和Decrypt等就波场 TRON 2023大事件进行了年度盘点 报道指出 波场TRON网络在2023年取得了一系列的发展和合作 提升了其在Web3领域的地位 其中 波场TRON网络账户数量增加了 54
  • 利用CHAT上传文件的操作

    问CHAT autox js ui 上传框 CHAT回复 上传文件的操作如果是在应用界面中的话 由于Android对于文件权限的限制 你可能不能直接模拟点击选择文件 一般来说有两种常见的解决方案 一种是使用intent来模拟发送一个文件路径
  • 作物叶片病害识别系统

    介绍 由于植物疾病的检测在农业领域中起着重要作用 因为植物疾病是相当自然的现象 如果在这个领域不采取适当的护理措施 就会对植物产生严重影响 进而影响相关产品的质量 数量或产量 植物疾病会引起疾病的周期性爆发 导致大规模死亡 这些问题需要在初
  • 2024 人工智能与大数据专业毕业设计(论文)选题指导

    目录 前言 毕设选题 选题迷茫 选题的重要性 更多选题指导 最后 前言 大四是整个大学期间最忙碌的时光 一边要忙着备考或实习为毕业后面临的就业升学做准备 一边要为毕业设计耗费大量精力 近几年各个学校要求的毕设项目越来越难 有不少课题是研究生
  • 手把手教你用 Stable Diffusion 写好提示词

    Stable Diffusion 技术把 AI 图像生成提高到了一个全新高度 文生图 Text to image 生成质量很大程度上取决于你的提示词 Prompt 好不好 前面文章写了一篇文章 一份保姆级的 Stable Diffusion
  • 如何用GPT进行论文润色与改写?

    详情点击链接 如何用GPT GPT4进行论文润色与改写 一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图 图像识别 文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Ge
  • CorelDRAW2024官方中文版重磅发布更新

    35年专注于矢量设计始于1988年并不断推陈出新 致力为全球设计工作者提供更高效的设计工具 CorelDRAW 滋养并见证了一代设计师的成长 在最短的时间内交付作品 CorelDRAW的智能高效会让你一见钟情 CorelDRAW 全称 Co
  • 3D点云检测神技 | UFO来了!让PointPillars、PV-RCNN统统涨点!

    作者 AI驾驶员 编辑 智驾实验室 点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 点击进入 自动驾驶之心 3D目标检测 技术交流群 本文只做学术分享 如有侵权 联系删文 在这篇论文中提出了一个关于在3D点云中检测未
  • 史上最全自动驾驶岗位介绍

    作者 自动驾驶转型者 编辑 汽车人 原文链接 https zhuanlan zhihu com p 353480028 点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 点击进入 自动驾驶之心 求职交流 技术交流群 本
  • 开始弃用NeRF?为什么Gaussian Splatting在自动驾驶场景如此受欢迎?(浙江大学最新)...

    点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述 文章首先回顾了3D Gaussian的原理和应用 借着全面比较了3D GS在静态
  • 基于节点电价的电网对电动汽车接纳能力评估模型研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码 数据
  • 考虑光伏出力利用率的电动汽车充电站能量调度策略研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码 数据
  • 自动驾驶离不开的仿真!Carla-Autoware联合仿真全栈教程

    随着自动驾驶技术的不断发展 研发技术人员开始面对一系列复杂挑战 特别是在确保系统安全性 处理复杂交通场景以及优化算法性能等方面 这些挑战中 尤其突出的是所谓的 长尾问题 即那些在实际道路测试中难以遇到的罕见或异常驾驶情况 这些问题暴露了实车
  • 对中国手机作恶的谷歌,印度CEO先后向三星和苹果低头求饶

    日前苹果与谷歌宣布合作 发布了 Find My Device Network 的草案 旨在规范蓝牙追踪器的使用 在以往苹果和谷歌的生态形成鲜明的壁垒 各走各路 如今双方竟然达成合作 发生了什么事 首先是谷歌安卓系统的市场份额显著下滑 数年来

随机推荐

  • python+Opencv数字图像处理入门到精通

    1 环境配置 在python 3 4 2 之后 一些算法被申请了专利 可能不能在使用 因此 建议使用的版本为 3 4 1 15或3 4 0 15 在Anaconda下安装opencv需要执行如下两个指令 pip install opencv
  • "免费!中文!10个最佳Python学习网站推荐

    分享资料 一起学习 我是小白 微信 tlxx233 备注 888建了个微信程序员学习群 互相解答问题 有需要的同学可以加我微信进群 10个免费学习 Python 的中文网站 如果你想要学习 Python 那么这篇文章将会介绍 10 个免费的
  • Linux和Windows下使用Syslog库

    本文档描述如何在Windows和Linux下使用Syslog库 在Linux下GNU库中已经自带有syslog库 但是在Windows下的标准库中没有syslog库 从网上可以找到syslog的开源代码实现 接口函数基本上与Linux一致
  • 高精度运算c++

    高精度运算c 前言 加法 减法 乘法 除法 求余 全部代码 完 前言 采用c 的stl库实现高精度的加减乘除 以及求余运算 希望可以帮助到大家 加法 string add big string a string b string 加 str
  • String和基本数据类型的比较方式

    package com test author xlj 简单的比较方式 public class Test public static void main String args System out println 192 168 101
  • springboot项目启动时:Failed to retrieve application JMX service URL

    application properties配置有问题 检查即可
  • Cannot find any provider supporting AES/CBC/PKCS5Padding

    1 出现的问题 java lang RuntimeException java security NoSuchAlgorithmException Cannot find any provider supporting AES CBC PK
  • Elastic Search 安装部署最全教程(Docker)

    一 部署单点ES 1 首先创建网络 因为我们还需要部署kibana容器 因此需要让es和kibana容器互联 这里先创建一个网络 docker network create es net 2 加载镜像 docker pull elastic
  • 刀片服务器 如何增加硬盘,IBM为刀片服务器添加新SAS及固态硬盘

    在调整过X64产品线后 我们又收到IBM将为服务器产品线添加新SAS硬盘及固态硬盘的消息 上周IBM刚发布了一款小尺寸的SAS硬盘 它只有2 5英寸 而之前的硬盘基本上都是3 5英寸的SCSI硬盘 因为IBM拥有世界上最好的硬盘研究和生产工
  • 疯壳4900、7072心率血压血氧心电四合一智能手表&模组电容触摸实现

    触摸 该手表的触摸是由RH6015C触摸IC完成的 该IC是一款内置稳压模块的单通道电容式触摸感应控制开关 IC 可以替代传统的机械式开关 RH6015可在有介质 如玻璃 亚克力 塑料 陶瓷等 隔离保护的情况下实现触摸功能 安全性高 RH6
  • delete 和 delete []的真正区别

    c 中对new申请的内存的释放方式有delete和delete 两种方式 到底这两者有什么区别呢 1 我们通常从教科书上看到这样的说明 delete 释放new分配的单个对象指针指向的内存 delete 释放new分配的对象数组指针指向的内
  • ubuntu下解决wps2019缺少字体问题

    准备字体包 链接 https pan baidu com s 1rsqn3CY SWS KWaKc0w83g 提取码 h9cs 复制 解压后的wps symbol fonts zip到 home usr share fonts下 sudo
  • 西门子PLC—用 SCL 编写你的第一个 TIA 代码

    前言 使用梯形图编写程序时 博途编辑器是通过网络段 把程序分成一段一段的 编辑器可以插入若干个网络段 每一个网络段可以有各自的注释 而SCL是文本语言 不分网络段 在LAD FBD语言内增加SCL的除外 这就需要需要用其他的方法来 解决程序
  • 面试总结大全

    预定义变量 0 脚本名 所有的参数 所有的参数 参数的个数 当前进程的PID 上一个后台进程的PID 上一个命令的返回值 0表示成功 for 循环次数是固定的 for i in 取值 范围 1 20 zhangsan lisi wanger
  • 牛客网——华为题库(41~50)

    华为题库 41 称砝码 42 学英语 43 迷宫问题 44 Sudoku 45 名字的漂亮度 46 截取字符串 48 从单向链表中删除指定值的节点 50 四则运算 41 称砝码 include
  • C++通过回车结束循环输入

    试想一个案例 假设需要你输入n行数字 而每一行输入的数字数量都未知 不定 如何通过C 来实现这一操作 本贴笔者给出一个具体案例 首先规定输入的行数 而后在每一行输入不定量的数字 最后将每一个数字对应的值 以及与其匹配的行数输出 例如 输入
  • 实战07- 模型融合:利用AdaBoost元算法提高分类性能

    元算法 meta algorithm 是对其他算法进行组合的一种方式 即模型融合 模型融合主要分为三种 Bagging Boosting和Stacking 思想 将弱分类器融合成强分类器 融合后比最强的弱分类器更好 视频导学 https w
  • 什么是高防CDN,高防CDN是如何防御网络攻击的呢?

    高防CDN是一种新型的网络构建法式 N是构建在现有网络基础之上的智能虚拟网络 依靠部署在各地的边缘服务器 通过中心平台的负载均衡 内容分发 调度等功能模块 使用户就近获取所需内容 降低网络拥塞 提高用户访问响应速度和命中率 CDN的关键技术
  • tensorflow2.1.0安装

    原来一直用1 x的tf 最近安装2 初始源error无法安装 下载本地包后 换清华源之类的 channels defaults show channel urls true default channels https mirrors tu
  • 机器学习(一)

    文章目录 人工智能 人工智能的诞生 人工智能的发展历程 人工智能与机器学习的关系 机器学习 机器学习的发展历程 讨论 机器学习的必要性 机器学习的定义 机器学习的三要素 机器学习的基本概念 作业 人工智能 人工智能的诞生 人工智能诞生于一群