走向无监督学习(无监督学习概述 - 告别启蒙阶段的深度学习)

2023-05-16

在这里插入图片描述

1 之前的人工智能学习(监督学习 supervised learning)

相信所有人在学习人工智能的时候,都经过了几个阶段,从一开始简单的数据处理,到机器学习简单算法,然后再到深度学习。在长时间的学习积累后,大家可能会有一种感受,就算法本身来说,并不是越复杂就一定越好,并不是说解决一个问题时,你运用到了神经网络的知识,就一定要比一般的机器学习高端,最适合的才是最好的。
另一方面,在过去的学习过程中,可能不少人都有这样一种感受,觉得我们做的事情都有一个大前提,那就是我们事先已经知道了答案,比方说分类问题和回归问题,我们事先已经知道了猫是什么样的,狗是什么样的,然后我们就给数据创建训练集,测试集,设定好标签,通过我们现有的认知来训练计算机,像这样的机器学习方式就叫做监督学习。
在这里插入图片描述
监督学习最大的好处就是,一切都是已知的,通过这些模型的建立,我们就能非常容易地对事物进行判断和预测。但是这需要投入大量的人力进行前期的数据处理和标签制作,在这个过程中,很容易掺杂大量的感情因素,也可能会出现人的工作疏忽,导致送给机器的数据或数据标签本身就有问题(本人就遇到过,有些狗长得和猫很像啊)。
在这里插入图片描述

但是,在现实生活中,有很多需要处理的事情,我们事先其实并不知道答案,无法告诉计算机什么才是正确的,但是计算机经过训练后却可以达到人类的要求。
像这种事先并没有标准答案(没有标签)的训练方式就叫做无监督学习
在这里插入图片描述

2 人工智能学习的新阶段(无监督学习 unsupervised learning)

相信不少刚接触人工智能的同学都会有一个疑问,如果我们事先不知道答案,就没有办法给数据设置标签,那计算机该怎么学习?
其实在无监督学习中,数据也是有标签的,而且数据的标签就是数据自己
在这里插入图片描述
无监督学习的思路是,将一组数据送给一个神经网络后,得到一个输出,然后再将这个输出送入另一个网络,希望输出结果为最原始的输入数据。
我们平时在做监督学习的分类问题时,一般要分层多少类,输出就是一个一乘几的数组,但是现在的情况下,由于没有标签,输出结果的维度就和原始数据保持一致,希望能尽可能的把输入数据给还原出来。
其中,中间的那个输出被称为“颈部neck()”。neck的维度没有规定大小,但是一般来说我们会进行降维操作,而且降维后的维度一般是二维或三维,这样做的目的在于比较容易做出可视化效果(三维以上长什么样画不出来啊),而且这样的可视化能相对完整地保留语义。
像这种把自己自动作为输出结果的标签的做法叫做Auto-Encoders
在这里插入图片描述

3 如何训练

在看明白原理之后,有些同学可能会觉得很奇怪,这种无监督学习具体的应该怎么训练。
大家一定要搞明白,我们看一种思路能不能实现的本质是看这种loss的方程到底能不能求导。
之前,我们在做监督学习的时候,用的是下面这个方程,也就是想办法让输出结果和实际结果之间的差距尽可能缩小。
这个方程在无监督学习过程中也一样可以使用,但意义变成了希望输出结果和和原来的输入结果之间的差尽量小,差距越小就说明还原得越成功。
在这里插入图片描述
但是,如果我们拿到的图像是黑白的,也就是说,如果我们可以把一张图片转化为黑白图片,每一个像素点非零即一,那么,我们就可以使用下面这个公式:
在这里插入图片描述
这个公式里面,如果原图中原图的某一个像素如果是0,就会有一项消掉。剩下的就是比较判断出来的这个像素点是0或1的概率(概率只可能是0到1之间),让这个方程的结果越小,就说明训练出的模型越成功。
不管你用的是TensorFlow还是Cafe,你只要确定一个loss的算法是可导的,后面的求导过程交个工具就可以了。
在这里插入图片描述

4 降维

在出现深度学习之前,大家使用的降维方式是PCA。
PCA的原理其实很好理解。大家知道,高维空间的线性投影就是一个低维空间,依据这个方法,早期的计算机科学家得到了最初的降维效果。但是我们知道,自然界的大多数数据其实不可能是线性关系的,这样的投影方式导致了大量的有效信息缺失。
而Auto-Encoders是神经网络的做法,这里面的激活函数发挥了非常重要的作用,使得原有信息得到了极大程度的保留。
在这里插入图片描述
比方说,上面这张图,中间的那一行是Auto-Encoders的还原效果,相较于原图(第一行),确实丢失了一些信息,但是效果比第三行的PCA明显要好很多。

5 结语

这里对无监督学习做一些简单的介绍,其实也是为了帮自己做一点概括可梳理,之后的一些文章可能会主要转向非监督学习,之后会在实际的使用层面做一些比较详细的记录。
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

走向无监督学习(无监督学习概述 - 告别启蒙阶段的深度学习) 的相关文章

  • SLAM技术目前主要应用在哪些领域

    当今科技发展速度飞快 xff0c 想让用户在AR VR 机器人 无人机 无人驾驶领域体验加强 xff0c 还是需要更多前沿技术做支持 xff0c SLAM就是其中之一 实际上 xff0c 有人就曾打比方 xff0c 若是手机离开了WIFI和
  • Intel Realsense D435i驱动安装及固件升级

    前言 实验室购买了intel realsense d435i RGBD相机 xff0c 用于无人机平台上的定位导航 xff0c 最近新购买了intel nuc xff0c 需要重新布置相机驱动 xff0c 特此把安装经历重新梳理一遍 xff
  • PixHawk飞控和Mission Planner地面站安装调试

    常用地面站软件主要有QGroundControl和MissionPlanner两种 下面以mission planner来介绍如何使用地面站软件进行固件升级和传感器校准 一 PixHawk飞控配置 www pixhawk com PixHa
  • PX4&GAAS

    PX4源码 xff1a https github com PX4 Firmware QGroundControl安装教程 xff1a https docs qgroundcontrol com en getting started down
  • MSCKF那些事-知乎转载

    MSCKF那些事 xff08 一 xff09 MSCKF算法简介MSCKF那些事 xff08 二 xff09 S MSCKF试用与源码解析MSCKF那些事 xff08 三 xff09 算法详解1 xff1a 前端特征跟踪MSCKF那些事 x
  • 赶快入手12代酷睿,畅享性能飞升体验-Acer掠夺者战斧300笔记本评测

    在这个社会全面数字化转型的时代 xff0c 人们对于计算机算力的需求越来越大 xff0c 对于日常使用的主力办公笔记本也是要求越来越全面 xff0c 尤其像笔者这样的编程一族 xff0c 今年一季度酷睿12代系列处理器的推出 xff0c 堪
  • 视觉惯性里程计VIO综述

    参考 xff1a https blog csdn net xiaoxiaowenqiang article details 81192045 目前主流的VIO开源方案主要有以下几类 xff0c 按照相机与IMU的耦合方式可分为松耦合和紧耦合
  • 常用地图结构和基础知识

    1 Occupancy grid map 占用栅格图 最稠密 每隔一个距离就要进行切分 xff08 当每个格子切的比较小也就是分辨率比较大的时候 xff0c 内存非常大 xff09 结构化坐标索引查询 xff0c O 1 https git
  • 2022年度盘点:十大最佳开源SLAM算法

    激光雷达里程计 香港大学开源激光雷达惯性视觉里程计FAST LIVO 论文名 xff1a FAST LIVO Fast and Tightly coupled Sparse Direct LiDAR Inertial Visual Odom
  • STL标准模版库之算法(algorithm)

    STL xff08 Standard Template Library xff0c 标准模板库 是惠普实验室开发的一系列软件的统称 它是由Alexander Stepanov Meng Lee和David R Musser在惠普实验室工作时
  • 树苺派TF卡备份/还原镜像

    树苺派TF卡备份 还原镜像 TF卡备份TF卡还原 备份和还原树莓派TF卡镜像推荐在Linux下进行 TF卡备份 在Ubuntu下插入装有Raspbian的TF卡会直接挂载 xff0c 挂载后的盘在 dev下显示为 34 dev sdx 34
  • 通过dockerfile 创建镜像以及更新镜像

    制作Docker镜像 1 安装 Docker Docker 要求 CentOS 系统的内核版本高于 3 10 查看当前系统的版本 uname r 安装 Docker 软件包和依赖包 yum y install docker 安装完成 从远程
  • RT-Thread 线程同步及通信 -- 信号量、互斥量、事件、邮箱、消息队列

    目录 一 RT Thread 信号量 二 RT Thread 互斥量 三 RT Thread 事件标志组 四 RT Thread 邮箱 五 RT Thread 消息队列 一 RT Thread 信号量 1 信号量相关函数 创建信号量 64
  • Fiddler抓不到浏览器包的常见原因

    代理未设置成功 fiddler 之所以能抓包 xff0c 本质上是因为浏览器 App 软件设置了代理为 fiddler 一旦遇到抓不到包的情况 xff0c 首先应排查浏览器代理是否设置正确 以 Chrome 为例 xff0c 代理设置为 x
  • 经典 SQL 数据库笔试题及答案整理

    马上又是金三银四啦 xff0c 有蛮多小伙伴在跳槽找工作 xff0c 但对于年限稍短的软件测试工程师 xff0c 难免会需要进行笔试 xff0c 而在笔试中 xff0c 基本都会碰到一道关于数据库的大题 xff0c 今天这篇文章呢 xff0
  • 软件测试项目实战(web+app+h5+小程序)

    没有实战经验 xff0c 简历不好编写 xff0c 而且也不好就业 今天给大家分享一个非常适合练手的软件测试项目 xff0c 此项目涵盖web端 app端 h5端 小程序端 xff0c 可以说非常之全面 获取方式在文末 项目介绍 项目名 x
  • 基础软件照搬开源不可取,自力更生才是正途

    最近有关开源软件的话题始终牢牢占据着IT界的新闻头条 xff0c Log4j开源软件的惊天漏洞 Fake js的作者也惊天删库跑路了 xff0c CurL的作者怒怼苹果只会白嫖开源却不出力 xff0c Linux的祖师爷Linus也不知所云
  • ADB 命令知多少?详细 ADB 命令大全来啦

    一 ADB 简介 1 什么是 ADB ADB 全称为 Android Debug Bridge xff0c 起到调试桥的作用 xff0c 是一个客户端 服务器端程序 其中客户端是用来操作的电脑 xff0c 服务端是 Android 设备 A
  • 软测面试如何介绍项目?要做哪些技术准备?

    测试人员在找工作中 xff0c 基本都会碰到让介绍项目的这种面试题 xff0c 如何正确介绍自己的项目 xff1f 需要做哪些技术准备 xff1f 今天这篇文章 xff0c 围绕这些问题 xff0c 跟大家一起聊一聊 Q 关于介绍自己的项目
  • 看完即会,抓取微信小程序数据包教程

    在给学员答疑的时候 xff0c 有很多小伙伴问到能不能抓取到微信小程序数据呢 xff1f 答案当然是肯定的 xff0c 通过Fiddler或者Charles这些主流的抓包工具都可以抓得到 xff0c 在IOS平台抓取微信小程序和https请

随机推荐